【EMNLP 2019 最佳论文】用控制任务设计和解释探针（Designing and Interpreting Probes with Control Tasks） - 专知VIP

会员服务 ·

0

EMNLP · Percy Liang · 人工智能 · 自然语言处理 · John Hewitt ·

2019 年 11 月 20 日

【EMNLP 2019 最佳论文】用控制任务设计和解释探针（Designing and Interpreting Probes with Control Tasks）

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

论文题目： Designing and Interpreting Probes with Control Tasks

论文摘要： 训练有素的监督模型可以根据表达形式（如 ELMo）预测属性（如词性），探测器在一系列语言任务上均具有很高的准确性。但这是否意味着这些表达形式对语言结构进行了编码，或者只是探测器已经学习了语言任务？在本文中，研究者提出了控制任务，将词的类型与随机输出联系起来，以辅助语言任务。按照设定，这些任务只能由探测器来学习。因此选择一个合适的探测器（能反映该表达形式的探测器）很重要，以实现较高的语言任务准确性和较低的控制任务准确性。探测器的选择性将语言任务的准确性与自身记忆词类型的能力相关联。研究者提出了用于英语词汇标注和依赖边缘预测的控制任务，并且展示了基于表达形式上的探测器是不可选择的。同时他们还发现，通常用于控制探测器复杂性的滤除对提高 MLP 的选择性是无效的，但是其他形式的正则化是有效的。最后，他们发现，尽管 ELMo 的第一层探测器比第二层探测器的词性标注精度高一些，但是第二层上的探测器更具选择性。引出了以下问题：究竟哪一层可以更好地代表词性。

作者简介：

John Hewitt，斯坦福大学计算机科学系二年级博士生，主要从事进行自然语言处理的研究，对（口译）表征学习、潜在层次结构的归纳、小数据环境和多语种感兴趣；本科生期间，在宾夕法尼亚大学克里斯·卡利森·伯奇的实验室工作。

Percy Liang，斯坦福大学计算机科学与统计学副教授，他感兴趣的是构建系统，学会将自然语言描述（例如，英语或汉语）翻译成程序（例如，在Python或C++中）。他的目标是开发可信赖的系统，可以有效地与人沟通，并随着时间的推移通过互动来改进。

成为VIP会员查看完整内容

Designing and Interpreting Probes with Control Tasks.pdf

2

相关内容

EMNLP

自然语言处理顶级会议

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

专知会员服务

43+阅读 · 2020年4月22日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

专知会员服务

103+阅读 · 2020年3月8日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

45+阅读 · 2020年1月23日

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

专知会员服务

14+阅读 · 2020年1月3日

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

专知会员服务

49+阅读 · 2020年1月1日

【ICLR2020】面向层次重要性属性:神经序列模型的组成语义解释（Towards Hierarchical Importance Attribution:explaining compositional semantics for Neural Sequence Models）

【ICLR2020】面向层次重要性属性:神经序列模型的组成语义解释（Towards Hierarchical Importance Attribution:explaining compositional semantics for Neural Sequence Models）

专知会员服务

10+阅读 · 2019年12月24日

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

专知会员服务

24+阅读 · 2019年11月20日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用（Definitions, methods, and applications in interpretable machine learning）,W. James Murdoch,Chandan Singh

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用（Definitions, methods, and applications in interpretable machine learning）,W. James Murdoch,Chandan Singh

专知会员服务

55+阅读 · 2019年11月20日

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

专知会员服务

104+阅读 · 2019年10月22日

《可解释的机器学习-interpretable-ml》中文翻译版

《可解释的机器学习-interpretable-ml》中文翻译版

专知

88+阅读 · 2020年2月23日

单语言表征如何迁移到多语言去？

单语言表征如何迁移到多语言去？

AI科技评论

5+阅读 · 2019年11月21日

NAACL 2019自然语言处理亮点

NAACL 2019自然语言处理亮点

专知

15+阅读 · 2019年6月15日

赛尔原创 | IJCAI 2019 New SOTA: 基于可迁移的BERT模型进行故事结尾预测

赛尔原创 | IJCAI 2019 New SOTA: 基于可迁移的BERT模型进行故事结尾预测

哈工大SCIR

7+阅读 · 2019年5月20日

注意力能提高模型可解释性？实验表明：并没有

注意力能提高模型可解释性？实验表明：并没有

黑龙江大学自然语言处理实验室

11+阅读 · 2019年4月16日

情感计算综述

情感计算综述

人工智能学家

34+阅读 · 2019年4月6日

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

专知

57+阅读 · 2018年12月16日

学界 | 谁来拯救集体失灵的NLP模型？

学界 | 谁来拯救集体失灵的NLP模型？

大数据文摘

9+阅读 · 2018年10月13日

自然语言处理（NLP）知识结构总结

自然语言处理（NLP）知识结构总结

AI100

51+阅读 · 2018年8月17日

教程 | 遗传算法的基本概念和实现（附Java实现案例）

教程 | 遗传算法的基本概念和实现（附Java实现案例）

机器之心

4+阅读 · 2017年7月11日

A Survey on Trajectory Data Management, Analytics, and Learning

A Survey on Trajectory Data Management, Analytics, and Learning

Arxiv

16+阅读 · 2020年3月25日

Semantics-aware BERT for Language Understanding

Arxiv

4+阅读 · 2019年9月5日

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Arxiv

21+阅读 · 2019年3月27日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

Sockeye: A Toolkit for Neural Machine Translation

Arxiv

7+阅读 · 2018年6月1日

Context-Aware Neural Machine Translation Learns Anaphora Resolution

Arxiv

3+阅读 · 2018年5月25日

Discovering Discrete Latent Topics with Neural Variational Inference

Arxiv

9+阅读 · 2018年5月21日

Strong Baselines for Neural Semi-supervised Learning under Domain Shift

Arxiv

4+阅读 · 2018年4月25日

Distributed Constraint Optimization Problems and Applications: A Survey

Arxiv

5+阅读 · 2018年1月11日

Interpretable R-CNN

Arxiv

4+阅读 · 2017年11月14日

VIP会员

相关主题

自然语言处理

相关VIP内容

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

专知会员服务

43+阅读 · 2020年4月22日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

专知会员服务

103+阅读 · 2020年3月8日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

45+阅读 · 2020年1月23日

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

专知会员服务

14+阅读 · 2020年1月3日

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

专知会员服务

49+阅读 · 2020年1月1日

【ICLR2020】面向层次重要性属性:神经序列模型的组成语义解释（Towards Hierarchical Importance Attribution:explaining compositional semantics for Neural Sequence Models）

【ICLR2020】面向层次重要性属性:神经序列模型的组成语义解释（Towards Hierarchical Importance Attribution:explaining compositional semantics for Neural Sequence Models）

专知会员服务

10+阅读 · 2019年12月24日

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

专知会员服务

24+阅读 · 2019年11月20日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用（Definitions, methods, and applications in interpretable machine learning）,W. James Murdoch,Chandan Singh

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用（Definitions, methods, and applications in interpretable machine learning）,W. James Murdoch,Chandan Singh

专知会员服务

55+阅读 · 2019年11月20日

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

专知会员服务

104+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

《可解释的机器学习-interpretable-ml》中文翻译版

《可解释的机器学习-interpretable-ml》中文翻译版

专知

88+阅读 · 2020年2月23日

单语言表征如何迁移到多语言去？

单语言表征如何迁移到多语言去？

AI科技评论

5+阅读 · 2019年11月21日

NAACL 2019自然语言处理亮点

NAACL 2019自然语言处理亮点

专知

15+阅读 · 2019年6月15日

赛尔原创 | IJCAI 2019 New SOTA: 基于可迁移的BERT模型进行故事结尾预测

赛尔原创 | IJCAI 2019 New SOTA: 基于可迁移的BERT模型进行故事结尾预测

哈工大SCIR

7+阅读 · 2019年5月20日

注意力能提高模型可解释性？实验表明：并没有

注意力能提高模型可解释性？实验表明：并没有

黑龙江大学自然语言处理实验室

11+阅读 · 2019年4月16日

情感计算综述

情感计算综述

人工智能学家

34+阅读 · 2019年4月6日

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能,195页PDF

专知

57+阅读 · 2018年12月16日

学界 | 谁来拯救集体失灵的NLP模型？

学界 | 谁来拯救集体失灵的NLP模型？

大数据文摘

9+阅读 · 2018年10月13日

自然语言处理（NLP）知识结构总结

自然语言处理（NLP）知识结构总结

AI100

51+阅读 · 2018年8月17日

教程 | 遗传算法的基本概念和实现（附Java实现案例）

教程 | 遗传算法的基本概念和实现（附Java实现案例）

机器之心

4+阅读 · 2017年7月11日

相关论文

A Survey on Trajectory Data Management, Analytics, and Learning

A Survey on Trajectory Data Management, Analytics, and Learning

Arxiv

16+阅读 · 2020年3月25日

Semantics-aware BERT for Language Understanding

Arxiv

4+阅读 · 2019年9月5日

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Arxiv

21+阅读 · 2019年3月27日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

Sockeye: A Toolkit for Neural Machine Translation

Arxiv

7+阅读 · 2018年6月1日

Context-Aware Neural Machine Translation Learns Anaphora Resolution

Arxiv

3+阅读 · 2018年5月25日

Discovering Discrete Latent Topics with Neural Variational Inference

Arxiv

9+阅读 · 2018年5月21日

Strong Baselines for Neural Semi-supervised Learning under Domain Shift

Arxiv

4+阅读 · 2018年4月25日

Distributed Constraint Optimization Problems and Applications: A Survey

Arxiv

5+阅读 · 2018年1月11日

Interpretable R-CNN

Arxiv

4+阅读 · 2017年11月14日

微信扫码咨询专知VIP会员