自然语言推理(NLI)是自然语言处理的一项基本任务,主要研究两个文本之间的蕴含关系。流行的NLI数据集是对该任务句子级别的研究。它们可以用来探讨语义表示,但并未涉及基于长文本的上下文推理,而这是人类推理过程的自然组成部分。我们提出了ConTRoL数据集来用于研究长文本的上下文推理。ConTRoL由8,325个专家设计的带有高质量标签的“上下文-假设”对组成,是一个段落级别的NLI数据集,重点关注复杂的上下文推理类型,例如逻辑推理。它是从竞争性甄选和招聘测试(推理测试)衍生而来的,具有很高的质量。与以前的NLI基准相比,ConTRoL中的材料更具挑战性,涉及多种推理类型。

实证结果表明,最先进的语言模型在ConTRoL上的性能表现远不如受过良好教育的人类。我们的数据集还可以用作下游任务(如检查摘要的事实正确性)的测试集。

成为VIP会员查看完整内容
14

相关内容

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
【AAAI2021】记忆门控循环网络
专知会员服务
50+阅读 · 2020年12月28日
【AAAI2021】层次推理图神经网络
专知会员服务
70+阅读 · 2020年12月27日
专知会员服务
47+阅读 · 2020年12月20日
【AAAI2021】 层次图胶囊网络
专知会员服务
84+阅读 · 2020年12月18日
AAAI 2020论文解读:关注实体以更好地理解文本
AI科技评论
17+阅读 · 2019年11月20日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
40+阅读 · 2019年8月18日
已删除
将门创投
3+阅读 · 2019年4月25日
Generating Rationales in Visual Question Answering
Arxiv
5+阅读 · 2020年4月4日
VIP会员
相关主题
相关VIP内容
【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
【AAAI2021】记忆门控循环网络
专知会员服务
50+阅读 · 2020年12月28日
【AAAI2021】层次推理图神经网络
专知会员服务
70+阅读 · 2020年12月27日
专知会员服务
47+阅读 · 2020年12月20日
【AAAI2021】 层次图胶囊网络
专知会员服务
84+阅读 · 2020年12月18日
相关资讯
AAAI 2020论文解读:关注实体以更好地理解文本
AI科技评论
17+阅读 · 2019年11月20日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
40+阅读 · 2019年8月18日
已删除
将门创投
3+阅读 · 2019年4月25日
微信扫码咨询专知VIP会员