题目: MuTual: A Dataset for Multi-Turn Dialogue Reasoning

摘要: 近年来,非任务导向的对话系统取得了巨大的成功,这得益于大量可访问的对话数据和深度学习技术的发展。在给定的上下文中,当前的系统能够产生相关的、流畅的响应,但是由于推理能力较弱,有时会出现逻辑错误。为了便于会话推理的研究,我们引入了一个用于多回合对话推理的新数据集MuTual,包括8,860个基于中国学生英语听力考试的手动注释对话。与以前的非面向任务的对话系统的基准测试相比,MuTual测试更具挑战性,因为它需要一个能够处理各种推理问题的模型。实证结果表明,最先进的推理方法只能达到71%,远远落后于人类94%的表现,说明推理能力还有很大的提升空间。

成为VIP会员查看完整内容
36

相关内容

自然语言处理(NLP)是语言学,计算机科学,信息工程和人工智能的一个子领域,与计算机和人类(自然)语言之间的相互作用有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
微软机器阅读理解在一场多轮对话挑战中媲美人类
微软丹棱街5号
19+阅读 · 2019年5月14日
自然语言处理常识推理综述论文,60页pdf
专知
69+阅读 · 2019年4月4日
知识在检索式对话系统的应用
微信AI
32+阅读 · 2018年9月20日
DuReader:百度大规模的中文机器阅读理解数据集
全球人工智能
7+阅读 · 2018年5月8日
Neural Module Networks for Reasoning over Text
Arxiv
9+阅读 · 2019年12月10日
Arxiv
6+阅读 · 2018年11月1日
Arxiv
6+阅读 · 2018年1月29日
VIP会员
相关VIP内容
微信扫码咨询专知VIP会员