微软要教机器学会阅读、回答和提问

2017 年 5 月 8 日 微软研究院AI头条

Rangan Majumder、Yi‐Min Wang 和高剑锋（自左至右）在微软雷德蒙研究院。

微软机器阅读工作可以追溯到大约20年前研究者在自然语言处理领域所做的早期工作。随着过去几年人工智能的发展，机器阅读也从更好的深度学习算法、大幅提升的云计算能力和海量数据中大受脾益。微软在SQuAD（Stanford Question Answering Dataset）文本理解挑战赛，这一机器阅读领域的核心基准上的成绩一直稳居榜首。尽管如此，为了创造出可以同时在语言及其细微差别方面真正理解人类诉求的系统，仍然有大量工作要做。（本文转载自机器之心，译自Microsoft is teaching systems to read, answer and even ask questionsRead more 请点击文末阅读原文或者直接将网址复制至浏览器中打开即可查看 https://blogs.microsoft.com/next/2017/05/04/microsoft-is-teaching-systems-to-read-answer-and-even-ask-questions/#rhuyYf27jpBWLlZx.99）

微软的研究员目前已经创造出了能够像人类一样完成两种困难任务的技术：图像识别和语音识别。现在微软的顶级人工智能专家正在研究能够完成更复杂任务的系统：阅读文本进而回答问题。

Maluuba 的联合创始人 Kaheer Suleman 说到，「我们正在尝试开发一种文献机器：它能阅读、理解文本，然后学习如何交流，无论是笔录还是口述。」微软在今年年初时收购了这家创业公司。

机器阅读系统也能帮助医生、律师和其他专家更快地完成文档阅读这样的苦差事，从而让专家们有更多的时间治疗病人或构想合法抗辩。

Maluuba 团队是微软几个解决机器阅读难题的团队之一。其他两个团队，一个在华盛顿雷德蒙，一个在北京的研究院。这两个团队在斯坦福大学的 SQuAD 数据集上正在展开竞争，使用 Wikipedia 上的信息测试人工智能系统回答问题的能力。

在 SQuAD 数据集上的排名

SQuAD 数据集是机器阅读这一新兴领域的核心基准，许多顶尖的学术或产业团队都在使用它测试自己的系统。它类似于 ImageNet 竞赛，激励着计算机视觉的发展。此外，微软研究员和其他来自学界、产业界的团队也在使用另一个数据集 MS MARCO 进行激烈竞争，MS MARCO 数据集使用来自 Bing 搜索词条的真实、匿名数据来测试系统回答问题的能力。

团队成员说这是一个有附加值的挑战，因为它是基于人类的真实问题。在这种数据上测试能保证建立的系统最终对客户有用。

微软 Bing 部门合作伙伴组的一位项目经理 Rangan Majumder 说：「我们不只要奖励一堆算法解决理论问题，我们也要使用它们解决真实问题，在真实数据上进行测试。」他与雷德蒙机器阅读研究团队有密切的合作，并领导开发了 MS MARCO 数据集。

前排左二的韦福如、前排中间周明、以及微软亚洲研究院自然语言计算研究团队的成员

认知 VS 感知

总体而言，人工智能专家认为机器阅读要比图像识别这样的人工智能任务更困难，因为中间有太多模糊不清的地方。

微软亚洲研究院副院长周明博士表示，图像识别这样的技能是感知型任务：基于系统之前见过的图像，使用机器学习算法进行识别。目前，周明博士带领着微软亚洲研究院的自然语言研究组。

机器阅读是更复杂的认知型任务：它需要系统有大局观，查看它所读取文字的语境，甚至需要加入自身已有的关于这个主题的背景知识。

周说：「一些词可能有不同的含义，而相同的事情可能用不同的方式提及。」

另一个复杂性在于：给出的回答可能不包含问题中的词汇，甚至可能一个都没有。

例如，让我们假设有人问，「John Smith 的国籍是？」答案可能是，「John Smith 生于美国」，或者「他有美国护照」。在任何情况下，系统需要寻找、使用关联国籍的信息，但可能不会明确的说国籍这个词。

微软深度学习技术中心的高剑锋表示：「它需要生成一个答案，而且该答案与已有的都不同。」

Maluuba 的联合创始人 Suleman 提到，这正是人们如何测试其他人学习内容的方式。问问题，从小就开始问，并贯穿一生。

他们团队如何进一步推进机器阅读任务？这是一句深入的描述，「他们正在研发一种能够阅读文章并构思问题的系统，而不只是回答。该研究受启发于 20 世纪 80 年代的一个研究，研究表明在答题测试中，学生被要求写下关于一个主题的问题时会做的更好。」

Suleman 说：「有趣的是，生成问题时（而非回答）你真的需要更深入地理解文本。」

从左开始，依次是 Muluuba 联合创始人 Kaheer Suleman 和 Sam Pasupalak

搜索引擎的终结

机器阅读如此诱人是因为它对许多人都有很大帮助。

例如，高效的机器阅读系统能够推进搜索引擎的工作。相比于敲打词条，然后获得一堆链接，先进的机器阅读系统能像一个知识渊博的人回答问题一样给出解答。

高说，「它以自然的方式传递信息。」

大部分搜索引擎只能做基础的词条搜索，而且不是人们期待的那种要复制所有的信息。

机器阅读系统也能帮助医生、律师以及其他专家更快地阅读专业的医学或判例文档，从而让他们有更多的时间对病人进行治疗或构思合法抗辩。

它也能帮助人们更快地发现隐藏在汽车使用说明书或税务条例中的信息，节约时间。

高说：「世界中有大量信息，尤其是互联网中；为了让信息产生价值，需要将其转化为知识，而机器阅读技术可以在信息与知识之间搭建一个桥梁。」

数十年的研究以及最新进展

微软机器阅读工作的根基可以追溯到大约 20 年之前研究者在自然语言处理领域所做的早期工作。那时，微软的自然语言处理方面的首席研究员 Bill Dolan 开玩笑说，系统的工作只是偶尔很完美。

尽管如此，这一基础性工作正在被整合进算法之中，雷德蒙团队正是借助这一算法取得了当前机器阅读的绝大多数进展；该算法还是 Dolan 及其团队在自然语言处理方面取得的其他突破性成果的基础。

正如过去几年出现的人工智能进展，机器阅读也从更好的深度学习算法、大幅提升的云计算能力和海量数据中大受脾益。

研究者说这些能力，连同深度学习方法在图像和语音识别领域的进步，已经使他们自信地感觉到机器阅读的重大突破尽在眼前。这正是许多人依然惊奇的事情。

微软亚洲研究院自然语言计算研究组主管研究员韦福如说：「这对于从事自然语言处理甚至是人工智能的研究者来说是一个长期的梦想。」

尽管如此，研究者警惕说，为了创造出可以同时在语言及其细微差别方面真正理解人类诉求的系统，仍然有大量工作要做。

通常来讲，人工智能系统仍然只擅长处理特殊任务，它们也许能够找到问题的正确答案，精确识别出狗的品种或者人类的情绪状态，甚至理解会话中的词语；但是，研究者指出，这并不意味着它们能够以人类一出生就具有的方式理解信息，注意到所有的细微差别和语境。

韦福如指出，即使机器阅读团队的系统可以在 SQuAD 数据集中和人表现的一样好，但并不意味着机器可以像人一样真正阅读和理解，这是未来必须要面临的一个挑战。

周说：「这只是通向自然语言理解巨大挑战的一小步。」

你也许还想看：

感谢你关注“微软研究院AI头条”，我们期待你的留言和投稿，共建交流平台。来稿请寄：msraai@microsoft.com。微软小冰进驻微软研究院微信啦！快去主页和她聊聊天吧。

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

专知会员服务

107+阅读 · 2020年7月9日

【Manning书籍】像数据科学家一样思考，331页pdf教您如何步步成为数据科学家

专知会员服务

49+阅读 · 2020年6月18日

【Manning新书】现代Java实战，592页pdf

专知会员服务

101+阅读 · 2020年5月22日

【ACL2020-浙大-微软】多轮对话推理数据集，MuTual: A Dataset for Multi-Turn Dialogue Reasoning

专知会员服务

37+阅读 · 2020年4月10日

【2020Manning新书】人工智能成功之道，272页pdf，Succeeding with AI

专知会员服务

99+阅读 · 2020年3月8日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

22+阅读 · 2020年1月28日

【NLP| 推荐文章】神经阅读理解与超越（Neural Reading Comprehension And Beyond）

专知会员服务

26+阅读 · 2019年11月23日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

63+阅读 · 2019年10月27日

问答与对话-技术与系统之人工智能在人机对话系统中的技术现状与挑战【严睿】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

33+阅读 · 2019年10月23日

【ICML 2019 Tutorials】(Neural Approaches to Conversational AI)，微软高级研究员| Michel Galley，微软研究经理|高剑峰

专知会员服务

17+阅读 · 2019年6月10日

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软丹棱街5号

19+阅读 · 2019年5月14日

微软机器阅读理解系统性能升级，刷新CoQA对话式问答挑战赛纪录

微软研究院AI头条

4+阅读 · 2019年5月6日

AI会话能力超越人类！CoQA挑战赛微软创新纪录

智东西

12+阅读 · 2019年5月5日

微软机器阅读理解超越人类水平，CoQA数据集得分刷新记录

机器之心

5+阅读 · 2019年5月4日

书单 | 系统了解智能问答和机器翻译，从这两本书开始（文末有福利）

微软研究院AI头条

24+阅读 · 2019年1月22日

2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

AI研习社

12+阅读 · 2018年7月30日

干货 | 2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

AI科技评论

7+阅读 · 2018年7月29日

ACL 2018 | 最佳短论文SQuAD 2.0：斯坦福大学发布的机器阅读理解问答数据集

机器之心

4+阅读 · 2018年6月13日

「2018 机器阅读理解技术竞赛」落下帷幕，看奇点机智如何从 800 多支队伍中杀出重围

AI研习社

5+阅读 · 2018年5月28日

揭秘|AI在斯坦福阅读测试中胜过人类，但TA真的看懂了吗

机器人大讲堂

3+阅读 · 2018年1月25日

Commonsense Knowledge + BERT for Level 2 Reading Comprehension Ability Test

Arxiv

4+阅读 · 2019年9月8日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

Automatic Summarization of Natural Language

Arxiv

3+阅读 · 2018年12月18日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

5+阅读 · 2018年10月5日

Knowledge Based Machine Reading Comprehension

Arxiv

4+阅读 · 2018年9月12日

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

Reciprocal Attention Fusion for Visual Question Answering

Arxiv

5+阅读 · 2018年7月22日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2018年4月10日

DVQA: Understanding Data Visualizations via Question Answering

Arxiv

8+阅读 · 2018年1月24日

What Does a TextCNN Learn?

Arxiv

8+阅读 · 2018年1月19日

VIP会员