牛津教授吐槽DeepMind心智神经网络，还推荐了这些多智能体学习论文

2020 年度新知答主

夏乙发自凹非寺
量子位出品 | 公众号 QbitAI

DeepMind最近又有一篇论文刷了屏：

在Machine Theory of Mind中，DeepMind提出了“机器心智理论网络”ToMnet，让AI智能体能理解自己和周围智能体的情绪、意图、欲望等等。他们在论文摘要中这样陈述这篇论文的价值：推进可解释性AI发展的重要一步。

论文地址：[1802.07740] Machine Theory of Mind

和历史上的每一篇刷屏论文一样，flag立得太高，当然会招来反对。

这次提出质疑的，不少我们熟悉的马库斯老师了，而是牛津大学计算机科学专业副教授希蒙（Shimon Whiteson）。

希蒙上周读完这篇论文之后，大概心里堆积了太多的槽点，于是连发10条Twitter想要一吐为快。他说：

我其实很喜欢这篇论文的想法，用元学习方法来为对手建模。但是，深度学习圈写论文的那些毛病，这篇论文就是个极度恶劣的样本！

说起“深度学习圈那些毛病”，你们大概能想到一个老生常谈的问题：Over Claim。

重要一步？

希蒙主要针对的，就是DeepMind所宣称的“重要一步”。

“重要一步”这样的定位，就算那些提出新想法、新概念、新问题的开创性论文上，用起来也是小心翼翼，何况DeepMind这一篇，无论如何也谈不上开创性。

希蒙批判这篇论文说，它没有讲理论，实验领域简单得跟玩儿似的，算法上的贡献也简直微不足道，只不过是网络架构的一些工程性处理。那如果还能找出“重要一步”，就只能是提出了什么重大的新想法吧？

想法新不新，要看“相关研究”那部分。可是这篇论文它……没有Related Work部分……

深度学习健忘症

这也就牵扯到了深度学习圈外人对圈里人的另一大意见：贵圈写论文之前会不会读一下相关文献？研究者们还专门给这个问题起了个名字，叫“深度学习健忘症（Deep Learning Amnesia）”。

回到DeepMind这篇论文本身。希蒙认为，这篇论文主要讲的是多智能体学习领域一个并不冷门的主题：对手建模（opponent modelling）。但是，全文从头到尾都没有提到这个概念。

在多智能体学习领域，有一种历史悠久的著名方法，叫做虚构对策（fictitious play），DeepMind提都没有提；多智能体环境中的对手建模，有一个完整的推理框架，叫做交互式的部分可观察马尔科夫决策过程（Interactive POMDPs），DeepMind也完全忽略了。

希蒙老师敲黑板：同学们，随便浏览一篇多智能体学习的综述文章，这些文献都提到了啊！

可是DeepMind这一篇，引用的相关文献完全跳过了这个领域，倒是谈了不少心智理论和贝叶斯。

对于“健忘症”这个问题，论文一作、DeepMind研究员Neil Rabinowitz在Twitter上回复说，这些文献他们是知道的，但是在introduction里不知道怎么的就忘了引用了。现在arXiv上更新的第二版论文中，已经加上了这些该引用的文献。

“相关研究”

不过，大部分论文中都有的“相关研究”那一节，还是没写。

对此，有一位前来吐槽的围观群众说得好：要不咱们给DeepMind众包个“相关研究”吧？

这显然不是个可行的解决之道，不过对于想爱学习的同学们来说，也不是非要看这一篇论文嘛，多智能体学习这个领域有不少文献综述可以读。

希蒙就列出了两篇：

A Comprehensive Survey of Multiagent Reinforcement Learning
A Comprehensive Survey of Multiagent Reinforcement Learning
A Framework for Sequential Planning in Multi-Agent Settings
https://www.jair.org/media/1579/live-1579-2391-jair.pdf

围观群众Katja Hofmann也贡献了一篇：

Autonomous Agents Modelling Other Agents: A Comprehensive Survey and Open Problems
A Comprehensive Survey and Open Problems

关于希蒙

对DeepMind开炮的希蒙是牛津大学计算机专业研究人工智能和机器学习方向的副教授，带领着WhiRL（Whiteson Research Lab），研究领域主要涉及强化学习、深度学习等，以及它们在机器人、游戏、信息检索上的应用。

他带领着学生们发表过不少很有名的论文，比如LipNet、比如和Pieter Abbeel合作的Learning with Opponent−Learning Awareness等等。

要详细了解希蒙老师，可以去他们实验室的主页看看：Whiteson Research Lab

— 完 —

欢迎大家关注我们的专栏：量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

发布于 2018-03-18 19:59

DeepMind

强化学习 (Reinforcement Learning)

人工智能算法

重要一步？

深度学习健忘症

“相关研究”

关于希蒙

文章被以下专栏收录

量子位