围观别人打超级玛丽后，AI自己创造了个新游戏

2017 年 9 月 11 日 量子位 专注报道AI

安妮编译自 The Verge
量子位出品 | 公众号 QbitAI

AI会打游戏已经不是新鲜事了。微软AI打出吃豆人史上最高分，暴雪和DeepMind开发工具包教AI打星际2，用神经网络和遗传算法搭建玩Flappy Bird的AI，甚至……连DOTA顶级选手都被AI完爆。AI不断解锁新游戏，还玩得6的飞起。

相比之下，乔治亚理工学院的这项研究有些与众不同，计算机学院的Matthew Guzdial、Boyang Li、Mark O.Reiedl三人想让AI学习制作游戏。曾是“网瘾少年”的AI，也要浪子回头步入游戏制作的正经行业了？

如何创造新游戏？

在论文《Game Engine Learning from Video》中，Guzdial等人描述了一种AI系统，可在围观别人打超级玛丽后重新创造一个游戏引擎。AI系统无法获取代码，但能通过观察像素学习。重建的游戏引擎有些地方看起来不太合理，但总体看还说得过去。

这是世界首个AI创造的游戏，创造过程不易，研究人员遇到了很多困难和限制条件。万事开头难，AI没有从头开始学习过游戏。

对此，研究人员为它提供了两个数据集：一个是游戏中各种小怪的视觉词典，另一个包含了物体位置和移动速度等基本概念，AI通过这些分析它看到的场景。

△ 超级玛丽的男一和男二：马里奥与板栗仔

依靠这两个数据集，AI将游戏情节逐帧分解，并给所见的东西打上标签，自动寻找行为规则。

△ 原版洛克人游戏（左）和AI重建的洛克人（右）

在接受外媒The Verge采访时，Guzdial举例解释了AI的学习过程。“解析器分析并收集每一帧画面，比如马里奥的状态、移动速度等，”Guzdial说，“某一帧马里奥踩在板栗仔上，下一帧板栗仔就消失了。根据看到的这个场景AI学习到的新规则，当马里奥踩在板栗仔上且速度为负时，板栗仔消失。”

△ 无穷马里奥中框架解析过程的可视化

随着训练时间增加，AI将逐步建立起所有小规则，之后将它们记录成一系列逻辑语句并组合起来近似组成游戏引擎。这些规则可以被导出并转换成很多编程语言，我们又可以用这些语言重新创造新的超级玛丽游戏。

论文摘要

智能体需要去预测环境。在这篇论文中，我们提出了一种通过对输入像素的简单搜索学习正向仿真模型的新方法。

我们用游戏超级玛丽初步测试这种方法，超级玛丽代表了没有现实情况这么复杂的物理系统。我们证明了这种方法在预测未来状态上比CNN基线有显著提高，并用学习过的模型训练游戏智能体。最后，我们依据输出模型的准确性和数值来评估算法。

应用于现实生活

目前，这个系统还依赖人类定义在特定游戏中可能发生的事情，因此只能在2D平台上工作，定义3D游戏还需要更多时间以及更先进的机器视觉工具。

Guzdial团队认为，在未来，这项技术不仅可以推导出游戏原理，还有应用在现实生活中的潜力。虽然这比超级玛丽游戏要复杂得多，但并不是一个不可能的想法。“我认为未来的版本可以(分析)有限的现实领域。”Guzdial说。

最后，附上论文地址：

https://www.cc.gatech.edu/~riedl/pubs/ijcai17.pdf

也可在量子位微信公众号（ID：qbitai）会话界面回复“超级玛丽”直接下载这篇论文。

— 完 —

活动报名

加入社群

量子位AI社群8群开始招募啦，欢迎对AI感兴趣的同学，加小助手微信qbitbot3入群；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot3，并务必备注相应群的关键词~通过审核后我们将邀请进群。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

关注 7072

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文，这些论文构成了整个领域的进步，也欢迎介绍人工智能应用的论文，但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能，而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案，强调其新颖性，并对正在开发的人工智能技术进行深入的评估。官网地址：http://dblp.uni-trier.de/db/journals/ai/

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

【ACL2020】利用模拟退火实现无监督复述

专知会员服务

14+阅读 · 2020年5月26日

【MIT-ICLR2020】神经网络能推断出什么? What Can Neural Networks Reason About?

专知会员服务

44+阅读 · 2020年2月21日

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日