观看5万个游戏视频后,英伟达AI学会了自己开发「吃豆人」

2020 年 5 月 23 日 量子位
晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

AI学会玩游戏已经不是什么新鲜事了,无论是星际争霸还是王者荣耀,AI的水平都已经超过了顶级选手。

现在,AI不仅能玩游戏,还学会了造游戏。

在观看了5万个的吃豆人(Pac-Man)游戏视频后,英伟达的AI终于自己“山寨”了一个,而且事先没有看过一行原始游戏代码。

来自英伟达的研究人员说:通过观察细节,AI学会了规则。

这些细节包括:吃豆人的速度、移动能力;四个鬼魂的运动方式;吃豆人吃下大力丸会怎样;当鬼魂碰到吃豆人时,会发生什么。

知道这些细节后,AI完成了逆向工程,从中悟出了游戏逻辑,有模有样地仿制出来:

英伟达这个逆向游戏的AI叫GameGAN,顾名思义,就是用来生成游戏的GAN。GAN之前的用途主要是生成图片。

5月22日是吃豆人这款游戏的40岁生日,英伟达在这一天推出GameGAN,是和吃豆人的游戏开发商万代南梦宫合作的纪念活动。

GameGAN制造的游戏,连万代南梦宫工程师堤光一郎看到后都大吃一惊:“很难想象这是在没有游戏引擎的情况下重新创造出吃豆人。”

不知道这位游戏开发者会不会有某一天被AI替代的恐惧。

英伟达是如何做到的

GameGAN在训练过程中会读取游戏画面和键盘操作,通过限制操作(如玩家按下的按钮)来预测下一帧。它直接利用图像和动作对进行学习,而无需访问底层的逻辑或引擎。

解码器要学习如何解开帧中的静态和动态分量,从而使GameGAN的行为更易于解释。

要做到这一点,研究人员需要克服巨大的设计挑战,要让模拟物理引擎并保持长期一致性(保证模拟场景不随事件编号),还必须确保GameGAN在创建游戏过程中模拟的可预测性与随机性(在一定规则内设计出不同关卡)。

GameGAN由3个部分组成:记忆模块,动力学引擎和渲染引擎。       

动力学引擎负责了解在游戏环境中哪些行为是“不允许的”(比如吃豆人无法穿墙而过),并负责对行为结果的反应方式进行建模。

内存模块负责建立长期一致性,让模拟场景不会随时间而变化,这部分是通过“记住”每个生成的场景来实现的。

渲染引擎负责渲染给定对象和属性贴图的模拟图像,并通过遮挡对象自动考虑深度。

GameGAN是生成对抗网络,当然也会有生成器和鉴别器,在这套模型中,系统尝试“欺骗”鉴别器来生成逼真的、连贯的游戏。鉴别器有三个:单图像鉴别器,行动条件鉴别器和时间鉴别器。

训练GameGAN的游戏数据由万代南梦宫提供,包括5万个游戏视频,总共有几百万帧。为了训练AI,英伟达的研究人员动用了4台DGX系统,每台均配备了Quadro GV100工作站级GPU。

英伟达并未透露训练时间,但是可以预测训练费用一定不菲。

训练AI的硬件

Nvidia的最新实验以类似的方式开始,因为其AI研究团队在50,000小时的“ 吃豆人”游戏中训练了四台计算机场(每台计算机均配备了Quadro GV100工作站级GPU)。

在实验中,Nvidia团队在四天内为GameGAN提供了50,000集(共几百万帧)的《吃豆人》

不仅仅是吃豆人

除了吃豆人外,英伟达还在Doom的基础上开发出了另一款《毁灭战士》。

比吃豆人负责的是,毁灭战士是一款3D游戏,GameAI还需要处理游戏前景和背景的遮挡关系。

当然,无论是吃豆人还是毁灭战士,英伟达GameGAN生成的画面都比较粗糙。研究人员承认现有模型存在着保真度问题。GameGAN生成的吃豆人游戏最大可达到128×128像素的分辨率,每秒约50帧。

但是这项技术有希望帮助游戏开发者加快开发新关卡、角色甚至代替部分游戏的创作过程。

对于一些用户可以自定义的游戏,比如《超级马里奥创造家》,AI是不是可以帮我们设计一下关卡呢?

传送门

论文地址:

https://cdn.arstechnica.net/wp-content/uploads/2020/05/Nvidia_GameGAN_Research.pdf

项目主页:

https://nv-tlabs.github.io/gameGAN/

作者系网易新闻·网易号“各有态度”签约作者


免费NLP直播课

图卷神经网络、BERT、对话生成、知识图谱

京东智联云&贪心学院联合举办,两周NLP系列直播,讲透图卷积神经网络、BERT、对话生成、知识图谱、词嵌入


第一场《基于知识图谱和图卷积神经网络的应用和开发》杨栋

第二场《深入浅出词嵌入技术》李文哲

第三场《BERT模型精讲》徐路

第四场《对话系统的中的生成问题》郑银河


扫码添加助教,进入直播交流群~



量子位 QbitAI · 头条号签约作者


վ'ᴗ' ի 追踪AI技术和产品新动态


喜欢就点「在看」吧 !


登录查看更多
1

相关内容

NVIDIA(全称NVIDIA Corporation,NASDAQ:NVDA,发音:IPA:/ɛnvɪdɪə/,台湾官方中文名为輝達),创立于1993年4月,是一家以设计显示芯片和芯片组为主的半导体公司。NVIDIA亦会设计游戏机核心,例如Xbox和PlayStation 3。NVIDIA最出名的产品线是为个人与游戏玩家所设计的GeForce系列,为专业工作站而设计的Quadro系列,以及为服务器和高效运算而设计的Tesla系列。 NVIDIA的总部设在美国加利福尼亚州的圣克拉拉。是一家无晶圆(Fabless)IC半导体设计公司。"NVIDIA"的读音与英文"video"相似,亦与西班牙文evidia(英文"envy")相似。现任总裁为黄仁勋。
专知会员服务
54+阅读 · 2020年7月4日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
人工智能学习笔记,247页pdf
专知会员服务
173+阅读 · 2019年12月14日
【自监督学习】OpenAI科学家一文详解自监督学习
产业智能官
25+阅读 · 2020年3月18日
机器学习:从入门到晋级
云栖社区
4+阅读 · 2018年11月21日
无需干净样本,英伟达AI去马赛克
AR酱
10+阅读 · 2018年7月13日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Arxiv
7+阅读 · 2018年6月19日
Arxiv
5+阅读 · 2018年6月5日
VIP会员
相关资讯
【自监督学习】OpenAI科学家一文详解自监督学习
产业智能官
25+阅读 · 2020年3月18日
机器学习:从入门到晋级
云栖社区
4+阅读 · 2018年11月21日
无需干净样本,英伟达AI去马赛克
AR酱
10+阅读 · 2018年7月13日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
Top
微信扫码咨询专知VIP会员