人类全面溃败！AI训练4.5万年，DOTA 2人机大战大结局

会员服务 ·

人类全面溃败！AI训练4.5万年，DOTA 2人机大战大结局

2019 年 4 月 14 日 未来产业促进会

点击上方“公众号”可以订阅哦！

新智元报道

编辑：大明、张乾

【导读】OpenAI Five在Dota 2中以2:0击败了世界冠军团队，人机大战人类最终不敌AI。OpenAI Five在去年输掉比赛后进行了优化，训练时间相当于人类玩了4.5万年。

OpenAI可以宣布自己是世界第一了。

今天凌晨，OpenAI Five在Dota 2中以2:0击败了世界冠军团队OG，再次显示出了AI的强大威力，也正式宣告人类在Dota这种高难度游戏中成为AI的手下败将。

这次比赛，OpenAI Five的表现出是迄今为止展示出的最高水平：人类对手去年赢得了世界上最令人垂涎的电子竞技赛事TI8的冠军；OpenAI Five在去年输掉比赛后进行了优化，训练时间相当于人类玩了4.5万年，赢得比赛也并不出乎意料。

人类对手OG团队

2:0，AI战胜人类

在这场人机大战中，每队只有17个英雄可供选择。 OpenAI还选择了所谓的“Captain's Draft”游戏模式。与之前的比赛一样，OpenAI也禁用了召唤和幻觉功能，这两项功能都涉及以英雄副本的形式引入其他变量，以及OpenAI训练系统时未考虑的一些特殊因素和单位。

除此之外，这场比赛与正常的Dota 2比赛一样，其最终目标是摧毁敌方队伍的“基地”，即每个团队领土末端的大型塔楼，在敌人的队伍成功摧毁其他小型塔后，基地是很脆弱的，整个比赛过程的中心是对塔的攻防，以及英雄与英雄之间的团战。

在第一场比赛中，OpenAI Five让对手OG大吃一惊，通过一系列激进战术获得了胜利，其中包括对游戏中获取的金币的花费方式，在本方英雄死亡时立即买活，即使在比赛初期也是如此。

对此，OpenAI首席技术官Greg Brockman指出，OpenAI喜欢有利于短期收益的战略，说明在长期规划上不如人类，而且DOTA2这种游戏通常要依赖于长期规划才能获胜。然而，在这场比赛中，这种早期的买活策略得到了回报，OpenAI Five获得了优势，当比赛拖入30分钟时，OG顶不住了。

在第二场比赛中，OpenAI表现更好，在最初的几分钟内即获得了对OG的早期优势，然后无情碾压了人类玩家，在第一场比赛时间刚刚过半的时间点上即取得胜利。

值得注意的是，OpenAI Five在第二场比赛中开始玩得异常激进，以及OG在AI全图范围内的推进时有些无力对抗。OpenAI Five能够利用其特定的英雄选择带来的优势。

飞速进化的OpenAI Five：已经训练4.5万年

去年8月，OpenAI Five曾以3:2击败半职业人类玩家，不过当面对职业对手时，OpenAI便输给了paiN Gaming战队，帅不过三秒。

根据OpenAI联合创始人兼主席Greg Brockman（也是该组织的CTO）的说法，在输掉比赛之后，OpenAI Five是通过在加速的虚拟环境中进行自我改进而变得更加强大的。

OpenAI Five由深度强化学习提供支持，也就是说它的编码目的不是“如何游戏”，而是“如何学习”。Brockman在比赛开始前表示。，AI在10个月中，已经玩了45000年的Dota 2游戏，而且，玩了这么长时间也没有觉得无聊。

这场比赛采用三局两胜制，所有bot都使用相同的深度强化学习技术进行训练，并由同一OpenAI系统的不同层独立控制。

OpenAI向公众开放与AI对决，终极目标是实现通用人工智能

对于OpenAI来说，值得庆祝的不仅仅是这次胜利，还因为其证明了对强化学习的态度及其关于AI的普适哲学树立的里程碑。

研究团队将不再公开展示其AI 游戏bot，而是致力于开发软件，让人类与OpenAI Five软件实时协作，与机器人一起玩游戏，并学习他们独特的前所未有的战略和行为。

OpenAI Five还发布了一个平台，供公众与OpenAI Five对战，这种模式称为“竞技场”模式，将于4月18日起开放三天。OpenAI表示，协作软件可能永远不会向公众开放，不过大家可以在活动中亲自尝试一下。

OpenAI的联合创始人兼首席执行官Sam Altman还表示，此类工作证明了与AI智能体的合作可能会在未来带来巨大的利益。

Altman说：“对于世界如何运作，如何训练这些智能体，令其实现协作上，这次活动是重要的一课。实现人类与AI的合作，是我们对未来世界更积极的愿景之一，人工智能与人类共同努力，使人类变得更好、更有趣、更有影响力。”

OpenAI可能会继续涉足Dota 2和其他视频游戏，主要是因为这些游戏是人工智能的良好测试平台，也是衡量AI技术进步的良好基准测试工具。

现在可能还没有一个游戏像OpenAI Five这样，AI系统最终无法具备超出人类能力的水平。对于更广泛的AI行业而言，精通视频游戏可能很快就会变得过时，我们需要简单的方式来证明AI系统可以快速学习，并能够更快速高效地的解决现实世界的困难任务，获得更有意义的好处。

最终，OpenAI希望将其Dota 2学习并扩展到游戏之外的新领域，并最终扩展到现实世界中。为此，OpenAI正致力于使用强化学习和其他技术，为机器人手提供更灵巧、更精细、更人性化的动作。

“OpenAI正在努力的方向建立通用人工智能（AGI），并与世界分享这些好处，同时确保其安全性。”Altman说的是建立一个能够执行任何人类任务的多功能AI系统。“我们的目标不是战胜电子游戏，虽然这很有趣。我们的目标是揭开实现AGI道路上的秘密。”

参考链接：

https://www.theverge.com/2019/4/13/18309459/openai-five-dota-2-finals-ai-bot-competition-og-e-sports-the-international-champion

　　注：投稿请电邮至124239956@qq.com ，合作或加入未来产业促进会请加：www13923462501 微信号或者扫描下面二维码：

　　文章版权归原作者所有。如涉及作品版权问题，请与我们联系，我们将删除内容或协商版权问题!联系QQ：124239956

登录查看更多

相关内容

OpenAI

关注 27

OpenAI，由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后，决定共同创建OpenAI，希望能够预防人工智能的灾难性影响，推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔（Peter Thiel）以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

专知会员服务

24+阅读 · 2020年2月17日

Google AI发布Meena-构建一个无所不聊的含26亿参数模型的聊天机器人

专知会员服务

54+阅读 · 2020年1月29日