会员服务 ·

DOTA 2血虐人类的OpenAI，原来靠的是作弊？

2018 年 8 月 21 日 量子位

郭一璞捣塔栗发自凹非寺
量子位报道 | 公众号 QbitAI

两周前，AI战队OpenAI Five还处在DOTA2击败人类的得意中；

两周后，它就陷入了作弊疑云。

美国媒体Motherboard指出了OpenAI Five在这场人机大战中的几个可疑之处。

没有BP

头一项就是BP的问题。

不管是DOTA、LOL还是王者荣耀，MOBA游戏的玩家都知道，BP（ban pick）机制是保证游戏公平的重要一环，其中也体现了玩家双方团队斗智斗勇的过程。

BP发生在游戏开始前的选英雄过程，双方轮流禁掉部分英雄，然后再轮流选择英雄。

禁掉哪位强势英雄或者对方玩家擅长的英雄，选择怎样的英雄阵容，依据对方的阵容如何进行克制，是BP中玩家需要考虑的问题。

这个过程不禁考验双方对不同英雄的了解和熟练程度，更是一个耍心机的战场，BP是双方团队默契配合与策略博弈的一部分，也是MOBA游戏的重要组成部分。

△ DOTA2中文官网的英雄目录

目前DOTA2中有115位英雄，然而，在8月6日早上（北京时间）的人机大战中，由于OpenAI Five还没有学会这么多英雄，所以整场比赛只有18个英雄可供选择。

这么少的英雄数量若是还要ban英雄的话，那恐怕是没得选了。所以双方都只是象征性的走流程，ban掉了一些不在这18个英雄范围内的英雄，就开始选英雄了。

BP的策略关被AI省掉了，相当于给AI降低了难度。

我用眼睛，你却用API

在AI打游戏这件事上，交互方式是最让人关注的问题之一。

对于人脑而言，打游戏时的输入是视觉&听觉信号，人类玩家需要用眼睛和耳朵这两种“传感器”来接受信号，传送到大脑中，判断游戏中的情景，知道敌人离我有多远、队友能否来得及支援、双方经济状况如何。

而对AI而言却容易多了，在这场比赛中，OpenAI Five可不长眼睛，而是直接靠API读取游戏中的数据。

这一点，在推特上引起了热烈的讨论。

有许多观众觉得，人类和AI打的根本不是一个比赛。

佐治亚理工学院 (Georgia Tech) 教授Mark Riedl说，虽然那个API的设计初衷，就是不让AI拥有的信息多过人类能获取的信息，但AI只有依靠视觉，才是和人类站在同一片战场。

不过，使用因为使用API而拥有优势，算不算作弊，依然有争论，毕竟这是官方赛前发布的消息。

但它确实不公平，因为这些数据带给AI的是100%的精确性。

比如说，当人类需要确认攻击能否打到敌人身上时，基本靠目测，如果低估了距离就会打不到敌人，如果高估了距离则容易受到敌人的攻击。而接收API数据的AI则可以通过计算卡在最远的距离上攻击敌人，或是在最佳的站位上发起进攻，足以保证自己的损失最小。

△ Capitalist

这次人机大战中的人类队员、DOTA2解说、半职业选手Capitalist（Austin Walsh）就对此感到十分扎心：

“AI清楚地知道每个英雄的位置，知道你拥有多少攻击力，它确切地知道一条路上的三、四个英雄可以造成多大的伤害。并且，当你的走位出现问题时，它会立即开团。我从来没这么玩过，这简直鹅妹子嘤。”

反之，让AI用视觉打游戏，并不简单。DeepMind用AI打星际的主力Oriol Vinyal，就让AI用视觉打过星际。用着64x64的输入，AI吃了大亏。

大概，在依靠视觉这一目标达成之前，不管AI解锁多少英雄、多少物品，赢过多少顶级人类选手，也不能算是称霸DOTA 2。

我用鼠标，你却用意念

输出也同样不公平。

人类要输出操作信息，必须使用鼠标和键盘，控制技能施放、控制走位全都依赖于键鼠。而AI则连手指都不需要动，一个指令就直接操作了，使用“意念”控制，简直比人类用宏编程鼠标玩游戏还简单。

宏编程鼠标，就是上面这玩意，通常我们都叫它游戏鼠标，除了左键右键滚轮之外，还在中间、侧面等位置加装了许多按键，可以用宏来把这些新增的按键设计成不同的游戏按钮，一键完成许多复杂的操作，让玩家操作起来更简单。

不过，在正式DOTA2比赛中，使用宏编程鼠标是违规的。今年6月，秘鲁队就因为一名队员在资格赛中使用了宏编程鼠标而被取消了TI8的比赛资格，秘鲁队不得不和2479万美元的奖金池say goodbye了。所以，OpenAI Five这种使用“意念”的操作模式也可以算作弊。

更何况，在队友配合方面，AI用的也是“意念”。

人类队伍有5个人，需要用语言交流配合；而OpenAI Five的“团队”活在同一块U盘里，它们之间压根不用沟通，直接“心灵感应”就可以了，简直不要太轻松。

说好的200毫秒呢？

另外，赛前OpenAI团队表示，在人机对战中会把AI的反应时间，下调到与人类相似的200毫秒，以求公平竞争。

可在赛后，由于AI赢得过于轻松，反应速度受到了观众的强烈质疑。

“肯定比200毫秒快”，这样的声音此起彼伏。

△ “这是扯淡！”

如果说，API是一早就公布了的信息，算不得作弊，那反应速度若有虚报，就是另一回事了。

然而，这个怀疑并没有得到OpenAI的官方回应。

不公平 = 作弊？

这场比赛是存在不公平的因素，但若强硬地表述为AI作弊，在许多人看来仍然有失偏颇。

比如，提出“AI该靠视觉来跟人类同场竞技”的Mark Riedl教授本人，就很排斥这个说法。

他觉得，OpenAI并没有隐藏AI的任何优势。尽人皆知的事，很难用“作弊”来定义。

另外，Riedl在深知这些的情况下，依然认为在DOTA2 5v5团战中战胜人类，是非常了不起的成就。

他看到，AI游刃有余，只要对手所处的位置不利，便可瞬间发动攻击。于是，获得了和现场观众一样的美妙感受。

毕竟，神经网络与人脑之间依然存在很大的差别，对人类来说自然而然的事，机器也要一点一点学起来。

这样想来，虽然比赛是在严格控制的环境下进行的，AI也算赢得漂亮。

TI8敬请期待

无论作弊的定义是否准确，人类都已经从被AI摩擦的恐惧里，感受到了OpenAI Five的强大。

所以，大家还是希望看到一场更加公平的比赛，不论是为人类正名也好，反向衬托AI的实力也罢。

如果，上一场5v5没有让各位心服口服，OpenAI Five不日将出战TI8。希望那时，顶级人类选手和AI之间的比赛，大家能看个过瘾。

你猜，和AI打比赛的会是哪支队？

— 完 —

活动推荐

加入社群

量子位AI社群19群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

OpenAI

关注 0

OpenAI，由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后，决定共同创建OpenAI，希望能够预防人工智能的灾难性影响，推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔（Peter Thiel）以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。