DOTA 2血虐人类的OpenAI,原来靠的是作弊?

2018 年 8 月 21 日 量子位
郭一璞 捣塔栗 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

两周前,AI战队OpenAI Five还处在DOTA2击败人类的得意中;

两周后,它就陷入了作弊疑云。

美国媒体Motherboard指出了OpenAI Five在这场人机大战中的几个可疑之处。

没有BP

头一项就是BP的问题。

不管是DOTA、LOL还是王者荣耀,MOBA游戏的玩家都知道,BP(ban pick)机制是保证游戏公平的重要一环,其中也体现了玩家双方团队斗智斗勇的过程。

BP发生在游戏开始前的选英雄过程,双方轮流禁掉部分英雄,然后再轮流选择英雄。

禁掉哪位强势英雄或者对方玩家擅长的英雄,选择怎样的英雄阵容,依据对方的阵容如何进行克制,是BP中玩家需要考虑的问题。

这个过程不禁考验双方对不同英雄的了解和熟练程度,更是一个耍心机的战场,BP是双方团队默契配合与策略博弈的一部分,也是MOBA游戏的重要组成部分。



 DOTA2中文官网的英雄目录

目前DOTA2中有115位英雄,然而,在8月6日早上(北京时间)的人机大战中,由于OpenAI Five还没有学会这么多英雄,所以整场比赛只有18个英雄可供选择。

这么少的英雄数量若是还要ban英雄的话,那恐怕是没得选了。所以双方都只是象征性的走流程,ban掉了一些不在这18个英雄范围内的英雄,就开始选英雄了。

BP的策略关被AI省掉了,相当于给AI降低了难度。

我用眼睛,你却用API

在AI打游戏这件事上,交互方式是最让人关注的问题之一。



对于人脑而言,打游戏时的输入是视觉&听觉信号,人类玩家需要用眼睛和耳朵这两种“传感器”来接受信号,传送到大脑中,判断游戏中的情景,知道敌人离我有多远、队友能否来得及支援、双方经济状况如何。

而对AI而言却容易多了,在这场比赛中,OpenAI Five可不长眼睛,而是直接靠API读取游戏中的数据。

这一点,在推特上引起了热烈的讨论。

有许多观众觉得,人类和AI打的根本不是一个比赛。



佐治亚理工学院 (Georgia Tech) 教授Mark Riedl说,虽然那个API的设计初衷,就是不让AI拥有的信息多过人类能获取的信息,但AI只有依靠视觉,才是和人类站在同一片战场

不过,使用因为使用API而拥有优势,算不算作弊,依然有争论,毕竟这是官方赛前发布的消息。

但它确实不公平,因为这些数据带给AI的是100%的精确性。

比如说,当人类需要确认攻击能否打到敌人身上时,基本靠目测,如果低估了距离就会打不到敌人,如果高估了距离则容易受到敌人的攻击。而接收API数据的AI则可以通过计算卡在最远的距离上攻击敌人,或是在最佳的站位上发起进攻,足以保证自己的损失最小。



 Capitalist

这次人机大战中的人类队员、DOTA2解说、半职业选手Capitalist(Austin Walsh)就对此感到十分扎心:

“AI清楚地知道每个英雄的位置,知道你拥有多少攻击力,它确切地知道一条路上的三、四个英雄可以造成多大的伤害。并且,当你的走位出现问题时,它会立即开团。我从来没这么玩过,这简直鹅妹子嘤。”

反之,让AI用视觉打游戏,并不简单。DeepMind用AI打星际的主力Oriol Vinyal,就让AI用视觉打过星际。用着64x64的输入,AI吃了大亏。


大概,在依靠视觉这一目标达成之前,不管AI解锁多少英雄、多少物品,赢过多少顶级人类选手,也不能算是称霸DOTA 2。

我用鼠标,你却用意念

输出也同样不公平。

人类要输出操作信息,必须使用鼠标和键盘,控制技能施放、控制走位全都依赖于键鼠。而AI则连手指都不需要动,一个指令就直接操作了,使用“意念”控制,简直比人类用宏编程鼠标玩游戏还简单。



宏编程鼠标,就是上面这玩意,通常我们都叫它游戏鼠标,除了左键右键滚轮之外,还在中间、侧面等位置加装了许多按键,可以用宏来把这些新增的按键设计成不同的游戏按钮,一键完成许多复杂的操作,让玩家操作起来更简单。

不过,在正式DOTA2比赛中,使用宏编程鼠标是违规的。今年6月,秘鲁队就因为一名队员在资格赛中使用了宏编程鼠标而被取消了TI8的比赛资格,秘鲁队不得不和2479万美元的奖金池say goodbye了。所以,OpenAI Five这种使用“意念”的操作模式也可以算作弊。

更何况,在队友配合方面,AI用的也是“意念”。

人类队伍有5个人,需要用语言交流配合;而OpenAI Five的“团队”活在同一块U盘里,它们之间压根不用沟通,直接“心灵感应”就可以了,简直不要太轻松。

说好的200毫秒呢?

另外,赛前OpenAI团队表示,在人机对战中会把AI的反应时间,下调到与人类相似的200毫秒,以求公平竞争。

可在赛后,由于AI赢得过于轻松,反应速度受到了观众的强烈质疑。

“肯定比200毫秒快”,这样的声音此起彼伏。



 “这是扯淡!”

如果说,API是一早就公布了的信息,算不得作弊,那反应速度若有虚报,就是另一回事了。

然而,这个怀疑并没有得到OpenAI的官方回应。

不公平 = 作弊?

这场比赛是存在不公平的因素,但若强硬地表述为AI作弊,在许多人看来仍然有失偏颇。

比如,提出“AI该靠视觉来跟人类同场竞技”的Mark Riedl教授本人,就很排斥这个说法。

他觉得,OpenAI并没有隐藏AI的任何优势。尽人皆知的事,很难用“作弊”来定义。

另外,Riedl在深知这些的情况下,依然认为在DOTA2 5v5团战中战胜人类,是非常了不起的成就。

他看到,AI游刃有余,只要对手所处的位置不利,便可瞬间发动攻击。于是,获得了和现场观众一样的美妙感受。

毕竟,神经网络与人脑之间依然存在很大的差别,对人类来说自然而然的事,机器也要一点一点学起来。

这样想来,虽然比赛是在严格控制的环境下进行的,AI也算赢得漂亮。

TI8敬请期待

无论作弊的定义是否准确,人类都已经从被AI摩擦的恐惧里,感受到了OpenAI Five的强大。

所以,大家还是希望看到一场更加公平的比赛,不论是为人类正名也好,反向衬托AI的实力也罢。

如果,上一场5v5没有让各位心服口服,OpenAI Five不日将出战TI8。希望那时,顶级人类选手和AI之间的比赛,大家能看个过瘾。



你猜,和AI打比赛的会是哪支队?

活动推荐

加入社群

量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


登录查看更多
0

相关内容

OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
126+阅读 · 2020年7月10日
【ACL2020-Allen AI】预训练语言模型中的无监督域聚类
专知会员服务
23+阅读 · 2020年4月7日
【论文】欺骗学习(Learning by Cheating)
专知会员服务
26+阅读 · 2020年1月3日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
卷及网络的弱点,有人想用胶囊网络给解决掉
人工智能头条
6+阅读 · 2018年11月21日
论强化学习的根本缺陷
AI科技评论
11+阅读 · 2018年7月24日
想轻松复现深度强化学习论文?看这篇经验之谈
机器之心
4+阅读 · 2018年4月10日
分析 | 盘点人工神经网络超过人类的6个领域
网易智能菌
5+阅读 · 2017年12月12日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员