《星际争霸2》也沦陷,AI终于赢了人类

2019 年 1 月 25 日 科技美学

之前AI打败柯洁的时候你们就在喊,有本事打星际啊!现在你们的愿望成真了,AI真的去打星际了。

Google DeepMind的最新AI人工智能程序“AlphaStar”以两个5:0连续血洗《星际争霸2》职业选手TLO、MaNa,只是在随后的一场表现赛中输给了MaNa。

其中,TLO是Liquid战队的虫族选手,目前世界排名第68,MaNa则是2018年WSC大赛的奥斯汀站亚军,神族选手,世界排名第19。

这次是AlphaStar首次公开亮相,比赛用的游戏版本是4.6.2,只进行神族内战,固定在Catalyst LE地图。

尤其令人称奇的是,AlphaStar与两位人类对手的比赛相隔只有两周,就迅速自学成才,对战TLO时虽然完胜但表现还相当菜鸟,而对战MaNa的时候已经有了几乎的完美,非人类的操作让人猝不及防。

DeepMind科学家Oriol Vinyals、David Silver介绍说,AlphaStar的训练首先是模仿学习,训练大量的比赛回放资料,让AI通过观察一个人所处的环境,尽可能地模仿某个特定的动作,从而理解游戏基本知识。

然后使用“Alpha League”循环比赛方法,先对比从人类数据中训练出来的神经网络,然后逐次迭代,产生新的Agent和分支,使其发展壮大。

接下来,这些Agent通过强化学习过程与Alpha League中的其他竞争对手进行比赛,尽可能有效地击败所有这些不同的策略,并调整个人学习目标,鼓励竞争对手朝特定方式演进,比如说获得特定奖励。

最后在Alpha League中选择最不容易被利用的Agent,称之为“The nash of League”,去挑战人类。

至于为何选择《星际争霸2》,主要是因为这款游戏具备策略性、竞争性的特性,需要即时做出大量决策,是非常有趣和复杂的游戏,在全球都很火爆,每年都有大量的比赛,有着海量的玩家基础。

虽然挑战的并不是排行前三的大佬,但是这个成绩也已经足够优秀了。你们觉得AI什么时候能将世界前三都战胜呢?

近期文章精选:

又一款无孔手机?vivo APEX 2019媒体沟通会圆满结束

魅族zero正式发布:真无孔

老年人才用九宫格输入?输入法习惯大调查

华为要如何追赶上三星(2)

手机保值率排名,国产机型进步明显

小米为什么要去非洲?


商务合作  kejimeixue@163.com


登录查看更多
0

相关内容

Google DeepMind 是一家英国的人工智能公司。公司创建于 2010 年,最初名称是 DeepMind 科技,在 2014 年被谷歌收购。
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
见字如面:二十年,终于等到你
肿瘤资讯
7+阅读 · 2019年6月19日
论强化学习的根本缺陷
AI科技评论
11+阅读 · 2018年7月24日
DeepMind发布《星际争霸 II》深度学习环境
人工智能学家
8+阅读 · 2017年9月22日
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关论文
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
Top
微信扫码咨询专知VIP会员