玩冰壶也在行?投掷冰壶的机器人组合,3:2击败韩国国家队选手

2020 年 10 月 1 日 新智元


  新智元报道  

来源:wired

编辑:小匀

【新智元导读】冰壶是一个「细致入微」的运动项目,掌握这门运动需要巧妙的技巧与策略。在近日Science的子刊《科学-机器人》中,来自韩国和柏林的研究人员训练了一组机器人Curly,它们在比赛中击败了韩国国家队队员,又是一个AI胜出的人机大战!


在很多体育项目中,机器人都取得了不凡的成绩。例如,在棋类等领域,已经有许多出手不凡能战胜专业选手的AI了。


最近,Science子刊《科学-机器人》上发表了一篇研究,一个名为Curly的机器人刚刚掌握了冰壶运动的技巧,就击败了两个韩国国家队。



与现实世界精确交互


高丽大学的研究人员位于首尔和柏林技术学院的研究人员设计了Curly,以测试「人工智能系统与高度不稳定的现实世界场景交互」。


换句话说,Curly能够观察现实世界,然后以精确而战略性的方式采取相应行动。



实际上,Curly是一个由两个机器人组成的团队,其中一个机器人观察得分位置,而另一个则负责完成投掷。虽然,目前没有其他机器人来完成磨冰动作,但再造一个这样的磨冰机器人也不是不可能。



Curly的形状有点像一个扁平的泪珠,有两个前轮和一个后轮。考虑到人类在冰上行走已经够困难的了,更不用说机器人了,所以,研究人员给Curly加了轮子。机器人还配备了两个摄像头,其中一个高达7英尺,这可以让机器人看到各方位的全景,而另一个则在它的前轮上方。

       



又是深度强化学习?


Curly的四个小轮子排成U形,前轮用于抓住冰壶,它们由传送带提供动力,传送带使冰壶旋转,就像人类玩家的操作一样,当沿顺时针旋转时,冰壶会向右卷曲;逆时针旋转则向左。




Curly的程序完全通过电脑游戏来进行训练,和很多「人机大战」的技术一样,Curly使用的也是「深度强化学习技术」,这能在程序边纠正自己的错误边改进。

       



深度强化学习在很多决策领域当中都取得了比较不错的结果,尤其是在游戏,多个游戏已经达到甚至是超过了人类水平。


基于深度强化学习,DeepMind研发的AlphaGo Zero在不使用任何人类围棋数据的前提下,在围棋上完虐人类;OpenAI研发的Dota Five则在Dota游戏上达到了人类玩家的顶尖水平;DeepMind研发的AlphaStar在星际争霸游戏上同样击败了人类职业玩家。


3:1!Curly赢了职业选手


在训练时,冰壶和冰都是用物理模型来模拟的。这样,研究人员就可以观察训练的情况如何,当然,这取决于模型的精准性。结果证明,训练的效果非常好,Curly只需要在每一场比赛的开始投一次冰壶,就能熟悉不同的情况,比如冰面是否足够光滑让冰壶划走。



Curly果然不负众望,在四轮比赛中赢了三场。但也有人发出质疑,如果加入擦扫冰面的条件出现,但对于一个机器人来说,这个成就已经非常值得骄傲了。


研究人员指出,这是一项重要的成就,不仅因为这证明了机器人在这项运动中具有竞争力,这项研究也涉及未来现实世界中实时的动态观察和决策。


因此,对于AI和机器人而言,这都是一个里程碑,而且对在模拟环境中训练此类机器人大有帮助。因为尽管在这几年,类似的研究还不足以达到这么明显的效果。


推荐阅读:

谷歌给听障人士按下静音键,AI的世界没有包容?


参考链接:

https://www.wired.com/story/meet-curly-the-curling-robot-that-beats-the-pros/



登录查看更多
1

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
124+阅读 · 2020年8月27日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
不对称多代理博弈中的博弈理论解读
AI前线
13+阅读 · 2018年3月8日
Arxiv
0+阅读 · 2020年11月30日
Arxiv
0+阅读 · 2020年11月30日
Arxiv
0+阅读 · 2020年11月27日
Arxiv
0+阅读 · 2020年11月27日
VIP会员
Top
微信扫码咨询专知VIP会员