玩冰壶也在行？投掷冰壶的机器人组合，3:2击败韩国国家队选手

会员服务 ·

玩冰壶也在行？投掷冰壶的机器人组合，3:2击败韩国国家队选手

2020 年 10 月 1 日 新智元

新智元报道

来源：wired

编辑：小匀

【新智元导读】冰壶是一个「细致入微」的运动项目，掌握这门运动需要巧妙的技巧与策略。在近日Science的子刊《科学-机器人》中，来自韩国和柏林的研究人员训练了一组机器人Curly，它们在比赛中击败了韩国国家队队员，又是一个AI胜出的人机大战！

在很多体育项目中，机器人都取得了不凡的成绩。例如，在棋类等领域，已经有许多出手不凡能战胜专业选手的AI了。

最近，Science子刊《科学-机器人》上发表了一篇研究，一个名为Curly的机器人刚刚掌握了冰壶运动的技巧，就击败了两个韩国国家队。

与现实世界精确交互

高丽大学的研究人员位于首尔和柏林技术学院的研究人员设计了Curly，以测试「人工智能系统与高度不稳定的现实世界场景交互」。

换句话说，Curly能够观察现实世界，然后以精确而战略性的方式采取相应行动。

实际上，Curly是一个由两个机器人组成的团队，其中一个机器人观察得分位置，而另一个则负责完成投掷。虽然，目前没有其他机器人来完成磨冰动作，但再造一个这样的磨冰机器人也不是不可能。

Curly的形状有点像一个扁平的泪珠，有两个前轮和一个后轮。考虑到人类在冰上行走已经够困难的了，更不用说机器人了，所以，研究人员给Curly加了轮子。机器人还配备了两个摄像头，其中一个高达7英尺，这可以让机器人看到各方位的全景，而另一个则在它的前轮上方。

又是深度强化学习？

Curly的四个小轮子排成U形，前轮用于抓住冰壶，它们由传送带提供动力，传送带使冰壶旋转，就像人类玩家的操作一样，当沿顺时针旋转时，冰壶会向右卷曲；逆时针旋转则向左。

Curly的程序完全通过电脑游戏来进行训练，和很多「人机大战」的技术一样，Curly使用的也是「深度强化学习技术」，这能在程序边纠正自己的错误边改进。

深度强化学习在很多决策领域当中都取得了比较不错的结果，尤其是在游戏，多个游戏已经达到甚至是超过了人类水平。

基于深度强化学习，DeepMind研发的AlphaGo Zero在不使用任何人类围棋数据的前提下，在围棋上完虐人类；OpenAI研发的Dota Five则在Dota游戏上达到了人类玩家的顶尖水平；DeepMind研发的AlphaStar在星际争霸游戏上同样击败了人类职业玩家。

3:1！Curly赢了职业选手

在训练时，冰壶和冰都是用物理模型来模拟的。这样，研究人员就可以观察训练的情况如何，当然，这取决于模型的精准性。结果证明，训练的效果非常好，Curly只需要在每一场比赛的开始投一次冰壶，就能熟悉不同的情况，比如冰面是否足够光滑让冰壶划走。

Curly果然不负众望，在四轮比赛中赢了三场。但也有人发出质疑，如果加入擦扫冰面的条件出现，但对于一个机器人来说，这个成就已经非常值得骄傲了。

研究人员指出，这是一项重要的成就，不仅因为这证明了机器人在这项运动中具有竞争力，这项研究也涉及未来现实世界中实时的动态观察和决策。

因此，对于AI和机器人而言，这都是一个里程碑，而且对在模拟环境中训练此类机器人大有帮助。因为尽管在这几年，类似的研究还不足以达到这么明显的效果。

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【CoRL2020最佳论文】学习潜在表示以影响多智能体交互作用

专知会员服务

28+阅读 · 2020年11月20日

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

121+阅读 · 2020年5月18日

【ICLR2020-MIT】元学习的好奇心算法，Meta-learning curiosity algorithms

专知会员服务

34+阅读 · 2020年3月13日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

「强化学习之路」清华博士后解读83篇文献，万字长文总结

专知会员服务

67+阅读 · 2020年2月28日

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

专知会员服务

24+阅读 · 2020年2月17日

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

专知会员服务

104+阅读 · 2019年10月22日

AI魔方大师：1.2秒解魔方超世界纪录2倍，平均移动28步

智东西

3+阅读 · 2019年7月17日

AI “赌神”完胜人类扑克冠军，以一敌五实现多人博弈里程碑

科研圈

3+阅读 · 2019年7月12日

前沿|机器人真的有意识了！突破狭义AI的自我学习机器人问世

机器人大讲堂

3+阅读 · 2019年2月2日

谷歌大脑QT-Opt算法，机器人探囊取物成功率96%，Jeff Dean大赞

量子位

4+阅读 · 2018年6月29日

Atari联合创始人去世，为什么游戏对AI很重要？

新智元

3+阅读 · 2018年6月4日

人工智能的热点：深度强化学习正成为通往通用AI的关键

DeepTech深科技

4+阅读 · 2018年4月11日

观点 | 善于单挑却难以协作，构建多智能体AI系统为何如此之难？

机器之心

4+阅读 · 2018年4月1日

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

【重磅】DeepMind发布Nature论文: 博弈网络让智能体成为游戏大咖

专知

9+阅读 · 2018年1月17日

人类：“共同探索围棋极限！”新AlphaGo：“不了吧，我到了。”

PingWest品玩

4+阅读 · 2017年10月20日

The Geometry and Kinematics of the Matrix Lie Group $SE_K(3)$

Arxiv

0+阅读 · 2020年12月2日

Concentration bounds for linear Monge mapping estimation and optimal transport domain adaptation

Arxiv

0+阅读 · 2020年12月1日

The Variable-Processor Cup Game

Arxiv

0+阅读 · 2020年11月30日

The statistical properties of RCTs and a proposal for shrinkage

Arxiv

0+阅读 · 2020年11月30日

Cutoff for exact recovery of Gaussian mixture models

Arxiv

0+阅读 · 2020年11月30日

Combining Deep Reinforcement Learning and Search for Imperfect-Information Games

Arxiv

0+阅读 · 2020年11月29日

Deep Learning for Classical Mechanics

Arxiv

0+阅读 · 2020年11月27日

Lower Bounds for Approximate Knowledge Compilation

Arxiv

0+阅读 · 2020年11月27日

Improving linear quantile regression for replicated data

Arxiv

0+阅读 · 2020年11月27日

Being Central on the Cheap: Stability in Heterogeneous Multiagent Centrality Games

Arxiv

0+阅读 · 2020年11月26日

VIP会员