MIT「迷你猎豹」秒速3.9米刷新四足机器人世界记录，但还是跑不过苏炳添

会员服务 ·

MIT「迷你猎豹」秒速3.9米刷新四足机器人世界记录，但还是跑不过苏炳添

2022 年 3 月 18 日 新智元

新智元报道

编辑：袁榭时光

【新智元导读】步态欠潇洒不要紧，只要速度足够快！MIT四足机器人刷新世界记录，靠的是合成数据训练机器！

自2014年立项以来，MIT的机器猎豹项目在四足机器人界屡有突破和贡献。

刚刚，迷你猎豹（Mini Cheetah）又晒出了新成绩：创下了秒速3.9米的四足机器人行进速度世界记录。

MIT机器猎豹，四足机器人里跑得最快

当下，各种机器人公司和项目，为了刷存在感，同时也给投资人信心，最时兴让机器人玩杂耍。

比如，2019年中，既有波士顿动力的两足机器人耍后空翻，也有MIT的四足机器猎豹耍后空翻，堪称业界热点、一时瑜亮。

当然，后空翻的意义不止于好看，还在于展示控制系统与行进机制的稳健性，以及体现处理输入数据的速度。

然而，机器人项目绕不过的难题是——它除了「稳」，还要「快」！

现在，市面上的各路机器狗产品价格堪比上档次的汽车，速度却远远跟不上。

当下机器狗的老头慢遛速度，让各种搞钱广告的杂技展示都减色不少。比如以下这种足球运动，有哪种真实动物会慢成这样呢……

不过2022年3月份，MIT的四足机器猎豹，终于比不管是东方还是西方的竞品都跑得还快了。

按照研究团队的数据，现在MIT的四足机器猎豹室内运动速度上限是秒速3.9米。

室外运动上限是秒速3.4米。

室内原地旋转的角速度是每秒5.7弧度。

考虑到没练过的普通人类整体旋转的角速度也就是每秒6-9弧度（花样滑冰运动员能转出每秒40弧度以上），机器猎豹打转的敏捷度已经很值得称道了。

换算一下，MIT的机器猎豹现在室内速度接近9迈，室外速度接近8迈。

直观地说，虽然与汽车相比，这速度还不算挂一档。但如果这数字调在跑步机上的话，即使健身狂魔们也得出汗费力才能跟上了。

此前的MIT机器猎豹，只算得上是四脚爬爬，现在才能真算上「跑步前进」了。尽管比不得活猎豹，但「迷你猎豹」（Mini Cheetah）跑赢真人肥宅似乎不算难事。

而且考虑到机器猎豹在冰上能维持同等运动速度与灵活度，真人恐怕还做不到咧。

步态不潇洒？

如图所示，迷你猎豹的步态还有点笨拙，没有猎豹的矫健身姿，看起来倒像一只小狗在地板上抓来抓去。

这是因为，AI除了加速之外没有优化任何东西。

「强化学习能找到跑得快的解决方案，但由于其奖励功能不明确，它没有理由选择一种「看起来更自然」或「人类更喜欢的」步态。」研究者称。

当高速移动时，它可能不是最优雅的姿态。

诚如研究者所言，「这个模型当然可以被指导开发一种更流畅的运动形式，但此次大家努力的重点只是优化速度」。

业界趋势：合成数据训练机器狗

教四足机器人运动，此前无外乎是两种途径：

摄像头等传感器搜集现实数据，然后码农手动编程处理数据；

或码农将传感器搜集的现实数据作为数据训练集，训练AI控制四足机器人动作。

「投多少人工出多少智能」，这两种办法其实都是耗时费力。

码农手动编程的时间成本与资源耗费不消说，环境出个变化就得手工改程序。

拿现实世界数据使劲训练AI，现在也遇到瓶颈了。

现实世界的数据变量实在太丰富，各种雄心勃勃要搞全无人L4自动驾驶的大车厂们就因此在训练AI上吃了大瘪：

砾石地、沙地、雪地的路况不同，不同风速、湿度、颗粒物状态的空气能见度不同，路上各种从活人到井盖的物体运动状况不同。越要训练出能因应万象的AI司机，现实数据的搜集和处理成本就越大。

当然如果和马斯克一样跳脱，在车上装超级电脑来走数据跑AI。理论上也不是不可以，只是现实中人会说这种解决方案是神经病。

穷则思变，如果现实数据搞起来太累太麻烦，那么换合成数据，不是就跑通了么？

现在业界巨擘们纷纷搞模拟环境/合成数据。谷歌拿NeRF为Waymo的无人车训练渲染了个模拟旧金山出来。英伟达在猛砸资源做Omniverse Replicator。

斩牛刀可以用来杀鸡，合成数据连参数和变量大到吓人的无人车AI都可以用，两足/四足机器人要面临的环境变量少得多，自然也可以用。

2021年起，加州大学伯克利分校的研究团队就在用模拟环境训练两足机器人Cassie。据称Meta的AI团队也在用模拟环境训练四足机器人。

MIT团队训练机器猎豹：3小时合成逾百日数据量

四足机器人界的泰山北斗之一、MIT的机器猎豹项目，自不甘人后。

研究团队完全不用摄像头等传感器输入真实外界数据，完全在模拟环境中训练控制机器猎豹的AI。

不得不说，效果满好。

由MIT研究团队释出的实景对比图像可以看出：

人工预编程的控制软件，让机器猎豹的步态更好看，但砾石地上的复杂路况大大限制了行动速度与敏捷度。

而在模拟环境中、通过奖惩机制训练的强化学习AI模型，控制下的机器猎豹酷似野狗乱爬，但速度和敏捷度提升了不止一个档次。

MIT研究小组表示，他们的环境模拟器在3小时内生成了相当于过百天的各种地形、天气等环境变化数据，以此为训练集来用强化学习方法训练机器猎豹的控制AI。

如此训练出的步态控制模型，的确很可能无法判别机器猎豹足下的是冰地还是砾石地。但AI判断出形态不稳、步态受干扰、要倒的结果速度可是大大提升了。

因此机器猎豹步态与形体的因应方案虽然难看，但既能高速前冲、又不会同时仆街，这个成就在四足机器人界可是前所未有。

如下图所示，用合成数据训练的强化学习AI，让机器猎豹成功过坎，避免了此前的仆街状况。

落地前景

MIT计算机科学和人工智能实验室（CSAIL）的研究人员相信，他们的技术可以用于提高其它机器人系统能力，尤其适用工厂发货前的组装系统。

全球疫情加速了机器人在工业中的应用，根据《自动化世界》（Automation World）的一项调查，在组装和制造工厂中，已经有44.9%工厂将机器人视为不可或缺的一部分。

现在，MIT开发设计的「迷你猎豹」系统，可以通过模拟环境进行强化学习，加快了运行时间。这种管线操作模式能用来训练机器猎豹，就能用来训练流水线机器人。

而且合成数据+强化学习这种模式还有个好处，就是摆脱了传感器的关注局限、让AI更加高效流畅地得出结果。

机器猎豹在快跑冲刺时，所有机件都出于满负荷运载状态，这时AI不会管是因为地面太滑要倒、还是螺丝松了要倒，给出的姿态解决方案只要达到“不会倒”的结果就好。

同样的模式应用在流水线机器人上，那可真是为生产效率提了个大台阶。

参考资料：

https://venturebeat.com/2022/03/17/mit-researchers-use-simulation-to-train-a-robot-to-run-at-high-speeds/

https://www.theverge.com/2022/3/17/22982620/robot-run-speed-mit-mini-cheetah-ai-reinforcement-learning

https://gizmodo.com/mits-robotic-cheetah-taught-itself-how-to-run-sets-new-1848656968

https://futurism.com/the-byte/mits-robot-cheetah-run

https://sites.google.com/view/model-free-speed/

登录查看更多

相关内容

麻省理工学院

关注 2

深入学习的成功来自于三个方面：高效的算法、强大的硬件和大规模的数据集。我们的实验室针对前两个方面，麻省理工学院汉实验室正在寻找有动机的学生在深入学习和计算机架构领域来解决有影响的人工智能问题，具有较轻的模型和较高的计算效率。

强化学习难学？Datawhale《Easy RL强化学习教程》出版了！188页pdf帮你轻松入门强化学习

专知会员服务

136+阅读 · 2022年4月8日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

132+阅读 · 2022年4月5日

【CVPR2022】机器人物体重排的迭代流最小化，IFOR: Iterative Flow Minimization for Robotic Object Rearrangement

专知会员服务

4+阅读 · 2022年3月2日

【MIT-韩松】微型化机器学习与高效深度学习，127页ppt

专知会员服务

57+阅读 · 2021年10月29日

【浙江大学】计算摄影学 (Computational Photography)课程

专知会员服务

25+阅读 · 2020年12月26日

【MIT】约束最小-最大优化的复杂性，84页pdf

专知会员服务

42+阅读 · 2020年9月25日

斯坦福EE364a《凸优化》课件，301页ppt

专知会员服务

93+阅读 · 2020年7月14日

【ICML2020】用于强化学习的对比无监督表示嵌入

专知会员服务

27+阅读 · 2020年7月6日

少标签数据学习，54页ppt

专知会员服务

194+阅读 · 2020年5月22日

Stabilizing Transformers for Reinforcement Learning

专知会员服务

57+阅读 · 2019年10月17日

川崎重工“羚羊”四足机器人亮相，造型酷似宫崎骏动漫，可负载100公斤！

大数据文摘

1+阅读 · 2022年3月23日

MIT机器狗再进化，碎石冰面上跑也不打滑，这次真的稳如狗了

量子位

1+阅读 · 2022年3月18日

仿生人能骑电子羊了！全球首款四足机器羊：小姐姐坐着有点颠

新智元

0+阅读 · 2022年3月15日

华为天才少年稚晖君自制硬萌机器人，开源5小时，GitHub收获317星！

极市平台

0+阅读 · 2022年3月13日

中国厨房里，俄乌在进行另一场战争

创业邦杂志

0+阅读 · 2022年3月6日

特斯拉机器人竟然叫「擎天柱」！马斯克：2022年我专搞机器人

新智元

3+阅读 · 2022年1月27日

时速22公里、载荷50kg，四足轮腿式机器人Swiss-Mile学会了变身

机器之心

0+阅读 · 2021年12月7日

机器人Ameca挣脱「灵魂」枷锁觉醒？邪魅一笑瞬间令人恐怖

新智元

0+阅读 · 2021年12月5日

「天才少年」稚晖君调戏机械臂！加上AI视觉，2小时学会抓螺母

极市平台

0+阅读 · 2021年11月21日

宇宙第一富豪！马斯克身家超2300亿美元=巴菲特+盖茨

新智元

0+阅读 · 2021年10月16日

基于机器学习的室外未知环境中移动机器人定位研究

国家自然科学基金

4+阅读 · 2014年12月31日

六足机器人环境建模与自主运动规划

国家自然科学基金

4+阅读 · 2014年12月31日

仿生沙基机器人二维运动C形腿数学模型的建立及自适应控制的研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向作业全要素的肢残者体力作业行为建模及功能残疾度评价方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于慎思/反应混合控制架构的气垫式越野机器人软地面自主导航研究

国家自然科学基金

0+阅读 · 2012年12月31日

自主机器人基于全景视觉的大范围未知环境归航方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

远期记忆的脑机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

形状记忆合金驱动的微创手术腕式末端执行器研究

国家自然科学基金

0+阅读 · 2011年12月31日

三自由度永磁球形电动机若干关键问题的深入研究

国家自然科学基金

0+阅读 · 2011年12月31日

数据驱动的双足机器人步态自学习控制方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

SILVR: A Synthetic Immersive Large-Volume Plenoptic Dataset

Arxiv

0+阅读 · 2022年4月20日

Approximate Sampling and Counting of Graphs with Near-$P$-stable Degree Intervals

Arxiv

0+阅读 · 2022年4月20日

Reinforcement Learning Control of a Biomechanical Model of the Upper Extremity

Arxiv

0+阅读 · 2022年4月20日

Structured and Unstructured Teams for Research Software Development at the Netherlands eScience Center

Arxiv

0+阅读 · 2022年4月19日

Beyond Being Real: A Sensorimotor Control Perspective on Interactions in Virtual Reality

Arxiv

0+阅读 · 2022年4月18日

Unveiling User Behavior on Summit Login Nodes as a User

Arxiv

0+阅读 · 2022年4月18日

Self-learning Emulators and Eigenvector Continuation

Arxiv

0+阅读 · 2022年4月17日

Turing's cascade instability supports the coordination of the mind, brain, and behavior

Arxiv

0+阅读 · 2022年4月17日

WIP: Achieving Self-Interference-Free Operation on SDR Platform with Critical TDD Turnaround Time

Arxiv

0+阅读 · 2022年4月15日

Team Power Dynamics and Team Impact: New Perspectives on Scientific Collaboration using Career Age as a Proxy for Team Power

Arxiv

0+阅读 · 2022年4月14日

VIP会员