「跌跌撞撞」的机器狗，1小时就没了......

2022 年 7 月 21 日 新智元

来源：学术头条

还在纠结会不会错过元宇宙和web3浪潮？清华大学科学史系副教授胡翌霖，这次给你讲个透！

为了避开捕食者，刚出生的长颈鹿或者马驹等动物必须学会用腿尽可能快地走路。

然而，学会精确协调腿部肌肉和肌腱，还是要花费一些时间。

最初，小动物严重依赖于天生的脊髓反射，运动控制反射帮助它们在第一次尝试行走时避免摔倒和受伤。

之后，它们必须学习更先进、更精确的肌肉控制，直到神经系统最终适应腿部肌肉和肌腱。

最后，它们就像成年动物一样，再也不会有不受控制的跌跌撞撞了。

这个过程可能非常短（比如牛羊刚出生就会走路），也可能是几天到几周（比如猫咪和狗子需要一些时间学习），也可能长达 1 年（比如人类幼儿学走路就很慢）。

（来源：Pixabay）

那么，问题来了，动物是如何学会行走并从磕磕绊绊中学习的？

为此，马克斯·普朗克智能系统研究所（MPI-IS）的研究团队进行了一项研究，他们制造了一个四条腿、狗一样大小的机器人，希望借此来回到这一问题。

图｜在跑步机上行走（素材来源：Morti）

相关研究论文以「Learning plastic matching of robot dynamics in closed-loop central pattern generators」为题，已发表在科学期刊 Nature Machine Intelligence 上。

「作为工程师和机器人专家，我们通过制造一个机器人来寻找答案，它具有像动物一样的反射能力，并从错误中学习。」论文第一作者、通讯作者 Felix Ruppert 说。

「如果动物跌倒了，这是一个错误吗？如果只发生一次，就不是错误。但是，如果它经常跌倒，就可以为我们提供一个衡量机器人行走能力的标准。」

用算法优化「虚拟脊髓」

据论文描述，该机器狗名为 Morti，只用了一个小时学习走路，就很好地掌握了复杂的腿部力学。

图｜机器狗 Morti（来源：MPI-IS）

在这一过程中，研究团队利用一种贝叶斯优化算法来指导机器狗学习：测量到的足部传感器信息与虚拟脊髓模型的目标数据相匹配，脊髓模型作为程序运行在机器人的「大脑」中。

机器人通过不断比较发送和期望的传感器信息、运行反射回路和调整其运动控制模式来学习行走。

该学习算法类似于中枢模式发生器（CPG）的控制参数。

在人类和动物中，这些 CPG 是脊髓中的神经元网络，它们产生周期性的肌肉收缩，而不需要来自大脑的输入。CPG 网络帮助产生有节奏的任务，比如走路、眨眼或消化。

此外，反射是由连接腿部传感器和脊髓的硬编码神经通路触发的无意识的运动控制行为。

只要小动物在一个完美的平面上行走，CPG 就足以控制来自脊髓的运动信号。

然而，仅仅是与地面的一次小碰撞，就能改变它们的行走方式。

这时，它们自身的（机体）反射开始发挥作用，帮助调整运动模式，防止摔倒。

这些运动信号的瞬间变化是可逆的，或者说是「有弹性的」，运动模式在受到调控后会恢复到原来的形态。

但是，如果它们在多次循环的运动后仍然会磕磕绊绊——尽管是主动的反射——那么这些运动模式必须重新学习，并使其「不可逆转」。

在动物刚出生的阶段，它们的 CPG 还没有调整好，它们在平坦或不平的地形上都会表现得跌跌撞撞。但是，这些动物很快就能学会 CPG 和反射是如何控制腿部肌肉和肌腱的。

（来源：MPI-IS）

拉布拉多犬大小的机器狗「Morti」也是如此。

更重要的是，Morti 优化运动模式的速度比小动物还快，只需要大约一小时。

Morti 的 CPG 是在一台控制机器人腿部运动的小型计算机上模拟的。

这个虚拟脊髓被放置在 Morti 的背部，也就是头部所在的位置。

在机器人平稳行走的过程中，Morti 足部的传感器数据会不断与它自身 CPG 预测的预期触地进行比较。

如果机器人摔倒了，学习算法会改变腿前后摆动的距离、速度以及腿在地面上的长度。

调整后的运动也会告诉 Morti 之后如何更好地利用腿部力学。

在学习过程中，Morti 的 CPG 会发送适应的运动信号来优化自身行走，进而减少磕磕绊绊。

在这个框架中，Morti 的虚拟脊髓并不了解自身的腿部设计、动力来源和身体结构。由于对自身物理结构一无所知，Morti 缺少一个机器人「模型」。

对此，Ruppert 解释说：「Morti 实际上并不知道它的腿部解剖结构以及它们是如何工作的。」

「CPG 类似于天然提供的内置自动行走智能，我们已经将其转移到机器人身上。计算机产生信号控制腿部的马达，机器人就会行走和跌倒。数据从传感器传到虚拟脊髓，与 CPG 数据进行对比。如果传感器数据与预期数据不匹配，学习算法就会改变行走行为，直到机器人走得很好，不会绊倒。学习过程的核心部分是改变 CPG 的输出，同时保持反应的活跃，并监测机器人的跌跌撞撞。」

节能的机器狗控制

Morti 的小型计算机在行走过程中只消耗了 5 瓦的能量。

但是，大多数现有的工业四足机器人对电力的需求要大得多。它们的控制器使用机器人的模型，根据机器人的精确质量和身体几何形状进行编码，通常消耗几十到几百瓦。

两种类型的机器人都是动态高效运行的，但 Morti 的能量消耗要低得多，而且还提供了对动物解剖学的重要见解。

「我们不能轻易地研究活体动物的脊髓。但我们可以在机器人中建立一个模型，」论文作者之一 Alexander Badri-Spröwitz 说。

「我们知道这些 CPG 存在于许多动物身上。我们知道反射是内在的；但如何将两者结合起来，让动物学习反射和 CPG 运动？这是机器人与生物学交叉领域的基础性研究。针对生物学无法回答的问题，我们的机器人模型给出了答案。」

在未来的工作中，研究团队将继续扩展 CPG，在产生臀部轨迹时将机体俯仰动作考虑其中。通过惯性测量装置，机体俯仰可以反馈到 CPG 中。

参考资料：
https://www.nature.com/articles/s42256-022-00505-4