Recent advances in hierarchical robot systems leverage a high-level planner to propose task plans and a low-level policy to generate robot actions. This design allows training the planner on action-free or even non-robot data sources (e.g., videos), providing transferable high-level guidance. Nevertheless, grounding these high-level plans into executable actions remains challenging, especially with the limited availability of high-quality robot data. To this end, we propose to improve the low-level policy through online interactions. Specifically, our approach collects online rollouts, retrospectively annotates the corresponding high-level goals from achieved outcomes, and aggregates these hindsight-relabeled experiences to update a goal-conditioned imitation policy. Our method, Hindsight Flow-conditioned Online Imitation (HinFlow), instantiates this idea with 2D point flows as the high-level planner. Across diverse manipulation tasks in both simulation and physical world, our method achieves more than $2\times$ performance improvement over the base policy, significantly outperforming the existing methods. Moreover, our framework enables policy acquisition from planners trained on cross-embodiment video data, demonstrating its potential for scalable and transferable robot learning.


翻译:近年来,分层机器人系统通过高层规划器生成任务计划,并利用低层策略产生机器人动作。这种设计使得规划器能够在无动作数据甚至非机器人数据源(如视频)上进行训练,从而提供可迁移的高层指导。然而,将这些高层计划转化为可执行动作仍然具有挑战性,尤其是在高质量机器人数据有限的情况下。为此,我们提出通过在线交互来改进低层策略。具体而言,我们的方法收集在线轨迹,根据已实现的结果回溯标注对应的高层目标,并聚合这些经过后见之明重标注的经验来更新目标条件模仿策略。我们的方法——后见之明流条件在线模仿(HinFlow)——以二维点流作为高层规划器实现了这一思想。在仿真和物理世界的多种操作任务中,我们的方法相比基础策略实现了超过 $2\times$ 的性能提升,显著优于现有方法。此外,我们的框架能够从跨具身视频数据训练的规划器中获取策略,展现了其在可扩展和可迁移机器人学习方面的潜力。

0
下载
关闭预览

相关内容

【ICML2024】上下文感知标记化的高效世界模型
专知会员服务
29+阅读 · 2024年7月2日
Python图像处理,366页pdf,Image Operators Image Processing in Python
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员