Visual imitation learning enables robotic agents to acquire skills by observing expert demonstration videos. In the one-shot setting, the agent generates a policy after observing a single expert demonstration without additional fine-tuning. Existing approaches typically train and evaluate on the same set of tasks, varying only object configurations, and struggle to generalize to unseen tasks with different semantic or structural requirements. While some recent methods attempt to address this, they exhibit low success rates on hard test tasks that, despite being visually similar to some training tasks, differ in context and require distinct responses. Additionally, most existing methods lack an explicit model of environment dynamics, limiting their ability to reason about future states. To address these limitations, we propose a novel framework for one-shot visual imitation learning via world-model-guided trajectory generation. Given an expert demonstration video and the agent's initial observation, our method leverages a learned world model to predict a sequence of latent states and actions. This latent trajectory is then decoded into physical waypoints that guide the agent's execution. Our method is evaluated on two simulated benchmarks and three real-world robotic platforms, where it consistently outperforms prior approaches, with over 30% improvement in some cases. The code is available at https://github.com/raktimgg/osvi-wm.


翻译:视觉模仿学习使机器人智能体能够通过观察专家演示视频来获取技能。在单次学习设定中,智能体在观察一次专家演示后即生成策略,无需额外微调。现有方法通常在相同的任务集上进行训练和评估,仅改变物体配置,难以泛化到具有不同语义或结构需求的未见任务。尽管近期一些方法试图解决此问题,但它们在困难的测试任务上成功率较低;这些测试任务尽管与某些训练任务视觉相似,但上下文不同且需要不同的响应。此外,大多数现有方法缺乏对环境动态的显式建模,限制了其对未来状态进行推理的能力。为应对这些局限,我们提出了一种通过世界模型引导轨迹生成进行单次视觉模仿学习的新框架。给定专家演示视频和智能体的初始观察,我们的方法利用学习到的世界模型来预测一系列潜在状态和动作。随后,该潜在轨迹被解码为物理路径点,以指导智能体的执行。我们在两个模拟基准测试和三个真实世界机器人平台上评估了我们的方法,其表现始终优于先前方法,在某些情况下提升超过30%。代码可在 https://github.com/raktimgg/osvi-wm 获取。

0
下载
关闭预览

相关内容

【AAAI2025】TimeDP:通过领域提示学习生成多领域时间序列
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员