模仿学习最新内容 - 专知

会员服务 ·

模仿学习

模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习（Imitation Learning）背后的原理是是通过隐含地给学习器关于这个世界的先验信息，比如执行、学习人类行为。在模仿学习任务中，智能体（agent）为了学习到策略从而尽可能像人类专家那样执行一种行为，它会寻找一种最佳的方式来使用由该专家示范的训练集（输入-输出对）。当智能体学习人类行为时，虽然我们也需要使用模仿学习，但实时的行为模拟成本会非常高。与之相反，吴恩达提出的学徒学习（Apprenticeship learning）执行的是存粹的贪婪/利用（exploitative）策略，并使用强化学习方法遍历所有的（状态和行为）轨迹（trajectories）来学习近优化策略。它需要极难的计略（maneuvers），而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态，所以可为自动驾驶这样的许多任务提供更可靠的通用框架。

Habitat Challenge 2022冠军方案：字节AI Lab提出融合传统和模仿学习的主动导航

Habitat Challenge 2022冠军方案：字节AI Lab提出融合传统和模仿学习的主动导航

机器之心

1+阅读 · 2022年11月22日

DeepMind新作：无需权重更新、提示和微调，transformer在试错中自主改进

DeepMind新作：无需权重更新、提示和微调，transformer在试错中自主改进

机器之心

1+阅读 · 2022年10月28日

惊呆了！双足机器人Cassie破百米吉尼斯世界纪录，用时24.73秒

惊呆了！双足机器人Cassie破百米吉尼斯世界纪录，用时24.73秒

新智元

0+阅读 · 2022年9月29日

【2022新书】机器学习的实用模拟与合成，428页pdf

【2022新书】机器学习的实用模拟与合成，428页pdf

专知

18+阅读 · 2022年8月10日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知

3+阅读 · 2022年7月18日

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

机器之心

1+阅读 · 2022年7月15日

ICML 2022 | 基于解耦梯度优化的可迁移模仿学习方法

ICML 2022 | 基于解耦梯度优化的可迁移模仿学习方法

PaperWeekly

1+阅读 · 2022年6月28日

南京大学&港中文联合总结: 29页中文详述《模仿学习》完整过程

南京大学&港中文联合总结: 29页中文详述《模仿学习》完整过程

专知

3+阅读 · 2022年2月4日

改善机器人模仿学习的决断力

改善机器人模仿学习的决断力

TensorFlow

3+阅读 · 2022年1月10日

改善机器人模仿学习的决断力

改善机器人模仿学习的决断力

谷歌开发者

0+阅读 · 2022年1月10日

模仿并超越人类围棋手，KL正则化搜索让AI下棋更像人类，Meta&CMU出品

模仿并超越人类围棋手，KL正则化搜索让AI下棋更像人类，Meta&CMU出品

量子位

1+阅读 · 2021年12月17日

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

专知

1+阅读 · 2021年11月22日

机器人运动轨迹的模仿学习综述

机器人运动轨迹的模仿学习综述

专知

1+阅读 · 2021年11月12日

【ICML2021】基于观察的跨域模仿学习

【ICML2021】基于观察的跨域模仿学习

专知

2+阅读 · 2021年8月30日

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

专知

7+阅读 · 2020年12月6日

参考链接

父主题

微信扫码咨询专知VIP会员