模仿学习热门内容 - 专知

会员服务 ·

模仿学习

模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习（Imitation Learning）背后的原理是是通过隐含地给学习器关于这个世界的先验信息，比如执行、学习人类行为。在模仿学习任务中，智能体（agent）为了学习到策略从而尽可能像人类专家那样执行一种行为，它会寻找一种最佳的方式来使用由该专家示范的训练集（输入-输出对）。当智能体学习人类行为时，虽然我们也需要使用模仿学习，但实时的行为模拟成本会非常高。与之相反，吴恩达提出的学徒学习（Apprenticeship learning）执行的是存粹的贪婪/利用（exploitative）策略，并使用强化学习方法遍历所有的（状态和行为）轨迹（trajectories）来学习近优化策略。它需要极难的计略（maneuvers），而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态，所以可为自动驾驶这样的许多任务提供更可靠的通用框架。

【NeurIPS 2020】生成对抗性模仿学习的f-Divergence

【NeurIPS 2020】生成对抗性模仿学习的f-Divergence

专知

0+阅读 · 2020年10月9日

伯克利大学《深度强化学习》更新 | 第二讲：监督学习和模仿学习

伯克利大学《深度强化学习》更新 | 第二讲：监督学习和模仿学习

AI科技评论

5+阅读 · 2019年1月10日

NIPS2018 | 腾讯AI Lab入选20篇论文，含2篇Spotlight

NIPS2018 | 腾讯AI Lab入选20篇论文，含2篇Spotlight

AI100

0+阅读 · 2018年10月15日

要抢足球教练饭碗！切尔西未来或将用上AI教练

要抢足球教练饭碗！切尔西未来或将用上AI教练

量子位

0+阅读 · 2018年11月17日

伯克利与OpenAI联合发文，通过最新「模仿学习」技术为机器人「赋能」（附论文）

伯克利与OpenAI联合发文，通过最新「模仿学习」技术为机器人「赋能」（附论文）

机器人圈

2+阅读 · 2017年7月15日

机器人顶级会议精华提炼（20190617-20190622)

机器人顶级会议精华提炼（20190617-20190622)

泡泡机器人SLAM

2+阅读 · 2019年6月22日

PRD、产品体验报告写不好？10天带你掌握高阶产品经理的文档写作法

PRD、产品体验报告写不好？10天带你掌握高阶产品经理的文档写作法

人人都是产品经理

0+阅读 · 2018年4月23日

使用模仿学习攻克Atari最难游戏！DeepMind新论文解读

使用模仿学习攻克Atari最难游戏！DeepMind新论文解读

CreateAMind

6+阅读 · 2018年6月9日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知

3+阅读 · 2022年7月18日

年薪百万-骥智CreateAMind2019招聘目标：年薪百万招聘大牛50+ 推荐成功送mate20

年薪百万-骥智CreateAMind2019招聘目标：年薪百万招聘大牛50+ 推荐成功送mate20

CreateAMind

0+阅读 · 2019年2月16日

和 DeepMind 一起考虑如何在 AI 中重现人类的价值观

和 DeepMind 一起考虑如何在 AI 中重现人类的价值观

雷锋网

1+阅读 · 2018年11月26日

学界 | 从监督式到DAgger，综述论文描绘模仿学习全貌

学界 | 从监督式到DAgger，综述论文描绘模仿学习全貌

机器之心

1+阅读 · 2018年1月29日

【2022新书】机器学习的实用模拟与合成，428页pdf

【2022新书】机器学习的实用模拟与合成，428页pdf

专知

18+阅读 · 2022年8月10日

学界 | 斯坦福大学&DeepMind联合提出机器人控制新方法，RL+IL端到端地学习视觉运动策略

学界 | 斯坦福大学&DeepMind联合提出机器人控制新方法，RL+IL端到端地学习视觉运动策略

机器之心

0+阅读 · 2018年3月19日

运营思路篇之类比性原理VS第一性原理

运营思路篇之类比性原理VS第一性原理

互联网er的早读课

0+阅读 · 2017年9月3日

参考链接

微信扫码咨询专知VIP会员