ICML2018 模仿学习教程

2018 年 7 月 14 日 专知

【导读】机器学习领域最具影响力的学术会议之一的ICML于2018年7月10日-15日在瑞典斯德哥尔摩举行。ICML是机器学习领域顶级会议，由国际机器学习协会（International Machine Learning Society）主办。本文介绍ICML2018中《Imitation Learning 》所配的一套149页的PPT，这套PPT由浅入深地介绍了模仿学习。

在传统的强化学习任务中，通常通过计算累积奖赏来学习最优策略（policy），这种方式简单直接，而且在可以获得较多训练数据的情况下有较好的表现。然而在多步决策（sequential decision）中，学习器不能频繁地得到奖励，且这种基于累积奖赏及学习方式存在非常巨大的搜索空间。而模仿学习（Imitation Learning）的方法经过多年的发展，已经能够很好地解决多步决策问题，在机器人、 NLP 等领域也有很多的应用。模仿学习是指从示教者提供的范例中学习，一般提供人类专家的决策数据每个决策包含状态和动作序列将所有「状态-动作对」抽取出来构造新的集合.

https://sites.google.com/view/icml2018-imitation-learning/

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知），

后台回复“IL” 就可以获取149页模仿学习PPT下载链接~

附PPT原文

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知），

后台回复“KGTIR” 就可以获取222页基于知识图谱的文本信息检索PPT下载链接~

-END-

专 · 知

人工智能领域主题知识资料查看与加入专知人工智能服务群：

【专知AI服务计划】专知AI知识技术服务会员群加入与人工智能领域26个主题知识资料全集获取。欢迎微信扫一扫加入专知人工智能知识星球群，获取专业知识教程视频资料和与专家交流咨询！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

请加专知小助手微信（扫一扫如下二维码添加），加入专知主题群（请备注主题类型：AI、NLP、CV、 KG等）交流~

请关注专知公众号，获取人工智能的专业知识！

点击“阅读原文”，使用专知

登录查看更多

相关内容

模仿学习

关注 322

模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习（Imitation Learning）背后的原理是是通过隐含地给学习器关于这个世界的先验信息，比如执行、学习人类行为。在模仿学习任务中，智能体（agent）为了学习到策略从而尽可能像人类专家那样执行一种行为，它会寻找一种最佳的方式来使用由该专家示范的训练集（输入-输出对）。当智能体学习人类行为时，虽然我们也需要使用模仿学习，但实时的行为模拟成本会非常高。与之相反，吴恩达提出的学徒学习（Apprenticeship learning）执行的是存粹的贪婪/利用（exploitative）策略，并使用强化学习方法遍历所有的（状态和行为）轨迹（trajectories）来学习近优化策略。它需要极难的计略（maneuvers），而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态，所以可为自动驾驶这样的许多任务提供更可靠的通用框架。

商业数据分析，39页ppt

专知会员服务

165+阅读 · 2020年6月2日

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日