【ICML2022】通过评估演示者的专业知识进行模仿学习

2022 年 7 月 18 日 专知


许多现有的模仿学习数据集是从多个演示者那里收集的,每个演示者在环境的不同部分具有不同的专长。然而,标准的模仿学习算法通常将所有演示者视为同质的,而不考虑他们的专业知识,吸收任何次优演示者的弱点。在这项工作中,我们表明,在演示者专业知识上的无监督学习可以导致模仿学习算法性能的持续提高。我们根据经验丰富的策略和演示者的专业水平,开发和优化一个联合模型。这使得我们的模型能够从最优行为中学习,并过滤掉每个演示者的次优行为。我们的模型学习了一个单一的策略,这个策略甚至可以超过最好的演示者,并且可以用来评估任何状态下任何演示者的专业知识。我们阐述了我们在Robomimic和离散环境(如MiniGrid和国际象棋)中对真实机器人连续控制任务的研究结果,在23个设置中有21个优于竞争方法,在最终奖励方面平均提高7%,最高提高60%。




专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“LED” 就可以获取【ICML2022】通过评估演示者的专业知识进行模仿学习》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
2

相关内容

【ICRA2022】机器人强化学习工具教程, 附slides与视频
专知会员服务
39+阅读 · 2022年5月27日
专知会员服务
19+阅读 · 2021年8月30日
专知会员服务
21+阅读 · 2021年7月10日
专知会员服务
45+阅读 · 2021年7月2日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
21+阅读 · 2021年5月27日
【ICML2021】来自观察的跨域模仿
专知会员服务
17+阅读 · 2021年5月25日
【NeurIPS 2020】生成对抗性模仿学习的f-Divergence
专知会员服务
25+阅读 · 2020年10月9日
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
89+阅读 · 2020年9月28日
IJCAI2022《对抗序列决策》教程,164页ppt
专知
4+阅读 · 2022年7月27日
【干货书】信息论与编码,517页pdf
专知
5+阅读 · 2022年7月20日
【ICML2022】几何多模态对比表示学习
专知
1+阅读 · 2022年7月17日
【实用书】强化学习实战:Python,110页pdf
机器人运动轨迹的模仿学习综述
专知
0+阅读 · 2021年11月12日
【ICML2021】基于观察的跨域模仿学习
专知
2+阅读 · 2021年8月30日
国家自然科学基金
90+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
48+阅读 · 2021年9月11日
VIP会员
相关VIP内容
【ICRA2022】机器人强化学习工具教程, 附slides与视频
专知会员服务
39+阅读 · 2022年5月27日
专知会员服务
19+阅读 · 2021年8月30日
专知会员服务
21+阅读 · 2021年7月10日
专知会员服务
45+阅读 · 2021年7月2日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
21+阅读 · 2021年5月27日
【ICML2021】来自观察的跨域模仿
专知会员服务
17+阅读 · 2021年5月25日
【NeurIPS 2020】生成对抗性模仿学习的f-Divergence
专知会员服务
25+阅读 · 2020年10月9日
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
89+阅读 · 2020年9月28日
相关资讯
相关基金
国家自然科学基金
90+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员