【ICML2022】通过评估演示者的专业知识进行模仿学习 - 专知VIP

会员服务 ·

8

ICML 2022 · 模仿学习 ·

2022 年 7 月 18 日

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

许多现有的模仿学习数据集是从多个演示者那里收集的，每个演示者在环境的不同部分具有不同的专长。然而，标准的模仿学习算法通常将所有演示者视为同质的，而不考虑他们的专业知识，吸收任何次优演示者的弱点。在这项工作中，我们表明，在演示者专业知识上的无监督学习可以导致模仿学习算法性能的持续提高。我们根据经验丰富的策略和演示者的专业水平，开发和优化一个联合模型。这使得我们的模型能够从最优行为中学习，并过滤掉每个演示者的次优行为。我们的模型学习了一个单一的策略，这个策略甚至可以超过最好的演示者，并且可以用来评估任何状态下任何演示者的专业知识。我们阐述了我们在Robomimic和离散环境(如MiniGrid和国际象棋)中对真实机器人连续控制任务的研究结果，在23个设置中有21个优于竞争方法，在最终奖励方面平均提高7%，最高提高60%。

成为VIP会员查看完整内容

17

相关内容

ICML 2022

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议，也是CCF-A类学术会议。ICML 2022 共收到5630 投稿，接收1117 篇 short oral，118篇 long oral，录用率为21.94%。

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

【ICML2021】学习权衡不完美的示范

专知会员服务

15+阅读 · 2021年9月23日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

【ICML2021】预测观察进行模仿学习

专知会员服务

24+阅读 · 2021年7月10日

[ICML2021]结构化上下文公式预测

专知会员服务

13+阅读 · 2021年7月2日

模仿学习: 进展，分类和机会

专知会员服务

48+阅读 · 2021年7月2日

【ICML2021】策略梯度贝叶斯鲁棒优化的模仿学习

专知会员服务

25+阅读 · 2021年6月15日

【ICML2021】模仿学习的超参数选择

专知会员服务

22+阅读 · 2021年5月27日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

93+阅读 · 2020年9月28日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

InfoQ

3+阅读 · 2021年12月20日

模仿并超越人类围棋手，KL正则化搜索让AI下棋更像人类，Meta&CMU出品

模仿并超越人类围棋手，KL正则化搜索让AI下棋更像人类，Meta&CMU出品

量子位

1+阅读 · 2021年12月17日

论文浅尝 | GaussianPath: 用于知识图谱推理的贝叶斯多跳推理框架

论文浅尝 | GaussianPath: 用于知识图谱推理的贝叶斯多跳推理框架

开放知识图谱

2+阅读 · 2021年11月21日

【ICML2021】基于观察的跨域模仿学习

【ICML2021】基于观察的跨域模仿学习

专知

2+阅读 · 2021年8月30日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

19+阅读 · 2020年6月28日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

这可能是最简单易懂的机器学习入门（小白必读）

这可能是最简单易懂的机器学习入门（小白必读）

专知

16+阅读 · 2018年6月4日

干货｜浅谈强化学习的方法及学习路线

干货｜浅谈强化学习的方法及学习路线

机器学习算法与Python学习

16+阅读 · 2018年3月28日

一文读懂推荐系统知识体系-下（评估、实战、学习资料）

一文读懂推荐系统知识体系-下（评估、实战、学习资料）

AI100

33+阅读 · 2017年11月7日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于认知学习的智能机器人控制系统关键问题的研究

国家自然科学基金

7+阅读 · 2014年12月31日

e-Learner认知效率建模及自适应调整方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于技能匹配、学习、拓展的遥操作机器人控制研究

国家自然科学基金

2+阅读 · 2014年12月31日

网络演化博弈实验中的策略学习动力学与相变问题研究

国家自然科学基金

4+阅读 · 2014年12月31日

多因素不确定情况下路面最优养护维修策略决策方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于融合决策的风电场建模策略与方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于模型的结构性程序错误的诊断方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

出生缺陷危险因素风险评估"预筛查"工具的研制及其实证研究

国家自然科学基金

1+阅读 · 2011年12月31日

CPS标准下AGC的最优松驰控制及其马尔可夫决策过程

国家自然科学基金

1+阅读 · 2008年12月31日

Enhancing Pre-trained Models with Text Structure Knowledge for Question Generation

Arxiv

0+阅读 · 2022年9月9日

HyperMAML: Few-Shot Adaptation of Deep Models with Hypernetworks

Arxiv

0+阅读 · 2022年9月9日

Multilevel Path Branching for Digital Options

Arxiv

0+阅读 · 2022年9月7日

pForest: In-Network Inference with Random Forests

Arxiv

0+阅读 · 2022年9月6日

Model-Based Policy Search Using Monte Carlo Gradient Estimation with Real Systems Application

Arxiv

0+阅读 · 2022年9月6日

DPGN: Distribution Propagation Graph Network for Few-shot Learning

Arxiv

12+阅读 · 2020年3月31日

Graph Neural Networks for Social Recommendation

Arxiv

20+阅读 · 2019年11月23日

HyperGCN: Hypergraph Convolutional Networks for Semi-Supervised Classification

HyperGCN: Hypergraph Convolutional Networks for Semi-Supervised Classification

Arxiv

13+阅读 · 2018年9月7日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员

相关主题

相关VIP内容

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

【ICML2021】学习权衡不完美的示范

专知会员服务

15+阅读 · 2021年9月23日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

【ICML2021】预测观察进行模仿学习

专知会员服务

24+阅读 · 2021年7月10日

[ICML2021]结构化上下文公式预测

专知会员服务

13+阅读 · 2021年7月2日

模仿学习: 进展，分类和机会

专知会员服务

48+阅读 · 2021年7月2日

【ICML2021】策略梯度贝叶斯鲁棒优化的模仿学习

专知会员服务

25+阅读 · 2021年6月15日

【ICML2021】模仿学习的超参数选择

专知会员服务

22+阅读 · 2021年5月27日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

93+阅读 · 2020年9月28日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能治理的未来

模态感知的特征匹配：单一模态与跨模态技术的全面综述

无监督行人重识别研究综述

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

相关资讯

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

InfoQ

3+阅读 · 2021年12月20日

模仿并超越人类围棋手，KL正则化搜索让AI下棋更像人类，Meta&CMU出品

模仿并超越人类围棋手，KL正则化搜索让AI下棋更像人类，Meta&CMU出品

量子位

1+阅读 · 2021年12月17日

论文浅尝 | GaussianPath: 用于知识图谱推理的贝叶斯多跳推理框架

论文浅尝 | GaussianPath: 用于知识图谱推理的贝叶斯多跳推理框架

开放知识图谱

2+阅读 · 2021年11月21日

【ICML2021】基于观察的跨域模仿学习

【ICML2021】基于观察的跨域模仿学习

专知

2+阅读 · 2021年8月30日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

19+阅读 · 2020年6月28日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

这可能是最简单易懂的机器学习入门（小白必读）

这可能是最简单易懂的机器学习入门（小白必读）

专知

16+阅读 · 2018年6月4日

干货｜浅谈强化学习的方法及学习路线

干货｜浅谈强化学习的方法及学习路线

机器学习算法与Python学习

16+阅读 · 2018年3月28日

一文读懂推荐系统知识体系-下（评估、实战、学习资料）

一文读懂推荐系统知识体系-下（评估、实战、学习资料）

AI100

33+阅读 · 2017年11月7日

相关基金

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于认知学习的智能机器人控制系统关键问题的研究

国家自然科学基金

7+阅读 · 2014年12月31日

e-Learner认知效率建模及自适应调整方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于技能匹配、学习、拓展的遥操作机器人控制研究

国家自然科学基金

2+阅读 · 2014年12月31日

网络演化博弈实验中的策略学习动力学与相变问题研究

国家自然科学基金

4+阅读 · 2014年12月31日

多因素不确定情况下路面最优养护维修策略决策方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于融合决策的风电场建模策略与方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于模型的结构性程序错误的诊断方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

出生缺陷危险因素风险评估"预筛查"工具的研制及其实证研究

国家自然科学基金

1+阅读 · 2011年12月31日

CPS标准下AGC的最优松驰控制及其马尔可夫决策过程

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Enhancing Pre-trained Models with Text Structure Knowledge for Question Generation

Arxiv

0+阅读 · 2022年9月9日

HyperMAML: Few-Shot Adaptation of Deep Models with Hypernetworks

Arxiv

0+阅读 · 2022年9月9日

Multilevel Path Branching for Digital Options

Arxiv

0+阅读 · 2022年9月7日

pForest: In-Network Inference with Random Forests

Arxiv

0+阅读 · 2022年9月6日

Model-Based Policy Search Using Monte Carlo Gradient Estimation with Real Systems Application

Arxiv

0+阅读 · 2022年9月6日

DPGN: Distribution Propagation Graph Network for Few-shot Learning

Arxiv

12+阅读 · 2020年3月31日

Graph Neural Networks for Social Recommendation

Arxiv

20+阅读 · 2019年11月23日

HyperGCN: Hypergraph Convolutional Networks for Semi-Supervised Classification

HyperGCN: Hypergraph Convolutional Networks for Semi-Supervised Classification

Arxiv

13+阅读 · 2018年9月7日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员