CVPR 2020 | 浙大李俊成:用无监督强化学习方法来获得迁移能力

2020 年 3 月 23 日 AI科技评论


作者 | 李俊成
编辑 | 蒋宝尚


本文是对浙江大学和加州大学圣巴巴拉分校合作完成的,被CVPR 2020收录的论文《Unsupervised Reinforcement Learning of Transferable Meta-Skills for Embodied Navigation》进行解读,相关工作已经开源。

论文:https://arxiv.org/abs/1911.07450


论文简介:

视觉导航任务要求智能体能够智能地导航到指定的目标。当前基于深度强化学习的方法往往需要大量的训练数据,而构建丰富的3D仿真环境以及提供任务相关标注是十分昂贵的。本文关注于在低资源的设定下完成视觉导航任务。本文通过提出无监督强化学习方法来获得具有迁移能力的子策略,使得模型能够快速迁移到视觉导航任务。在AI2-THOR环境中,我们的方法实现了最佳的性能,进一步的实验分析证明我们的方法学习到了一些具备迁移能力的元技能,从而帮助模型实现更好的泛化。


作者简介:

李俊成,浙江大学2019级博士,研究方向为Embodied Agent和vison-and-language understanding。两篇相关工作分别发表于ACM MM2019和CVPR2020。

CVPR 2020 系列报道


相关报道:


CVPR 2020接收论文公布:录用1470篇,接收率“二连降”,仅22% !


论文集:


01. 17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解

02. 22篇入选,百度 15 篇 CVPR 2020 精选论文详解

 

论文解读:


01. [微软] 古有照妖镜,今有换脸识别机,微软 CVPR 2020力作,让伪造人脸无处遁形
02. [港大] PolarMask:将实例分割统一到FCN,有望在工业界大规模应用
03. [牛津大学] RandLA-Net:大场景三维点云语义分割新框架(已开源)
04. [北大&华为] CIFAR-10上做NAS,仅需单卡半天!华为提出基于进化算法和权值共享CARS模型
05. [南京大学] 化繁为简,弱监督目标定位领域的新SOTA - 伪监督目标定位方法
06. [UC 伯克利] 挑战 11 种 GAN的图像真伪,DeepFake鉴别一点都不难
07. [哈斯特帕大学] 学习一个宫崎骏画风的图像风格转换GAN
08. [人大&阿德莱德大学] 看图说话之随心所欲:细粒度可控的图像描述自动生成
09.[北京大学]PQ-NET:序列化的三维形状生成网络
10. 视觉-语言导航新篇章:真实场景下的远程物体定位导航任务
11. 室内设计师失业?针对语言描述的自动三维场景设计算法
12.  深度视觉推理2.0:组合式目标指代理解


登录查看更多
1

相关内容

CVPR is the premier annual computer vision event comprising the main conference and several co-located workshops and short courses. With its high quality and low cost, it provides an exceptional value for students, academics and industry researchers. CVPR 2020 will take place at The Washington State Convention Center in Seattle, WA, from June 16 to June 20, 2020. http://cvpr2020.thecvf.com/
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
59+阅读 · 2020年6月25日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
【浙江大学】使用MAML元学习的少样本图分类
专知会员服务
62+阅读 · 2020年3月22日
专知会员服务
109+阅读 · 2020年3月12日
科研人员提出海量虚拟数据生成新方法
中科院之声
6+阅读 · 2019年9月25日
CVPR 2019 Oral 论文解读 | 无监督域适应语义分割
AI科技评论
49+阅读 · 2019年5月29日
“弄假成真”:基于对抗学习的数据增广方法
科技导报
4+阅读 · 2018年10月8日
CVPR 2018 | 无监督语义分割之全卷积域适应网络
极市平台
8+阅读 · 2018年6月28日
【学界】 李飞飞学生最新论文:利用场景图生成图像
GAN生成式对抗网络
15+阅读 · 2018年4月9日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
6+阅读 · 2018年3月19日
Arxiv
10+阅读 · 2017年12月29日
VIP会员
相关VIP内容
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
59+阅读 · 2020年6月25日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
【浙江大学】使用MAML元学习的少样本图分类
专知会员服务
62+阅读 · 2020年3月22日
专知会员服务
109+阅读 · 2020年3月12日
相关论文
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
6+阅读 · 2018年3月19日
Arxiv
10+阅读 · 2017年12月29日
Top
微信扫码咨询专知VIP会员