CVPR 2020 | 浙大李俊成：用无监督强化学习方法来获得迁移能力

2020 年 3 月 23 日 AI科技评论

作者 | 李俊成

编辑 | 蒋宝尚

本文是对浙江大学和加州大学圣巴巴拉分校合作完成的，被CVPR 2020收录的论文《Unsupervised Reinforcement Learning of Transferable Meta-Skills for Embodied Navigation》进行解读，相关工作已经开源。

论文：https://arxiv.org/abs/1911.07450

论文简介：

视觉导航任务要求智能体能够智能地导航到指定的目标。当前基于深度强化学习的方法往往需要大量的训练数据，而构建丰富的3D仿真环境以及提供任务相关标注是十分昂贵的。本文关注于在低资源的设定下完成视觉导航任务。本文通过提出无监督强化学习方法来获得具有迁移能力的子策略，使得模型能够快速迁移到视觉导航任务。在AI2-THOR环境中，我们的方法实现了最佳的性能，进一步的实验分析证明我们的方法学习到了一些具备迁移能力的元技能，从而帮助模型实现更好的泛化。

作者简介：

李俊成，浙江大学2019级博士，研究方向为Embodied Agent和vison-and-language understanding。两篇相关工作分别发表于ACM MM2019和CVPR2020。

CVPR 2020 系列报道

相关报道：

CVPR 2020接收论文公布：录用1470篇，接收率“二连降”，仅22% !

论文集：

01. 17篇入选CVPR 2020，腾讯优图 9 篇精选论文详解

02. 22篇入选，百度 15 篇 CVPR 2020 精选论文详解

论文解读：

01. [微软] 古有照妖镜，今有换脸识别机，微软 CVPR 2020力作，让伪造人脸无处遁形

02. [港大] PolarMask：将实例分割统一到FCN，有望在工业界大规模应用

03. [牛津大学] RandLA-Net:大场景三维点云语义分割新框架（已开源）

04. [北大&华为] CIFAR-10上做NAS，仅需单卡半天！华为提出基于进化算法和权值共享CARS模型

05. [南京大学] 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

06. [UC 伯克利] 挑战 11 种 GAN的图像真伪，DeepFake鉴别一点都不难

07. [哈斯特帕大学] 学习一个宫崎骏画风的图像风格转换GAN

08. [人大&阿德莱德大学] 看图说话之随心所欲：细粒度可控的图像描述自动生成

09.[北京大学]PQ-NET：序列化的三维形状生成网络

10. 视觉-语言导航新篇章：真实场景下的远程物体定位导航任务

11. 室内设计师失业？针对语言描述的自动三维场景设计算法

12. 深度视觉推理2.0：组合式目标指代理解

登录查看更多

相关内容

CVPR 2020

关注 57

CVPR is the premier annual computer vision event comprising the main conference and several co-located workshops and short courses. With its high quality and low cost, it provides an exceptional value for students, academics and industry researchers. CVPR 2020 will take place at The Washington State Convention Center in Seattle, WA, from June 16 to June 20, 2020. http://cvpr2020.thecvf.com/

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

近期必读的5篇顶会CVPR 2020【图神经网络（GNN）】相关论文-Part2

专知会员服务

84+阅读 · 2020年3月17日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日