【强化学习论文推荐集合】2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019 - 专知VIP

会员服务 ·

1

强化学习 · 深度强化学习 · AI · 深度学习 ·

2020 年 1 月 15 日

【强化学习论文推荐集合】2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

题目

2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019

关键字

强化学习，深度学习，论文总结

简介

大型项目
- DeepMind’s AlphaStar (Vinyals et al, 2019)
- OpenAI’s Solving’ of the Rubik’s Cube (OpenAI, 2019)
基于模型的Rl
- MuZero (Schrittwieser et al., 2019)
- Dreamer (aka. PlaNet 2.0; Hafner et al., 2019)
多代理RL
- Social Influence as Intrinsic Motivation (Jaques et al., 2019)
- Autocurricula & Emergent Tool-Use (OpenAI, 2019)
学习动力
- Non-Staggered Meta-Learner’s Dynamics (Rabinowitz, 2019)
- Ray Interference (Schaul et al., 2019)
组成和先验
- Information Asymmetry in KL-Regularized RL (Galashov et al., 2019)
- NPMP: Neural Probabilistic Motor Primitives (Merel et al., 2019)
总结
- 总而言之，2019年凸显了Deep RL在以前无法想象的尺寸中的巨大潜力。突出显示的大型项目距离采样效率还差得远。但是，当前寻求有效归纳偏差，先验和基于模型的方法正在解决这些问题。

作者

Robert Tjarko Lange

成为VIP会员查看完整内容

42

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

元学习(meta learning) 最新进展综述论文

元学习(meta learning) 最新进展综述论文

专知会员服务

281+阅读 · 2020年5月8日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

专知会员服务

213+阅读 · 2020年1月13日

【论文推荐】深度学习中贝叶斯不确定性简单基线（A simple baseline for bayesian uncertainty in deep learning）

【论文推荐】深度学习中贝叶斯不确定性简单基线（A simple baseline for bayesian uncertainty in deep learning）

专知会员服务

46+阅读 · 2019年12月25日

【论文推荐中科院自动化所】视频游戏中深度强化学习的研究综述，A Survey of Deep Reinforcement Learning in Video

【论文推荐中科院自动化所】视频游戏中深度强化学习的研究综述，A Survey of Deep Reinforcement Learning in Video

专知会员服务

48+阅读 · 2019年12月24日

【强化学习资源集合】Awesome Reinforcement Learning

【强化学习资源集合】Awesome Reinforcement Learning

专知会员服务

97+阅读 · 2019年12月23日

实时强化学习《Real-Time Reinforcement Learning》S Ramstedt, C Pal [Mila, Element AI] (2019)

实时强化学习《Real-Time Reinforcement Learning》S Ramstedt, C Pal [Mila, Element AI] (2019)

专知会员服务

13+阅读 · 2019年11月17日

生成式对抗网络GAN异常检测

生成式对抗网络GAN异常检测

专知会员服务

118+阅读 · 2019年10月13日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

ICML2019《元学习》教程与必读论文列表

ICML2019《元学习》教程与必读论文列表

专知

42+阅读 · 2019年6月16日

近期强化学习领域论文导读（附源码）

近期强化学习领域论文导读（附源码）

人工智能前沿讲习班

7+阅读 · 2019年6月15日

带你读论文 | 生成对抗网络GAN论文TOP 10

带你读论文 | 生成对抗网络GAN论文TOP 10

微软研究院AI头条

25+阅读 · 2019年4月11日

必读！TOP10生成对抗网络GAN论文（附链接）

必读！TOP10生成对抗网络GAN论文（附链接）

数据派THU

16+阅读 · 2019年3月24日

论文推荐 | 生成对抗网络GAN论文TOP 10

论文推荐 | 生成对抗网络GAN论文TOP 10

机器学习算法与Python学习

5+阅读 · 2019年3月20日

必读！生成对抗网络GAN论文TOP 10

必读！生成对抗网络GAN论文TOP 10

全球人工智能

7+阅读 · 2019年3月19日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

强化学习十大原则

强化学习十大原则

专知

12+阅读 · 2018年9月17日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

A Survey on Bayesian Deep Learning

A Survey on Bayesian Deep Learning

Arxiv

64+阅读 · 2020年7月2日

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年6月18日

1D Convolutional Neural Networks and Applications: A Survey

1D Convolutional Neural Networks and Applications: A Survey

Arxiv

6+阅读 · 2019年5月9日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Deep Learning on Graphs: A Survey

Arxiv

53+阅读 · 2018年12月11日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Implementing the Deep Q-Network

Arxiv

3+阅读 · 2017年11月20日

VIP会员

相关主题

深度强化学习

相关VIP内容

元学习(meta learning) 最新进展综述论文

元学习(meta learning) 最新进展综述论文

专知会员服务

281+阅读 · 2020年5月8日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

专知会员服务

213+阅读 · 2020年1月13日

【论文推荐】深度学习中贝叶斯不确定性简单基线（A simple baseline for bayesian uncertainty in deep learning）

【论文推荐】深度学习中贝叶斯不确定性简单基线（A simple baseline for bayesian uncertainty in deep learning）

专知会员服务

46+阅读 · 2019年12月25日

【论文推荐中科院自动化所】视频游戏中深度强化学习的研究综述，A Survey of Deep Reinforcement Learning in Video

【论文推荐中科院自动化所】视频游戏中深度强化学习的研究综述，A Survey of Deep Reinforcement Learning in Video

专知会员服务

48+阅读 · 2019年12月24日

【强化学习资源集合】Awesome Reinforcement Learning

【强化学习资源集合】Awesome Reinforcement Learning

专知会员服务

97+阅读 · 2019年12月23日

实时强化学习《Real-Time Reinforcement Learning》S Ramstedt, C Pal [Mila, Element AI] (2019)

实时强化学习《Real-Time Reinforcement Learning》S Ramstedt, C Pal [Mila, Element AI] (2019)

专知会员服务

13+阅读 · 2019年11月17日

生成式对抗网络GAN异常检测

生成式对抗网络GAN异常检测

专知会员服务

118+阅读 · 2019年10月13日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

从社会学实验到行为仿真：理解基于Agent的观点动力学建模思维

中英文版《GPT-5 System Card速览》报告

ACL 2025 | 大模型结构化知识提示的泛化能力研究

【普林斯顿博士论文】大型模型的高效推理

相关资讯

ICML2019《元学习》教程与必读论文列表

ICML2019《元学习》教程与必读论文列表

专知

42+阅读 · 2019年6月16日

近期强化学习领域论文导读（附源码）

近期强化学习领域论文导读（附源码）

人工智能前沿讲习班

7+阅读 · 2019年6月15日

带你读论文 | 生成对抗网络GAN论文TOP 10

带你读论文 | 生成对抗网络GAN论文TOP 10

微软研究院AI头条

25+阅读 · 2019年4月11日

必读！TOP10生成对抗网络GAN论文（附链接）

必读！TOP10生成对抗网络GAN论文（附链接）

数据派THU

16+阅读 · 2019年3月24日

论文推荐 | 生成对抗网络GAN论文TOP 10

论文推荐 | 生成对抗网络GAN论文TOP 10

机器学习算法与Python学习

5+阅读 · 2019年3月20日

必读！生成对抗网络GAN论文TOP 10

必读！生成对抗网络GAN论文TOP 10

全球人工智能

7+阅读 · 2019年3月19日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

强化学习十大原则

强化学习十大原则

专知

12+阅读 · 2018年9月17日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

相关论文

A Survey on Bayesian Deep Learning

A Survey on Bayesian Deep Learning

Arxiv

64+阅读 · 2020年7月2日

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年6月18日

1D Convolutional Neural Networks and Applications: A Survey

1D Convolutional Neural Networks and Applications: A Survey

Arxiv

6+阅读 · 2019年5月9日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Deep Learning on Graphs: A Survey

Arxiv

53+阅读 · 2018年12月11日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Implementing the Deep Q-Network

Arxiv

3+阅读 · 2017年11月20日

微信扫码咨询专知VIP会员