DeepMind ：超越传统强化学习的价值分布方法

会员服务 ·

DeepMind ：超越传统强化学习的价值分布方法

2017 年 7 月 30 日 CreateAMind

代码：

https://github.com/go2sea/C51DQN

https://github.com/Kiwoo/distributional_perspective_on_RL

论文：https://arxiv.org/abs/1707.06887

deepmind 博客： https://deepmind.com/blog/going-beyond-average-reinforcement-learning/

掌握好了来面试哦！

翻译：https://mp.weixin.qq.com/s/cO1VlYGwdRBAbPs7IgvcAA

登录查看更多

相关内容

价值分布

关注 0

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

《强化学习》简介小册，24页pdf

专知会员服务

280+阅读 · 2020年4月19日

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

MIT新书《强化学习与最优控制》

专知会员服务

282+阅读 · 2019年10月9日

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

OpenAI官方发布：强化学习中的关键论文

专知

14+阅读 · 2018年12月12日

【干货】强化学习介绍

专知

12+阅读 · 2018年6月24日

2017年12月19日精彩内容推荐（《强化学习》第二版免费下载）

Chatbots技术与产品

6+阅读 · 2017年12月19日

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

Variational Bayesian Reinforcement Learning with Regret Bounds

Arxiv

3+阅读 · 2018年7月25日

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

17+阅读 · 2018年6月27日

Representation Learning for Visual-Relational Knowledge Graphs

Arxiv

9+阅读 · 2018年3月31日

Face Synthesis from Visual Attributes via Sketch using Conditional VAEs and GANs

Arxiv

4+阅读 · 2017年12月30日

VIP会员

DeepMind ： 超越传统强化学习的价值分布方法

相关内容

DeepMind ：超越传统强化学习的价值分布方法