DeepMind : 超越传统强化学习的价值分布方法

2017 年 7 月 30 日 CreateAMind


代码:

https://github.com/go2sea/C51DQN

https://github.com/Kiwoo/distributional_perspective_on_RL



论文:https://arxiv.org/abs/1707.06887



deepmind 博客: https://deepmind.com/blog/going-beyond-average-reinforcement-learning/



掌握好了来面试哦!



翻译:https://mp.weixin.qq.com/s/cO1VlYGwdRBAbPs7IgvcAA



登录查看更多
0

相关内容

《强化学习》简介小册,24页pdf
专知会员服务
280+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
282+阅读 · 2019年10月9日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
OpenAI官方发布:强化学习中的关键论文
专知
14+阅读 · 2018年12月12日
【干货】强化学习介绍
专知
12+阅读 · 2018年6月24日
2017年12月19日精彩内容推荐(《强化学习》第二版免费下载)
Chatbots技术与产品
6+阅读 · 2017年12月19日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关VIP内容
《强化学习》简介小册,24页pdf
专知会员服务
280+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
282+阅读 · 2019年10月9日
相关资讯
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
OpenAI官方发布:强化学习中的关键论文
专知
14+阅读 · 2018年12月12日
【干货】强化学习介绍
专知
12+阅读 · 2018年6月24日
2017年12月19日精彩内容推荐(《强化学习》第二版免费下载)
Chatbots技术与产品
6+阅读 · 2017年12月19日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Top
微信扫码咨询专知VIP会员