【代码集合】深度强化学习Pytorch实现集锦

2018 年 10 月 23 日 机器学习算法与Python学习

本次分享的是用PyTorch语言编写的深度强化学习算法的高质量实现这些IPython笔记本的目的主要是帮助练习和理解这些论文;因此,在某些情况下,我将选择可读性而不是效率。首先,我会上传论文的实现,然后是标记来解释代码的每一部分。


相关论文



  1. Human Level Control Through Deep Reinforement Learning

     [Publication] https://deepmind.com/research/publications/human-level-control-through-deep-reinforcement-learning/

     [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/01.DQN.ipynb

  2. Multi-Step Learning (from Reinforcement Learning: An Introduction, Chapter 7) 

    [Publication] https://github.com/qfettes/DeepRL-Tutorials/blob/master/01.DQN.ipynb

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/02.NStep_DQN.ipynb

  3. Deep Reinforcement Learning with Double Q-learning 

    [Publication] https://arxiv.org/abs/1509.06461

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/03.Double_DQN.ipynb

  4. Dueling Network Architectures for Deep Reinforcement Learning 

    [Publication] https://arxiv.org/abs/1511.06581

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/04.Dueling_DQN.ipynb

  5. Noisy Networks for Exploration 

    [Publication] https://github.com/qfettes/DeepRL-Tutorials/blob/master/04.Dueling_DQN.ipynb

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/05.DQN-NoisyNets.ipynb

  6. Prioritized Experience Replay 

    [Publication] https://arxiv.org/abs/1511.05952?context=cs

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/06.DQN_PriorityReplay.ipynb

  7. A Distributional Perspective on Reinforcement Learning 

    [Publication] https://arxiv.org/abs/1707.06887

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/07.Categorical-DQN.ipynb

  8. Rainbow: Combining Improvements in Deep Reinforcement Learning 

    [Publication] https://arxiv.org/abs/1710.02298

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/08.Rainbow.ipynb

  9. Distributional Reinforcement Learning with Quantile Regression 

    [Publication] https://arxiv.org/abs/1710.10044

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/09.QuantileRegression-DQN.ipynb

  10. Rainbow with Quantile Regression 

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/10.Quantile-Rainbow.ipynb

  11. Deep Recurrent Q-Learning for Partially Observable MDPs 

    [Publication] https://arxiv.org/abs/1507.06527

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/11.DRQN.ipynb

  12. Advantage Actor Critic (A2C) 

    [Publication1] https://arxiv.org/abs/1602.01783

    [Publication2] https://blog.openai.com/baselines-acktr-a2c/

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/12.A2C.ipynb

  13. High-Dimensional Continuous Control Using Generalized Advantage Estimation 

    [Publication] https://arxiv.org/abs/1506.02438

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/13.GAE.ipynb

  14. Proximal Policy Optimization Algorithms 

    [Publication] https://arxiv.org/abs/1707.06347

    [code] https://github.com/qfettes/DeepRL-Tutorials/blob/master/14.PPO.ipynb


PyTorch实现


关注公众号,后天回复关键词

20181023


推荐阅读

宿命之战:程序员VS产品经理

赛事发布 | 数字合肥广邀智慧城市建设英才,三十万重金等你来战

800万中文词,腾讯AI Lab开源大规模NLP数据集

pandas入门教程

10 张令人喷饭的程序员漫画

【资源】机器学习算法工程师手册(PDF下载)

源码 | Python爬虫之网易云音乐下载

548页MIT强化学习教程,收藏备用【PDF下载】


登录查看更多
8

相关内容

专知会员服务
109+阅读 · 2020年3月12日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
115+阅读 · 2019年12月31日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
93+阅读 · 2019年12月23日
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
37+阅读 · 2019年10月9日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
17种深度强化学习算法用Pytorch实现
新智元
30+阅读 · 2019年9月16日
5大必知的图算法,附Python代码实现
AI100
4+阅读 · 2019年9月10日
图像分类论文与代码大列表
专知
6+阅读 · 2019年2月16日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
OpenAI官方发布:强化学习中的关键论文
专知
14+阅读 · 2018年12月12日
【深度强化学习教程】高质量PyTorch实现集锦
【ECCV2018】24篇论文代码实现
专知
17+阅读 · 2018年9月10日
深度学习TensorFlow实现集合
专知
9+阅读 · 2018年9月8日
机器学习的Pytorch实现资源集合
专知
11+阅读 · 2018年9月1日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
Arxiv
4+阅读 · 2019年12月2日
Symbolic Priors for RNN-based Semantic Parsing
Arxiv
3+阅读 · 2018年9月20日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
19+阅读 · 2018年3月28日
Arxiv
11+阅读 · 2018年1月18日
VIP会员
相关VIP内容
专知会员服务
109+阅读 · 2020年3月12日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
115+阅读 · 2019年12月31日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
93+阅读 · 2019年12月23日
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
37+阅读 · 2019年10月9日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
相关资讯
17种深度强化学习算法用Pytorch实现
新智元
30+阅读 · 2019年9月16日
5大必知的图算法,附Python代码实现
AI100
4+阅读 · 2019年9月10日
图像分类论文与代码大列表
专知
6+阅读 · 2019年2月16日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
OpenAI官方发布:强化学习中的关键论文
专知
14+阅读 · 2018年12月12日
【深度强化学习教程】高质量PyTorch实现集锦
【ECCV2018】24篇论文代码实现
专知
17+阅读 · 2018年9月10日
深度学习TensorFlow实现集合
专知
9+阅读 · 2018年9月8日
机器学习的Pytorch实现资源集合
专知
11+阅读 · 2018年9月1日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
Top
微信扫码咨询专知VIP会员