RL Foundation: Policy Gradient Method

会员服务 ·

RL Foundation: Policy Gradient Method

2019 年 10 月 18 日 CreateAMind

Reference:

Reinforcement Learning An Introduction

https://spinningup.openai.com/en/latest/spinningup/rl_intro3.html

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching_files/pg.pdf

欢迎加入打卡群自律学习强化学习，更欢迎支持或加入我们！请参考公众号createAmind菜单说明。

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【斯坦福】凸优化圣经- Convex Optimization （附730pdf下载）

专知会员服务

211+阅读 · 2020年6月5日

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

专知会员服务

80+阅读 · 2020年2月18日

深度强化学习策略梯度教程，53页ppt

专知会员服务

176+阅读 · 2020年2月1日

【强化学习论文推荐集合】2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019

专知会员服务

41+阅读 · 2020年1月15日

【强化学习资源集合】Awesome Reinforcement Learning

专知会员服务

93+阅读 · 2019年12月23日

新书分享：强化学习最新书稿《强化学习导论》（Reinforcement Learning An Introduction）第二版出炉

专知会员服务

111+阅读 · 2019年10月25日

Stabilizing Transformers for Reinforcement Learning

专知会员服务

56+阅读 · 2019年10月17日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

31+阅读 · 2019年10月12日

强化学习最新教程，17页pdf

专知会员服务

167+阅读 · 2019年10月11日

MIT新书《强化学习与最优控制》

专知会员服务

270+阅读 · 2019年10月9日

RL解决'LunarLander-v2' (SOTA)

CreateAMind

62+阅读 · 2019年9月27日

RL圣经出中文版了

CreateAMind

18+阅读 · 2019年9月13日

强化学习从入门到放弃：汪军李宏毅等大佬资源大放送！

新智元

23+阅读 · 2018年12月29日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

spinningup.openai 强化学习资源完整

CreateAMind

6+阅读 · 2018年12月17日

OpenAI官方发布：强化学习中的关键论文

专知

14+阅读 · 2018年12月12日

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

Reinforcement Learning: An Introduction 2018第二版 500页

CreateAMind

11+阅读 · 2018年4月27日

Deep Reinforcement Learning 深度增强学习资源

数据挖掘入门与实战

7+阅读 · 2017年11月4日

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

Learning When Not to Answer: A Ternary Reward Structure for Reinforcement Learning based Question Answering

Arxiv

6+阅读 · 2019年4月3日

Learning Heuristics over Large Graphs via Deep Reinforcement Learning

Arxiv

12+阅读 · 2019年3月8日

PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation

Arxiv

8+阅读 · 2018年12月18日

HAQ: Hardware-Aware Automated Quantization

Arxiv

6+阅读 · 2018年11月21日

Bipedal Walking Robot using Deep Deterministic Policy Gradient

Arxiv

3+阅读 · 2018年7月16日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

Arxiv

8+阅读 · 2018年7月10日

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

15+阅读 · 2018年6月27日

Logically-Constrained Reinforcement Learning

Arxiv

5+阅读 · 2018年4月22日

MQGrad: Reinforcement Learning of Gradient Quantization in Parameter Server

Arxiv

4+阅读 · 2018年4月22日

VIP会员

RL Foundation: Policy Gradient Method

相关内容

知识荟萃

更多