【伯克利-Pieter Abbeel】深度强化学习基础，附slides与视频 - 专知VIP

会员服务 ·

6

深度强化学习 · 加州大学伯克利分校 (UC Berkeley) ·

2021 年 8 月 26 日

【伯克利-Pieter Abbeel】深度强化学习基础，附slides与视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

来自伯克利Pieter Abbeel教授讲述的深度强化学习课程6讲，讲述内容包括，MDP basics, value & policy iteration, max-ent, DQN, policy gradient, TRPO, PPO, DDPG, SAC, model-based RL.

视频地址： https://www.youtube.com/playlist?list=PLwRJQ4m4UJjNymuBM9RdmB3Z9N5-0IlY0

成为VIP会员查看完整内容

29

相关内容

深度强化学习

深度强化学习

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而，传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下，深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

【CVPR2021】面向机器人的预训练模型-一种通用方法，伯克利Pieter Abbeel教授，附slides与视频

专知会员服务

29+阅读 · 2021年6月28日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

专知会员服务

67+阅读 · 2021年3月24日

UC伯克利最新深度学习课程上线，强化学习大牛Sergey Levine授课（B站可看）

专知会员服务

33+阅读 · 2021年3月21日

李宏毅《机器学习》国语课程(2021)来了！附Slides和视频！

李宏毅《机器学习》国语课程(2021)来了！附Slides和视频！

专知会员服务

95+阅读 · 2021年3月1日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

76+阅读 · 2021年1月23日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知会员服务

34+阅读 · 2019年11月26日

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

专知会员服务

29+阅读 · 2019年11月2日

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

专知会员服务

84+阅读 · 2019年10月29日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

专知

19+阅读 · 2019年6月17日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

伯克利人工智能导论课开放：视频、PPT和练习都在这 | 资源

伯克利人工智能导论课开放：视频、PPT和练习都在这 | 资源

量子位

9+阅读 · 2019年1月17日

资源 | 伯克利2018秋季课程：人工智能导论（视频+PPT+作业）

资源 | 伯克利2018秋季课程：人工智能导论（视频+PPT+作业）

机器之心

17+阅读 · 2018年12月31日

UC伯克利Pieter Abbeel谈论强化学习-视频

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

资源 | 伯克利CS294深度强化学习课程资料放出（PPT+录像）

资源 | 伯克利CS294深度强化学习课程资料放出（PPT+录像）

大数据文摘

10+阅读 · 2018年9月12日

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

大数据文摘

20+阅读 · 2018年6月13日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

Improving Hyperparameter Optimization by Planning Ahead

Improving Hyperparameter Optimization by Planning Ahead

Arxiv

0+阅读 · 2021年10月15日

Meta-Reinforcement Learning Based Resource Allocation for Dynamic V2X Communications

Arxiv

0+阅读 · 2021年10月14日

A review of Generative Adversarial Networks (GANs) and its applications in a wide variety of disciplines -- From Medical to Remote Sensing

Arxiv

0+阅读 · 2021年10月1日

Density Constrained Reinforcement Learning

Arxiv

6+阅读 · 2021年6月24日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月6日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

A Tour of Reinforcement Learning: The View from Continuous Control

Arxiv

6+阅读 · 2018年6月25日

Cache-Enabled Dynamic Rate Allocation via Deep Self-Transfer Reinforcement Learning

Arxiv

4+阅读 · 2018年3月30日

VIP会员

相关主题

深度强化学习

加州大学伯克利分校 (UC Berkeley)

相关VIP内容

【CVPR2021】面向机器人的预训练模型-一种通用方法，伯克利Pieter Abbeel教授，附slides与视频

专知会员服务

29+阅读 · 2021年6月28日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

专知会员服务

67+阅读 · 2021年3月24日

UC伯克利最新深度学习课程上线，强化学习大牛Sergey Levine授课（B站可看）

专知会员服务

33+阅读 · 2021年3月21日

李宏毅《机器学习》国语课程(2021)来了！附Slides和视频！

李宏毅《机器学习》国语课程(2021)来了！附Slides和视频！

专知会员服务

95+阅读 · 2021年3月1日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

76+阅读 · 2021年1月23日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知会员服务

34+阅读 · 2019年11月26日

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

专知会员服务

29+阅读 · 2019年11月2日

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

专知会员服务

84+阅读 · 2019年10月29日

热门VIP内容

开通专知VIP会员享更多权益服务

扩散语言模型综述

《美陆军徒步机动作战条令手册》最新168页

【博士论文】理解神经网络的训练动态：从局部优化轨迹与特征学习视角

军事后勤数字化未来展望

相关资讯

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

专知

19+阅读 · 2019年6月17日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

伯克利人工智能导论课开放：视频、PPT和练习都在这 | 资源

伯克利人工智能导论课开放：视频、PPT和练习都在这 | 资源

量子位

9+阅读 · 2019年1月17日

资源 | 伯克利2018秋季课程：人工智能导论（视频+PPT+作业）

资源 | 伯克利2018秋季课程：人工智能导论（视频+PPT+作业）

机器之心

17+阅读 · 2018年12月31日

UC伯克利Pieter Abbeel谈论强化学习-视频

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

资源 | 伯克利CS294深度强化学习课程资料放出（PPT+录像）

资源 | 伯克利CS294深度强化学习课程资料放出（PPT+录像）

大数据文摘

10+阅读 · 2018年9月12日

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

大数据文摘

20+阅读 · 2018年6月13日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关论文

Improving Hyperparameter Optimization by Planning Ahead

Improving Hyperparameter Optimization by Planning Ahead

Arxiv

0+阅读 · 2021年10月15日

Meta-Reinforcement Learning Based Resource Allocation for Dynamic V2X Communications

Arxiv

0+阅读 · 2021年10月14日

A review of Generative Adversarial Networks (GANs) and its applications in a wide variety of disciplines -- From Medical to Remote Sensing

Arxiv

0+阅读 · 2021年10月1日

Density Constrained Reinforcement Learning

Arxiv

6+阅读 · 2021年6月24日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月6日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

A Tour of Reinforcement Learning: The View from Continuous Control

Arxiv

6+阅读 · 2018年6月25日

Cache-Enabled Dynamic Rate Allocation via Deep Self-Transfer Reinforcement Learning

Arxiv

4+阅读 · 2018年3月30日

微信扫码咨询专知VIP会员