【南洋理工Xavier】深度强化学习,课件与代码,109页PPT

2019 年 11 月 28 日 专知

【导读】Xavier Bresson是新加坡南洋理工的副教授,他开设的深度学习数据科学课程《Deep Learning For Data Science》,内容充实,前沿新颖。在第15节课程深度强化学习,Xavier博士一步步讲解了最受欢迎的强化学习算法DQN, REINFORCE, QAC, AAC: ,课件含有109页ppt,并且涵盖代码,值得学习。



Xavier Bresson,是新加坡南洋理工大学计算机科学副教授。他目前的研究重点是弥合稀疏数据表示和谱图理论之间的差距,为大数据科学设计新的算法。

https://www.ntu.edu.sg/home/xbresson/bio.html


深度强化学习


目录:

  • RL与深度学习

  • 代理,环境与MDP

  • 策略,值函数与模型

  • 最优值函数与策略

  • DQN

  • 策略网络

  • Actor-Critic 算法

  • RL与监督学习

  • 学习与规划

深度强化学习:深度学习+强化学习


强化学习框架



策略函数、值函数、模型函数



最优值函数与策略

DQN算法


策略网络算法

演员-评论员算法

强化学习与监督学习相似性

学习与规划

完整版查看:关注专知公众号(点击上方蓝色专知关注

  • 后台回复“NRL” 获取109页《Deep Reinforcement Learning》PPT下载链接索引~




代码

https://github.com/xbresson/CE7454_2019/tree/master/codes/labs_lecture15



更多关于“强化学习”的论文知识资料,请登录专知网站www.zhuanzhi.ai查看,或者点击“阅读原文查看:

https://www.zhuanzhi.ai/topic/2001320766352755/awesome 





-END-
专 · 知


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询
请加专知小助手微信(扫一扫如下二维码添加),获取专知VIP会员码,加入专知人工智能主题群,咨询技术商务合作~
点击“阅读原文”,了解成为 专知会员 ,查看5000+AI主题知识资料
登录查看更多
53

相关内容

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。
模型优化基础,Sayak Paul,67页ppt
专知会员服务
74+阅读 · 2020年6月8日
【ICLR2020】图神经网络与图像处理,微分方程,27页ppt
专知会员服务
47+阅读 · 2020年6月6日
元学习与图神经网络逻辑推导,55页ppt
专知会员服务
127+阅读 · 2020年4月25日
深度强化学习策略梯度教程,53页ppt
专知会员服务
175+阅读 · 2020年2月1日
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
【CVPR2019教程】视频理解中的图表示学习
专知
43+阅读 · 2019年6月20日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
深度强化学习简介
专知
29+阅读 · 2018年12月3日
Arxiv
26+阅读 · 2019年3月5日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Arxiv
11+阅读 · 2018年1月28日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员