【新书】分布式强化学习,280页pdf

2021 年 12 月 19 日 专知


本书分为三个部分。第一部分介绍了分布式强化学习的构建模块。我们首先介绍了我们的基本研究对象,收益分布和分布Bellman方程(第二章)。第三章介绍了分类时间差分学习,一种简单的学习收益分布的算法。在第三章结束时,读者应该理解分布式强化学习的基本原则,并且应该能够在简单的实际设置中使用它。


第二部分是对分布式强化学习理论的发展。第4章介绍了一种用于测量返回分布之间距离的语言,以及与这些分布交互的操作符。第5章介绍了实现分布式强化学习所需的概率表示的概念;在此基础上,研究了用这种表示来计算和近似收益分布的问题,并引入了分布动态规划的框架。第6章研究了如何从样本中以增量的方式学习返回分布,给出了类别时间差分学习的正式结构,以及其他算法,如分位数时间差异学习。第7章将这些思想扩展到最优决策的设置(也称为控制设置)。最后,第8章介绍了基于统计泛函概念的分布强化学习的不同视角。在第二部分结束时,读者应该理解在设计分布式强化学习算法时出现的挑战,以及解决这些挑战的可用工具。



第三部分和最后一部分为实际场景ios开发了分布式强化学习。第九章回顾了线性值函数逼近的原理,并将这些思想推广到分布环境中。第10章讨论了如何将分布方法与深度神经网络相结合来获得深度强化学习的算法,并提出了一个模型来研究这种结合所产生的现象。第11章讨论了分布式强化学习在两个进一步研究领域(多主体学习和神经科学)的新兴应用,并得出结论。


https://www.distributional-rl.org/



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“D280” 就可以获取【新书】分布式强化学习,280页pdf》专知下载链接

商务、投稿、技术等合作:请加微信助手:Quan_ABT, 或发邮件到bd@zhuanzhi.ai

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取7万+AI主题干货知识资料!

点击“ 阅读原文 ”,了解使用 专知
登录查看更多
19

相关内容

【2021新书稿】在线凸优化导论(第二版),260页pdf
专知会员服务
69+阅读 · 2021年12月23日
【新书】统计学傻瓜式入门第二版,451页pdf
专知会员服务
104+阅读 · 2021年11月5日
【开放电子书】概率编程导论,301页pdf
专知会员服务
47+阅读 · 2021年10月21日
专知会员服务
238+阅读 · 2021年10月8日
【2020新书】概率机器学习,附212页pdf与slides
专知会员服务
101+阅读 · 2020年11月12日
最新《机器学习:基本原理》2021新书,209页pdf
专知会员服务
130+阅读 · 2020年10月24日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
336+阅读 · 2020年6月24日
【经典书】贝叶斯强化学习概述,147页pdf
专知
4+阅读 · 2021年11月21日
【Manning新书】高级算法与数据结构,769页pdf
【开放电子书】概率编程导论,301页pdf
专知
4+阅读 · 2021年10月21日
【经典书】线性代数,436页pdf
专知
3+阅读 · 2021年3月16日
【干货书】计算机科学离散数学,627页pdf
专知
54+阅读 · 2020年8月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
11+阅读 · 2021年3月25日
Arxiv
24+阅读 · 2021年1月25日
Arxiv
135+阅读 · 2018年10月8日
Arxiv
25+阅读 · 2018年8月19日
VIP会员
相关VIP内容
【2021新书稿】在线凸优化导论(第二版),260页pdf
专知会员服务
69+阅读 · 2021年12月23日
【新书】统计学傻瓜式入门第二版,451页pdf
专知会员服务
104+阅读 · 2021年11月5日
【开放电子书】概率编程导论,301页pdf
专知会员服务
47+阅读 · 2021年10月21日
专知会员服务
238+阅读 · 2021年10月8日
【2020新书】概率机器学习,附212页pdf与slides
专知会员服务
101+阅读 · 2020年11月12日
最新《机器学习:基本原理》2021新书,209页pdf
专知会员服务
130+阅读 · 2020年10月24日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
336+阅读 · 2020年6月24日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员