【干货书】强化学习算法，98页pdf综合讲解人工智能和机器学习 - 专知VIP

会员服务 ·

15

强化学习算法 · 机器学习 · 人工智能 ·

2021 年 2 月 21 日

【干货书】强化学习算法，98页pdf综合讲解人工智能和机器学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习是一种学习范式，它关注于如何学习控制一个系统，从而最大化表达一个长期目标的数值性能度量。强化学习与监督学习的区别在于，对于学习者的预测，只向学习者提供部分反馈。此外，预测还可能通过影响被控系统的未来状态而产生长期影响。因此，时间起着特殊的作用。强化学习的目标是开发高效的学习算法，以及了解算法的优点和局限性。强化学习具有广泛的实际应用价值，从人工智能到运筹学或控制工程等领域。在这本书中，我们重点关注那些基于强大的动态规划理论的强化学习算法。我们给出了一个相当全面的学习问题目录，描述了核心思想，关注大量的最新算法，然后讨论了它们的理论性质和局限性。

Preface ix Acknowledgments xiii Markov Decision Processes 1 Value Prediction Problems 11 Control 37 For Further Exploration 63 Further reading 63 Applications 63 Software 64 Appendix: The Theory of Discounted Markovian Decision Processes 65 A.1 Contractions and Banach’s fixed-point theorem 65 A.2 Application to MDPs 69 Bibliography 73 Author's Biography 89

成为VIP会员查看完整内容

66

相关内容

强化学习算法

强化学习算法

《行为与认知机器人学》，241页pdf

《行为与认知机器人学》，241页pdf

专知会员服务

54+阅读 · 2021年4月11日

【干货书】Python实现机器学习算法的一步一步指南，103页pdf

【干货书】Python实现机器学习算法的一步一步指南，103页pdf

专知会员服务

174+阅读 · 2021年3月19日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

77+阅读 · 2021年1月23日

最新《计算控制理论》笔记与课程，60页pdf

专知会员服务

54+阅读 · 2020年12月24日

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

233+阅读 · 2020年4月28日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

专知

182+阅读 · 2019年10月23日

近期强化学习领域论文导读（附源码）

近期强化学习领域论文导读（附源码）

人工智能前沿讲习班

7+阅读 · 2019年6月15日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

增强学习算法讲解:马尔可夫决策过程MDP

增强学习算法讲解:马尔可夫决策过程MDP

数据挖掘入门与实战

7+阅读 · 2018年4月22日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

荐书丨机器学习——Python实践（留言送书）

荐书丨机器学习——Python实践（留言送书）

程序人生

7+阅读 · 2018年1月5日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

No-Pain No-Gain: DRL Assisted Optimization in Energy-Constrained CR-NOMA Networks

Arxiv

0+阅读 · 2021年4月13日

Simpler is better: A comparative study of randomized algorithms for computing the CUR decomposition

Arxiv

0+阅读 · 2021年4月13日

On the Globalization of ASPIN Employing Trust-Region Control Strategies -- Convergence Analysis and Numerical Examples

On the Globalization of ASPIN Employing Trust-Region Control Strategies -- Convergence Analysis and Numerical Examples

Arxiv

0+阅读 · 2021年4月12日

Planning for Safe Abortable Overtaking Maneuvers in Autonomous Driving

Arxiv

0+阅读 · 2021年4月12日

MPPI-VS: Sampling-Based Model Predictive Control Strategy for Constrained Image-Based and Position-Based Visual Servoing

Arxiv

0+阅读 · 2021年4月11日

Estimation of multivariate generalized gamma convolutions through Laguerre expansions

Arxiv

0+阅读 · 2021年4月9日

Categorical Stochastic Processes and Likelihood

Arxiv

0+阅读 · 2021年4月8日

Coupled Layer-wise Graph Convolution for Transportation Demand Prediction

Arxiv

12+阅读 · 2020年12月15日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

End to end learning and optimization on graphs

Arxiv

7+阅读 · 2019年5月31日

VIP会员

相关主题

强化学习算法

相关VIP内容

《行为与认知机器人学》，241页pdf

《行为与认知机器人学》，241页pdf

专知会员服务

54+阅读 · 2021年4月11日

【干货书】Python实现机器学习算法的一步一步指南，103页pdf

【干货书】Python实现机器学习算法的一步一步指南，103页pdf

专知会员服务

174+阅读 · 2021年3月19日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

77+阅读 · 2021年1月23日

最新《计算控制理论》笔记与课程，60页pdf

专知会员服务

54+阅读 · 2020年12月24日

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

233+阅读 · 2020年4月28日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】移动计算摄影的神经场表示

大语言模型遇见法律人工智能：综述

【ICCV2025】InfGen：一种分辨率无关的可扩展图像合成范式

美军用无人地面战车发展：现代战争中超越弹药的多元应用

相关资讯

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

专知

182+阅读 · 2019年10月23日

近期强化学习领域论文导读（附源码）

近期强化学习领域论文导读（附源码）

人工智能前沿讲习班

7+阅读 · 2019年6月15日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

增强学习算法讲解:马尔可夫决策过程MDP

增强学习算法讲解:马尔可夫决策过程MDP

数据挖掘入门与实战

7+阅读 · 2018年4月22日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

荐书丨机器学习——Python实践（留言送书）

荐书丨机器学习——Python实践（留言送书）

程序人生

7+阅读 · 2018年1月5日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关论文

No-Pain No-Gain: DRL Assisted Optimization in Energy-Constrained CR-NOMA Networks

Arxiv

0+阅读 · 2021年4月13日

Simpler is better: A comparative study of randomized algorithms for computing the CUR decomposition

Arxiv

0+阅读 · 2021年4月13日

On the Globalization of ASPIN Employing Trust-Region Control Strategies -- Convergence Analysis and Numerical Examples

On the Globalization of ASPIN Employing Trust-Region Control Strategies -- Convergence Analysis and Numerical Examples

Arxiv

0+阅读 · 2021年4月12日

Planning for Safe Abortable Overtaking Maneuvers in Autonomous Driving

Arxiv

0+阅读 · 2021年4月12日

MPPI-VS: Sampling-Based Model Predictive Control Strategy for Constrained Image-Based and Position-Based Visual Servoing

Arxiv

0+阅读 · 2021年4月11日

Estimation of multivariate generalized gamma convolutions through Laguerre expansions

Arxiv

0+阅读 · 2021年4月9日

Categorical Stochastic Processes and Likelihood

Arxiv

0+阅读 · 2021年4月8日

Coupled Layer-wise Graph Convolution for Transportation Demand Prediction

Arxiv

12+阅读 · 2020年12月15日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

End to end learning and optimization on graphs

Arxiv

7+阅读 · 2019年5月31日

微信扫码咨询专知VIP会员