【2022新书】强化学习工业应用，408页pdf - 专知VIP

会员服务 ·

98

强化学习 · 书籍 ·

2022 年 2 月 3 日

【2022新书】强化学习工业应用，408页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

https://rl-book.com/

强化学习(RL)将成为未来10年人工智能领域最大的突破之一，使算法能够从环境中学习以实现任意目标。这一令人兴奋的发展避免了传统机器学习(ML)算法中的限制。这本实用的书向数据科学和人工智能专业人士展示了如何通过强化学习，让机器自己学习。

Winder研究的作者Phil Winder涵盖了从基本的模块到最先进的实践。您将探索RL的当前状态，关注工业应用，学习许多算法，并从部署RL解决方案到生产的专门章节中受益。这不是一本教谱; 不回避数学，并希望熟悉ML。

了解RL是什么，以及算法如何帮助解决问题
掌握RL的基本原理，包括马尔可夫决策过程、动态规划和时间差异学习
深入研究一系列的价值和策略梯度方法
运用先进的RL解决方案，如元学习、分层学习、多智能体和模仿学习
了解前沿的深度RL算法，包括Rainbow、PPO、TD3、SAC等
通过相应的网站获得实际的例子

目录内容： Preface

Why Reinforcement Learning?
Markov Decision Processes, Dynamic Programming, and Monte Carlo Methods
Temporal-Difference Learning, Q-Learning, and n-Step Algorithms
Deep Q-Networks
Policy Gradient Methods
Beyond Policy Gradients
Learning All Possible Policies with Entropy Methods
Improving How an Agent Learns
Practical Reinforcement Learning
Operational Reinforcement Learning
Conclusions and the Future A. The Gradient of a Logistic Policy for Two Actions B. The Gradient of a Softmax Policy

成为VIP会员查看完整内容

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

【经典书】强化学习算法，98页pdf

专知会员服务

130+阅读 · 2021年8月25日

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

专知会员服务

264+阅读 · 2021年1月27日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【UMD开放书】机器学习课程书册，19章227页pdf，带你学习ML

【UMD开放书】机器学习课程书册，19章227页pdf，带你学习ML

专知会员服务

102+阅读 · 2019年12月9日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

【干货书】人工智能自动驾驶，AI FOR CARS，129页pdf

【干货书】人工智能自动驾驶，AI FOR CARS，129页pdf

专知

8+阅读 · 2021年12月27日

【干货书】Python参考手册，210页pdf

【干货书】Python参考手册，210页pdf

专知

3+阅读 · 2021年4月30日

【干货书】数据科学手册，456页pdf

【干货书】数据科学手册，456页pdf

专知

15+阅读 · 2021年4月28日

【干货书】面向计算科学和工程的Python导论，167页pdf

【干货书】面向计算科学和工程的Python导论，167页pdf

专知

3+阅读 · 2021年4月7日

17种深度强化学习算法用Pytorch实现

17种深度强化学习算法用Pytorch实现

新智元

31+阅读 · 2019年9月16日

使用强化学习训练机械臂完成人类任务

使用强化学习训练机械臂完成人类任务

AI研习社

13+阅读 · 2019年3月23日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

最优再保险理论研究及其在金融中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

多策略自适应群智能算法及其在大规模生产调度中的应用

国家自然科学基金

1+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于事件的强化学习及其在群机器人优化控制中的应用

国家自然科学基金

3+阅读 · 2012年12月31日

约束Markov过程的大偏差与拟遍历性及相关问题

国家自然科学基金

0+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

系统范式及延迟脉冲金融投资演化均衡模型的创新性研究

国家自然科学基金

0+阅读 · 2008年12月31日

Deep Interactive Bayesian Reinforcement Learning via Meta-Learning

Arxiv

1+阅读 · 2022年4月15日

A Machine Learning Tutorial for Operational Meteorology, Part I: Traditional Machine Learning

A Machine Learning Tutorial for Operational Meteorology, Part I: Traditional Machine Learning

Arxiv

1+阅读 · 2022年4月15日

Machine Learning: Algorithms, Models, and Applications

Arxiv

23+阅读 · 2022年1月6日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

A Survey of the Usages of Deep Learning in Natural Language Processing

A Survey of the Usages of Deep Learning in Natural Language Processing

Arxiv

122+阅读 · 2019年9月11日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Deep Reinforcement Learning for List-wise Recommendations

Arxiv

13+阅读 · 2018年1月5日

VIP会员

相关主题

相关VIP内容

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

【经典书】强化学习算法，98页pdf

专知会员服务

130+阅读 · 2021年8月25日

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

专知会员服务

264+阅读 · 2021年1月27日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【UMD开放书】机器学习课程书册，19章227页pdf，带你学习ML

【UMD开放书】机器学习课程书册，19章227页pdf，带你学习ML

专知会员服务

102+阅读 · 2019年12月9日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】移动计算摄影的神经场表示

大语言模型遇见法律人工智能：综述

【ICCV2025】InfGen：一种分辨率无关的可扩展图像合成范式

美军用无人地面战车发展：现代战争中超越弹药的多元应用

相关资讯

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

【干货书】人工智能自动驾驶，AI FOR CARS，129页pdf

【干货书】人工智能自动驾驶，AI FOR CARS，129页pdf

专知

8+阅读 · 2021年12月27日

【干货书】Python参考手册，210页pdf

【干货书】Python参考手册，210页pdf

专知

3+阅读 · 2021年4月30日

【干货书】数据科学手册，456页pdf

【干货书】数据科学手册，456页pdf

专知

15+阅读 · 2021年4月28日

【干货书】面向计算科学和工程的Python导论，167页pdf

【干货书】面向计算科学和工程的Python导论，167页pdf

专知

3+阅读 · 2021年4月7日

17种深度强化学习算法用Pytorch实现

17种深度强化学习算法用Pytorch实现

新智元

31+阅读 · 2019年9月16日

使用强化学习训练机械臂完成人类任务

使用强化学习训练机械臂完成人类任务

AI研习社

13+阅读 · 2019年3月23日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关基金

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

最优再保险理论研究及其在金融中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

多策略自适应群智能算法及其在大规模生产调度中的应用

国家自然科学基金

1+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于事件的强化学习及其在群机器人优化控制中的应用

国家自然科学基金

3+阅读 · 2012年12月31日

约束Markov过程的大偏差与拟遍历性及相关问题

国家自然科学基金

0+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

系统范式及延迟脉冲金融投资演化均衡模型的创新性研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Deep Interactive Bayesian Reinforcement Learning via Meta-Learning

Arxiv

1+阅读 · 2022年4月15日

A Machine Learning Tutorial for Operational Meteorology, Part I: Traditional Machine Learning

A Machine Learning Tutorial for Operational Meteorology, Part I: Traditional Machine Learning

Arxiv

1+阅读 · 2022年4月15日

Machine Learning: Algorithms, Models, and Applications

Arxiv

23+阅读 · 2022年1月6日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

A Survey of the Usages of Deep Learning in Natural Language Processing

A Survey of the Usages of Deep Learning in Natural Language Processing

Arxiv

122+阅读 · 2019年9月11日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Deep Reinforcement Learning for List-wise Recommendations

Arxiv

13+阅读 · 2018年1月5日

微信扫码咨询专知VIP会员