【实用书】强化学习实战：Python，110页pdf - 专知

会员服务 ·

0

【实用书】强化学习实战：Python，110页pdf

2022 年 6 月 9 日 专知

强化学习是人工智能中一个强大的工具，其中虚拟或物理代理学习优化他们的决策，以实现长期目标。在某些情况下，这种机器学习方法可以节省程序员的时间，超越现有的控制器，达到超人的性能，并不断适应不断变化的条件。这本书认为，这些成功表明强化学习可以成功地应用于许多不同的情况，包括机器人控制、股票交易、供应链优化和工厂控制。

然而，强化学习传统上仅限于虚拟环境或模拟环境中的应用，在这些环境中已经提供了设置。此外，实验可以完成几乎无限次的尝试无风险。在许多现实生活任务中，使用强化学习并不像(1)数据没有正确的形式;(2)数据稀缺，(3)自动化在现实世界中有局限性。

因此，这本书是写来帮助学者，领域专家，和数据爱好者一样理解的基本原则，应用强化学习到现实世界的问题。这是通过将重点放在使用实际示例和将标准数据建模为所需的正确形式，然后应用基本智能体的过程来实现的。为了进一步帮助读者获得对这些方法的深入和接地气的理解，本书展示了完整的手工计算示例，以及如何用代码以更自动化的方式实现这一点。

对于对强化学习作为解决方案感兴趣但不精通的决策者，本书在介绍和案例研究部分包括简单的、非技术的例子。这些提供了强化学习的背景，以及在实践中应用它的挑战和风险。具体来说，这些部分阐述了强化学习和其他机器学习方法的区别，以及知名公司如何成功地使用这种方法解决他们的问题。

https://www.morganclaypool.com/doi/abs/10.2200/S01170ED1V01Y202202AIM052

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“P110” 就可以获取《【实用书】强化学习实战：Python，110页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

9

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【2022新书】Python手册，275页pdf

【2022新书】Python手册，275页pdf

专知会员服务

182+阅读 · 2022年3月18日

机器学习简介，61页pdf

专知会员服务

57+阅读 · 2021年7月6日

【干货书】Python机器学习，361页pdf

【干货书】Python机器学习，361页pdf

专知会员服务

270+阅读 · 2021年2月25日

【2020新书】C++傻瓜式学习(第四版)，915页pdf

专知会员服务

102+阅读 · 2020年12月19日

【干货书】Python 编程，480页pdf

【干货书】Python 编程，480页pdf

专知会员服务

242+阅读 · 2020年8月14日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

算法与数据结构Python，369页pdf

算法与数据结构Python，369页pdf

专知会员服务

165+阅读 · 2020年3月4日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【2022新书】Python DevOps，245页pdf

【2022新书】Python DevOps，245页pdf

专知

6+阅读 · 2022年7月11日

【干货书】机器学习的金融风险管理与Python，194页pdf

【干货书】机器学习的金融风险管理与Python，194页pdf

专知

27+阅读 · 2022年7月1日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

专知

28+阅读 · 2022年1月29日

【经典书】贝叶斯强化学习概述，147页pdf

【经典书】贝叶斯强化学习概述，147页pdf

专知

4+阅读 · 2021年11月21日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【干货书】Python机器学习导论，340页pdf数据科学家指南

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知

97+阅读 · 2020年6月4日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

38+阅读 · 2020年5月9日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

42+阅读 · 2020年3月10日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

量子计算算法设计与实现方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于供应链视角的环境治理：策略选择与协同机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于在线机器学习的组合算法交易策略研究

国家自然科学基金

5+阅读 · 2013年12月31日

互联网环境下的服务供应链知识协作治理模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

关注碳排放权交易的供应链绩效评估与改进研究

国家自然科学基金

0+阅读 · 2013年12月31日

证券市场中ARA的建模算法及实证研究

国家自然科学基金

1+阅读 · 2012年12月31日

动态多策略差分演化算法及其在无线传感器网络能量分配优化中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

博弈精炼的一般框架和Nash平衡实现的理性路径

国家自然科学基金

3+阅读 · 2011年12月31日

基于移动Agent的无线传感器网络数据处理技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

信息环境下面向过程的钢铁制造业成本要素分配方法及其应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

HierarchicalForecast: A Reference Framework for Hierarchical Forecasting in Python

Arxiv

0+阅读 · 2022年7月28日

Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning

Arxiv

0+阅读 · 2022年7月28日

Co-Evolutionary Diversity Optimisation for the Traveling Thief Problem

Arxiv

0+阅读 · 2022年7月28日

Planning and Learning: A Review of Methods involving Path-Planning for Autonomous Vehicles

Arxiv

0+阅读 · 2022年7月26日

Statistically Efficient Advantage Learning for Offline Reinforcement Learning in Infinite Horizons

Arxiv

0+阅读 · 2022年7月26日

Forecasting: theory and practice

Arxiv

57+阅读 · 2022年1月5日

The Confluence of Networks, Games and Learning

Arxiv

94+阅读 · 2021年5月17日

Attention, please! A survey of Neural Attention Models in Deep Learning

Arxiv

59+阅读 · 2021年3月31日

Dissecting Supervised Constrastive Learning

Arxiv

11+阅读 · 2021年2月17日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

VIP会员

相关主题

机器人控制

相关VIP内容

【2022新书】Python手册，275页pdf

【2022新书】Python手册，275页pdf

专知会员服务

182+阅读 · 2022年3月18日

机器学习简介，61页pdf

专知会员服务

57+阅读 · 2021年7月6日

【干货书】Python机器学习，361页pdf

【干货书】Python机器学习，361页pdf

专知会员服务

270+阅读 · 2021年2月25日

【2020新书】C++傻瓜式学习(第四版)，915页pdf

专知会员服务

102+阅读 · 2020年12月19日

【干货书】Python 编程，480页pdf

【干货书】Python 编程，480页pdf

专知会员服务

242+阅读 · 2020年8月14日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

算法与数据结构Python，369页pdf

算法与数据结构Python，369页pdf

专知会员服务

165+阅读 · 2020年3月4日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《军事远程操作中的自动语音识别与多模态交互技术》最新报告

《人工智能与预测性健康管理（PHM）技术在军事智能装备保障中的应用》

人工智能无人机：传统军事优势面临的新挑战

《定向能武器对无人机核心系统及体外细胞动力学影响的深度剖析》最新28页报告

相关资讯

【2022新书】Python DevOps，245页pdf

【2022新书】Python DevOps，245页pdf

专知

6+阅读 · 2022年7月11日

【干货书】机器学习的金融风险管理与Python，194页pdf

【干货书】机器学习的金融风险管理与Python，194页pdf

专知

27+阅读 · 2022年7月1日

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

专知

28+阅读 · 2022年1月29日

【经典书】贝叶斯强化学习概述，147页pdf

【经典书】贝叶斯强化学习概述，147页pdf

专知

4+阅读 · 2021年11月21日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【干货书】Python机器学习导论，340页pdf数据科学家指南

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知

97+阅读 · 2020年6月4日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

38+阅读 · 2020年5月9日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

42+阅读 · 2020年3月10日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

相关基金

量子计算算法设计与实现方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于供应链视角的环境治理：策略选择与协同机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于在线机器学习的组合算法交易策略研究

国家自然科学基金

5+阅读 · 2013年12月31日

互联网环境下的服务供应链知识协作治理模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

关注碳排放权交易的供应链绩效评估与改进研究

国家自然科学基金

0+阅读 · 2013年12月31日

证券市场中ARA的建模算法及实证研究

国家自然科学基金

1+阅读 · 2012年12月31日

动态多策略差分演化算法及其在无线传感器网络能量分配优化中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

博弈精炼的一般框架和Nash平衡实现的理性路径

国家自然科学基金

3+阅读 · 2011年12月31日

基于移动Agent的无线传感器网络数据处理技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

信息环境下面向过程的钢铁制造业成本要素分配方法及其应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

HierarchicalForecast: A Reference Framework for Hierarchical Forecasting in Python

Arxiv

0+阅读 · 2022年7月28日

Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning

Arxiv

0+阅读 · 2022年7月28日

Co-Evolutionary Diversity Optimisation for the Traveling Thief Problem

Arxiv

0+阅读 · 2022年7月28日

Planning and Learning: A Review of Methods involving Path-Planning for Autonomous Vehicles

Arxiv

0+阅读 · 2022年7月26日

Statistically Efficient Advantage Learning for Offline Reinforcement Learning in Infinite Horizons

Arxiv

0+阅读 · 2022年7月26日

Forecasting: theory and practice

Arxiv

57+阅读 · 2022年1月5日

The Confluence of Networks, Games and Learning

Arxiv

94+阅读 · 2021年5月17日

Attention, please! A survey of Neural Attention Models in Deep Learning

Arxiv

59+阅读 · 2021年3月31日

Dissecting Supervised Constrastive Learning

Arxiv

11+阅读 · 2021年2月17日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

大家都在搜

智库最新报告

生成式人工智能

国防科技创新

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员