【2023新书】《强化学习的艺术：基础知识、数学原理与Python实现》，290页pdf - 专知VIP

会员服务 ·

87

强化学习 · 书籍 · Python ·

2023 年 12 月 18 日

【2023新书】《强化学习的艺术：基础知识、数学原理与Python实现》，290页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

解锁强化学习（RL）全部潜力：本综合指南将深入探索人工智能的一个关键子领域。这本书深入介绍了强化学习的核心概念、数学原理和实用算法，帮助您全面理解这项前沿技术。从马尔可夫决策过程、动态规划、蒙特卡洛方法和时差学习等基本概念概述开始，本书使用清晰、简洁的示例解释了RL理论的基础知识。接下来的部分涵盖了价值函数近似这一强化学习中的关键技术，并探索了各种策略近似方法，如策略梯度方法和像近端策略优化（PPO）这样的高级算法。本书还深入探讨了分布式强化学习、好奇心驱动的探索以及著名的AlphaZero算法等高级主题，为读者提供了这些前沿技术的详细介绍。注重解释算法及其背后的直觉，《强化学习的艺术》包括了您可以用来实现RL算法的实用源代码示例。完成本书后，您将深入理解强化学习背后的概念、数学和算法，成为人工智能从业者、研究人员和学生的必备资源。您将学到什么： * 掌握强化学习的基本概念和特点，包括它与其他AI和非交互式机器学习方法的区别 * 将问题建模为马尔可夫决策过程，以及如何使用动态规划、蒙特卡洛方法和时差学习评估和优化策略 * 利用近似价值函数和策略的技术，包括线性和非线性价值函数近似以及策略梯度方法 * 了解分布式强化学习的架构和优势 * 掌握好奇心驱动探索的概念，以及如何利用它来改进强化学习代理 * 探索AlphaZero算法以及它如何能够击败职业围棋选手

本书适合谁阅读： * 想要在他们的项目和应用中融入强化学习算法的机器学习工程师、数据科学家、软件工程师和开发人员。

成为VIP会员查看完整内容

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【新书】《自然语言处理应用中的情感分析的计算智能》，704页pdf

【新书】《自然语言处理应用中的情感分析的计算智能》，704页pdf

专知会员服务

51+阅读 · 1月29日

【2023新书】医学图像分析的深度学习，第2版，544页pdf

【2023新书】医学图像分析的深度学习，第2版，544页pdf

专知会员服务

80+阅读 · 2023年12月10日

【2023新书】《开发人员的LLM提示工程：揭开LLM真正潜力的艺术与科学》，302页pdf

【2023新书】《开发人员的LLM提示工程：揭开LLM真正潜力的艺术与科学》，302页pdf

专知会员服务

133+阅读 · 2023年9月22日

【2023新书】决策的艺术和科学，320页pdf

【2023新书】决策的艺术和科学，320页pdf

专知会员服务

84+阅读 · 2023年9月5日

【2023新书】强化学习基础，97页pdf

【2023新书】强化学习基础，97页pdf

专知会员服务

104+阅读 · 2023年8月23日

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

专知会员服务

108+阅读 · 2023年6月1日

【Manning2022新书】深度学习自然语言处理，296页pdf

【Manning2022新书】深度学习自然语言处理，296页pdf

专知会员服务

146+阅读 · 2022年10月25日

【Manning新书】面向数据编程降低软件复杂度，426页pdf

【Manning新书】面向数据编程降低软件复杂度，426页pdf

专知会员服务

74+阅读 · 2022年9月5日

【Manning新书】深度学习: 数学与算法模型，Inside Deep Learning，602页pdf

【Manning新书】深度学习: 数学与算法模型，Inside Deep Learning，602页pdf

专知会员服务

185+阅读 · 2022年4月24日

【新书】基于物理的深度学习，220页pdf

【新书】基于物理的深度学习，220页pdf

专知会员服务

144+阅读 · 2021年9月15日

【2022新书】Python数据分析第三版，579页pdf

【2022新书】Python数据分析第三版，579页pdf

专知

16+阅读 · 2022年8月31日

【2022新书】应用深度学习：工具、技术与实现，355页pdf

【2022新书】应用深度学习：工具、技术与实现，355页pdf

专知

35+阅读 · 2022年7月26日

【2022新书】高效数据科学基础: 如何使数据科学家高效，353页pdf

【2022新书】高效数据科学基础: 如何使数据科学家高效，353页pdf

专知

18+阅读 · 2022年7月17日

【干货书】机器学习的金融风险管理与Python，194页pdf

【干货书】机器学习的金融风险管理与Python，194页pdf

专知

20+阅读 · 2022年7月1日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

专知

26+阅读 · 2022年6月2日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

24+阅读 · 2022年5月26日

【Manning新书】深度学习: 数学与算法模型，Inside Deep Learning，602页pdf

【Manning新书】深度学习: 数学与算法模型，Inside Deep Learning，602页pdf

专知

29+阅读 · 2022年4月24日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

12+阅读 · 2021年12月3日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

35+阅读 · 2020年5月9日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

81+阅读 · 2020年1月19日

非线性组合优化暑期学校暨学术前沿研讨会

国家自然科学基金

5+阅读 · 2017年6月30日

拓扑非线性分析专题讲习班

国家自然科学基金

11+阅读 · 2016年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

1+阅读 · 2015年12月31日

基因表达专题讲习班

国家自然科学基金

1+阅读 · 2015年4月30日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

4+阅读 · 2014年12月31日

基于中智集的模糊多属性决策理论、方法与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

波动率微笑：隐含信息与动态建模

国家自然科学基金

1+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

131+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

138+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

52+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

326+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

88+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

54+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

56+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

114+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

38+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

16+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

【新书】《自然语言处理应用中的情感分析的计算智能》，704页pdf

【新书】《自然语言处理应用中的情感分析的计算智能》，704页pdf

专知会员服务

51+阅读 · 1月29日

【2023新书】医学图像分析的深度学习，第2版，544页pdf

【2023新书】医学图像分析的深度学习，第2版，544页pdf

专知会员服务

80+阅读 · 2023年12月10日

【2023新书】《开发人员的LLM提示工程：揭开LLM真正潜力的艺术与科学》，302页pdf

【2023新书】《开发人员的LLM提示工程：揭开LLM真正潜力的艺术与科学》，302页pdf

专知会员服务

133+阅读 · 2023年9月22日

【2023新书】决策的艺术和科学，320页pdf

【2023新书】决策的艺术和科学，320页pdf

专知会员服务

84+阅读 · 2023年9月5日

【2023新书】强化学习基础，97页pdf

【2023新书】强化学习基础，97页pdf

专知会员服务

104+阅读 · 2023年8月23日

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

专知会员服务

108+阅读 · 2023年6月1日

【Manning2022新书】深度学习自然语言处理，296页pdf

【Manning2022新书】深度学习自然语言处理，296页pdf

专知会员服务

146+阅读 · 2022年10月25日

【Manning新书】面向数据编程降低软件复杂度，426页pdf

【Manning新书】面向数据编程降低软件复杂度，426页pdf

专知会员服务

74+阅读 · 2022年9月5日

【Manning新书】深度学习: 数学与算法模型，Inside Deep Learning，602页pdf

【Manning新书】深度学习: 数学与算法模型，Inside Deep Learning，602页pdf

专知会员服务

185+阅读 · 2022年4月24日

【新书】基于物理的深度学习，220页pdf

【新书】基于物理的深度学习，220页pdf

专知会员服务

144+阅读 · 2021年9月15日

热门VIP内容

相关资讯

【2022新书】Python数据分析第三版，579页pdf

【2022新书】Python数据分析第三版，579页pdf

专知

16+阅读 · 2022年8月31日

【2022新书】应用深度学习：工具、技术与实现，355页pdf

【2022新书】应用深度学习：工具、技术与实现，355页pdf

专知

35+阅读 · 2022年7月26日

【2022新书】高效数据科学基础: 如何使数据科学家高效，353页pdf

【2022新书】高效数据科学基础: 如何使数据科学家高效，353页pdf

专知

18+阅读 · 2022年7月17日

【干货书】机器学习的金融风险管理与Python，194页pdf

【干货书】机器学习的金融风险管理与Python，194页pdf

专知

20+阅读 · 2022年7月1日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

专知

26+阅读 · 2022年6月2日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

24+阅读 · 2022年5月26日

【Manning新书】深度学习: 数学与算法模型，Inside Deep Learning，602页pdf

【Manning新书】深度学习: 数学与算法模型，Inside Deep Learning，602页pdf

专知

29+阅读 · 2022年4月24日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

12+阅读 · 2021年12月3日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

35+阅读 · 2020年5月9日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

81+阅读 · 2020年1月19日

相关基金

非线性组合优化暑期学校暨学术前沿研讨会

国家自然科学基金

5+阅读 · 2017年6月30日

拓扑非线性分析专题讲习班

国家自然科学基金

11+阅读 · 2016年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

1+阅读 · 2015年12月31日

基因表达专题讲习班

国家自然科学基金

1+阅读 · 2015年4月30日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

4+阅读 · 2014年12月31日

基于中智集的模糊多属性决策理论、方法与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

波动率微笑：隐含信息与动态建模

国家自然科学基金

1+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

131+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

138+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

52+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

326+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

88+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

54+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

56+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

114+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

38+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

16+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员