【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf - 专知VIP

会员服务 ·

22

姜楠 · Sham M. Kakade · 迁移学习 · Softmax回归 · Alekh Agarwal ·

2019 年 11 月 24 日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

题目： Reinforcement Learning:Theory and Algorithms

简介：

强化学习是近几年研究的热点，特别是伴随DeepMind AlphaGo的出现名声大噪。强化学习(RL)是一种机器学习范式，在这种范式中，agent从经验中学习完成顺序决策任务，RL在机器人、控制、对话系统、医疗等领域有广泛的应用。《强化学习：理论与算法》这本书讲述了强化学习最新进展，包括MDP、样本复杂度、策略探索、PG、值函数等关键议题，是了解强化学习的材料。

章节：

第一章：马尔科夫决策过程MDP 预介绍
第二章：生成模型的样本复杂度
第三章：强化学习的策略探索
第四章：策略梯度方法
第五章：值函数近似
第六章：RL的战略探索和丰富的观测资料
第七章：行为克隆和学徒学习

作者简介：

Alekh Agarwal目前是微软人工智能研究中心的研究员，领导强化学习研究小组。之前，在加州大学伯克利分校获得计算机科学博士学位后，与彼得·巴特利特(Peter Bartlett)和马丁·温赖特(Martin Wainwright)一起在纽约微软研究院(Microsoft Research)度过了六年美好的时光。

姜楠，UIUC助理教授，机器学习研究员。核心研究领域是强化学习(RL)，关注于RL的样本效率，并利用统计学习理论中的思想来分析和开发RL算法。

沙姆·卡卡德(Sham M. Kakade)是华盛顿研究基金会(Washington Research Foundation)数据科学主席，同时在华盛顿大学(University of Washington)艾伦学院(Allen School)和统计学系任职。他致力于机器学习的理论基础，专注于设计(和实现)统计和计算效率的算法。

成为VIP会员查看完整内容

rl_monograph_AJK.pdf

相关内容

姜楠，UIUC助理教授，机器学习研究员。核心研究领域是强化学习(RL)，关注于RL的样本效率，并利用统计学习理论中的思想来分析和开发RL算法。

最新《机器学习最优化》课程笔记，36页pdf，Optimization for Machine Learning

专知会员服务

170+阅读 · 2020年5月10日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

232+阅读 · 2020年4月28日

普林斯顿大学经典书《在线凸优化导论》，178页pdf

普林斯顿大学经典书《在线凸优化导论》，178页pdf

专知会员服务

185+阅读 · 2020年2月3日

【KDD2019|讲座推荐】深强化学习及其在交通运输中的应用：Deep Reinforcement Learning with Applications in Transportation

【KDD2019|讲座推荐】深强化学习及其在交通运输中的应用：Deep Reinforcement Learning with Applications in Transportation

专知会员服务

57+阅读 · 2019年12月4日

【新书稿：强化学习：理论与算法】《Reinforcement Learning: Theory and Algorithms》by Alekh Agarwal, Nan Jiang, Sham M. Kakade (2019)，(附83页pdf)

【新书稿：强化学习：理论与算法】《Reinforcement Learning: Theory and Algorithms》by Alekh Agarwal, Nan Jiang, Sham M. Kakade (2019)，(附83页pdf)

专知会员服务

79+阅读 · 2019年11月23日

【电子书推荐】强化学习（Reinforcement Learning）法兰克福大学 | Cornelius Weber

【电子书推荐】强化学习（Reinforcement Learning）法兰克福大学 | Cornelius Weber

专知会员服务

44+阅读 · 2019年11月19日

【电子书】理解机器学习：从理论到算法（Understanding Machine Learning: From Theory to Algorithms）449页PDF免费下载

【电子书】理解机器学习：从理论到算法（Understanding Machine Learning: From Theory to Algorithms）449页PDF免费下载

专知会员服务

156+阅读 · 2019年10月30日

新书分享：强化学习最新书稿《强化学习导论》（Reinforcement Learning An Introduction）第二版出炉

新书分享：强化学习最新书稿《强化学习导论》（Reinforcement Learning An Introduction）第二版出炉

专知会员服务

118+阅读 · 2019年10月25日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

【CMU】机器学习导论课程（Introduction to Machine Learning）

【CMU】机器学习导论课程（Introduction to Machine Learning）

专知会员服务

61+阅读 · 2019年8月26日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

Reinforcement Learning: An Introduction 2018第二版 500页

Reinforcement Learning: An Introduction 2018第二版 500页

CreateAMind

14+阅读 · 2018年4月27日

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

专知

31+阅读 · 2018年4月10日

一个强化学习 Q-learning 算法的简明教程

一个强化学习 Q-learning 算法的简明教程

数据挖掘入门与实战

10+阅读 · 2018年3月18日

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

专知

27+阅读 · 2017年12月17日

【AlphaGo核心技术-教程学习笔记02】深度强化学习第二讲马尔科夫决策过程

【AlphaGo核心技术-教程学习笔记02】深度强化学习第二讲马尔科夫决策过程

机器学习研究会

6+阅读 · 2017年10月22日

学界 | 面向工程师的机器学习简介：理论、算法、概念全覆盖

学界 | 面向工程师的机器学习简介：理论、算法、概念全覆盖

机器之心

17+阅读 · 2017年9月15日

Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey

Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey

Arxiv

20+阅读 · 2020年3月10日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Accelerated Randomized Coordinate Descent Algorithms for Stochastic Optimization and Online Learning

Arxiv

9+阅读 · 2018年7月16日

A Tour of Reinforcement Learning: The View from Continuous Control

Arxiv

6+阅读 · 2018年6月25日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Learning to Evade Static PE Machine Learning Malware Models via Reinforcement Learning

Arxiv

3+阅读 · 2018年1月30日

Reinforcement Learning based Recommender System using Biclustering Technique

Arxiv

5+阅读 · 2018年1月17日

VIP会员

相关主题

相关VIP内容

最新《机器学习最优化》课程笔记，36页pdf，Optimization for Machine Learning

专知会员服务

170+阅读 · 2020年5月10日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

232+阅读 · 2020年4月28日

普林斯顿大学经典书《在线凸优化导论》，178页pdf

普林斯顿大学经典书《在线凸优化导论》，178页pdf

专知会员服务

185+阅读 · 2020年2月3日

【KDD2019|讲座推荐】深强化学习及其在交通运输中的应用：Deep Reinforcement Learning with Applications in Transportation

【KDD2019|讲座推荐】深强化学习及其在交通运输中的应用：Deep Reinforcement Learning with Applications in Transportation

专知会员服务

57+阅读 · 2019年12月4日

【新书稿：强化学习：理论与算法】《Reinforcement Learning: Theory and Algorithms》by Alekh Agarwal, Nan Jiang, Sham M. Kakade (2019)，(附83页pdf)

【新书稿：强化学习：理论与算法】《Reinforcement Learning: Theory and Algorithms》by Alekh Agarwal, Nan Jiang, Sham M. Kakade (2019)，(附83页pdf)

专知会员服务

79+阅读 · 2019年11月23日

【电子书推荐】强化学习（Reinforcement Learning）法兰克福大学 | Cornelius Weber

【电子书推荐】强化学习（Reinforcement Learning）法兰克福大学 | Cornelius Weber

专知会员服务

44+阅读 · 2019年11月19日

【电子书】理解机器学习：从理论到算法（Understanding Machine Learning: From Theory to Algorithms）449页PDF免费下载

【电子书】理解机器学习：从理论到算法（Understanding Machine Learning: From Theory to Algorithms）449页PDF免费下载

专知会员服务

156+阅读 · 2019年10月30日

新书分享：强化学习最新书稿《强化学习导论》（Reinforcement Learning An Introduction）第二版出炉

新书分享：强化学习最新书稿《强化学习导论》（Reinforcement Learning An Introduction）第二版出炉

专知会员服务

118+阅读 · 2019年10月25日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

【CMU】机器学习导论课程（Introduction to Machine Learning）

【CMU】机器学习导论课程（Introduction to Machine Learning）

专知会员服务

61+阅读 · 2019年8月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】以人为中心的强化学习

任务规划与地形分析：现代复杂环境作战导航体系

认知优势：人工智能在国家安全决策中的核心作用

大模型赋能的具身智能：决策与具身学习综述

相关资讯

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

Reinforcement Learning: An Introduction 2018第二版 500页

Reinforcement Learning: An Introduction 2018第二版 500页

CreateAMind

14+阅读 · 2018年4月27日

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

专知

31+阅读 · 2018年4月10日

一个强化学习 Q-learning 算法的简明教程

一个强化学习 Q-learning 算法的简明教程

数据挖掘入门与实战

10+阅读 · 2018年3月18日

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

专知

27+阅读 · 2017年12月17日

【AlphaGo核心技术-教程学习笔记02】深度强化学习第二讲马尔科夫决策过程

【AlphaGo核心技术-教程学习笔记02】深度强化学习第二讲马尔科夫决策过程

机器学习研究会

6+阅读 · 2017年10月22日

学界 | 面向工程师的机器学习简介：理论、算法、概念全覆盖

学界 | 面向工程师的机器学习简介：理论、算法、概念全覆盖

机器之心

17+阅读 · 2017年9月15日

相关论文

Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey

Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey

Arxiv

20+阅读 · 2020年3月10日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Accelerated Randomized Coordinate Descent Algorithms for Stochastic Optimization and Online Learning

Arxiv

9+阅读 · 2018年7月16日

A Tour of Reinforcement Learning: The View from Continuous Control

Arxiv

6+阅读 · 2018年6月25日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Learning to Evade Static PE Machine Learning Malware Models via Reinforcement Learning

Arxiv

3+阅读 · 2018年1月30日

Reinforcement Learning based Recommender System using Biclustering Technique

Arxiv

5+阅读 · 2018年1月17日

微信扫码咨询专知VIP会员