《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲 - 专知VIP

会员服务 ·

25

强化学习导论 · 强化学习 · Google DeepMind · David Silver ·

2021 年 1 月 2 日

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

https://deepmind.com/learning-resources/-introduction-reinforcement-learning-david-silver

这个经典的10部分课程，由强化学习(RL)的驱David Silver教授，虽然录制于2015年，但仍然是任何想要学习RL基础的同学所必需的资源。

强化学习已经成为现代机器学习中一项强大的技术，它允许系统通过反复试验进行学习。它已成功应用于许多领域，包括AlphaZero等系统，学会了掌握国际象棋、围棋和Shogi游戏。

这门课程由DeepMind首席科学家、伦敦大学学院教授、AlphaZero的共同创始人David Silver教授共同向学生们介绍RL中使用的主要方法和技术。学生们还会发现萨顿和巴托的经典著作《强化学习:入门》(Reinforcement Learning: an Introduction)是一个很有帮助的书籍。

经典书《强化学习导论》

强化学习教父 Richard Sutton 的经典教材《Reinforcement Learning：An Introduction》第二版公布啦。本书分为三大部分，共十七章，机器之心对其简介和框架做了扼要介绍，并附上了全书目录、课程代码与资料。下载《强化学习》PDF 请点击文末「阅读原文」。

原书籍地址：hhttp://incompleteideas.net/book/the-book.html

当我们思考学习的本质时，首先映入脑海的想法很可能是通过与环境的交互进行学习。当一个婴儿玩耍时，挥舞手臂，左顾右盼，旁边没有老师指导他，他与环境却有着一种直接的感知连接。通过这种连接，他懂得了因果关系，行动带来的结果，以及为了达成目标所需做的一切。人的一生中，这样的交互成了我们关于环境和自身知识的主要来源。不管学习驾驶汽车，还是进行一场交谈，实际上我们自始至终观察着环境如何回应我们的所为，并通过自身行为影响当下情景。交互式学习几乎是所有学习与智能理论的基石。

本书中我们提出了一种通过计算实现交互式学习的方法。我们没有直接理论化人类或动物的学习方式，而是探索理想的学习环境，评估不同学习方法的有效性。即，我们站在人工智能研究者或工程师的角度来解决问题。我们探讨了在解决科学或经济问题方面表现突出的机器的设计，通过数学分析或计算实验评估其设计。我们提出的这一方法称之为强化学习。相较于其他机器学习方法，它更专注于交互之中的目标导向性学习。

成为VIP会员查看完整内容

86

相关内容

强化学习导论

强化学习导论

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

77+阅读 · 2021年1月23日

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

专知会员服务

66+阅读 · 2021年1月5日

【康奈尔】最新《强化学习基础》CS 6789课程

【康奈尔】最新《强化学习基础》CS 6789课程

专知会员服务

70+阅读 · 2020年9月27日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

最新《因果推断导论》课程，102页ppt

最新《因果推断导论》课程，102页ppt

专知会员服务

185+阅读 · 2020年9月1日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

B站学强化学习？港中文周博磊变身up主，中文课程已上线

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

深度强化学习入门，这一篇就够了！

深度强化学习入门，这一篇就够了！

机器学习算法与Python学习

28+阅读 · 2018年8月17日

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

专知

31+阅读 · 2018年4月10日

2018年4月02日精彩内容推荐（强化学习导论第二版、伯克利课程：深度强化学习等）

2018年4月02日精彩内容推荐（强化学习导论第二版、伯克利课程：深度强化学习等）

Chatbots技术与产品

3+阅读 · 2018年4月2日

强化学习的入门之旅

强化学习的入门之旅

机器学习研究会

7+阅读 · 2018年2月12日

【强化学习】一文读懂AlphaGo背后的强化学习：它的背景知识与贝尔曼方程的原理

【强化学习】一文读懂AlphaGo背后的强化学习：它的背景知识与贝尔曼方程的原理

产业智能官

7+阅读 · 2017年11月26日

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

专知

126+阅读 · 2017年10月19日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

Formal Methods for An Iterated Volunteer's Dilemma

Formal Methods for An Iterated Volunteer's Dilemma

Arxiv

0+阅读 · 2021年3月2日

Operator inference of non-Markovian terms for learning reduced models from partially observed state trajectories

Arxiv

0+阅读 · 2021年3月1日

Correcting Experience Replay for Multi-Agent Communication

Arxiv

0+阅读 · 2021年2月28日

A Copula-based Fully Bayesian Nonparametric Evaluation of Cardiovascular Risk Markers in the Mexico City Diabetes Study

Arxiv

0+阅读 · 2021年2月25日

Mixed-Initiative Level Design with RL Brush

Arxiv

0+阅读 · 2021年2月25日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

Passage Re-ranking with BERT

Arxiv

4+阅读 · 2019年2月18日

Graph-based Filtering of Out-of-Vocabulary Words for Encoder-Decoder Models

Arxiv

4+阅读 · 2018年5月28日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Multi-Pointer Co-Attention Networks for Recommendation

Arxiv

12+阅读 · 2018年1月28日

VIP会员

相关主题

强化学习导论

Google DeepMind

相关VIP内容

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

77+阅读 · 2021年1月23日

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

专知会员服务

66+阅读 · 2021年1月5日

【康奈尔】最新《强化学习基础》CS 6789课程

【康奈尔】最新《强化学习基础》CS 6789课程

专知会员服务

70+阅读 · 2020年9月27日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

最新《因果推断导论》课程，102页ppt

最新《因果推断导论》课程，102页ppt

专知会员服务

185+阅读 · 2020年9月1日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

热门VIP内容

开通专知VIP会员享更多权益服务

军事战术边缘计算的重要性

《欧洲天空盾牌倡议：应对无人机饱和攻击与高超音速导弹的多层防空演进与挑战》报告

《美军使用大语言模型技术生成领域特定文档》2025最新379页

《代理生成式人工智能与国家安全：提升竞争力的政策建议》

相关资讯

B站学强化学习？港中文周博磊变身up主，中文课程已上线

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

深度强化学习入门，这一篇就够了！

深度强化学习入门，这一篇就够了！

机器学习算法与Python学习

28+阅读 · 2018年8月17日

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

专知

31+阅读 · 2018年4月10日

2018年4月02日精彩内容推荐（强化学习导论第二版、伯克利课程：深度强化学习等）

2018年4月02日精彩内容推荐（强化学习导论第二版、伯克利课程：深度强化学习等）

Chatbots技术与产品

3+阅读 · 2018年4月2日

强化学习的入门之旅

强化学习的入门之旅

机器学习研究会

7+阅读 · 2018年2月12日

【强化学习】一文读懂AlphaGo背后的强化学习：它的背景知识与贝尔曼方程的原理

【强化学习】一文读懂AlphaGo背后的强化学习：它的背景知识与贝尔曼方程的原理

产业智能官

7+阅读 · 2017年11月26日

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

专知

126+阅读 · 2017年10月19日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

相关论文

Formal Methods for An Iterated Volunteer's Dilemma

Formal Methods for An Iterated Volunteer's Dilemma

Arxiv

0+阅读 · 2021年3月2日

Operator inference of non-Markovian terms for learning reduced models from partially observed state trajectories

Arxiv

0+阅读 · 2021年3月1日

Correcting Experience Replay for Multi-Agent Communication

Arxiv

0+阅读 · 2021年2月28日

A Copula-based Fully Bayesian Nonparametric Evaluation of Cardiovascular Risk Markers in the Mexico City Diabetes Study

Arxiv

0+阅读 · 2021年2月25日

Mixed-Initiative Level Design with RL Brush

Arxiv

0+阅读 · 2021年2月25日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

Passage Re-ranking with BERT

Arxiv

4+阅读 · 2019年2月18日

Graph-based Filtering of Out-of-Vocabulary Words for Encoder-Decoder Models

Arxiv

4+阅读 · 2018年5月28日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Multi-Pointer Co-Attention Networks for Recommendation

Arxiv

12+阅读 · 2018年1月28日

微信扫码咨询专知VIP会员