斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载 - 专知VIP

会员服务 ·

9

强化学习 · 斯坦福大学 (Stanford University) ·

2021 年 1 月 23 日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

要实现人工智能的梦想，就需要学会做出正确决策的自主系统。强化学习是这样做的一个强大范式，它与大量的任务相关，包括机器人、游戏、消费者建模和医疗保健。本课程将提供强化学习领域的充实介绍，学生将学习强化学习的核心挑战和方法，包括推广和探索。通过讲课、书面作业和编码作业的结合，学生将学习RL的关键思想和技术。作业将包括强化学习的基础知识以及深度强化学习——一个结合了深度学习技术和强化学习的极具前景的新领域。

地址： https://web.stanford.edu/class/cs234/

学生能够学习到：

定义强化学习与人工智能和非交互式机器学习的区别的关键特征。
给定一个应用问题(例如，计算机视觉，机器人等)，决定它是否应该被表述为RL问题;如果是，可以正- 式定义它(根据状态空间，行动空间，动态和奖励模型)，说明什么算法(从类)是最适合解决它，并证明你的答案。
在代码中实现通用的RL算法。
描述(列出和定义)分析RL算法的多种标准，并根据这些指标评估算法:例如遗憾度、样本复杂度、计算复杂度、经验性能、收敛性等。
描述探索与开发的挑战，并对至少两种解决这一挑战的方法进行比较和对比(从性能、可伸缩性、实现的复杂性和理论保证方面)。

内容目录：

Introduction to Reinforcement Learning
Tabular MDP planning
Tabular RL policy evaluation
Q-learning
RL with function approximation
Policy search
Exploration
Exploration / Exploitation
Batch Reinforcement Learning
Monte Carlo Tree Search

成为VIP会员查看完整内容

77

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

最新《计算控制理论》笔记与课程，60页pdf

专知会员服务

54+阅读 · 2020年12月24日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

48+阅读 · 2020年10月26日

【斯坦福大牛Chelsea Finn2020新课】深度多任务和元学习，附课程PPT下载

专知会员服务

56+阅读 · 2020年10月24日

【康奈尔】最新《强化学习基础》CS 6789课程

【康奈尔】最新《强化学习基础》CS 6789课程

专知会员服务

70+阅读 · 2020年9月27日

最新《统计机器学习》课程，26页ppt

最新《统计机器学习》课程，26页ppt

专知会员服务

82+阅读 · 2020年8月30日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

234+阅读 · 2020年4月28日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

资源 | 伯克利2018秋季课程：人工智能导论（视频+PPT+作业）

资源 | 伯克利2018秋季课程：人工智能导论（视频+PPT+作业）

机器之心

17+阅读 · 2018年12月31日

Pytoch1.0深度学习如何玩？这一门含900页ppt和代码实例的深度学习课程带你飞

Pytoch1.0深度学习如何玩？这一门含900页ppt和代码实例的深度学习课程带你飞

专知

84+阅读 · 2018年12月14日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

斯坦福大学2017年-Spring-最新强化学习（Reinforcement Learning）课程分享

斯坦福大学2017年-Spring-最新强化学习（Reinforcement Learning）课程分享

深度学习与NLP

5+阅读 · 2017年9月21日

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

新智元

11+阅读 · 2017年8月16日

斯坦福CS231n Spring 2017开放全部课程视频（附大纲）

斯坦福CS231n Spring 2017开放全部课程视频（附大纲）

机器之心

4+阅读 · 2017年8月13日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

斯坦福CS231n Spring 2017详细课程大纲（附完整版课件下载）

斯坦福CS231n Spring 2017详细课程大纲（附完整版课件下载）

数据派THU

10+阅读 · 2017年7月7日

Model-Based Offline Planning

Arxiv

1+阅读 · 2021年3月17日

On the role of planning in model-based deep reinforcement learning

Arxiv

0+阅读 · 2021年3月17日

Inclined Quadrotor Landing using Deep Reinforcement Learning

Arxiv

0+阅读 · 2021年3月16日

Neural Architecture Search From Task Similarity Measure

Arxiv

0+阅读 · 2021年3月15日

Baconian: A Unified Open-source Framework for Model-Based Reinforcement Learning

Arxiv

0+阅读 · 2021年3月15日

gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo

gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo

Arxiv

7+阅读 · 2019年3月14日

Logically-Constrained Reinforcement Learning

Logically-Constrained Reinforcement Learning

Arxiv

3+阅读 · 2018年12月6日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Learning to Extract Coherent Summary via Deep Reinforcement Learning

Arxiv

6+阅读 · 2018年4月19日

Inverse Reinforcement Learning via Deep Gaussian Process

Arxiv

3+阅读 · 2017年5月4日

VIP会员

相关主题

斯坦福大学 (Stanford University)

相关VIP内容

最新《计算控制理论》笔记与课程，60页pdf

专知会员服务

54+阅读 · 2020年12月24日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

48+阅读 · 2020年10月26日

【斯坦福大牛Chelsea Finn2020新课】深度多任务和元学习，附课程PPT下载

专知会员服务

56+阅读 · 2020年10月24日

【康奈尔】最新《强化学习基础》CS 6789课程

【康奈尔】最新《强化学习基础》CS 6789课程

专知会员服务

70+阅读 · 2020年9月27日

最新《统计机器学习》课程，26页ppt

最新《统计机器学习》课程，26页ppt

专知会员服务

82+阅读 · 2020年8月30日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

234+阅读 · 2020年4月28日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

人机协同作战规划：来自美海军陆战队的大语言模型（LLM）使用教训

对北约军事总部战略规划制定与实施的研究 | 140页

美联参会指南-联合规划与执行概述及政策框架 | 32页

俄罗斯军事规划差异性凸显其思维的重要性 | 2025最新文献

相关资讯

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

资源 | 伯克利2018秋季课程：人工智能导论（视频+PPT+作业）

资源 | 伯克利2018秋季课程：人工智能导论（视频+PPT+作业）

机器之心

17+阅读 · 2018年12月31日

Pytoch1.0深度学习如何玩？这一门含900页ppt和代码实例的深度学习课程带你飞

Pytoch1.0深度学习如何玩？这一门含900页ppt和代码实例的深度学习课程带你飞

专知

84+阅读 · 2018年12月14日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

斯坦福大学2017年-Spring-最新强化学习（Reinforcement Learning）课程分享

斯坦福大学2017年-Spring-最新强化学习（Reinforcement Learning）课程分享

深度学习与NLP

5+阅读 · 2017年9月21日

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

新智元

11+阅读 · 2017年8月16日

斯坦福CS231n Spring 2017开放全部课程视频（附大纲）

斯坦福CS231n Spring 2017开放全部课程视频（附大纲）

机器之心

4+阅读 · 2017年8月13日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

斯坦福CS231n Spring 2017详细课程大纲（附完整版课件下载）

斯坦福CS231n Spring 2017详细课程大纲（附完整版课件下载）

数据派THU

10+阅读 · 2017年7月7日

相关论文

Model-Based Offline Planning

Arxiv

1+阅读 · 2021年3月17日

On the role of planning in model-based deep reinforcement learning

Arxiv

0+阅读 · 2021年3月17日

Inclined Quadrotor Landing using Deep Reinforcement Learning

Arxiv

0+阅读 · 2021年3月16日

Neural Architecture Search From Task Similarity Measure

Arxiv

0+阅读 · 2021年3月15日

Baconian: A Unified Open-source Framework for Model-Based Reinforcement Learning

Arxiv

0+阅读 · 2021年3月15日

gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo

gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo

Arxiv

7+阅读 · 2019年3月14日

Logically-Constrained Reinforcement Learning

Logically-Constrained Reinforcement Learning

Arxiv

3+阅读 · 2018年12月6日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Learning to Extract Coherent Summary via Deep Reinforcement Learning

Arxiv

6+阅读 · 2018年4月19日

Inverse Reinforcement Learning via Deep Gaussian Process

Arxiv

3+阅读 · 2017年5月4日

微信扫码咨询专知VIP会员