斯坦福大学2017年-Spring-最新强化学习（Reinforcement Learning）课程分享 - 专知

会员服务 ·

0

斯坦福大学2017年-Spring-最新强化学习（Reinforcement Learning）课程分享

2017 年 9 月 21 日 深度学习与NLP lqfarmer

课程说明

为了实现人工智能的梦想，我们需要学习出可以进行自主决策的系统。强化学习就是实现这一目标的强有力的例子，它与包括机器人、游戏、消费者画像和医疗保健在内的各种任务息息相关。本门课程将详细介绍强化学习领域的基础知识，学生们将会学习到强化学习核心方法和技术，包括如何进行泛化（Generalization）和探索（Exploration）。通过专家讲座、书面课程和线下编码任务相结合的方式，学生将会深入了解强化学习的关键思想和技巧。作业将包括强化学习的基础知识、以及深度强化学习相关知识-这是一个非常有前途的新领域，将深度学习技术与强化学习相结合。此外，通过线下的开放性项目，学生将提升他们对强化学习的理解。

学习目标

在课程结束后，学生应该能够

· 定义强化学习的关键特征，这也是区分AI和非交互式机器学习的关键特征

· 定义MDP，POMDP，bandit，batch offline 强化学习，online 强化学习

· 描述研究 VS 应用的挑战，并比较和对比至少两种方法来应对这一挑战

· 给定一个应用问题（例如，计算机视觉，机器人等）决定是否应该被定为一个强化学习问题，如果是，如何制定，应该采用什么算法来处理这个问题，并证明答案正确性。

· 实现包括深度强化学习算法在内的常见强化学习算法

· 学习分析强化学习算法和评估这些算法的多个标准：例如regret，样本复杂度（sample complexity），计算复杂度，收敛性等。

· 列出强化学习领域中至少两个开放的挑战或热门话题

课程大纲

课程ppt等资料下载地址：

链接: https://pan.baidu.com/s/1bpq7xO7

密码: 公众号回复“SRL”

往期精彩内容分享

神经机器翻译（NMT）的一些重要资源分享

《模型汇总-20》深度学习背后的秘密：初学者指南-深度学习激活函数大全

深度学习与NLP 深度学习|机器学习|人工智能精品视频教程合集分享

纯干货-8 21套深度学习相关的视频教程分享

模型汇总-12 深度学习中的表示学习_Representation Learning

<纯干货-4> 加州伯克利大学2017年最新深度强化学习视频课程_part3

<深度学习优化策略-3> 深度学习网络加速器Weight Normalization_WN

扫描下方二维码可以订阅哦！

DeepLearning_NLP

深度学习与NLP

商务合作请联系微信号：lqfarmerlq

登录查看更多

5

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

斯坦福大学经典《自然语言处理cs224n》2020课件合集

斯坦福大学经典《自然语言处理cs224n》2020课件合集

专知会员服务

97+阅读 · 2020年5月25日

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

专知会员服务

176+阅读 · 2020年5月10日

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

专知会员服务

84+阅读 · 2020年2月18日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【Gilles Louppe Spring 2019硬核课程推荐】深度学习：Deep Learning，附639页ppt

【Gilles Louppe Spring 2019硬核课程推荐】深度学习：Deep Learning，附639页ppt

专知会员服务

156+阅读 · 2019年12月20日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

专知会员服务

65+阅读 · 2019年8月8日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

台大陈蕴侬-2019-《应用深度学习（中文）》课程视频分享

台大陈蕴侬-2019-《应用深度学习（中文）》课程视频分享

深度学习与NLP

25+阅读 · 2019年3月27日

李宏毅-《机器学习/深度学习-2019》视频及资料分享

李宏毅-《机器学习/深度学习-2019》视频及资料分享

深度学习与NLP

43+阅读 · 2019年3月20日

MIT深度学习基础-2019视频课程分享

MIT深度学习基础-2019视频课程分享

深度学习与NLP

10+阅读 · 2019年2月7日

资源 | 《深度强化学习》手稿开放了！

资源 | 《深度强化学习》手稿开放了！

THU数据派

16+阅读 · 2018年10月24日

CMU-2018年8月-深度学习基础课程视频分享

CMU-2018年8月-深度学习基础课程视频分享

深度学习与NLP

6+阅读 · 2018年9月20日

李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享

李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享

深度学习与NLP

15+阅读 · 2018年6月20日

李宏毅-深度学习与生成对抗学习基础-2018年（春）课程分享

李宏毅-深度学习与生成对抗学习基础-2018年（春）课程分享

深度学习与NLP

5+阅读 · 2018年5月30日

麻省理工学院-2018年最新深度学习算法及其应用入门课程资源分享

麻省理工学院-2018年最新深度学习算法及其应用入门课程资源分享

深度学习与NLP

6+阅读 · 2018年2月16日

国立台湾大学-李宏毅-2017年（秋）最新深度学习与机器学习应用及其深入和结构化研究课程分享

国立台湾大学-李宏毅-2017年（秋）最新深度学习与机器学习应用及其深入和结构化研究课程分享

深度学习与NLP

14+阅读 · 2017年10月29日

The Deep Learning Compiler: A Comprehensive Survey

Arxiv

15+阅读 · 2020年2月6日

Learning to Walk via Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年12月26日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Multi-task Deep Reinforcement Learning with PopArt

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月6日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

斯坦福大学 (Stanford University)

深度强化学习

相关VIP内容

斯坦福大学经典《自然语言处理cs224n》2020课件合集

斯坦福大学经典《自然语言处理cs224n》2020课件合集

专知会员服务

97+阅读 · 2020年5月25日

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

专知会员服务

176+阅读 · 2020年5月10日

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

专知会员服务

84+阅读 · 2020年2月18日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【Gilles Louppe Spring 2019硬核课程推荐】深度学习：Deep Learning，附639页ppt

【Gilles Louppe Spring 2019硬核课程推荐】深度学习：Deep Learning，附639页ppt

专知会员服务

156+阅读 · 2019年12月20日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

专知会员服务

65+阅读 · 2019年8月8日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向可扩展深度神经网络的预测编码：理论与实践

如何快速获取数百万架无人机？

EMNLP 2025 | RTQA：递归思想求解复杂的时间知识图谱问答

组合式零样本学习综述

相关资讯

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

台大陈蕴侬-2019-《应用深度学习（中文）》课程视频分享

台大陈蕴侬-2019-《应用深度学习（中文）》课程视频分享

深度学习与NLP

25+阅读 · 2019年3月27日

李宏毅-《机器学习/深度学习-2019》视频及资料分享

李宏毅-《机器学习/深度学习-2019》视频及资料分享

深度学习与NLP

43+阅读 · 2019年3月20日

MIT深度学习基础-2019视频课程分享

MIT深度学习基础-2019视频课程分享

深度学习与NLP

10+阅读 · 2019年2月7日

资源 | 《深度强化学习》手稿开放了！

资源 | 《深度强化学习》手稿开放了！

THU数据派

16+阅读 · 2018年10月24日

CMU-2018年8月-深度学习基础课程视频分享

CMU-2018年8月-深度学习基础课程视频分享

深度学习与NLP

6+阅读 · 2018年9月20日

李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享

李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享

深度学习与NLP

15+阅读 · 2018年6月20日

李宏毅-深度学习与生成对抗学习基础-2018年（春）课程分享

李宏毅-深度学习与生成对抗学习基础-2018年（春）课程分享

深度学习与NLP

5+阅读 · 2018年5月30日

麻省理工学院-2018年最新深度学习算法及其应用入门课程资源分享

麻省理工学院-2018年最新深度学习算法及其应用入门课程资源分享

深度学习与NLP

6+阅读 · 2018年2月16日

国立台湾大学-李宏毅-2017年（秋）最新深度学习与机器学习应用及其深入和结构化研究课程分享

国立台湾大学-李宏毅-2017年（秋）最新深度学习与机器学习应用及其深入和结构化研究课程分享

深度学习与NLP

14+阅读 · 2017年10月29日

相关论文

The Deep Learning Compiler: A Comprehensive Survey

Arxiv

15+阅读 · 2020年2月6日

Learning to Walk via Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年12月26日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Multi-task Deep Reinforcement Learning with PopArt

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月6日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

大家都在搜

蓝牙安全攻防

2025最新文献

国防科技创新

朱克爱德华兹家族

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员