斯坦福大学2017年-Spring-最新强化学习(Reinforcement Learning)课程分享

2017 年 9 月 21 日 深度学习与NLP lqfarmer

课程说明

    为了实现人工智能的梦想,我们需要学习出可以进行自主决策的系统。强化学习就是实现这一目标的强有力的例子,它与包括机器人、游戏、消费者画像和医疗保健在内的各种任务息息相关。本门课程将详细介绍强化学习领域的基础知识,学生们将会学习到强化学习核心方法和技术,包括如何进行泛化(Generalization)和探索(Exploration)。通过专家讲座、书面课程和线下编码任务相结合的方式,学生将会深入了解强化学习的关键思想和技巧。作业将包括强化学习的基础知识、以及深度强化学习相关知识-这是一个非常有前途的新领域,将深度学习技术与强化学习相结合。此外,通过线下的开放性项目,学生将提升他们对强化学习的理解。

学习目标

在课程结束后,学生应该能够

·     定义强化学习的关键特征,这也是区分AI和非交互式机器学习的关键特征

·     定义MDP,POMDP,bandit,batch offline 强化学习,online 强化学习

·     描述研究 VS 应用的挑战,并比较和对比至少两种方法来应对这一挑战

·     给定一个应用问题(例如,计算机视觉,机器人等)决定是否应该被定为一个强化学习问题,如果是,如何制定,应该采用什么算法来处理这个问题,并证明答案正确性。

·     实现包括深度强化学习算法在内的常见强化学习算法

·     学习分析强化学习算法和评估这些算法的多个标准:例如regret,样本复杂度(sample complexity),计算复杂度,收敛性等。

·     列出强化学习领域中至少两个开放的挑战或热门话题

课程大纲

课程ppt等资料下载地址:

链接: https://pan.baidu.com/s/1bpq7xO7 

密码: 公众号回复“SRL”

往期精彩内容分享

神经机器翻译(NMT)的一些重要资源分享

《模型汇总-20》深度学习背后的秘密:初学者指南-深度学习激活函数大全

深度学习与NLP 深度学习|机器学习|人工智能 精品视频教程合集分享

纯干货-8 21套深度学习相关的视频教程分享

模型汇总-12  深度学习中的表示学习_Representation Learning

<纯干货-4> 加州伯克利大学2017年最新深度强化学习视频课程_part3

<深度学习优化策略-3> 深度学习网络加速器Weight Normalization_WN

扫描下方二维码可以订阅哦!

DeepLearning_NLP

深度学习与NLP

       商务合作请联系微信号:lqfarmerlq

登录查看更多
4

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
斯坦福大学经典《自然语言处理cs224n》2020课件合集
专知会员服务
94+阅读 · 2020年5月25日
深度强化学习策略梯度教程,53页ppt
专知会员服务
175+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
112+阅读 · 2020年1月15日
斯坦福CS236-深度生成模型2019-全套课程资料分享
深度学习与NLP
17+阅读 · 2019年8月20日
台大陈蕴侬-2019-《应用深度学习(中文)》课程视频分享
李宏毅-《机器学习/深度学习-2019》视频及资料分享
深度学习与NLP
42+阅读 · 2019年3月20日
MIT深度学习基础-2019视频课程分享
深度学习与NLP
10+阅读 · 2019年2月7日
资源 | 《深度强化学习》手稿开放了!
THU数据派
16+阅读 · 2018年10月24日
CMU-2018年8月-深度学习基础课程视频分享
深度学习与NLP
6+阅读 · 2018年9月20日
李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享
深度学习与NLP
15+阅读 · 2018年6月20日
Arxiv
14+阅读 · 2020年2月6日
Arxiv
7+阅读 · 2018年12月26日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Arxiv
21+阅读 · 2018年8月30日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关资讯
斯坦福CS236-深度生成模型2019-全套课程资料分享
深度学习与NLP
17+阅读 · 2019年8月20日
台大陈蕴侬-2019-《应用深度学习(中文)》课程视频分享
李宏毅-《机器学习/深度学习-2019》视频及资料分享
深度学习与NLP
42+阅读 · 2019年3月20日
MIT深度学习基础-2019视频课程分享
深度学习与NLP
10+阅读 · 2019年2月7日
资源 | 《深度强化学习》手稿开放了!
THU数据派
16+阅读 · 2018年10月24日
CMU-2018年8月-深度学习基础课程视频分享
深度学习与NLP
6+阅读 · 2018年9月20日
李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享
深度学习与NLP
15+阅读 · 2018年6月20日
相关论文
Arxiv
14+阅读 · 2020年2月6日
Arxiv
7+阅读 · 2018年12月26日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Arxiv
21+阅读 · 2018年8月30日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
Top
微信扫码咨询专知VIP会员