资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!

2018 年 6 月 13 日 大数据文摘
资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!


大数据文摘出品


入坑深度学习的同学肯定都听过台湾大学的李宏毅教授,或者是他那本非常受欢迎的课程——《1天搞懂深度学习》。这门课程的讲义PPT总共有286页,深入浅出的介绍了深度学习的概念、框架及展望。


课程内容通俗易懂,适合深度学习初学者及相关从业人员,在大数据文摘后台回复“深度学习”可下载课程讲义。


文摘菌今天要给大家推荐的是李老师最近更新的课程:深度强化学习(deep reinforcement learning),目前这门课程在youtobe上更新了4个视频,分别是策略梯度算法(Policy Gradient)、近端策略优化(Proximal Policy Optimization,PPO)、Q-learning算法基本概念和Q-learning算法高级技巧。


每个视频大约40分钟左右,PPT内容为英文,讲授语言为中文。课程内容主打强化学习,涉及理论和论文解读,需要一定的强化学习的基础,感兴趣的小伙伴可以学起来啦!


深度强化学习youtube链接:

https://www.youtube.com/watch?v=z95ZYgPgXOY

深度强化学习B站链接:

http://www.bilibili.com/video/av24724071


文摘菌对视频内容做了简单介绍,供大家参考。


策略梯度算法:

  • 策略梯度算法理论

  • 算法实现

  • 实用建议

近端策略优化:

  • 采样问题

  • PPO算法理论

  • 对论文结果的解读

Q-learning算法基本概念:

  • 蒙特卡洛方法

  • Actor-Critic算法

  • Q-learning理论

Q-learning算法高级技巧:

  • Double DQN

  • Dueling DQN

  • 高级技巧


目前课程在连载状态,感兴趣的同学可以关注李宏毅的youtube主页:

https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ/videos


此外,李老师在youtube还有《机器学习》和《深度学习》两门课程的视频讲解,这两门课程也获得了不错的口碑,课程链接如下:


机器学习youtube链接:

https://www.youtube.com/watch?v=CXgbekl66jc&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49


机器学习B站链接:

http://www.bilibili.com/video/av19144978


深度学习youtube链接:

https://www.youtube.com/watch?v=KKT2VkTdFyc


深度学习B站链接:

http://www.bilibili.com/video/av20961661


李宏毅老师简介:主要研究领域为机器学习(特别是深度学习)、口语语义理解和语音识别。

  • 2012年从台北 National Taiwan University (NTU) 博士毕业。

  • 2012年9月—2013年8月,在 Sinica Academia 的 Research Center for Information Technology Innovation 做博士后。

  • 2013年9月—2014年7月,在 MIT Computer Science and ArtificialIntelligence Laboratory (CSAIL) 的 Spoken Language Systems Group 做访问学者。

  • 现任 Department of Electrical Engineering of National TaiwanUniversity 副教授。


今日机器学习概念】

Have a Great Definition

登录查看更多
17

相关内容

李宏毅(Hung-yi Lee)目前任台湾大学电机工程学系和电机资讯学院的助理教授,他曾于 2012 年获得台湾大学博士学位,并于 2013 年赴麻省理工学院(MIT)计算机科学和人工智能实验室(CSAIL)做访问学者。他的研究方向主要是机器学习(深度学习)和语音识别。

台大教授李宏毅的机器学习课程广受欢迎与好评。李老师的授课风格风趣幽默,通俗易懂,其课程内容中不仅有机器学习、深度学习的基础知识,也会介绍 ML 领域里的各种最新技术。最新的机器学习课程,李老师讲述了终身学习与可解释ML、异常检测、对抗攻击,值得观看学习。

2019 版《机器学习》课程目录:

  • week 1:回归、梯度下降
  • week 2:误差来源、分类、逻辑回归
  • week 3:深度学习、反向传播、异常检测
  • week 4:CNN、Keras、对抗性攻击
  • week 5:训练深度模型、可解释 AI
  • week 6:RNN、Order LSTM
  • week 7:Ensemble
  • week 8:半监督式学习、迁移学习、终身学习
  • week 9:元学习
  • week 10:seq2seq、Transformer
  • week 11:Few/Zero shot learning
  • week 12:非监督式学习、BERT
  • week 13:强化学习、强化学习进阶
  • week 14:网络压缩
  • week 15:GAN、GLOW
  • week 16:无监督域适应
  • week 17:为什么需要深度学习、深度学习理论

课程资料链接:
http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML19.html

课程视频(Bilibili):
https://www.bilibili.com/video/av46561029/

YouTube 链接:
https://www.youtube.com/playlist?list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4

成为VIP会员查看完整内容
0
69
小贴士
相关论文
Optimization for deep learning: theory and algorithms
Ruoyu Sun
82+阅读 · 2019年12月19日
Deepak Nathani,Jatin Chauhan,Charu Sharma,Manohar Kaul
38+阅读 · 2019年6月4日
Deep Learning for Energy Markets
Michael Polson,Vadim Sokolov
4+阅读 · 2019年4月10日
Borja Ibarz,Jan Leike,Tobias Pohlen,Geoffrey Irving,Shane Legg,Dario Amodei
4+阅读 · 2018年11月15日
Large-Scale Study of Curiosity-Driven Learning
Yuri Burda,Harri Edwards,Deepak Pathak,Amos Storkey,Trevor Darrell,Alexei A. Efros
7+阅读 · 2018年8月13日
Bipedal Walking Robot using Deep Deterministic Policy Gradient
Arun Kumar,Navneet Paul,S N Omkar
3+阅读 · 2018年7月16日
Yong Wang,Xiao-Ming Wu,Qimai Li,Jiatao Gu,Wangmeng Xiang,Lei Zhang,Victor O. K. Li
9+阅读 · 2018年7月8日
Vinicius Zambaldi,David Raposo,Adam Santoro,Victor Bapst,Yujia Li,Igor Babuschkin,Karl Tuyls,David Reichert,Timothy Lillicrap,Edward Lockhart,Murray Shanahan,Victoria Langston,Razvan Pascanu,Matthew Botvinick,Oriol Vinyals,Peter Battaglia
4+阅读 · 2018年6月5日
Zuxuan Wu,Tushar Nagarajan,Abhishek Kumar,Steven Rennie,Larry S. Davis,Kristen Grauman,Rogerio Feris
5+阅读 · 2018年3月30日
Lantao Yu,Weinan Zhang,Jun Wang,Yong Yu
5+阅读 · 2017年8月25日
Top
微信扫码咨询专知VIP会员