重磅干货-Richard S. Sutton-2018年强化学习教程免费下载

2018 年 4 月 1 日 深度学习与NLP lqfarmer
重磅干货-Richard S. Sutton-2018年强化学习教程免费下载

    Richard S. Sutton是加拿大的一名计算机科学家,目前是阿尔伯塔大学计算机科学教授和iCORE主席。Sutton被认为是现代强化学习的奠基人之一,主要有以下几个显著的贡献,包括时间差分学习、策略梯度法、在Dyna架构, 由其主笔撰写的书:《Reinforcement Learning: An Introduction》,一直被视为强化学习领域的圣经。

    该书自2014年以来一直在不停的修订和完善,今年Sutton又分享了他最新版本的强化学习入门的最新版本,内容比去年的版本丰富了很多,页数增加到548页,非常值得阅读学习。附全书下载链接:

    链接: https://pan.baidu.com/s/10uPubO7Pw_IpVdcEpR97FA 

    密码: 5wmt

附加福利

    小编认识的一位快手的HR朋友正急招深度强化学习、机器学习相关的技术人员,感兴趣的朋友可以与她联系,投递简历。

附职位介绍及联系方式。


机器学习-深度强化学习工程师/研究员

    基本项 
    1. 教育背景:本科/研究生 学校,专业相关
    2. 研究背景
      ● 研究方向:机器学习、模式识别、数据挖掘等
      ● 论文质量/数量,研究经历

    加分项 (有一项及以上较突出)
    1. 开源项目(github),技术博客
    2. 竞赛:ACM、Kaggle/KDD等
    3. 相关技术方向经验
      ● 强化学习,游戏AI(完全信息/非完全信息博弈),推荐系统


    职位描述:
    工作职责: 
    1、深度学习、强化学习等前沿技术方向研究,探索个性化推荐/广告、游戏AI等不同领域应用

    基本要求:
    1、计算机/电子/数学等相关专业  硕士及以上学历
    2、机器学习/深度学习领域 2年以上 研究/应用 经验
    3、较强编程能力:Python/C/C++
    4、熟悉常见深度学习框架:Tensorflow/PyTorch/Caffe2 


    联系方式:

    邮箱:yumenglei@kuaishou.com

登录查看更多
7

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
小贴士
相关资讯
下载 | 512页教程《神经网络与深度学习》,2018最新著作
机器学习算法与Python学习
40+阅读 · 2019年1月6日
免费教材-《数据科学基础-2018》最新版下载
深度学习与NLP
28+阅读 · 2018年12月28日
548页MIT强化学习教程,收藏备用【PDF下载】
机器学习算法与Python学习
5+阅读 · 2018年10月11日
李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享
深度学习与NLP
13+阅读 · 2018年6月20日
招聘 | 深度强化学习研究员/工程师
七月在线实验室
6+阅读 · 2017年12月27日
2017年12月19日精彩内容推荐(《强化学习》第二版免费下载)
Chatbots技术与产品
6+阅读 · 2017年12月19日
送你一份深度学习资源&教程!
THU数据派
10+阅读 · 2017年11月30日
相关VIP内容
专知会员服务
85+阅读 · 2020年2月1日
专知会员服务
55+阅读 · 2020年1月15日
【电子书】让 PM 全面理解深度学习 65页PDF免费下载
专知会员服务
11+阅读 · 2019年10月30日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
83+阅读 · 2019年10月28日
MIT新书《强化学习与最优控制》
专知会员服务
126+阅读 · 2019年10月9日
相关论文
3D Deep Learning on Medical Images: A Review
Satya P. Singh,Lipo Wang,Sukrit Gupta,Haveesh Goli,Parasuraman Padmanabhan,Balázs Gulyás
8+阅读 · 2020年4月1日
Generalization and Regularization in DQN
Jesse Farebrother,Marlos C. Machado,Michael Bowling
5+阅读 · 2019年1月30日
A Survey on Deep Learning for Named Entity Recognition
Jing Li,Aixin Sun,Jianglei Han,Chenliang Li
65+阅读 · 2018年12月22日
Antoine J. -P. Tixier
10+阅读 · 2018年8月30日
Video Object Detection with an Aligned Spatial-Temporal Memory
Fanyi Xiao,Yong Jae Lee
3+阅读 · 2018年7月27日
Yi Tay,Luu Anh Tuan,Siu Cheung Hui
3+阅读 · 2018年6月3日
Shanmin Pang,Jin Ma,Jianru Xue,Jihua Zhu,Vicente Ordonez
3+阅读 · 2018年5月25日
Ermo Wei,Drew Wicke,David Freelan,Sean Luke
10+阅读 · 2018年4月25日
Xin Wang,Wenhu Chen,Jiawei Wu,Yuan-Fang Wang,William Yang Wang
20+阅读 · 2018年3月29日
Hyrum S. Anderson,Anant Kharkar,Bobby Filar,David Evans,Phil Roth
3+阅读 · 2018年1月30日
Top