文末送书| 国内第一本用 TensorFlow2 实现的算法书

2019 年 7 月 22 日 人工智能头条

强化学习正在改变人类社会的方方面面:基于强化学习的游戏AI已经在围棋、星际争霸等游戏上战胜人类顶尖选手,基于强化学习的控制算法已经运用于机器人、无人机等设备,基于强化学习的交易算法已经部署在金融平台上并取得超额收益。

由于同一套强化学习代码在使用同一套参数的情况下能解决多个看起来毫无关联的问题,所以强化学习常被认为是迈向通用人工智能的重要途径。在此诚邀相关专业人士研究强化学习,以立于人工智能的时代之巅。

今天为大家推荐一本书《强化学习:原理与Python实现》

本书是国内第一本基于 TensorFlow2 实现的算法书,现在在【华章鲜读】购买本书鲜读专栏享受7折优惠 62.3 元(原价89元),不仅可以入库即刻发货得到作者签名版(先到先得),还可以在鲜读平台向作者提问,和鲜友交流。

扫描下方二维码即可尝鲜订阅

本书特色

本书完整地介绍了主流的强化学习理论。

全书采用完整的数学体系,各章内容循序渐进,严谨地讲授强化学习的理论基础,主要定理均给出证明过程。基于理论讲解强化学习算法,覆盖了所有主流强化学习算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。

全书采用一致的数学符号,并且与权威强化学习教程(如R. Sutton等的《Reinforce-ment Learning: An Introduction(第2版)》和D. Silver的视频课程)完美兼容。

本书各章均提供 Python 代码,实战性强。

全书代码统一规范,基于最新的 Python 3.7(兼容Python 3.6)、Gym 0.12和TensorFlow 2(兼容TensorFlow 1)实现强化学习算法。所有代码在Windows、macOS和Linux三大操作系统上均可运行,书中给出了环境的安装和配置方法。

全内容简介

本书介绍强化学习理论及其Python实现,全书分为三个部分。

第1章:介绍强化学习的基础知识与环境库Gym的使用,并给出一个完整的编程实例。

第2~9章:介绍强化学习的理论和算法。采用严谨的数学语言,推导强化学习的基本理论,进而在理论的基础上讲解算法,并为算法提供配套的Python实现。算法的讲解和Python实现逐一对应,覆盖了所有主流的强化学习算法。

第10~12章:介绍多个综合案例,包括电动游戏、棋盘游戏和自动驾驶。环境部分涵盖Gym库的完整安装和自定义扩展,也包括Gym库以外的环境。算法部分涵盖了《自然》 《科学》等权威期刊发表的多个深度强化学习明星算法。涉及环境全面。

第1~9章提供算法的配套实现,强化学习环境只依赖于 Gym 的最小安装,使理论学习免受环境安装困扰;

第10~12章的综合案例既涵盖 Gym 库的完整安装和自定义扩展,还包括 Gym 库以外的环境,让读者体验更加复杂的强化学习任务。

全书实现对硬件配置要求低。第1~9章代码在没有 GPU 的计算机上也可运行;第10~12章代码在配置普通 GPU 的计算机上即可运行。

提前阅读本书的鲜友写的豆瓣书评

活动参与方式:畅所欲言,在留言区聊聊 Python   

点赞数最高前 5 名将赠送《强化学习:原理与Python实现》纸书一本,共送出 5 本。

活动时间:即日起截止 7月25日 中午12:00

中奖领取方式:点赞数多的前 5 名,小编会私信各位详细地址来给您寄送纸书

#急于购书的朋友也可以点击阅读原文链接直接购买#

登录查看更多
1

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
《深度学习》圣经花书的数学推导、原理与Python代码实现
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
139+阅读 · 2020年3月1日
【干货】谷歌Joshua Gordon 《TensorFlow 2.0讲解》,63页PPT
专知会员服务
28+阅读 · 2019年11月2日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
167+阅读 · 2019年10月28日
【赠书】TensorFlow自然语言处理
AINLP
17+阅读 · 2019年7月14日
资源 | 《白话深度学习与TensorFlow》
AI研习社
5+阅读 · 2018年9月22日
资源 | 《Tensorflow:实战Google深度学习框架》
AI研习社
9+阅读 · 2018年8月21日
实战 | 40行代码实现人脸识别
七月在线实验室
3+阅读 · 2018年3月7日
【强化学习】强化学习入门以及代码实现
产业智能官
18+阅读 · 2017年9月4日
技术 | 强化学习入门以及代码实现
AI100
51+阅读 · 2017年8月26日
Arxiv
8+阅读 · 2019年3月21日
Symbolic Priors for RNN-based Semantic Parsing
Arxiv
3+阅读 · 2018年9月20日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
4+阅读 · 2018年4月9日
VIP会员
相关VIP内容
相关资讯
【赠书】TensorFlow自然语言处理
AINLP
17+阅读 · 2019年7月14日
资源 | 《白话深度学习与TensorFlow》
AI研习社
5+阅读 · 2018年9月22日
资源 | 《Tensorflow:实战Google深度学习框架》
AI研习社
9+阅读 · 2018年8月21日
实战 | 40行代码实现人脸识别
七月在线实验室
3+阅读 · 2018年3月7日
【强化学习】强化学习入门以及代码实现
产业智能官
18+阅读 · 2017年9月4日
技术 | 强化学习入门以及代码实现
AI100
51+阅读 · 2017年8月26日
Top
微信扫码咨询专知VIP会员