强化学习是机器学习的一个热门领域,从基础开始: 发现代理和环境如何演变,然后获得它们之间如何相互关联的清晰联系。然后你将学习与强化学习相关的理论,并了解建立强化学习过程的概念。

这本书讨论了对强化学习很重要的算法实现,包括马尔可夫决策过程和半马尔可夫决策过程。下一节将向您展示如何在查看Open AI Gym之前开始使用Open AI。然后您将学习Python中关于增强学习方面的群体智能。

本书的最后一部分从TensorFlow环境开始,并给出了如何将强化学习应用于TensorFlow的概述。还有Keras,一个可以用于强化学习的框架。最后,您将深入研究谷歌的深层思想,并看到可以使用强化学习的场景。

你将学习

  • 吸收强化学习过程的核心概念
  • 使用深度学习和人工智能的高级主题
  • 与Open AI Gym、Open AI和Python一起工作
  • 利用TensorFlow和Keras使用Python进行强化学习

这本书是给谁看的

数据科学家、机器学习和深度学习专业人员、希望适应和学习强化学习的开发人员。

成为VIP会员查看完整内容
0
84

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

这本书在对算法工作原理的高层次理解和对优化模型的具体细节的了解之间找到一个平衡点。这本书将给你的信心和技能时,开发所有主要的机器学习模型。在这本Pro机器学习算法中,您将首先在Excel中开发算法,以便在用Python/R实现模型之前,实际了解可以在模型中调优的所有细节。

你将涵盖所有主要的算法:监督和非监督学习,其中包括线性/逻辑回归;k - means聚类;主成分分析;推荐系统;决策树;随机森林;“GBM”;和神经网络。您还将通过CNNs、RNNs和word2vec等文本挖掘工具了解最新的深度学习。你不仅要学习算法,还要学习特征工程的概念来最大化模型的性能。您将看到该理论与案例研究,如情绪分类,欺诈检测,推荐系统,和图像识别,以便您得到最佳的理论和实践为工业中使用的绝大多数机器学习算法。在学习算法的同时,您还将接触到在所有主要云服务提供商上运行的机器学习模型。

你会学到什么?

  • 深入了解所有主要的机器学习和深度学习算法
  • 充分理解在构建模型时要避免的陷阱
  • 在云中实现机器学习算法
  • 通过对每种算法的案例研究,采用动手实践的方法
  • 学习集成学习的技巧,建立更精确的模型
  • 了解R/Python编程的基础知识和Keras深度学习框架

这本书是给谁看的

希望转换到数据科学角色的业务分析师/ IT专业人员。想要巩固机器学习知识的数据科学家。

成为VIP会员查看完整内容
0
105

https://www.manning.com/books/deep-learning-with-javascript

深度学习已经改变了计算机视觉、图像处理和自然语言应用领域。多亏了TensorFlow.js,现在JavaScript开发人员可以无需依赖Python或R就能构建深度学习应用程序。使用JavaScript的深度学习向开发人员展示了如何将DL技术引入web。本书由TensorFlow库的主要作者编写,为在浏览器或Node上使用JavaScript进行深度学习的应用程序提供了有趣的用例和深入的指导。

关于技术

在浏览器或基于Node的后端中运行深度学习应用程序,为智能web应用程序开辟了令人兴奋的可能性。使用TensorFlow.js库,您可以用JavaScript构建和训练深度学习模型。TensorFlow.js具有无与伦比的可扩展性,模块化和响应能力,其可移植性确实令人眼前一亮。它的模型可以在JavaScript运行的任何地方运行,从而将ML推向应用程序堆栈的更上层。

关于这本书

在Deep Learning with JavaScript这本书中,您将学习使用TensorFlow.js来构建直接在浏览器中运行的深度学习模型。这本快节奏的书由Google工程师撰写,是实用的,引人入胜且易于阅读。通过以文本分析,语音处理,图像识别和自学习游戏AI为特色的各种示例,您将掌握深度学习的所有基础知识并探索高级概念,例如对现有模型进行再训练以进行迁移学习和图像生成。

书里面有什么

在浏览器中的图像和语言处理

用客户端数据调优ML模型

通过生成式深度学习创建文本和图像

源代码示例以进行测试和修改

成为VIP会员查看完整内容
0
63

简介:

自从2012年以来,最近的技术史上最重大的事件也许就是神经网络爆炸了。标记数据集的增长,计算能力的提高以及算法的创新齐头并进。从那时起,深度神经网络使以前无法实现的任务得以实现,并提高了任务的准确性,使它们超出了学术研究范围,并进入了语音识别,图像标记,生成模型和推荐系统等领域的实际应用。在这种背景下,Google Brain的团队开始开发TensorFlow.js。该项目开始时,许多人认为“ JavaScript深度学习”是一种新颖事物,对于某些用例来说并不能当真。尽管Python已经有了一些完善的,功能强大的深度学习框架,但JavaScript机器学习的前景仍然是零散的和不完整的。在当时可用的少数JavaScript库中,大多数仅支持以其他语言(通常是Python)进行预训练的部署模型。

这本书不仅是作为如何在TensorFlow.js中编写代码的秘诀,而且还是以JavaScript和Web开发人员的母语为基础的机器学习基础入门课程。深度学习领域是一个快速发展的领域。我们相信,无需正式的数学处理就可以对机器学习有深入的了解,而这种了解将使您能够在技术的未来发展中保持最新。有了这本书,您就成为成为成长中的JavaScript机器学习从业人员社区的第一步,他们已经在JavaScript和深度学习之间的交汇处带来了许多有影响力的应用程序。我们衷心希望本书能激发您在这一领域的创造力和独创性。

目录:

内容简介:

本书分为四个部分。第一部分仅由第一章组成,向您介绍了人工智能,机器学习和深度学习的概况,以及在JavaScript中实践深度学习为何有意义。第二部分是对深度学习中最基础和最常遇到的概念的简要介绍。本书的第三部分系统地为希望建立对更前沿技术的理解的用户,提供了深度学习的高级主题,重点是ML系统的特定挑战领域以及与之配合使用的TensorFlow.js工具。

成为VIP会员查看完整内容
0
30

题目:Applied Reinforcement Learning with Python With OpenAI Gym, Tensorflow, and Keras

深入研究强化学习算法,并通过Python将它们应用到不同的用例中。这本书涵盖了重要的主题,如策略梯度和Q学习,并利用框架,如Tensorflow, Keras,和OpenAI Gym。

Python中的应用增强学习向您介绍了强化学习(RL)算法背后的理论和用于实现它们的代码。您将在指导下了解OpenAI Gym的特性,从使用标准库到创建自己的环境,然后了解如何构建强化学习问题,以便研究、开发和部署基于rl的解决方案。

你将学习:

  • 用Python实现强化学习
  • 使用AI框架,如OpenAI Gym、Tensorflow和Keras
  • 通过云资源部署和培训基于增强学习的解决方案
  • 应用强化学习的实际应用

这本书是给谁看的: 数据科学家、机器学习工程师和软件工程师熟悉机器学习和深度学习的概念。

地址:

https://www.springerprofessional.de/en/applied-reinforcement-learning-with-python/17098944

目录:

第1章 强化学习导论

在过去的一年里,深度学习技术的不断扩散和发展给各个行业带来了革命性的变化。毫无疑问,这个领域最令人兴奋的部分之一是强化学习(RL)。这本身往往是许多通用人工智能应用程序的基础,例如学习玩视频游戏或下棋的软件。强化学习的好处是,假设可以将问题建模为包含操作、环境和代理的框架,那么代理就可以熟悉大量的任务。假设,解决问题的范围可以从简单的游戏,更复杂的3d游戏,自动驾驶汽车教学如何挑选和减少乘客在各种不同的地方以及教一个机械手臂如何把握对象和地点在厨房柜台上。

第二章 强化学习算法

读者应该知道,我们将利用各种深度学习和强化学习的方法在这本书。然而,由于我们的重点将转移到讨论实现和这些算法如何在生产环境中工作,我们必须花一些时间来更详细地介绍算法本身。因此,本章的重点将是引导读者通过几个强化学习算法的例子,通常应用和展示他们在使用Open AI gym 不同的问题。

第三章 强化学习算法:Q学习及其变体

随着策略梯度和Actor-Critic模型的初步讨论的结束,我们现在可以讨论读者可能会发现有用的替代深度学习算法。具体来说,我们将讨论Q学习、深度Q学习以及深度确定性策略梯度。一旦我们了解了这些,我们就可以开始处理更抽象的问题,更具体的领域,这将教会用户如何处理不同任务的强化学习。

第四章 通过强化学习做市场

除了在许多书中发现的强化学习中的一些标准问题之外,最好看看那些答案既不客观也不完全解决的领域。在金融领域,尤其是强化学习领域,最好的例子之一就是做市。我们将讨论学科本身,提出一些不基于机器学习的基线方法,然后测试几种基于强化学习的方法。

第五章 自定义OpenAI强化学习环境

在我们的最后一章,我们将专注于Open AI Gym,但更重要的是尝试理解我们如何创建我们自己的自定义环境,这样我们可以处理更多的典型用例。本章的大部分内容将集中在我对开放人工智能的编程实践的建议,以及我如何编写这个软件的建议。最后,在我们完成创建环境之后,我们将继续集中精力解决问题。对于这个例子,我们将集中精力尝试创建和解决一个新的视频游戏。

成为VIP会员查看完整内容
0
71

简介: Google一直是引入突破性技术和产品的先驱。在效率和规模方面,TensorFlow也不例外,因此,编写本书只是向读者介绍TensorFlow核心团队所做的这些重要更改。本书着重于机器学习方面的TensorFlow的不同应用,并更深入地探讨了方法的最新变化。对于那些想要用TensorFlow进行机器学习的人来说,这本书是一个很好的参考点。本书分为三个部分。第一篇:使用TensorFlow 2.0进行数据处理。第二部分:使用TensorFlow 2.0构建机器学习和深度学习模型。它还包括使用TensorFlow 2.0的神经语言编程(NLP)。第三部分介绍了如何在环境中保存和部署TensorFlow 2.0模型。这本书对数据分析人员和数据工程师也很有用,因为它涵盖了使用TensorFlow 2.0处理大数据的步骤。想要过渡到数据科学和机器学习领域的读者也会发现,本书提供了实用的入门指南,以后可能会出现更复杂的方面。书中提供的案例研究和示例使您很容易理解和理解相关的基本概念。本书的优势在于其简单性以及将机器学习应用于有意义的数据集。

目录:

  • Chapter 1:tenforflow 2.0介绍
    • tensor
    • TensorFlow 1.0与 Tensorflow 2.0的对比
    • Tensorflow 2.0安装于基础操作
  • Chapter 2:tenforflow 与监督学习
    • 监督机器学习是什么
    • TF2.0实现线性回归
    • 使用TF和Keras的线性回归应用
    • TF2.0实现逻辑回归
    • TF2.0实现boosted树
  • Chapter 3:tenforflow与深度神经网络
    • 什么是神经网络
    • 前向传播与反向传播
    • TF2.0构建神经网络
    • 深度神经网络
    • TF2.0构建深度神经网络
    • 使用Keras模型估量
    • 总结
  • Chapter 4:图片与Tensorflow
    • 图片处理
    • 卷积神经网络
    • TF2.0与卷积神经网络
    • 迁移学习
    • TF2.0与变分自编码器
    • 总结
  • Chapter 5:TF2.0与自然语言处理(NLP)
    • NLP概述
    • 文本处理
    • 文本分类与TF
    • TF projector
  • Chapter 6:TF模型
    • TF部署
    • 模型部署的Python
    • 基于TF的Keras模型
成为VIP会员查看完整内容
0
144
小贴士
相关VIP内容
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
179+阅读 · 2020年3月17日
专知会员服务
105+阅读 · 2020年2月11日
相关论文
Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning
Prithviraj Ammanabrolu,Mark O. Riedl
4+阅读 · 2019年3月25日
Borja Ibarz,Jan Leike,Tobias Pohlen,Geoffrey Irving,Shane Legg,Dario Amodei
4+阅读 · 2018年11月15日
Learning to Coordinate Multiple Reinforcement Learning Agents for Diverse Query Reformulation
Rodrigo Nogueira,Jannis Bulian,Massimiliano Ciaramita
3+阅读 · 2018年9月27日
Image Captioning based on Deep Reinforcement Learning
Haichao Shi,Peng Li,Bo Wang,Zhenyu Wang
6+阅读 · 2018年9月13日
Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning
Tom Zahavy,Matan Haroush,Nadav Merlis,Daniel J. Mankowitz,Shie Mannor
4+阅读 · 2018年9月6日
Antoine J. -P. Tixier
10+阅读 · 2018年8月30日
Video Summarisation by Classification with Deep Reinforcement Learning
Kaiyang Zhou,Tao Xiang,Andrea Cavallaro
3+阅读 · 2018年7月9日
Shikun Liu,Edward Johns,Andrew J. Davison
12+阅读 · 2018年3月28日
Ashish Mishra,M Shiva Krishna Reddy,Anurag Mittal,Hema A Murthy
5+阅读 · 2018年1月27日
Iulian V. Serban,Chinnadhurai Sankar,Mathieu Germain,Saizheng Zhang,Zhouhan Lin,Sandeep Subramanian,Taesup Kim,Michael Pieper,Sarath Chandar,Nan Rosemary Ke,Sai Rajeswar,Alexandre de Brebisson,Jose M. R. Sotelo,Dendi Suhubdy,Vincent Michalski,Alexandre Nguyen,Joelle Pineau,Yoshua Bengio
10+阅读 · 2018年1月20日
Top