机器学习已经成为许多商业应用和研究项目中不可或缺的一部分,但这一领域并不仅限于拥有广泛研究团队的大公司。如果您使用Python,即使是初学者,这本书也会教你构建自己的机器学习解决方案的实用方法。今天,有了所有可用的数据,机器学习应用程序只受限于你的想象力。
您将学习使用Python和scikit-learn库创建成功的机器学习应用程序所需的步骤。两位作者安德烈亚斯•穆勒(Andreas Muller)和萨拉•圭多(Sarah Guido)关注的是使用机器学习算法的实践层面,而不是背后的数学。熟悉NumPy和matplotlib库将有助于您从本书获得更多信息。
通过这本书,你会学到 :
使用高级架构开发和优化深度学习模型。这本书教你错综复杂的细节和微妙的算法,是卷积神经网络的核心。在高级应用深度学习中,您将学习CNN的高级主题和使用Keras和TensorFlow的对象检测。
在此过程中,您将了解CNN中的基本操作,如卷积和池化,然后了解更高级的架构,如inception networks、resnets等等。当这本书讨论理论主题时,你会发现如何有效地与Keras工作,其中有许多技巧和提示,包括如何用自定义回调类自定义Keras登录,什么是迫切执行,以及如何在你的模型中使用它。最后,您将学习对象检测是如何工作的,并在Keras和TensorFlow中构建YOLO(只查看一次)算法的完整实现。在书的最后,你将实现各种各样的模型在Keras和学习许多高级技巧,将把你的技能到下一个水平。
你将学到什么
这本书是给谁的
这本教科书通过提供实用的建议,使用直接的例子,并提供相关应用的引人入胜的讨论,以一种容易理解的方式介绍了基本的机器学习概念。主要的主题包括贝叶斯分类器,最近邻分类器,线性和多项式分类器,决策树,神经网络,和支持向量机。后面的章节展示了如何通过“推进”的方式结合这些简单的工具,如何在更复杂的领域中利用它们,以及如何处理各种高级的实际问题。有一章专门介绍流行的遗传算法。
这个修订的版本包含关于工业中机器学习的实用应用的关键主题的三个全新的章节。这些章节研究了多标签域,无监督学习和它在深度学习中的使用,以及归纳逻辑编程的逻辑方法。许多章节已经被扩展,并且材料的呈现已经被增强。这本书包含了许多新的练习,许多解决的例子,深入的实验,和独立工作的计算机作业。
https://link.springer.com/book/10.1007/978-3-319-63913-0#about
关于大数据技术的信息很多,但将这些技术拼接到端到端企业数据平台是一项艰巨的任务,没有得到广泛的讨论。通过这本实用的书,您将学习如何在本地和云中构建大数据基础设施,并成功地构建一个现代数据平台。
本书非常适合企业架构师、IT经理、应用程序架构师和数据工程师,它向您展示了如何克服Hadoop项目期间出现的许多挑战。在深入了解以下内容之前,您将在一个彻底的技术入门中探索Hadoop和大数据领域中可用的大量工具:
-平台: 了解部署、操作、安全性、高可用性和灾难恢复的各个方面,以及将平台与企业IT的其他部分集成在一起所需了解的所有内容
有兴趣的数据科学专业人士可以通过本书学习Scikit-Learn图书馆以及机器学习的基本知识。本书结合了Anaconda Python发行版和流行的Scikit-Learn库,演示了广泛的有监督和无监督机器学习算法。通过用Python编写的清晰示例,您可以在家里自己的机器上试用和试验机器学习的原理。
所有的应用数学和编程技能需要掌握的内容,在这本书中涵盖。不需要深入的面向对象编程知识,因为工作和完整的例子被提供和解释。必要时,编码示例是深入和复杂的。它们也简洁、准确、完整,补充了介绍的机器学习概念。使用示例有助于建立必要的技能,以理解和应用复杂的机器学习算法。
对于那些在机器学习方面追求职业生涯的人来说,Scikit-Learn机器学习应用手册是一个很好的起点。学习这本书的学生将学习基本知识,这是胜任工作的先决条件。读者将接触到专门为数据科学专业人员设计的蟒蛇分布,并将在流行的Scikit-Learn库中构建技能,该库是Python世界中许多机器学习应用程序的基础。
你将学习
这本书是给谁的
改进您的编程技术和方法,成为一个更有生产力和创造性的Python程序员。本书探索了一些概念和特性,这些概念和特性不仅将改进您的代码,而且还将帮助您理解Python社区,并对Python哲学有深入的了解和详细的介绍。
专业的Python 3,第三版给你的工具写干净,创新的代码。它首先回顾了一些核心的Python原则,这些原则将在本书后面的各种概念和示例中进行说明。本书的前半部分探讨了函数、类、协议和字符串的各个方面,描述了一些技术,这些技术可能不是常见的知识,但它们共同构成了坚实的基础。后面的章节涉及文档、测试和应用程序分发。在此过程中,您将开发一个复杂的Python框架,该框架将整合在本书中所学到的思想。
这个版本的更新包括Python 3中迭代器的角色、用Scrapy和BeautifulSoup进行web抓取、使用请求调用没有字符串的web页面、用于分发和安装的新工具等等。在本书的最后,您将准备好部署不常见的特性,这些特性可以将您的Python技能提升到下一个级别。
你将学习
这本书是给谁看的 熟悉Python的中级程序员,希望提升到高级水平。您应该至少编写了一个简单的Python应用程序,并且熟悉基本的面向对象方法、使用交互式解释器和编写控制结构。
本书通过提供真实的案例研究和示例,为使用Python库进行机器学习提供了坚实的基础。它涵盖了诸如机器学习基础、Python入门、描述性分析和预测分析等主题。包括高级机器学习概念,如决策树学习、随机森林、增强、推荐系统和文本分析。这本书在理论理解和实际应用之间采取了一种平衡的方法。所有的主题都包括真实世界的例子,并提供如何探索、构建、评估和优化机器学习模型的逐步方法。
书名: Hands-On Machine Learning with Scikit-Learn and TensorFlow
主要内容:
这本书分为两个部分。
第一部分,机器学习的基础知识,涵盖以下主题:
第二部分,神经网络和深度学习,包括以下主题:
第一部分主要基于 scikit-learn ,而第二部分则使用 TensorFlow 。 注意:不要太急于深入学习到核心知识:深度学习无疑是机器学习中最令人兴奋的领域之 一,但是你应该首先掌握基础知识。而且,大多数问题可以用较简单的技术很好地解决(而 不需要深度学习),比如随机森林和集成方法(我们会在第一部分进行讨论)。如果你拥有 足够的数据,计算能力和耐心,深度学习是最适合复杂的问题的,如图像识别,语音识别或 自然语言处理。
机器学习(ML)是一组用于发现数据关系的编程技术。使用ML算法,您可以对数据进行聚类和分类,以执行建议或欺诈检测之类的任务,并对销售趋势、风险分析和其他预测进行预测。机器学习曾经是学术数据科学家的领域,现在已经成为主流的业务流程,而像易于学习的R编程语言这样的工具将高质量的数据分析交到任何程序员的手中。《使用R、tidyverse和mlr的机器学习》将教会您广泛使用的ML技术,以及如何使用R编程语言及其强大的工具生态系统将它们应用于您自己的数据集。这本书会让你开始!
对这项技术
机器学习技术准确而有效地识别数据中的模式和关系,并使用这些模型对新数据进行预测。ML技术甚至可以在相对较小的数据集上工作,使这些技能成为几乎所有数据分析任务的强大盟友。R语言的设计考虑了数学和统计的应用。小型数据集是它的最佳选择,它的现代数据科学工具(包括流行的tidyverse包)使R成为ML的自然选择。
关于这本书
《使用R、tidyverse和mlr的机器学习》将教会您如何使用强大的R编程语言从数据中获得有价值的见解。作者兼R专家Hefin Ioan Rhys以其引人入胜的、非正式的风格为ML基础知识打下了坚实的基础,并向您介绍了tidyverse,这是一套专门为实用数据科学设计的强大的R工具。有了这些基础知识,您将更深入地研究常用的机器学习技术,包括分类、预测、约简和聚类算法,并将每种技术应用于实际数据,从而对有趣的问题进行预测。
使用tidyverse包,您将转换、清理和绘制您的数据,并在工作中使用数据科学最佳实践。为了简化您的学习过程,您还将使用R的mlr包,这是一个非常灵活的接口,用于各种核心算法,允许您以最少的编码执行复杂的ML任务。您将探索一些基本概念,如过拟合、欠拟合、验证模型性能,以及如何为您的任务选择最佳模型。富有启发性的图片提供了清晰的解释,巩固了你的新知识。
无论您是在处理业务问题、处理研究数据,还是仅仅是一个有数据头脑的开发人员,您都可以通过本实用教程立即构建自己的ML管道!
里面有什么
简介:
科学专业人员可以通过本书学习Scikit-Learn库以及机器学习的基础知识。该书将Anaconda Python发行版与流行的Scikit-Learn库结合在一起,展示了各种有监督和无监督的机器学习算法。通过Python编写的清晰示例向读者介绍机器学习的原理,以及相关代码。
本书涵盖了掌握这些内容所需的所有应用数学和编程技能。不需要深入的面向对象编程知识,因为可以提供并说明完整的示例。必要时,编码示例很深入且很复杂。它们也简洁,准确,完整,是对引入的机器学习概念的补充。处理示例有助于建立理解和应用复杂机器学习算法所需的技能。
本书的学生将学习作为胜任力前提的基础知识。读者将了解专门为数据科学专业人员设计的Python Anaconda发行版,并将在流行的Scikit-Learn库中构建技能,该库是Python领域许多机器学习应用程序的基础。
本书内容包括:
内容介绍:
这本书分为八章。 第1章介绍了机器学习,Anaconda和Scikit-Learn的主题。 第2章和第3章介绍算法分类。 第2章对简单数据集进行分类,第3章对复杂数据集进行分类。 第4章介绍了回归预测模型。 第5章和第6章介绍分类调整。 第5章调整简单数据集,第6章调整复杂数据集。 第7章介绍了预测模型回归调整。 第8章将所有知识汇总在一起,以整体方式审查和提出发现。
作者介绍:
David Paper博士是犹他州立大学管理信息系统系的教授。他写了两本书-商业网络编程:Oracle的PHP面向对象编程和Python和MongoDB的数据科学基础。他在诸如组织研究方法,ACM通讯,信息与管理,信息资源管理期刊,AIS通讯,信息技术案例与应用研究期刊以及远程计划等参考期刊上发表了70余篇论文。他还曾在多个编辑委员会担任过各种职务,包括副编辑。Paper博士还曾在德州仪器(TI),DLS,Inc.和凤凰城小型企业管理局工作。他曾为IBM,AT&T,Octel,犹他州交通运输部和空间动力实验室执行过IS咨询工作。 Paper博士的教学和研究兴趣包括数据科学,机器学习,面向对象的程序设计和变更管理。
目录: