机器学习已经成为许多商业应用和研究项目中不可或缺的一部分,但这一领域并不仅限于拥有广泛研究团队的大公司。如果您使用Python,即使是初学者,这本书也会教你构建自己的机器学习解决方案的实用方法。今天,有了所有可用的数据,机器学习应用程序只受限于你的想象力。

您将学习使用Python和scikit-learn库创建成功的机器学习应用程序所需的步骤。两位作者安德烈亚斯•穆勒(Andreas Muller)和萨拉•圭多(Sarah Guido)关注的是使用机器学习算法的实践层面,而不是背后的数学。熟悉NumPy和matplotlib库将有助于您从本书获得更多信息。

通过这本书,你会学到 :

  • 机器学习的基本概念和应用
  • 广泛应用的机器学习算法的优缺点
  • 如何表示机器学习处理过的数据,包括关注哪些数据方面
  • 先进的模型评估和参数调整方法
  • 用于链接模型和封装工作流的管道概念
  • 处理文本数据的方法,包括特定于文本的处理技术
  • 提高机器学习和数据科学技能的建议
成为VIP会员查看完整内容
0
86

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

使用高级架构开发和优化深度学习模型。这本书教你错综复杂的细节和微妙的算法,是卷积神经网络的核心。在高级应用深度学习中,您将学习CNN的高级主题和使用Keras和TensorFlow的对象检测。

在此过程中,您将了解CNN中的基本操作,如卷积和池化,然后了解更高级的架构,如inception networks、resnets等等。当这本书讨论理论主题时,你会发现如何有效地与Keras工作,其中有许多技巧和提示,包括如何用自定义回调类自定义Keras登录,什么是迫切执行,以及如何在你的模型中使用它。最后,您将学习对象检测是如何工作的,并在Keras和TensorFlow中构建YOLO(只查看一次)算法的完整实现。在书的最后,你将实现各种各样的模型在Keras和学习许多高级技巧,将把你的技能到下一个水平。

你将学到什么

  • 看看卷积神经网络和目标检测是如何工作的
  • 在磁盘上的权值和模型
  • 暂停训练,在稍后的阶段重新开始
  • 在代码中使用硬件加速
  • 使用数据集TensorFlow抽象和使用预先训练的模型和迁移学习
  • 删除和添加层到预先训练的网络,使其适应您的特定项目
  • 将预先训练好的模型(如Alexnet和VGG16)应用到新的数据集

这本书是给谁的

  • 拥有中级到高级Python和机器学习技能的科学家和研究人员。此外,还需要Keras和TensorFlow的中级知识。
成为VIP会员查看完整内容
0
77

这本教科书通过提供实用的建议,使用直接的例子,并提供相关应用的引人入胜的讨论,以一种容易理解的方式介绍了基本的机器学习概念。主要的主题包括贝叶斯分类器,最近邻分类器,线性和多项式分类器,决策树,神经网络,和支持向量机。后面的章节展示了如何通过“推进”的方式结合这些简单的工具,如何在更复杂的领域中利用它们,以及如何处理各种高级的实际问题。有一章专门介绍流行的遗传算法。

这个修订的版本包含关于工业中机器学习的实用应用的关键主题的三个全新的章节。这些章节研究了多标签域,无监督学习和它在深度学习中的使用,以及归纳逻辑编程的逻辑方法。许多章节已经被扩展,并且材料的呈现已经被增强。这本书包含了许多新的练习,许多解决的例子,深入的实验,和独立工作的计算机作业。

https://link.springer.com/book/10.1007/978-3-319-63913-0#about

成为VIP会员查看完整内容
0
119

关于大数据技术的信息很多,但将这些技术拼接到端到端企业数据平台是一项艰巨的任务,没有得到广泛的讨论。通过这本实用的书,您将学习如何在本地和云中构建大数据基础设施,并成功地构建一个现代数据平台。

本书非常适合企业架构师、IT经理、应用程序架构师和数据工程师,它向您展示了如何克服Hadoop项目期间出现的许多挑战。在深入了解以下内容之前,您将在一个彻底的技术入门中探索Hadoop和大数据领域中可用的大量工具:

  • 基础设施: 查看现代数据平台中的所有组件层,从服务器到数据中心,为企业中的数据建立坚实的基础

-平台: 了解部署、操作、安全性、高可用性和灾难恢复的各个方面,以及将平台与企业IT的其他部分集成在一起所需了解的所有内容

  • 将Hadoop带到云端: 学习在云中运行大数据平台的重要架构方面,同时保持企业安全性和高可用性
成为VIP会员查看完整内容
0
115

有兴趣的数据科学专业人士可以通过本书学习Scikit-Learn图书馆以及机器学习的基本知识。本书结合了Anaconda Python发行版和流行的Scikit-Learn库,演示了广泛的有监督和无监督机器学习算法。通过用Python编写的清晰示例,您可以在家里自己的机器上试用和试验机器学习的原理。

所有的应用数学和编程技能需要掌握的内容,在这本书中涵盖。不需要深入的面向对象编程知识,因为工作和完整的例子被提供和解释。必要时,编码示例是深入和复杂的。它们也简洁、准确、完整,补充了介绍的机器学习概念。使用示例有助于建立必要的技能,以理解和应用复杂的机器学习算法。

对于那些在机器学习方面追求职业生涯的人来说,Scikit-Learn机器学习应用手册是一个很好的起点。学习这本书的学生将学习基本知识,这是胜任工作的先决条件。读者将接触到专门为数据科学专业人员设计的蟒蛇分布,并将在流行的Scikit-Learn库中构建技能,该库是Python世界中许多机器学习应用程序的基础。

你将学习

  • 使用Scikit-Learn中常见的简单和复杂数据集
  • 将数据操作为向量和矩阵,以进行算法处理
  • 熟悉数据科学中使用的蟒蛇分布
  • 应用带有分类器、回归器和降维的机器学习
  • 优化算法并为每个数据集找到最佳算法
  • 从CSV、JSON、Numpy和panda格式加载数据并保存为这些格式

这本书是给谁的

  • 有抱负的数据科学家渴望通过掌握底层的基础知识进入机器学习领域,而这些基础知识有时在急于提高生产力的过程中被忽略了。一些面向对象编程的知识和非常基本的线性代数应用将使学习更容易,尽管任何人都可以从这本书获益。
成为VIP会员查看完整内容
0
127

改进您的编程技术和方法,成为一个更有生产力和创造性的Python程序员。本书探索了一些概念和特性,这些概念和特性不仅将改进您的代码,而且还将帮助您理解Python社区,并对Python哲学有深入的了解和详细的介绍。

专业的Python 3,第三版给你的工具写干净,创新的代码。它首先回顾了一些核心的Python原则,这些原则将在本书后面的各种概念和示例中进行说明。本书的前半部分探讨了函数、类、协议和字符串的各个方面,描述了一些技术,这些技术可能不是常见的知识,但它们共同构成了坚实的基础。后面的章节涉及文档、测试和应用程序分发。在此过程中,您将开发一个复杂的Python框架,该框架将整合在本书中所学到的思想。

这个版本的更新包括Python 3中迭代器的角色、用Scrapy和BeautifulSoup进行web抓取、使用请求调用没有字符串的web页面、用于分发和安装的新工具等等。在本书的最后,您将准备好部署不常见的特性,这些特性可以将您的Python技能提升到下一个级别。

你将学习

  • 用各种类型的Python函数实现程序
  • 使用类和面向对象编程
  • 使用标准库和第三方库中的字符串
  • 使用Python获取web站点数据
  • 通过编写测试套件来自动化单元测试
  • 回顾成像、随机数生成和NumPy科学扩展
  • 理解Python文档的精髓,以帮助您决定分发代码的最佳方式

这本书是给谁看的 熟悉Python的中级程序员,希望提升到高级水平。您应该至少编写了一个简单的Python应用程序,并且熟悉基本的面向对象方法、使用交互式解释器和编写控制结构。

成为VIP会员查看完整内容
0
125

本书通过提供真实的案例研究和示例,为使用Python库进行机器学习提供了坚实的基础。它涵盖了诸如机器学习基础、Python入门、描述性分析和预测分析等主题。包括高级机器学习概念,如决策树学习、随机森林、增强、推荐系统和文本分析。这本书在理论理解和实际应用之间采取了一种平衡的方法。所有的主题都包括真实世界的例子,并提供如何探索、构建、评估和优化机器学习模型的逐步方法。

成为VIP会员查看完整内容
Machine Learning using Python by Manaranjan Pradhan.pdf
0
185

书名: Hands-On Machine Learning with Scikit-Learn and TensorFlow

主要内容:

这本书分为两个部分。

第一部分,机器学习的基础知识,涵盖以下主题:

  • 什么是机器学习?它被试图用来解决什么问题?机器学习系统的主要类别和基本概念是什么?
  • 典型的机器学习项目中的主要步骤。
  • 通过拟合数据来学习模型。
  • 优化成本函数(cost function)。
  • 零、前言
  • 处理,清洗和准备数据。
  • 选择和设计特征。
  • 使用交叉验证选择一个模型并调整超参数。
  • 机器学习的主要挑战,特别是欠拟合和过拟合(偏差和方差权衡)。
  • 对训练数据进行降维以对抗 the curse of dimensionality(维度诅咒)
  • 最常见的学习算法:线性和多项式回归, Logistic 回归,k-最近邻,支持向量机,决策 树,随机森林和集成方法。

第二部分,神经网络和深度学习,包括以下主题:

  • 什么是神经网络?它们有啥优势?
  • 使用 TensorFlow 构建和训练神经网络。
  • 最重要的神经网络架构:前馈神经网络,卷积网络,递归网络,长期短期记忆网络 (LSTM)和自动编码器。
  • 训练深度神经网络的技巧。
  • 对于大数据集缩放神经网络。
  • 强化学习。

第一部分主要基于 scikit-learn ,而第二部分则使用 TensorFlow 。 注意:不要太急于深入学习到核心知识:深度学习无疑是机器学习中最令人兴奋的领域之 一,但是你应该首先掌握基础知识。而且,大多数问题可以用较简单的技术很好地解决(而 不需要深度学习),比如随机森林和集成方法(我们会在第一部分进行讨论)。如果你拥有 足够的数据,计算能力和耐心,深度学习是最适合复杂的问题的,如图像识别,语音识别或 自然语言处理。

成为VIP会员查看完整内容
Hands on Machine Learning with Scikit Learn and TensorFlow - 中文版.pdf
0
63

机器学习(ML)是一组用于发现数据关系的编程技术。使用ML算法,您可以对数据进行聚类和分类,以执行建议或欺诈检测之类的任务,并对销售趋势、风险分析和其他预测进行预测。机器学习曾经是学术数据科学家的领域,现在已经成为主流的业务流程,而像易于学习的R编程语言这样的工具将高质量的数据分析交到任何程序员的手中。《使用R、tidyverse和mlr的机器学习》将教会您广泛使用的ML技术,以及如何使用R编程语言及其强大的工具生态系统将它们应用于您自己的数据集。这本书会让你开始!

对这项技术

机器学习技术准确而有效地识别数据中的模式和关系,并使用这些模型对新数据进行预测。ML技术甚至可以在相对较小的数据集上工作,使这些技能成为几乎所有数据分析任务的强大盟友。R语言的设计考虑了数学和统计的应用。小型数据集是它的最佳选择,它的现代数据科学工具(包括流行的tidyverse包)使R成为ML的自然选择。

关于这本书

《使用R、tidyverse和mlr的机器学习》将教会您如何使用强大的R编程语言从数据中获得有价值的见解。作者兼R专家Hefin Ioan Rhys以其引人入胜的、非正式的风格为ML基础知识打下了坚实的基础,并向您介绍了tidyverse,这是一套专门为实用数据科学设计的强大的R工具。有了这些基础知识,您将更深入地研究常用的机器学习技术,包括分类、预测、约简和聚类算法,并将每种技术应用于实际数据,从而对有趣的问题进行预测。

使用tidyverse包,您将转换、清理和绘制您的数据,并在工作中使用数据科学最佳实践。为了简化您的学习过程,您还将使用R的mlr包,这是一个非常灵活的接口,用于各种核心算法,允许您以最少的编码执行复杂的ML任务。您将探索一些基本概念,如过拟合、欠拟合、验证模型性能,以及如何为您的任务选择最佳模型。富有启发性的图片提供了清晰的解释,巩固了你的新知识。

无论您是在处理业务问题、处理研究数据,还是仅仅是一个有数据头脑的开发人员,您都可以通过本实用教程立即构建自己的ML管道!

里面有什么

  • 常用ML技术
  • 使用tidyverse包来组织和绘制数据
  • 验证模型的性能
  • 为您的任务选择最佳的ML模型
  • 各种实际的编码练习
  • ML的最佳实践
成为VIP会员查看完整内容
0
78

简介:

科学专业人员可以通过本书学习Scikit-Learn库以及机器学习的基础知识。该书将Anaconda Python发行版与流行的Scikit-Learn库结合在一起,展示了各种有监督和无监督的机器学习算法。通过Python编写的清晰示例向读者介绍机器学习的原理,以及相关代码。

本书涵盖了掌握这些内容所需的所有应用数学和编程技能。不需要深入的面向对象编程知识,因为可以提供并说明完整的示例。必要时,编码示例很深入且很复杂。它们也简洁,准确,完整,是对引入的机器学习概念的补充。处理示例有助于建立理解和应用复杂机器学习算法所需的技能。

本书的学生将学习作为胜任力前提的基础知识。读者将了解专门为数据科学专业人员设计的Python Anaconda发行版,并将在流行的Scikit-Learn库中构建技能,该库是Python领域许多机器学习应用程序的基础。

本书内容包括:

  • 使用Scikit-Learn通用的简单和复杂数据集
  • 将数据处理为向量和矩阵以进行算法处理
  • 熟悉数据科学中使用的Anaconda发行版
  • 通过分类器,回归器和降维应用机器学习
  • 调整算法并为每个数据集找到最佳算法
  • 从CSV,JSON,Numpy和Pandas格式加载数据并保存

内容介绍:

这本书分为八章。 第1章介绍了机器学习,Anaconda和Scikit-Learn的主题。 第2章和第3章介绍算法分类。 第2章对简单数据集进行分类,第3章对复杂数据集进行分类。 第4章介绍了回归预测模型。 第5章和第6章介绍分类调整。 第5章调整简单数据集,第6章调整复杂数据集。 第7章介绍了预测模型回归调整。 第8章将所有知识汇总在一起,以整体方式审查和提出发现。

作者介绍:

David Paper博士是犹他州立大学管理信息系统系的教授。他写了两本书-商业网络编程:Oracle的PHP面向对象编程和Python和MongoDB的数据科学基础。他在诸如组织研究方法,ACM通讯,信息与管理,信息资源管理期刊,AIS通讯,信息技术案例与应用研究期刊以及远程计划等参考期刊上发表了70余篇论文。他还曾在多个编辑委员会担任过各种职务,包括副编辑。Paper博士还曾在德州仪器(TI),DLS,Inc.和凤凰城小型企业管理局工作。他曾为IBM,AT&T,Octel,犹他州交通运输部和空间动力实验室执行过IS咨询工作。 Paper博士的教学和研究兴趣包括数据科学,机器学习,面向对象的程序设计和变更管理。

目录:

成为VIP会员查看完整内容
0
67
小贴士
相关VIP内容
专知会员服务
77+阅读 · 2020年6月20日
【干货书】《机器学习导论(第二版)》,348页pdf
专知会员服务
119+阅读 · 2020年6月16日
专知会员服务
115+阅读 · 2020年6月15日
专知会员服务
127+阅读 · 2020年6月10日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
185+阅读 · 2020年3月17日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
63+阅读 · 2020年3月15日
相关论文
Text-to-Image Synthesis Based on Machine Generated Captions
Marco Menardi,Alex Falcon,Saida S. Mohamed,Lorenzo Seidenari,Giuseppe Serra,Alberto Del Bimbo,Carlo Tasso
3+阅读 · 2019年10月9日
UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction
Leland McInnes,John Healy,James Melville
7+阅读 · 2018年12月6日
Antoine J. -P. Tixier
10+阅读 · 2018年8月30日
Ken C. L. Wong,Tanveer Syeda-Mahmood,Mehdi Moradi
4+阅读 · 2018年8月15日
Babak Hosseini,Barbara Hammer
3+阅读 · 2018年5月2日
Dianqi Li,Qiuyuan Huang,Xiaodong He,Lei Zhang,Ming-Ting Sun
10+阅读 · 2018年4月11日
Nicole Novielli,Daniela Girardi,Filippo Lanubile
3+阅读 · 2018年3月17日
Yonatan Belinkov,Yonatan Bisk
3+阅读 · 2018年2月24日
Linyuan Gong,Ruyi Ji
8+阅读 · 2018年1月19日
Kai Song,Yue Zhang,Min Zhang,Weihua Luo
4+阅读 · 2018年1月11日
Top