【新书】没有标签的数据：实用的无监督机器学习

书籍简介

《没有标签的数据》揭示了处理未标注数据的关键算法和模型的所有实践实现，充满了案例研究，展示了如何将每项技术应用于现实世界的问题。在《没有标签的数据》中，您将学习到： * 机器学习和无监督学习的基本构建块和概念 * 结构化和非结构化数据（如文本和图像）的数据清理 * 聚类算法，如K-means、层次聚类、DBSCAN、高斯混合模型和谱聚类 * 降维方法，如主成分分析（PCA）、SVD、多维尺度法和t-SNE * 关联规则算法，如aPriori、ECLAT、SPADE * 无监督时间序列聚类、高斯混合模型和统计方法 * 构建神经网络，如生成对抗网络（GANs）和自编码器 * 使用Python工具和库，如scikit-learn、numpy、Pandas、matplotlib、Seaborn、Keras、TensorFlow和Flask * 如何解释无监督学习的结果 * 如何为您的问题选择合适的算法 * 如何将无监督学习部署到生产环境 * 机器学习解决方案的维护与更新

《没有标签的数据》介绍了数学技巧、关键算法和Python实现，帮助您构建针对无标签数据的机器学习模型。您将发现无监督机器学习的方法，这些方法可以解开原始、现实世界的数据集，并支持您的业务做出正确的战略决策。这本书不仅仅是理论的堆砌，它架起了复杂数学和实践Python实现之间的桥梁，涵盖了从模型开发到生产部署的全过程。您将发现机器学习和无监督学习的业务用例，并访问相关的研究论文，帮助您完善知识体系。 技术概述

生成式AI、预测算法、欺诈检测等许多分析任务都依赖廉价且丰富的无标签数据。无标签数据的机器学习——即无监督学习——将原始文本、图像和数字转化为有关客户的洞察、精确的计算机视觉和用于训练AI模型的高质量数据集。本书将向您展示如何实现这一点。 关于本书

《没有标签的数据》是一本全面介绍无监督学习的指南，深入探讨其数学基础、算法和实际应用。书中通过零售、航空和银行的实际案例，结合完整的Python代码进行讲解。您将学习到核心技术，如聚类和降维，并深入探讨自编码器和生成对抗网络（GANs）等高级主题。通过本书，您将了解如何将无监督学习应用于商业场景，并学会如何开发端到端的机器学习模型。 书中内容

精通无监督学习算法 * 实际的业务应用 * 精心策划AI训练数据集 * 探索自编码器和GANs的应用

读者对象

本书面向数据科学专业人士，假设读者具备Python和基础机器学习的知识。 作者简介

Vaibhav Verdhan 是一位资深的数据科学专业人士，拥有在大型制药公司从事数据科学项目的丰富经验。目录

第1部分

机器学习简介 1. 聚类技术 1. 降维方法

第2部分

关联规则
聚类
降维
无监督学习在文本数据中的应用 第3部分
深度学习：基础概念
自编码器
生成对抗网络（GANs）、生成式AI和ChatGPT
端到端模型部署 附录A 数学基础 购买打印版书籍，您将免费获得电子书（PDF或ePub格式），并获得在线liveBook格式的访问权限（包括其AI助手，可以用任何语言回答您的问题）。

书评

“这是一本很好的无监督学习技术入门书。” —— Richard Vaughan “用Python深入探讨无监督学习的极佳书籍！” —— Todd Cook 封底文字

《没有标签的数据》展示了处理无标签数据的关键算法和模型的所有实践实现，充满了案例研究，展示了如何将每项技术应用于现实世界的问题。在《无监督学习的模型与算法》中，您将学习到： * 机器学习和无监督学习的基本构建块和概念 * 结构化和非结构化数据（如文本和图像）的数据清理 * 无监督时间序列聚类、高斯混合模型和统计方法 * 构建神经网络，如生成对抗网络（GANs）和自编码器 * 如何解释无监督学习的结果 * 如何为您的问题选择合适的算法 * 如何将无监督学习部署到生产环境 * 机器学习和无监督学习的业务用例

《无监督学习的模型与算法》介绍了数学技巧、关键算法和Python实现，帮助您构建针对无标签数据的机器学习模型。您将发现无监督机器学习方法，这些方法能够解开原始、现实世界的数据集，并支持您的业务做出明智的战略决策。本书避免陷入理论的泥潭——它架起了复杂数学和实践Python实现之间的桥梁，涵盖了从模型开发到生产部署的全过程。

成为VIP会员查看完整内容