书籍简介
《没有标签的数据》揭示了处理未标注数据的关键算法和模型的所有实践实现,充满了案例研究,展示了如何将每项技术应用于现实世界的问题。 在《没有标签的数据》中,您将学习到: * 机器学习和无监督学习的基本构建块和概念 * 结构化和非结构化数据(如文本和图像)的数据清理 * 聚类算法,如K-means、层次聚类、DBSCAN、高斯混合模型和谱聚类 * 降维方法,如主成分分析(PCA)、SVD、多维尺度法和t-SNE * 关联规则算法,如aPriori、ECLAT、SPADE * 无监督时间序列聚类、高斯混合模型和统计方法 * 构建神经网络,如生成对抗网络(GANs)和自编码器 * 使用Python工具和库,如scikit-learn、numpy、Pandas、matplotlib、Seaborn、Keras、TensorFlow和Flask * 如何解释无监督学习的结果 * 如何为您的问题选择合适的算法 * 如何将无监督学习部署到生产环境 * 机器学习解决方案的维护与更新
《没有标签的数据》介绍了数学技巧、关键算法和Python实现,帮助您构建针对无标签数据的机器学习模型。您将发现无监督机器学习的方法,这些方法可以解开原始、现实世界的数据集,并支持您的业务做出正确的战略决策。 这本书不仅仅是理论的堆砌,它架起了复杂数学和实践Python实现之间的桥梁,涵盖了从模型开发到生产部署的全过程。您将发现机器学习和无监督学习的业务用例,并访问相关的研究论文,帮助您完善知识体系。 技术概述
生成式AI、预测算法、欺诈检测等许多分析任务都依赖廉价且丰富的无标签数据。无标签数据的机器学习——即无监督学习——将原始文本、图像和数字转化为有关客户的洞察、精确的计算机视觉和用于训练AI模型的高质量数据集。本书将向您展示如何实现这一点。 关于本书
《没有标签的数据》是一本全面介绍无监督学习的指南,深入探讨其数学基础、算法和实际应用。书中通过零售、航空和银行的实际案例,结合完整的Python代码进行讲解。您将学习到核心技术,如聚类和降维,并深入探讨自编码器和生成对抗网络(GANs)等高级主题。通过本书,您将了解如何将无监督学习应用于商业场景,并学会如何开发端到端的机器学习模型。 书中内容
精通无监督学习算法 * 实际的业务应用 * 精心策划AI训练数据集 * 探索自编码器和GANs的应用
读者对象
本书面向数据科学专业人士,假设读者具备Python和基础机器学习的知识。 作者简介
Vaibhav Verdhan 是一位资深的数据科学专业人士,拥有在大型制药公司从事数据科学项目的丰富经验。 目录
第1部分
机器学习简介 1. 聚类技术 1. 降维方法
第2部分
关联规则
聚类
降维
无监督学习在文本数据中的应用 第3部分
深度学习:基础概念
自编码器
生成对抗网络(GANs)、生成式AI和ChatGPT
端到端模型部署 附录A 数学基础 购买打印版书籍,您将免费获得电子书(PDF或ePub格式),并获得在线liveBook格式的访问权限(包括其AI助手,可以用任何语言回答您的问题)。
书评
“这是一本很好的无监督学习技术入门书。” —— Richard Vaughan “用Python深入探讨无监督学习的极佳书籍!” —— Todd Cook 封底文字
《没有标签的数据》展示了处理无标签数据的关键算法和模型的所有实践实现,充满了案例研究,展示了如何将每项技术应用于现实世界的问题。在《无监督学习的模型与算法》中,您将学习到: * 机器学习和无监督学习的基本构建块和概念 * 结构化和非结构化数据(如文本和图像)的数据清理 * 无监督时间序列聚类、高斯混合模型和统计方法 * 构建神经网络,如生成对抗网络(GANs)和自编码器 * 如何解释无监督学习的结果 * 如何为您的问题选择合适的算法 * 如何将无监督学习部署到生产环境 * 机器学习和无监督学习的业务用例
《无监督学习的模型与算法》介绍了数学技巧、关键算法和Python实现,帮助您构建针对无标签数据的机器学习模型。您将发现无监督机器学习方法,这些方法能够解开原始、现实世界的数据集,并支持您的业务做出明智的战略决策。本书避免陷入理论的泥潭——它架起了复杂数学和实践Python实现之间的桥梁,涵盖了从模型开发到生产部署的全过程。