本书直击企业级图表示与图学习落地过程中的核心挑战。通过这本实用指南,应用数据科学家、机器学习工程师和从业者将学习如何构建端到端(E2E)的图学习流水线。你将探索流水线各阶段的核心难点——从数据获取与表示,到实时推理与反馈回路再训练。 基于作者在构建可扩展、生产级图学习流水线中的丰富经验,本书将带你逐步走过在动态、不断演化的图世界中搭建E2E图学习系统的完整过程。 你将学到: * 理解图学习在推动企业级应用中的重要性 * 掌握开发与部署企业级图学习和推理流水线中的关键挑战 * 运用传统与前沿的图学习技术来解决图相关应用场景 * 使用并贡献于 PyGraf(一个开源图学习库),在构建图应用时融入最佳实践 * 基于公开数据与合成数据设计并实现图学习算法 * 在图学习过程中应用隐私保护技术
在每一章中,我们将介绍构建高效图学习系统的具体步骤,并通过实践案例展示其工作方式。 * 第1章 《图基础介绍》:概述图结构、其应用,以及为什么图在企业问题中如此强大。 * 第2章 《图机器学习流水线》:讲解如何端到端地构建、部署和维护基于图的机器学习系统。 * 第3章 《图的传统机器学习方法》:探讨如何将经典的机器学习技术改造并应用于图数据。 * 第4章 《PyGraf:端到端图学习与服务》:介绍 PyGraf,这一在生产环境中构建与服务图学习模型的实用框架。 * 第5章 《图神经网络》:深入讲解图神经网络(GNN)的基础概念与核心架构。 * 第6章 《图学习的高级技术》:涵盖更复杂的图学习方法及其应用场景。 * 第7章 《可扩展图神经网络》:聚焦将GNN扩展到企业级大规模数据集的挑战及其解决方案。 * 第8章 《图的企业级应用》:展示我们在多个行业实践中积累的图学习真实案例。 * 第9章 《隐私保护的图学习》:探讨在严格数据隐私规范下构建图模型的技术方法。 * 第10章 《图推理与部署策略》:聚焦如何高效部署图学习模型,以支持实时与批处理推理。 * 第11章 《监控与反馈回路》:讨论如何监控已部署图模型的性能,并建立反馈机制以实现持续改进。 * 第12章 《未来趋势:图学习与大语言模型》:展望新兴技术,特别是图学习与大型语言模型(LLMs)的交叉,以及它们潜在的影响。
Ahmed Menshawy 现任万事达卡(Mastercard)网络与智能(Cyber and Intelligence)部门的AI工程副总裁,负责领导AI工程团队,推动AI产品的研发与运营化,并解决围绕机器学习流水线的广泛挑战与技术债务。他还领导团队打造一系列AI加速器与能力,包括服务引擎与特征存储,以提升AI工程的多个方面。Ahmed 是《Deep Learning with TensorFlow》的合著者,以及《Deep Learning by Example》的作者,专注于深度学习的前沿主题。 Sameh 是机器学习与健康信息学专家,拥有十余年学术与工业界经验,致力于机器学习与人工智能解决方案。他在爱尔兰戈尔韦大学取得博士学位,研究方向为图上的机器学习及其在生物医学中的应用,并获得心血管介入医学硕士学位。之后,他曾在万事达卡、Carelon 和微软担任技术领导角色,开发了应用于金融、健康保险与内容生成领域的机器学习解决方案。他的贡献主要集中在表示学习、自然语言处理和健康信息学等主题。 Maraim Rizk Masoud 现任万事达卡网络与智能部门的高级机器学习工程师,同时担任AI研究员。她在工业界与学术界均有广泛背景,研究方向涵盖自然语言处理与AI治理等领域。Maraim 拥有伦敦帝国理工学院的机器学习硕士学位,以及南安普顿大学的工程学硕士学位。