如今,机器学习已广泛应用于各个领域和众多问题。在进行机器学习时,一个基本挑战是将特定机器学习技术的抽象数学与具体、现实世界的问题相结合。本书通过基于模型的机器学习方法来解决这一挑战。基于模型的机器学习专注于理解编码假设以及其对系统行为影响的于现实情境中假设从算法所需详细数学中分离出来,使得更容易理解。有关基于模型的机器学习是什么以及它如何帮助解决问题,请参阅名为“机器学习如何解决我的问题?”介绍章节获取更多详细信息。本书独特之处在于不回顾算法或技术类别,而是通过案例研究介绍所有关键思想,并涉及到现实世界应用程序。案例研究在讨论建模假设时起着核心作用,因为只有在应用程序上下文中才能有意义地讨论它们。每个案例研究章节都介绍了一个现实世界应用,并使用基于模型的方法来解决该问题。此外,第一个教程章节探讨了一个虚构谋杀谜团问题。
每一章也会介绍各种机器学习的概念,不是抽象的概念,而是根据应用需求而具体介绍的技术。您可以将这些概念视为构建模型的构件。尽管您将需要投入一些时间来完全理解这些概念,但您很快就会发现,可以从相对较少的构建块构建各种各样的模型。通过学习本书中的案例,你将了解这些组件是什么以及如何使用它们。目的是让您充分了解基于模型的方法的威力和灵活性,以允许您解决机器学习问题。
本书适用于任何想要使用机器学习解决现实问题的技术人员,或者想要理解为什么现有的机器学习系统会这样运行的技术人员。本书的重点是设计模型来解决实际案例研究中出现的问题。最后一章“如何阅读模型”将使用基于模型的机器学习来理解现有的机器学习技术。一些更有数学头脑的读者会想了解模型如何变成可运行算法的细节。在本书中,我们将这些需要更高级数学知识的部分分成了更深入的部分。深潜部分被标记为如下图所示的面板。这些部分是可选的——你可以在没有它们的情况下阅读本书。推理深入研究算法细节的技术部分将被标记为这样。如果你只想专注于建模,可以跳过这些部分。
这是一位作为移民在美国成长的科学家的感人回忆录,她在人工智能革命的前沿找到了自己的使命。 《连线》杂志称李飞飞博士为“负责人工智能近期显著进步的一小群科学家之一,这个群体可能足够小,以至于能围坐在一张厨房桌子旁”。
作为全球所熟知的ImageNet创造者,这是现代人工智能的关键催化剂,李博士在该领域的前沿工作了二十多年。然而,她的科学生涯一开始就显得并不可能。作为移民,她的家庭经历了从中国中产阶级到美国贫困的艰难过渡。在他们努力照顾身患重病的母亲的同时,母亲还在不懈地努力帮助他们在新国家站稳脚跟。 然而,飞飞在青少年时期对物理学的兴趣持续存在,并最终使她在我们现在称之为人工智能的重大突破中发挥了关键作用,使她处于全球变革的中心。在过去的几十年里,她的工作让她直面技术所带来的非凡可能性——以及非凡的危险。
《我所见之世界》是一部第一人称的科学故事,从内部记录了世纪的定义性时刻。它提供了一位科学家工作的扣人心弦的故事,以及对人工智能到底是什么以及它是如何形成的清晰而激动人心的解释。这本书情感真挚,智力上不妥协,不仅是对技术学术所需激情的见证,也是对其核心永恒好奇心的见证。
这本书全面介绍了涵盖Transformer架构、BERT模型和GPT系列(包括GPT-3和GPT-4)的详细信息的一系列主题。书中分为十个章节,从基础概念如注意力机制开始,然后是令牌化技术,探索Transformer和BERT架构的细微差别,最后在与GPT系列最新进展相关的高级主题中达到高潮,包括ChatGPT。关键章节提供了深度学习中注意力演化和重要性的洞见、Transformer架构的复杂性、对BERT家族的两部分探索,以及关于使用GPT-3的实践指导。结尾章节概述了ChatGPT、GPT-4和使用生成性AI的可视化。除了主要话题外,本书还涵盖了如DeepMind、OpenAI、Cohere、Hugging Face等影响力大的AI组织。读者将全面了解NLP模型的当前景观、它们的底层架构和实际应用。书中附有伴随文件,包括众多书中代码样本和图表。 特点:
关于作者 Oswald Campesato是加州大学圣克鲁斯分校的兼职讲师,专长于深度学习、Python、数据科学和GPT-4。他是《Python与机器学习》、《数据清洗》和《开发者的NLP》(均由Mercury Learning and Information出版)等四十多本书的作者或合著者。 目录 1: 注意力机制 2: 令牌化 3: Transformer架构介绍 4: 更深入的Transformer架构 5: BERT家族介绍 6: 更深入的BERT家族 7: 使用GPT-3介绍 8: 更深入的使用GPT-3 9: ChatGPT和GPT-4 10: 使用生成性AI的可视化
这本书提供了关于移动边缘计算(MEC)的全面而独立的知识,这是在下一代无线通信和计算网络中实现智能化的一个非常有前景的技术。随着超越5G/6G和物联网的快速发展,越来越多的智能设备被部署在网络的边缘。由于数据量巨大和传输距离长,中心化的计算机制导致高延迟和网络拥塞。通过将计算和存储资源靠近用户,MEC可以显著提高性能,表现在低延迟、减少通信开销和高质量的用户体验上。此外,在边缘设备上处理数据将增强系统安全性和数据隐私。
这本书由于广泛覆盖了MEC的原理和应用,因此易于交叉参考。它涵盖了MEC的基础知识、关键主题和未来方向。它还详细介绍了MEC中通信、计算和缓存的设计和实现。书中首先介绍了MEC的基本概念、关键技术和网络架构。然后,我们展示了MEC的广泛应用,包括边缘缓存、6G网络、车联网和无人机。在最后一部分,我们介绍了MEC遇到区块链、人工智能和分布式机器学习(例如,联邦学习)时的新机遇。我们还确定了MEC在大流行、工业物联网和灾害管理中的新兴应用。
这本书的目的是提供MEC的基本概念,探索与新兴技术集成的MEC的有前景的应用场景,并给出MEC可能的未来发展方向的见解。为了更好地理解,本书还介绍了在不同场景中MEC模型和应用的几个用例。主要读者包括高年级本科生、研究生、教育工作者、科学家、研究人员、工程师、创新者和研究策略师。这本书主要为无线网络和边缘智能领域的学术界和工业界的学者和研究人员设计。主修计算机科学、电子和通信的学生也将从这本书中受益。这本书的内容对从事MEC研究的高年级本科生、研究生和教师也有用。
《浅层与深度》是一系列讲义,提供了对神经网络和机器学习的通俗易懂的介绍。然而,一开始就很明显,这些笔记无法完全覆盖这个快速变化和不断发展的领域。这些讲义主要关注经典的机器学习技术,偏重于分类和回归。其他学习范式和许多最新的发展,例如深度学习,要么没有涉及,要么只是简要提及。
比尔(Biehl)认为,对该领域的基础知识有扎实的了解至关重要,特别是对那些希望探索机器学习世界并且抱有超越仅将某些软件包应用于某些数据集的雄心的人来说。因此,《浅层与深层》强调基本概念和理论背景。这也涉及深入探讨神经网络的历史和前史,在那里为大多数最近的发展奠定了基础。这些笔记旨在揭开机器学习和神经网络的神秘面纱,同时不失对它们令人印象深刻的力量和多功能性的欣赏。
这些讲义的副标题是“对神经网络和传统机器学习的偏见介绍”,原因是显而易见的。尽管目标是提供一个易于接触的领域介绍,但从一开始就明确了它不会成为一个全面、完整的概述。重点是经典机器学习,许多最新的发展无法涵盖。个人而言,我最早接触神经网络是在我作为物理学家的早期生涯。那时,阅读少量论文,或许稍后阅读一本好书[HKP91]就足以保持最新状态并能够为大难题贡献一份力量。我是否夸大其词,有点怀旧?可能。但情况肯定发生了很大变化。如今,大量的出版物使得筛选相关信息和跟上发展成为难题。这些笔记中的主题选择在很大程度上是由我自己的研究兴趣和早期经历决定的。这对于最初关注简单的感知器,正如曼弗雷德·奥珀所说的神经网络研究的氢原子[Opp90],绝对是真的。此外,这本文本的主要内容是关于浅层系统的监督学习,特别是分类,这反映了我在该领域的主要兴趣。这些笔记可能被视为老派,肯定会被一些时尚的忠实追随者所认为[Dav66]。诚然,文本没有涉及最新的发展,例如深度学习及其应用。然而,在我谦虚的看法中,在探索机器学习世界并且有着超越仅将某些软件包应用于某些数据集的雄心之前,拥有对基础知识的扎实背景知识是无价的。
这本书深入探讨了生成AI的世界,涵盖了从神经网络基础到ChatGPT和Google Bard等大型语言模型的复杂性。它是任何对理解和应用这一变革性技术感兴趣的人的一站式资源,特别适合那些刚开始接触生成AI的人。《初学者应用生成AI指南》围绕详细章节构建,将指导您从基础知识到实际实施。它从生成AI及其当前景观的介绍开始,接着探讨了神经网络的演变如何导致大型语言模型的发展。本书然后深入探讨了像ChatGPT和Google Bard这样的特定架构,并提供了使用Sklearn等工具的实际操作演示。您还将了解在企业环境中实施生成AI的战略方面的洞见,作者涵盖了关键主题,如LLMOps、技术栈选择和上下文学习。书的后半部分探讨了图像的生成AI,并提供了行业特定的用例,使其成为在各个领域实际应用的全面指南。无论您是希望实施高级模型的数据科学家、希望利用AI促进企业增长的商业领袖,还是对尖端进展感兴趣的学者,这本书都提供了一个简明而全面的指南,帮助您掌握生成AI,平衡理论知识与实用洞察。您将学到什么从神经网络的基础开始,深入理解生成AI,发展到ChatGPT和Google Bard等复杂架构 使用Sklearn实现大型语言模型,包括代码示例和现实应用的最佳实践 了解如何在企业中整合LLM,包括LLMOps和技术栈选择等方面 通过详细的用例和可操作的洞察,了解生成AI如何应用于各个行业,从医疗保健到市场营销再到法律合规 这本书适合谁对生成AI和LLMs感兴趣的数据科学家、AI从业者、研究人员和软件工程师。
书籍简介 本书是一本全面的资源,为生成对抗网络(GAN)的方法论、它们在现实世界项目中的应用,以及它们背后的数学和理论概念提供了坚实的基础。 主要特点: * 引导您穿越复杂的GAN世界,揭示它们的复杂性 * 以现实世界的例子和实际应用陪伴您的学习之旅 * 以易于理解和全面的方式介绍GAN背后的理论 * 使用流行的深度学习平台简化GAN的实现 * 介绍各种GAN架构,为读者提供它们应用的广泛视野 * 用我们全面而易于理解的内容培养您对AI的知识 * 通过众多案例研究和编码示例练习您的技能 * 清晰解释和实际示例回顾高级GAN,如DCGAN、cGAN和CycleGAN * 适应初学者和经验丰富的从业者,内容组织以满足对GAN熟悉程度不同的人 * 将GAN理论与实践联系起来,提供对主题的全面理解 * 介绍不同数据类型下GAN的应用,突出它们的多样性 * 激发读者超越本书的探索,促进独立学习和研究的环境 * 缩小复杂的GAN方法论与它们的实际实现之间的差距,让读者能够直接应用他们的知识 * 使您具备自信使用GAN在项目中的技能和知识 * 准备深入探索GAN的迷人领域,体验AI的力量,这本书将GAN的理论和实践方面结合在一起,以连贯和易于理解的方式呈现,使它成为初学者和经验丰富的从业者的必备资源。
关于作者Mehdi Ghayoumi博士是纽约州立大学(SUNY)坎顿分校的助理教授。他专注于尖端技术,将其专业知识致力于包括机器学习、机器视觉、机器人技术、人机交互(HRI)和隐私等领域。Ghayoumi博士的研究围绕构建复杂系统,以应对这些领域内的复杂性和挑战,推动创新并推进他所在领域知识的前沿。
本专著汇集了我们近年来在等变CNN的表示理论和微分几何方面获得的发现。它推广了以前的结果,提出了新的见解,并增加了背景知识、直观解释、可视化和示例。内容简要概述:
第一部分发展了欧几里得空间上等变CNN的表示理论。它演示了传统和泛化CNN的层是如何完全根据对称性原则推导出来的。包括群卷积网络、谐波网络和张量场网络在内的流行模型在一个共同的数学框架中得到了统一。 我们随后将这种表述扩展到黎曼流形。坐标独立性的要求被证明会导致神经连接的规范对称性约束。书的第二部分对流形上的CNN进行了直观的介绍。第三部分用相关纤维束的语言对这些思想进行了形式化。 第四部分专注于特定流形上的应用和实例。它从微分几何的角度重新审视了欧几里得CNN,并涵盖了球面CNN和一般表面上的CNN。
在这本书《等变和坐标独立的卷积网络》中,我们开发了一种用于处理空间结构化数据(如图像、音频或视频)的人工神经网络的规范理论。这类数据的标准神经网络架构是卷积网络,其特点是位置独立的推理。卷积网络在空间位置上概括学习的内容,与非卷积模型相比,它们在数据效率和鲁棒性方面都有显著提高。这一特性在医学成像等培训数据稀缺的领域尤为重要。
空间位置的独立性被网络的平移群等变性正式捕捉,即它们与输入信号的平移交换的属性。我们展示了卷积网络设计不仅仅是平移等变性的充分条件,实际上是必要条件 - 因此可以通过要求模型的等变性来推导卷积。这项工作的第一部分利用这一洞见来定义在更大对称群下等变的广义卷积网络。
这类模型在附加的几何变换上推广了它们的推理,例如图像中模式的旋转或反射。我们通过实证展示,与传统卷积网络相比,它们在数据效率、收敛速度和最终性能上都有显著提高。我们公开可用的实现在研究社区得到了广泛应用。
在第二部分中,我们进一步扩展卷积网络以处理黎曼流形上的信号。除了平面欧几里得图像外,这种设置还包括例如地球表面上全球天气模式的球面信号,或动脉壁或大脑皮层等一般表面上的信号。我们展示了如果要求网络推理坐标独立,则流形上的卷积核需要在局部规范变换下等变。结果产生的坐标独立网络被证明是与流形的全局对称性(等距)等变的。
我们的目标不是为狭窄的应用领域提出又一个等变网络设计,而是为卷积网络设计一个统一的数学框架。这本书的最后部分通过展示我们的微分几何公式化的卷积网络能够解释文献中大量等变网络架构,来证明我们公式化的通用性。