如今,机器学习已广泛应用于各个领域和众多问题。在进行机器学习时,一个基本挑战是将特定机器学习技术的抽象数学与具体、现实世界的问题相结合。本书通过基于模型的机器学习方法来解决这一挑战。基于模型的机器学习专注于理解编码假设以及其对系统行为影响的于现实情境中假设从算法所需详细数学中分离出来,使得更容易理解。有关基于模型的机器学习是什么以及它如何帮助解决问题,请参阅名为“机器学习如何解决我的问题?”介绍章节获取更多详细信息。本书独特之处在于不回顾算法或技术类别,而是通过案例研究介绍所有关键思想,并涉及到现实世界应用程序。案例研究在讨论建模假设时起着核心作用,因为只有在应用程序上下文中才能有意义地讨论它们。每个案例研究章节都介绍了一个现实世界应用,并使用基于模型的方法来解决该问题。此外,第一个教程章节探讨了一个虚构谋杀谜团问题。

每一章也会介绍各种机器学习的概念,不是抽象的概念,而是根据应用需求而具体介绍的技术。您可以将这些概念视为构建模型的构件。尽管您将需要投入一些时间来完全理解这些概念,但您很快就会发现,可以从相对较少的构建块构建各种各样的模型。通过学习本书中的案例,你将了解这些组件是什么以及如何使用它们。目的是让您充分了解基于模型的方法的威力和灵活性,以允许您解决机器学习问题。

本书适用于任何想要使用机器学习解决现实问题的技术人员,或者想要理解为什么现有的机器学习系统会这样运行的技术人员。本书的重点是设计模型来解决实际案例研究中出现的问题。最后一章“如何阅读模型”将使用基于模型的机器学习来理解现有的机器学习技术。一些更有数学头脑的读者会想了解模型如何变成可运行算法的细节。在本书中,我们将这些需要更高级数学知识的部分分成了更深入的部分。深潜部分被标记为如下图所示的面板。这些部分是可选的——你可以在没有它们的情况下阅读本书。推理深入研究算法细节的技术部分将被标记为这样。如果你只想专注于建模,可以跳过这些部分。

成为VIP会员查看完整内容
117

这是一位作为移民在美国成长的科学家的感人回忆录,她在人工智能革命的前沿找到了自己的使命。 《连线》杂志称李飞飞博士为“负责人工智能近期显著进步的一小群科学家之一,这个群体可能足够小,以至于能围坐在一张厨房桌子旁”。

作为全球所熟知的ImageNet创造者,这是现代人工智能的关键催化剂,李博士在该领域的前沿工作了二十多年。然而,她的科学生涯一开始就显得并不可能。作为移民,她的家庭经历了从中国中产阶级到美国贫困的艰难过渡。在他们努力照顾身患重病的母亲的同时,母亲还在不懈地努力帮助他们在新国家站稳脚跟。 然而,飞飞在青少年时期对物理学的兴趣持续存在,并最终使她在我们现在称之为人工智能的重大突破中发挥了关键作用,使她处于全球变革的中心。在过去的几十年里,她的工作让她直面技术所带来的非凡可能性——以及非凡的危险。

《我所见之世界》是一部第一人称的科学故事,从内部记录了世纪的定义性时刻。它提供了一位科学家工作的扣人心弦的故事,以及对人工智能到底是什么以及它是如何形成的清晰而激动人心的解释。这本书情感真挚,智力上不妥协,不仅是对技术学术所需激情的见证,也是对其核心永恒好奇心的见证。

成为VIP会员查看完整内容
113

这本书全面介绍了涵盖Transformer架构、BERT模型和GPT系列(包括GPT-3和GPT-4)的详细信息的一系列主题。书中分为十个章节,从基础概念如注意力机制开始,然后是令牌化技术,探索Transformer和BERT架构的细微差别,最后在与GPT系列最新进展相关的高级主题中达到高潮,包括ChatGPT。关键章节提供了深度学习中注意力演化和重要性的洞见、Transformer架构的复杂性、对BERT家族的两部分探索,以及关于使用GPT-3的实践指导。结尾章节概述了ChatGPT、GPT-4和使用生成性AI的可视化。除了主要话题外,本书还涵盖了如DeepMind、OpenAI、Cohere、Hugging Face等影响力大的AI组织。读者将全面了解NLP模型的当前景观、它们的底层架构和实际应用。书中附有伴随文件,包括众多书中代码样本和图表。 特点:

  • 提供一系列全面的主题,涵盖Transformer架构、BERT模型和GPT系列的细节,包括GPT-3和GPT-4。
  • 特色伴随文件,包括书中大量代码样本和图表。

关于作者 Oswald Campesato是加州大学圣克鲁斯分校的兼职讲师,专长于深度学习、Python、数据科学和GPT-4。他是《Python与机器学习》、《数据清洗》和《开发者的NLP》(均由Mercury Learning and Information出版)等四十多本书的作者或合著者。 目录 1: 注意力机制 2: 令牌化 3: Transformer架构介绍 4: 更深入的Transformer架构 5: BERT家族介绍 6: 更深入的BERT家族 7: 使用GPT-3介绍 8: 更深入的使用GPT-3 9: ChatGPT和GPT-4 10: 使用生成性AI的可视化

成为VIP会员查看完整内容
105

这本书提供了关于移动边缘计算(MEC)的全面而独立的知识,这是在下一代无线通信和计算网络中实现智能化的一个非常有前景的技术。随着超越5G/6G和物联网的快速发展,越来越多的智能设备被部署在网络的边缘。由于数据量巨大和传输距离长,中心化的计算机制导致高延迟和网络拥塞。通过将计算和存储资源靠近用户,MEC可以显著提高性能,表现在低延迟、减少通信开销和高质量的用户体验上。此外,在边缘设备上处理数据将增强系统安全性和数据隐私。

这本书由于广泛覆盖了MEC的原理和应用,因此易于交叉参考。它涵盖了MEC的基础知识、关键主题和未来方向。它还详细介绍了MEC中通信、计算和缓存的设计和实现。书中首先介绍了MEC的基本概念、关键技术和网络架构。然后,我们展示了MEC的广泛应用,包括边缘缓存、6G网络、车联网和无人机。在最后一部分,我们介绍了MEC遇到区块链、人工智能和分布式机器学习(例如,联邦学习)时的新机遇。我们还确定了MEC在大流行、工业物联网和灾害管理中的新兴应用。

这本书的目的是提供MEC的基本概念,探索与新兴技术集成的MEC的有前景的应用场景,并给出MEC可能的未来发展方向的见解。为了更好地理解,本书还介绍了在不同场景中MEC模型和应用的几个用例。主要读者包括高年级本科生、研究生、教育工作者、科学家、研究人员、工程师、创新者和研究策略师。这本书主要为无线网络和边缘智能领域的学术界和工业界的学者和研究人员设计。主修计算机科学、电子和通信的学生也将从这本书中受益。这本书的内容对从事MEC研究的高年级本科生、研究生和教师也有用。

成为VIP会员查看完整内容
76

这是概率论的入门指南,适合自学使用。它涵盖了我在明尼苏达大学教授的一学期入门课程相同的主题,并增加了一些额外讨论,以便自行阅读。强调了概率规则背后的原因。概率论当然是有用的。但学习它感觉如何呢?嗯,像数学的其他领域一样,概率论包含优雅的概念,它让你有机会发挥你的独创性,这通常很有趣。但此外,随机性和概率是我们在现实世界中的经验的一部分,在各处都存在,但仍然有些神秘。这使得概率这一主题具有特殊的兴趣。考虑到自学,本书提供了所有练习题的详细解答。练习题与论述混合在一起,鼓励你在阅读理论时(用纸)解决它们。为了获得练习的好处,请在阅读解答前认真完成它们或尝试解答。至少尝试一些练习对于学习至关重要。许多事实以编号的引理或评论的形式陈述,通常有描述性名称。这增加了一些噪音,但应有助于自己理解思路。如果给出证明,目的是为了澄清概念,并且所有细节都有解释。本书中的证明始终是可选的,但鼓励读者努力理解,因为证明是我们内化数学思想的方式之一。内化思想意味着将它们变成我们的思维的一部分,而不是把它们当作来自外部来源的配方。解决问题、完成示例、思考概念的物理意义是内化数学的其他方式。当在计算机上阅读这本书时(这是预期的方式),你可以使用链接在练习和解答之间来回跳转,以及追踪公式和定理的引用。有一个大的目录和一个带有主题和定义链接的大索引。(大多数PDF查看器可以从跟随链接返回,回到之前的位置。这可以节省时间。可能有返回的按钮,或者是像“ctrl-left-arrow”或“alt-left-arrow”的快捷键。)章节的顺序相当合乎逻辑,但不同的顺序可能同样自然。根据你的兴趣,某些章节可以省略或快速阅读。学习数学总是需要一些“强烈的独立思考”,但它也是一种人类活动。如果你有机会与他人讨论你的工作并分享想法,请尝试这样做。有许多关于概率论的优秀教科书,浏览另一本书可能非常有启发性,尤其是如果你发现一个主题的不同方法。有可能存在一些印刷错误。将非常感谢对概率书@gmail.com的更正和建议。我特别感谢Larry Susanka,他对概率提出了许多有洞察力的评论。本书献给我概率课程中的所有参与者。感谢你们的聆听!

成为VIP会员查看完整内容
71

《浅层与深度》是一系列讲义,提供了对神经网络和机器学习的通俗易懂的介绍。然而,一开始就很明显,这些笔记无法完全覆盖这个快速变化和不断发展的领域。这些讲义主要关注经典的机器学习技术,偏重于分类和回归。其他学习范式和许多最新的发展,例如深度学习,要么没有涉及,要么只是简要提及。

比尔(Biehl)认为,对该领域的基础知识有扎实的了解至关重要,特别是对那些希望探索机器学习世界并且抱有超越仅将某些软件包应用于某些数据集的雄心的人来说。因此,《浅层与深层》强调基本概念和理论背景。这也涉及深入探讨神经网络的历史和前史,在那里为大多数最近的发展奠定了基础。这些笔记旨在揭开机器学习和神经网络的神秘面纱,同时不失对它们令人印象深刻的力量和多功能性的欣赏。

这些讲义的副标题是“对神经网络和传统机器学习的偏见介绍”,原因是显而易见的。尽管目标是提供一个易于接触的领域介绍,但从一开始就明确了它不会成为一个全面、完整的概述。重点是经典机器学习,许多最新的发展无法涵盖。个人而言,我最早接触神经网络是在我作为物理学家的早期生涯。那时,阅读少量论文,或许稍后阅读一本好书[HKP91]就足以保持最新状态并能够为大难题贡献一份力量。我是否夸大其词,有点怀旧?可能。但情况肯定发生了很大变化。如今,大量的出版物使得筛选相关信息和跟上发展成为难题。这些笔记中的主题选择在很大程度上是由我自己的研究兴趣和早期经历决定的。这对于最初关注简单的感知器,正如曼弗雷德·奥珀所说的神经网络研究的氢原子[Opp90],绝对是真的。此外,这本文本的主要内容是关于浅层系统的监督学习,特别是分类,这反映了我在该领域的主要兴趣。这些笔记可能被视为老派,肯定会被一些时尚的忠实追随者所认为[Dav66]。诚然,文本没有涉及最新的发展,例如深度学习及其应用。然而,在我谦虚的看法中,在探索机器学习世界并且有着超越仅将某些软件包应用于某些数据集的雄心之前,拥有对基础知识的扎实背景知识是无价的。

成为VIP会员查看完整内容
69

这本书深入探讨了生成AI的世界,涵盖了从神经网络基础到ChatGPT和Google Bard等大型语言模型的复杂性。它是任何对理解和应用这一变革性技术感兴趣的人的一站式资源,特别适合那些刚开始接触生成AI的人。《初学者应用生成AI指南》围绕详细章节构建,将指导您从基础知识到实际实施。它从生成AI及其当前景观的介绍开始,接着探讨了神经网络的演变如何导致大型语言模型的发展。本书然后深入探讨了像ChatGPT和Google Bard这样的特定架构,并提供了使用Sklearn等工具的实际操作演示。您还将了解在企业环境中实施生成AI的战略方面的洞见,作者涵盖了关键主题,如LLMOps、技术栈选择和上下文学习。书的后半部分探讨了图像的生成AI,并提供了行业特定的用例,使其成为在各个领域实际应用的全面指南。无论您是希望实施高级模型的数据科学家、希望利用AI促进企业增长的商业领袖,还是对尖端进展感兴趣的学者,这本书都提供了一个简明而全面的指南,帮助您掌握生成AI,平衡理论知识与实用洞察。您将学到什么从神经网络的基础开始,深入理解生成AI,发展到ChatGPT和Google Bard等复杂架构 使用Sklearn实现大型语言模型,包括代码示例和现实应用的最佳实践 了解如何在企业中整合LLM,包括LLMOps和技术栈选择等方面 通过详细的用例和可操作的洞察,了解生成AI如何应用于各个行业,从医疗保健到市场营销再到法律合规 这本书适合谁对生成AI和LLMs感兴趣的数据科学家、AI从业者、研究人员和软件工程师。

成为VIP会员查看完整内容
55

书籍简介 本书是一本全面的资源,为生成对抗网络(GAN)的方法论、它们在现实世界项目中的应用,以及它们背后的数学和理论概念提供了坚实的基础。 主要特点: * 引导您穿越复杂的GAN世界,揭示它们的复杂性 * 以现实世界的例子和实际应用陪伴您的学习之旅 * 以易于理解和全面的方式介绍GAN背后的理论 * 使用流行的深度学习平台简化GAN的实现 * 介绍各种GAN架构,为读者提供它们应用的广泛视野 * 用我们全面而易于理解的内容培养您对AI的知识 * 通过众多案例研究和编码示例练习您的技能 * 清晰解释和实际示例回顾高级GAN,如DCGAN、cGAN和CycleGAN * 适应初学者和经验丰富的从业者,内容组织以满足对GAN熟悉程度不同的人 * 将GAN理论与实践联系起来,提供对主题的全面理解 * 介绍不同数据类型下GAN的应用,突出它们的多样性 * 激发读者超越本书的探索,促进独立学习和研究的环境 * 缩小复杂的GAN方法论与它们的实际实现之间的差距,让读者能够直接应用他们的知识 * 使您具备自信使用GAN在项目中的技能和知识 * 准备深入探索GAN的迷人领域,体验AI的力量,这本书将GAN的理论和实践方面结合在一起,以连贯和易于理解的方式呈现,使它成为初学者和经验丰富的从业者的必备资源。

关于作者Mehdi Ghayoumi博士是纽约州立大学(SUNY)坎顿分校的助理教授。他专注于尖端技术,将其专业知识致力于包括机器学习、机器视觉、机器人技术、人机交互(HRI)和隐私等领域。Ghayoumi博士的研究围绕构建复杂系统,以应对这些领域内的复杂性和挑战,推动创新并推进他所在领域知识的前沿。

成为VIP会员查看完整内容
50

本专著汇集了我们近年来在等变CNN的表示理论和微分几何方面获得的发现。它推广了以前的结果,提出了新的见解,并增加了背景知识、直观解释、可视化和示例。内容简要概述:

第一部分发展了欧几里得空间上等变CNN的表示理论。它演示了传统和泛化CNN的层是如何完全根据对称性原则推导出来的。包括群卷积网络、谐波网络和张量场网络在内的流行模型在一个共同的数学框架中得到了统一。 我们随后将这种表述扩展到黎曼流形。坐标独立性的要求被证明会导致神经连接的规范对称性约束。书的第二部分对流形上的CNN进行了直观的介绍。第三部分用相关纤维束的语言对这些思想进行了形式化。 第四部分专注于特定流形上的应用和实例。它从微分几何的角度重新审视了欧几里得CNN,并涵盖了球面CNN和一般表面上的CNN。

在这本书《等变和坐标独立的卷积网络》中,我们开发了一种用于处理空间结构化数据(如图像、音频或视频)的人工神经网络的规范理论。这类数据的标准神经网络架构是卷积网络,其特点是位置独立的推理。卷积网络在空间位置上概括学习的内容,与非卷积模型相比,它们在数据效率和鲁棒性方面都有显著提高。这一特性在医学成像等培训数据稀缺的领域尤为重要。

空间位置的独立性被网络的平移群等变性正式捕捉,即它们与输入信号的平移交换的属性。我们展示了卷积网络设计不仅仅是平移等变性的充分条件,实际上是必要条件 - 因此可以通过要求模型的等变性来推导卷积。这项工作的第一部分利用这一洞见来定义在更大对称群下等变的广义卷积网络。

这类模型在附加的几何变换上推广了它们的推理,例如图像中模式的旋转或反射。我们通过实证展示,与传统卷积网络相比,它们在数据效率、收敛速度和最终性能上都有显著提高。我们公开可用的实现在研究社区得到了广泛应用。

在第二部分中,我们进一步扩展卷积网络以处理黎曼流形上的信号。除了平面欧几里得图像外,这种设置还包括例如地球表面上全球天气模式的球面信号,或动脉壁或大脑皮层等一般表面上的信号。我们展示了如果要求网络推理坐标独立,则流形上的卷积核需要在局部规范变换下等变。结果产生的坐标独立网络被证明是与流形的全局对称性(等距)等变的。

我们的目标不是为狭窄的应用领域提出又一个等变网络设计,而是为卷积网络设计一个统一的数学框架。这本书的最后部分通过展示我们的微分几何公式化的卷积网络能够解释文献中大量等变网络架构,来证明我们公式化的通用性。

成为VIP会员查看完整内容
30
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员