人工智能在过去几年中获得了令人惊讶的新语言能力。由于深度学习的快速进展,语言AI系统能够比以往更好地书写和理解文本。这一趋势推动了新功能、新产品和整个行业的兴起。通过本书,Python开发者将学习到今天使用这些能力所需的实用工具和概念。
你将学习如何利用预训练的大型语言模型的强大功能来进行文案写作和摘要生成;创建超越关键词匹配的语义搜索系统;构建分类和聚类文本的系统,以实现大规模理解大量文本文档;并使用现有的库和预训练模型进行文本分类、搜索和聚类。 本书还将向你展示如何:
大型语言模型(LLMs)和扩散模型,如ChatGPT和Stable Diffusion,具有前所未有的潜力。由于它们经过了对互联网公开文本和图像的训练,它们可以为各种任务做出有用的贡献。随着入门门槛的显著降低,几乎任何开发者都可以利用LLMs和扩散模型来解决以前不适合自动化的问题。通过本书,您将获得生成式AI的坚实基础,包括如何在实践中应用这些模型。大多数开发者在首次将LLMs和扩散模型集成到他们的工作流程中时,往往难以从中获得足够可靠的结果以用于自动化系统。作者James Phoenix和Mike Taylor向您展示了一套称为提示工程的原则,这些原则可以使您有效地与AI合作。学习如何让AI为您服务。本书解释了:
“《生成式AI的提示工程》可能是未来保障您技术职业的最具前瞻性的方法。这无疑是任何从事AI实际应用工作的人的最佳资源。这里面丰富、精炼的原则将帮助新老AI工程师在未来可预见的竞争中保持领先。” ——Ellis Crosby,Incremento CTO兼联合创始人“这是代理和服务专业人员的必备指南。将AI与服务和客户交付结合起来,利用自动化管理,加快解决方案的速度,将设定新的行业标准。您会在书中找到有用、实用的信息和策略,使您能够充分理解和利用AI的潜力。” ——Byron Tassoni-Resch,WeDiscover CEO兼联合创始人作者的话自2020年GPT-3测试版以来,我们一直在做提示工程,当GPT-4推出时,我们发现许多我们曾使用的技巧和窍门已不再必要。这促使我们定义了一套可跨模型和模态转移的面向未来的原则,这些原则在使用GPT-5或未来的任何模型时仍然有用。提示的五项原则是:1. 提供方向:详细描述所需的风格,或参考相关的角色。2. 指定格式:定义要遵循的规则和响应的必要结构。3. 提供示例:插入一组多样的测试案例,其中任务已正确完成。4. 评估质量:识别错误并评价响应,测试驱动性能的因素。5. 分工:将任务分成多个步骤,链式连接以实现复杂目标。我们首次在2022年7月以博客文章的形式发布了这些原则,它们经受住了时间的考验,包括与OpenAI自己一年后发布的提示工程指南高度契合。任何与生成式AI密切合作的人都可能会收敛到一组类似的策略来解决常见问题,但这本书旨在更快地让您达到这一点。在本书中,您将看到数百个提示技术的示例,包括文本和图像提示,以及使用Python构建AI自动化脚本和产品。这不是一个寻找正确魔法词组组合的提示技巧列表,而是一个构建系统的实用指南,提供AI应用所需的正确上下文,以及如何测试和扩展生产环境中的AI系统。如果您符合以下情况,这本书将对您有用:- 您的时间价值超过每小时40美元,阅读这本书节省的几个小时,而不是从多个来源拼凑一切,对您来说是值得的。- 您不仅是随便使用AI,而是实际在构建一个AI应用或内部模板,许多人每天将使用数百或数千次。- 您希望通过学习数百个如何解决AI常见问题的真实案例来减少幻觉并提高AI的可靠性。- 您希望比较OpenAI与其他模型的优缺点,以及LangChain等常见框架、不同的向量数据库选项和AUTOMATIC1111。- 您想看到从一个天真的提示到一个完整AI代理,包括使用Gradio构建基本用户界面的端到端AI应用构建过程。
许多组织今天分析并共享关于个人的庞大且敏感的数据集。无论这些数据集涵盖的是医疗细节、财务记录还是考试成绩,组织通过去识别化、匿名化以及其他传统统计披露限制技术来保护个人信息变得越来越困难。这本实用的书籍解释了差分隐私(DP)如何帮助实现这一目标。作者Ethan Cowan、Michael Shoemate和Mayana Pereira解释了这些技术如何使数据科学家、研究人员和程序员能够进行统计分析而不暴露任何单个个体的贡献。您将深入了解基本的DP概念,明白如何使用开源工具来创建差分隐私统计数据,探索如何评估实用性/隐私权之间的权衡,并学习如何将差分隐私集成到工作流程中。通过这本书,您将学到:- 当其他数据匿名化方法无效时,DP如何保证隐私- 保留数据集中个体隐私的含义- 如何在多个现实场景和数据集中应用DP- 潜在的隐私攻击方法,包括重新识别攻击的含义- 如何在隐私保护的数据发布中使用OpenDP库- 如何解释特定DP数据发布提供的保证关于作者Ethan Cowan是哈佛大学Open Differential Privacy(OpenDP)团队的一员,从事软件和研究工作,尤其关注机器学习模型的隐私化以及开发内置差分隐私的敏感数据分析平台。Ethan还致力于伦理、公平和联邦学习的交叉领域。Michael Shoemate在研究组织TwoRavens工作,开发用于可视化数据和进行统计分析的工具。他的工作涉及多个不同的项目:核心项目、元数据服务和EventData。他还创建了一个名为“common”的可重用模块化UI组件集合,用于在Mithril中快速且统一的前端开发。Mayana Pereira在微软的AI for Good团队中,致力于将机器学习和隐私保护技术应用于各种实际问题。Mayana也是OpenDP的活跃合作者,OpenDP是一个差分隐私社区的开源项目,旨在开发通用的、经过验证的、可用且可扩展的差分隐私工具。