在过去十年中,人工智能(AI)取得了显著突破,尤其是在深度学习和基础模型(foundation models)领域——这类模型属于次符号(sub-symbolic)机器学习方法,依赖于拥有数百亿参数的深度神经网络。由于这类模型的可解释性和可理解性非常有限,它们通常被称为“黑箱”模型。这项技术在提升交互能力、感知能力以及自然语言处理方面发挥了关键作用,有时甚至超越了人类的表现。因此,一些研究者开始将AI等同于深度学习和基础模型。然而,我认为这是一个重大的误解。 AI的内涵远不止于次符号机器学习;它还包括符号化(即人类可理解的)建模、搜索算法和推理技术——这些都是超越机器学习、体现人类智能的重要方面,同时也可以结合机器学习,以提升算法性能与模型准确性。 规划(planning)与行动(acting)是人类与生俱来的能力。即使是年幼的儿童,也会自然地进行规划和行动,从环境中学习其行为的后果,并在成长过程中不断精进这些能力。而机器在规划与行动方面尚未达到人类水平,尤其是在将其与学习过程相结合方面仍有很大提升空间,这也为自主智能系统的进步留下了广阔的发展余地。 本书在“规划、行动与学习”研究领域中是一个重要的里程碑,探讨了如何有效地将这些智能特征融合与集成,以提升智能系统的整体性能。作者Malik Ghallab、Dana Nau 和 Paolo Traverso 是三位在国际学术界享有极高声誉的杰出科学家与研究者。本书是他们在该领域撰写的第三本著作:第一本聚焦于规划,第二本则探讨了行动与规划之间的交互,而这第三本则更进一步,系统地涵盖了行动、规划与学习三者的结合。 书中讨论了诸如确定性状态转换(Deterministic State-Transitions)、分层任务网络(Hierarchical Task Networks)、概率模型、不确定性模型、分层细化模型(Hierarchical-Refinement)以及时间建模(Temporal Models)等内容,同时也涉及机器人运动与操作(Robotic Motion and Manipulation)。此外,书中还探讨了大语言模型(Large Language Models)的新兴能力及其在该领域的应用,这一主题正处于次符号AI与符号AI交汇的前沿。 本书不仅是该研究领域科学家的重要参考资料,也可作为研究生课程的教科书,清晰、全面且结构严谨地梳理了领域建模、计划生成与执行,以及如何将学习过程融入上述各个环节的技术与算法。我毫不怀疑,这本书将会被我在课程中推荐,并作为个人的重要参考资料使用。 对于一个智能体而言,实现智能行为依赖于三项基本的认知功能:行动(acting)、规划(planning)和学习(learning)。本书的主题正是如何实现这三种功能的自动化与集成。本书是我们前两本著作《自动规划》[409] 以及《规划与行动的结合》[410] 的延续,涵盖了自这些书出版以来在该领域取得的一系列研究进展。 本书涵盖了多种模型、方法与算法——包括确定性、概率性、分层结构、非确定性、时间性与空间性等类型——并探讨了如何将这些模型应用于行动、规划与学习的过程。关于这些主题的已有文献庞杂且分散于多个相互割裂的研究领域,不可能在一本书中面面俱到。因此,我们在内容选择上坚持以“行动、规划与学习的集成为核心目标”这一主线来组织材料。 全书共包含24章。第1章为引言,其余章节分为八个部分。前七个部分聚焦于不同的表示模型,每一部分均包括关于该模型下的行动、规划与学习的相关章节: * 第一部分 使用“经典的”确定性状态转换模型,基于状态变量进行建模。本章中的若干核心概念贯穿全书始终。 * 第二部分 在第一部分的状态转换模型基础上,引入了分层任务网络(HTN)。 * 第三、四部分 对第一部分的状态转换模型进行扩展,分别引入了概率性非确定性。 * 第五部分 描述了一种分层细化(hierarchical refinement)方法,它结合了第二部分中的HTN概念与第三部分中的概率模型。 * 第六部分 使用chronicle表示法对时间与并发进行建模。 * 第七部分 引入了机器人运动与操作模型,并探讨了其与更抽象任务的结合。

最后,第八部分包含两章,讨论了一些尽管不属于本书核心关注点但仍非常重要的主题:大语言模型以及感知、监控与目标推理(goal reasoning)

如何使用本书

本书既可作为科学研究与工程实践中的信息参考来源,也可作为研究生层次的教材使用。大多数章节的参考文献被集中放在章节末尾的讨论部分;多数讨论部分后还附有习题。我们将提供配套的幻灯片与其他辅助材料,供读者在线获取[^1]。 在书中的伪代码中,所有变量默认为局部变量,除非明确声明为全局变量。我们假设读者已具备本科阶段计算机科学课程中算法与数据结构的基本知识。附录中补充了一些超出该背景范围的数学与技术内容。 除了对当前技术状态进行系统性的整合外,本书还包含了大量全新的内容,这些内容大多经过详尽的阐述,以便于教学使用。其中部分章节提出的新方法尚未被实现或实证评估,旨在激发未来进一步的研究探索。 读者可以根据自身的需求与背景知识,选择不同的阅读路径来学习本书。图1给出了各章节之间的依赖关系,希望能帮助读者与授课教师合理规划本书的学习路径,获得最大收益。

成为VIP会员查看完整内容
3

相关内容

【新书】通用人工智能,144页pdf
专知会员服务
63+阅读 · 2024年9月27日
【2023新书】移动边缘计算,123页pdf
专知会员服务
104+阅读 · 2023年11月18日
【2023新书】负责任人工智能手册:跨学科视角,528页pdf
专知会员服务
75+阅读 · 2023年7月14日
【硬核书】迁移学习多智能体强化学习系统,131页pdf
专知会员服务
147+阅读 · 2022年7月8日
【实用书】强化学习实战:Python,110页pdf
专知会员服务
148+阅读 · 2022年6月9日
【新书】人工智能与因果推理,395页pdf
专知会员服务
211+阅读 · 2022年5月5日
【新书】机器学习算法,模型与应用,154页pdf
专知会员服务
96+阅读 · 2022年1月20日
【硬核书】终身机器学习,145页pdf
专知会员服务
85+阅读 · 2021年3月1日
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
48+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
473+阅读 · 2023年3月31日
Arxiv
172+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
69+阅读 · 2022年9月7日
Arxiv
26+阅读 · 2019年3月5日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
相关VIP内容
【新书】通用人工智能,144页pdf
专知会员服务
63+阅读 · 2024年9月27日
【2023新书】移动边缘计算,123页pdf
专知会员服务
104+阅读 · 2023年11月18日
【2023新书】负责任人工智能手册:跨学科视角,528页pdf
专知会员服务
75+阅读 · 2023年7月14日
【硬核书】迁移学习多智能体强化学习系统,131页pdf
专知会员服务
147+阅读 · 2022年7月8日
【实用书】强化学习实战:Python,110页pdf
专知会员服务
148+阅读 · 2022年6月9日
【新书】人工智能与因果推理,395页pdf
专知会员服务
211+阅读 · 2022年5月5日
【新书】机器学习算法,模型与应用,154页pdf
专知会员服务
96+阅读 · 2022年1月20日
【硬核书】终身机器学习,145页pdf
专知会员服务
85+阅读 · 2021年3月1日
相关基金
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
48+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
相关论文
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
473+阅读 · 2023年3月31日
Arxiv
172+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
69+阅读 · 2022年9月7日
Arxiv
26+阅读 · 2019年3月5日
Arxiv
11+阅读 · 2018年7月31日
微信扫码咨询专知VIP会员