自主智能体长期以来一直是学术界一个显著的研究课题。在这个领域,以往的研究往往侧重于在孤立环境中训练智能体,使其具备有限的知识,这与人类的学习过程有很大不同,从而使得智能体难以做出类似人类决策的能力。最近,通过获取大量的网络知识,大型语言模型(LLMs)展现出在实现人类水平智能方面的非凡潜力。这引发了对基于LLMs的自主智能体研究的高潮。为了充分发挥LLMs的全部潜能,研究人员设计了多样化的智能体架构,以适应不同的应用。在本文中,我们呈现了对这些研究的全面调查,从整体的角度对自主智能体领域进行了系统回顾。更具体地说,我们的关注重点在于基于LLMs的智能体构建,为此我们提出了一个统一的框架,涵盖了大部分先前工作。此外,我们还总结了基于LLMs的人工智能智能体在社会科学、自然科学和工程领域中的各种应用。最后,我们讨论了常用的基于LLMs的人工智能智能体评估策略。基于以前的研究,我们还提出了该领域面临的若干挑战和未来发展方向。为了跟踪该领域的发展并不断更新我们的调查,我们在https://github.com/Paitesanshi/LLM-Agent-Survey上维护了一个相关参考文献的存储库。 https://www.zhuanzhi.ai/paper/ec99db922919b77690942c358a845fee

自主智能体长期以来被视为通向人工通用智能(AGI)的一条有前途的道路,能够通过自主规划和指令来完成任务。在早期的范式中,指导智能体行动的策略函数是通过启发式方法构建的,随后通过与环境的互动进行了改进。然而,出现了明显的差距,这些函数往往无法在特别是在非受限的开放领域环境中复制人类水平的熟练程度。这种差异可以追溯到启发式设计固有的潜在不准确性,以及训练环境提供的受限知识所导致的。

近年来,大型语言模型(LLMs)取得了显著的成功,表明它们具有实现类人智能的潜力。这种能力源于综合的训练数据集和大量的模型参数的利用。受到这种能力的推动,近年来出现了一个蓬勃发展的趋势(见图1,显示了这一领域的增长趋势),在这个趋势中,LLMs被应用作为创建自主智能体的核心协调者。这种战略性的应用旨在模拟类人决策过程,从而为更复杂和适应性更强的人工智能系统提供一条路径。在基于LLM的自主智能体方向上,人们设计了许多有前途的模型,重点是增强LLMs的关键能力,比如记忆和规划,使它们能够模拟人类的行为并熟练地执行各种任务。然而,这些模型是独立提出的,对它们进行全面的总结和比较的努力有限。为现有基于LLM的自主智能体作品进行全面的总结分析是至关重要的,这在发展对这一领域的综合理解以及为未来的研究提供灵感方面具有重要意义。

在本文中,我们对基于LLM的自主智能体领域进行了全面的综述。具体来说,我们根据构建、应用和评估这三个方面来组织我们的调查。对于智能体的构建,我们提出了一个由四个组件组成的统一框架,包括一个用于表示智能体属性的配置模块,一个用于存储历史信息的记忆模块,一个用于规划未来动作的规划模块,以及一个用于执行计划决策的执行模块。通过禁用一个或多个模块,大部分先前的研究可以被视为这个框架的具体示例。在介绍典型的智能体模块后,我们还总结了常用的微调策略,以增强智能体在不同应用场景下的适应性。除了构建智能体,我们还概述了自主智能体的潜在应用,探讨了这些智能体如何提升社会科学、自然科学和工程领域。最后,我们讨论了评估自主智能体的方法,重点关注主观和客观策略。总之,本调查提供了对基于LLM的自主智能体领域现有研究的系统回顾,并建立了清晰的分类。它关注智能体的构建、应用和评估三个方面。基于以前的研究,我们确定了该领域面临的若干挑战,并讨论了未来的发展方向。我们认为该领域仍处于早期阶段,因此我们维护一个存储库,以持续跟踪该领域的研究,网址为 https://github.com/Paitesanshi/LLM-Agent-Survey。

基于LLM的自主智能体构建

近期语言模型(LLMs)的进步展示了它们在完成广泛任务方面的潜力。然而,仅仅基于LLMs,由于其架构的限制,实现一个有效的自主智能体是困难的。为了填补这一差距,先前的工作开发了许多模块,以激发和增强LLMs的能力,用于构建自主智能体。在本节中,我们提出了一个统一的框架,以总结先前工作中提出的架构。具体而言,我们的框架的总体结构如图2所示,由配置模块、记忆模块、规划模块和执行模块组成。配置模块的目的是识别智能体的角色。记忆和规划模块将智能体置于一个动态环境中,使其能够回顾过去的行为并规划未来的动作。执行模块负责将智能体的决策转化为具体的输出。在这些模块内部,配置模块影响记忆和规划模块,而这三个模块共同影响执行模块。接下来,我们详细介绍这些模块。

基于LLM的自主智能体在各个领域的应用代表了我们解决问题、做决策和创新方式的范式转变。这些智能体具备语言理解、推理和适应能力,通过提供前所未有的见解、辅助和解决方案,正在颠覆行业和学科。在本节中,我们将探讨LLM-based自主智能体在社会科学、自然科学和工程领域的变革性影响(请参见图3左侧部分,以获取整体概览)。

成为VIP会员查看完整内容
129

相关内容

大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。
《以数据为中心的图学习》综述
专知会员服务
49+阅读 · 2023年10月11日
大模型如何赋能医学?全科医学人工智能基础模型
专知会员服务
73+阅读 · 2023年4月13日
佐治亚理工学院最新《图神经网络社会推荐系统》2022综述
华东师大《无数据知识迁移》综述论文
专知会员服务
55+阅读 · 2022年1月6日
综述| 当图神经网络遇上强化学习
图与推荐
23+阅读 · 2022年7月1日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
18+阅读 · 2018年9月1日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
133+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
327+阅读 · 2023年3月31日
Arxiv
56+阅读 · 2023年3月26日
Arxiv
115+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员