摘要:

人工智能(AI)正在重塑科学发现,其角色正从专门的计算工具演化为自主的科研伙伴。我们将**智能体科学(Agentic Science)**定位为“AI for Science”范式中的关键阶段,在这一阶段,AI 系统从部分辅助走向全面的科学自主性。借助大语言模型(LLMs)、多模态系统以及一体化研究平台,智能体化 AI 展现出在假设生成、实验设计、执行、分析与迭代改进等方面的能力——这些行为曾被认为是人类独有的。本综述从生命科学、化学、材料和物理等领域出发,对自主科学发现进行了面向学科的系统性回顾,综合各学科的研究进展与突破。我们通过一个综合框架统一了此前分散的三类视角——过程导向、自主性导向和机制导向——并将其与基础能力、核心过程及领域特定实现联系起来。在该框架的基础上,我们:(i) 追溯 AI for Science 的演进,(ii) 识别支撑科学自主性的五大核心能力,(iii) 将科学发现建模为动态的四阶段工作流,(iv) 回顾其在生命科学、化学、材料科学和物理学中的应用,(v) 综合关键挑战与未来机遇。本研究确立了一个面向学科的自主科学发现综合视角,并将智能体科学定位为推动 AI 驱动科研进步的结构化范式。 关键词: 智能体科学,自主科学发现,自然科学,AI for Science,智能体化 AI,大语言模型

1. 引言

科学发现正经历着一场由人工智能(AI)快速演进所驱动的变革性转变,AI 的角色正在从专门化的工具转向科研合作者。这一进展标志着“AI for Science”范式中的关键阶段,即 AI 系统已从充当面向特定任务的计算“神谕”【121, 306, 339, 42, 87, 281, 351】逐步走向智能体科学(Agentic Science)的兴起(见图 1)【229, 220, 81, 274, 157】。智能体科学指的是“AI for Science”演化中的特定阶段——主要对应图 1 中的第 3 级(完全智能体化发现),其前身是第 2 级(部分智能体化发现)。在这一阶段,AI 作为自主科学智能体,能够独立提出假设、设计并执行实验、解释结果,并以更少的人类依赖性迭代完善理论【229, 22】。这种进展得益于诸如 Intern-Discovery 这样的综合平台(其提供了对多样化 AI 智能体和数据集的访问),以及 Intern-S1 等展现出深度科学推理能力的多模态模型。 这一转变受到基础模型(尤其是大语言模型,LLMs)【82, 256, 351】的最新突破所推动。LLMs 在自然语言理解、复杂推理和工具使用方面提供了前所未有的能力【245, 348, 323, 338, 337】,从而催生出能够超越静态学习流程的 AI 智能体。这类智能体不再仅是被动的模型,而是作为动态的、目标驱动的实体,能够自主探索科学方法【311, 89, 178, 358】。从假设生成【307, 209】,到自主实验【22, 317】,再到合成数据集的构建【150】,这些智能体展现出曾被认为仅属于人类的涌现行为。 与现有综述的比较。 尽管该领域发展迅速,但关于如何理解与设计日益自主化的科学系统,目前仍缺乏统一的框架。现有综述大体可分为三类互补视角。过程导向的综述试图将 LLM 的能力映射到经典的 与现有综述的比较。 尽管研究进展迅速,但关于如何理解和设计日益自主的科学系统,仍缺乏统一框架。现有综述可沿三条互补轴线加以归类:过程导向的视角将 LLM 的能力映射到经典研究循环【172, 352, 39】;自主性导向的研究依据系统的主动性与责任划分等级【346, 293】;机制导向的分析则剖析支撑智能体行为的架构基元及其演化角色【220, 331, 81, 274】。尽管这些工作奠定了重要基础,但仍然碎片化——往往将工作流程、自主性分级或体系结构彼此割裂开来单独考察。 我们的贡献。 有别于既有综述分别从过程、自主性或架构单点切入,本文通过图 2 所示的综合框架对上述视角进行统一与拓展,将自主科学发现中的基础能力—核心过程—领域实现贯通起来。我们围绕生命科学、化学、材料与物理四大领域,给出面向学科的自主科学发现综述,系统综合各学科的研究进展与代表性成果。该统一视角将智能体科学从一个抽象阶段提升为贯穿“能力—过程—应用”的结构化研究范式。我们的具体贡献如下: 1. 绘制 AI for Science 的演进图谱。 我们追溯了从“计算神谕”到“自主科研伙伴”的演进,形式化地将智能体科学界定为 AI 系统展现自主性、目标驱动推理与迭代学习的阶段。 1. 科学智能体的“机理解剖”:五大核心能力。 我们识别并分析科学智能体所需的五项基础能力:(i) 推理与规划,(ii) 工具整合,(iii) 记忆机制,(iv) 多智能体协作,以及 (v) 优化与进化。针对每一项能力,我们回顾最前沿的实现(如【169, 25, 189, 32】)与领域特定挑战。 1. 智能体科学的动态工作流:四个核心阶段。 我们将科学发现建模为由智能体驱动的动态四阶段工作流:(i) 观察与假设生成,(ii) 实验规划与执行,(iii) 数据与结果分析,(iv) 综合、验证与进化。我们强调,智能体可以灵活、动态地组合这些阶段以解决复杂科学问题【12, 22, 74, 73】。 1. 跨自然科学的系统综述。 我们在自然科学四大领域(见图 4:生命科学、化学、材料、物理)系统回顾智能体系统,覆盖十余个细分方向,从药物发现【317】到材料设计【113】,展示了智能体科学的广泛适用性与领域特定创新。 1. 挑战与未来机遇。 我们综合该领域面临的主要技术、伦理与哲学挑战——包括可复现性新发现的验证人—智能体协作——并提出研究路线图,以引导稳健、可信且具影响力的科学智能体的未来发展。

通过上述综合,我们旨在为智能体科学奠定概念与方法论基础,引导后续研究走向能够与人类探究共进化的 AI 系统设计,从而加速科学发现前沿的推进。

成为VIP会员查看完整内容
1

相关内容

人工智能将与科研深度结合,成为科学家继计算机之后的新生产工具。
人工智能治理全景综述
专知会员服务
13+阅读 · 8月13日
重建四维空间智能:综述
专知会员服务
18+阅读 · 7月29日
联邦图学习的全面数据中心化综述
专知会员服务
21+阅读 · 7月23日
视觉中的生成物理人工智能:综述
专知会员服务
36+阅读 · 1月26日
《多模态对齐与融合》综述
专知会员服务
90+阅读 · 2024年11月27日
脑启发的人工智能:全面综述
专知会员服务
49+阅读 · 2024年8月30日
迈向可信的人工智能:伦理和稳健的大型语言模型综述
专知会员服务
37+阅读 · 2024年7月28日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
【长文综述】基于图神经网络的知识图谱研究进展
深度学习自然语言处理
15+阅读 · 2020年8月23日
Gartner 报告:人工智能的现状与未来
InfoQ
14+阅读 · 2019年11月29日
用Attention玩转CV,一文总览自注意力语义分割进展
深度学习人体姿态估计算法综述
AI前线
24+阅读 · 2019年5月19日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
13+阅读 · 2016年12月31日
国家自然科学基金
33+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
44+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
477+阅读 · 2023年3月31日
Arxiv
78+阅读 · 2023年3月26日
Arxiv
173+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
人工智能治理全景综述
专知会员服务
13+阅读 · 8月13日
重建四维空间智能:综述
专知会员服务
18+阅读 · 7月29日
联邦图学习的全面数据中心化综述
专知会员服务
21+阅读 · 7月23日
视觉中的生成物理人工智能:综述
专知会员服务
36+阅读 · 1月26日
《多模态对齐与融合》综述
专知会员服务
90+阅读 · 2024年11月27日
脑启发的人工智能:全面综述
专知会员服务
49+阅读 · 2024年8月30日
迈向可信的人工智能:伦理和稳健的大型语言模型综述
专知会员服务
37+阅读 · 2024年7月28日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
13+阅读 · 2016年12月31日
国家自然科学基金
33+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
44+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员