摘要 —— 鉴于智能体 AI(Agentic AI)与算法化(Algorithmization)领域近期出现的融合趋势,本文旨在为日益碎片化的学术论述恢复概念清晰度,并提供一个结构化的分析框架。首先,(a) 本文考察了当代技术图景,并对从“智能”到“智能体 AI”等核心概念给出了精确定义。其次,(b) 通过回顾前期研究工作,本文对过去十年间开发的方法论与技术进展进行了语境化梳理,强调了它们之间的相互依赖关系及累进式轨迹。第三,(c) 通过对机器学习(Machine Learning)领域中“机器”(Machine)与“学习”(Learning)属性的辨析,(d) 本文引入了机器学习中的“第一台机器”(M1)概念,即支持当今基于大语言模型(LLM)的智能体 AI 的底层平台;该平台被构想为 B2C 信息检索用户体验的延伸,目前正被重新应用于 B2B 转型。基于此区分,(e) 本白皮书提出了“第二台机器”(M2)的概念,将其视为实现全面、生产级 B2B 转型的架构前提,并将其特征描述为“基于策略的智能体 AI”(Strategies-based Agentic AI),其定义基于此类系统在实现业务运作时必须克服的结构性准入门槛。此外,(f) 本文对首个完全实现的 M2 架构提供了理论与技术洞察。最后,凭借过去二十年间在开发算法化底层架构方面所积累的专业与学术经验,(g) 本文勾勒了未来二十年的前瞻性研究与转型议程。
智能体 AI(Agentic AI)已成为全球技术论述的主导主题。截至 2025 年初,它已渗透进企业董事会、咨询框架、国家数字化战略以及公众想象中。然而,尽管其地位迅速攀升,该术语的使用仍存在不一致且往往不够精确的问题——通常被机械地挂钩于大语言模型(LLMs)方法论。这种普遍的误解掩盖了智能体系统真实的架构与战略影响,导致企业、政府和学术机构将其预期锚定在从未设计用于“生产级转型”的技术之上。 这种鸿沟在 2025 年 9 月变得尤为明显,当时文献 [21] 揭示了一个关键洞察:通常被称为“幻觉”的现象并非偶然缺陷,而是 LLM 的结构性特征。这些模型产生的错误直接源于其统计估计过程,而非检索失败。因此,许多准备将基于 LLM 的智能体 AI 集成到其运营基础设施中的企业——通常采用肤浅的或“氛围驱动型”(vibe-driven)开发方法——实际上是在其生产系统中嵌入了结构性噪声。这在现有的运营脆弱性和网络安全风险之上增加了一类新的风险,使得对这些战略计划进行彻底重新评估变得刻不容缓。 重要的是,这一结论对我们的读者来说并不新鲜。在我们 2023 年 9 月的出版物 [9] 中,我们明确指出“大语言模型中不存在幻觉……只有设计使然的错误”,因为 LLM 并不检索信息,而是对其进行估计和组合。因此,LLM 错误的结构性本质在近期机构承认此观点的前几年就是可预测的,并且已经得到了阐明。 这些问题仅反映了更深层次的误解和方法论错位的冰山一角。为什么这些持久的误判会持续出现在如此有影响力的机构中?虽然本文后续部分将剖析我们认为真正的“房间里的大象”(隐蔽的重大问题),但核心解释可简要概括为:当前的技术格局处于一种经济失衡状态,这是由供应侧(技术销售方)和需求侧(企业购买方)普遍缺乏判断力所驱动的。这种失衡不仅可以理解,而且在结构上嵌入在该领域的激励机制和知识约束中。 鉴于涉及的社会利害关系——从大规模投资的错误分配到不必要的大规模裁员——对概念精确性和架构清晰度的需求极其迫切。因此,我们的目标有两个:第一,阐明当前围绕智能体 AI 的误解起源及其驱动因素;第二,指明前行之路,以便科学家、高管、政策制定者和从业者能够更有效、更负责任地参与并塑造这一技术转型。
本文认为,混乱源于未能区分机器学习的两个底层组件:学习(Learning, L)与机器(Machine, M)。 * 学习(L):由计算统计学和传统统计学定义,本质上是一项科学事业。由于学术创新的全球性和开放性,其输出(模型 $f(\cdot)$)已成为一种商品。竞争优势无法在模型层面(L)持续产生。 * 机器(M):竞争优势必须源于“机器”,即管理模型部署、编排、启发式结合以及适配现实运营的架构与算法基础设施。这就是为什么作为一种软件架构新范式的“智能体 AI”已成为“获胜权”(right-to-win)计划基石的原因。
为使这一区分形式化,我们引入了智能体 AI 的机器理论,进一步区分了两类“机器”: * M1:指估计算力密集型模型(如校准 LLM 所需模型)所需的科学与数据工程的融合。 * M2:在 M1 能力之上,增加了创建联邦化、模块化算法生态系统所需的特性。M2 明显比 M1 更复杂(它可以为不同目的创建多个 M1),且我们认为,这才是企业最终追求的技术。
在 M2 内部,我们区分了两种路径: 1. 基于 LLM 的 M2:当前智能体 AI 的主流。即试图在 LLM 的“氛围编码”(vibe coding)之上构建 M2,使软件由非程序员创建并自动部署。这受限于 LLM 供应商从 B2C(零售服务)转向 B2B(企业服务)的枢纽战略。然而,其结构性属性(幻觉、不透明、有限的确定性)对其支撑生产级 M2 架构的能力构成了内在约束。 1. 基于策略的 M2 (Strategies-based M2):源自 [10] 的原始智能体 AI。它将 M2 构想为一种自顶向下的架构学科,立足于目前存在的最复杂的数字业务:算法交易。该观点认为,组织无法通过从最简单的用例向上进阶来扩展技术能力;相反,正确的轨迹是:从最严苛的运营和算法语境出发,将这些能力向下推广到所有业务职能。
本文的范畴刻意聚焦于我们过去十年在应用科学(Applied Science)领域的演进。应用科学本质上是颠覆性的:它将科学理论与专家启发式方法、战略推理与运营部署、多种统计模型与特定领域的判断相结合。 本文在空间上具有特殊性:它既不符合学术研究的风格标准,也不遵循行业白皮书的惯例。它旨在阐述一门跨越两界但又不完全受限于任何一界的学科。此外,本文有意整合了比以往更多的商业洞察。这种系统的专有性和高度定制化特性,排除了进行标准化定量性能比较的可能性。 算法化的可扩展性本质上受限于顾问在 M2 平台之上提供的专业服务(战略咨询和数据科学)的强度。因此,本工作刻意限制在 M2 层本身,这是使算法化能够独立于人力瓶颈、在全球范围内实现扩展的主要机制。
富有意义、可扩展且具韧性的转型是一个“机器”问题,而非“学习”问题。 正确理解下的智能体 AI 不是 LLM 动态的延伸,而是跨组织、跨行业、跨国家实现智能(人类与机器)运营化所需的架构学科。只有掌握基于策略的 M2,机构才能从肤浅的数字化转型走向真正的竞争力和结构效率。换言之,在组织完成自我转型之前,没有任何机构能有效处理 AI。