将**知识图谱(Knowledge Graphs, KG)与大语言模型(Large Language Models, LLMs)**结合,以构建更强大、更可靠、且具可解释性的人工智能系统。 知识图谱通过建模对象、事件、概念及其相互关系,帮助你在数据中识别关键模式,从而做出更优决策。与 LLM 相结合,它们在处理结构化与非结构化企业数据、构建推荐系统、欺诈检测机制或客服对话系统等任务中展现出巨大潜力。
本书提供了系统的方法与工具,帮助读者高效地组织数据、建模知识图谱,并将其融入 LLM 的工作流程之中(反之亦然),实现互补增强。
使用自顶向下、需求驱动的迭代方法建模知识图谱 * 从本体(Ontology)、分类体系(Taxonomy)与结构化数据构建知识图谱 * 利用 LLM 从非结构化数据源中自动构建知识图谱 * 应用机器学习算法补全知识图谱并挖掘其中的洞见 * 在知识图谱上进行推理,并构建基于 KG 的 RAG 系统以增强 LLM
结合知识图谱与 LLM 可显著: * **减少幻觉(Hallucination)**现象 * 提升输出的可解释性
增强推理与知识一致性
知识图谱通过自然地编码数据间的关系,使得 AI 系统即便在领域知识有限的情境下,也能保持更高的可靠性与准确性。
展示如何在基于 LLM 的应用与 RAG 管线中引入来自结构化与非结构化源的知识图谱
提供涵盖医疗、金融风控等领域的真实案例研究
深入讨论知识表示与推理策略的工程实践
Part 1
知识图谱与 LLM:强强联合 1. 智能系统的混合范式
Part 2
从本体创建首个知识图谱
从简单网络到多源数据融合 Part 3
从非结构化数据中抽取领域知识
使用 LLM 构建知识图谱
实体消歧(Named Entity Disambiguation)
基于开放式 LLM 与领域本体的实体消歧 Part 4
知识图谱上的机器学习入门
图特征工程:手动与半自动方法
图表示学习与图神经网络(GNN)
节点分类与链接预测 Part 5
基于知识图谱的 RAG 系统
使用自然语言向知识图谱提问
利用 LangGraph 构建问答智能体
适合机器学习工程师、AI 工程师、数据科学家与数据工程师。 书中示例均使用 Python 实现。
Dr. Alessandro Negro:GraphAware 首席科学家,《Graph-Powered Machine Learning》作者,GraphAware Hume 平台联合创始人。 * Dr. Vlastimil Kus:GraphAware 首席数据科学家,专长于 NLP 与图机器学习。 * Dr. Giuseppe Futia:GraphAware 高级数据科学家、意大利都灵理工大学博士,研究方向为图表示学习与知识图谱自动构建。 * Fabio Montagna:GraphAware 首席机器学习工程师,专注于将科研成果快速转化为工业应用。
《机器学习系统》提供了一个系统化的框架,用于理解与构建机器学习(ML)系统。这本教材弥合了理论基础与工程实践之间的鸿沟,强调从系统视角出发构建高效人工智能解决方案的思维方式。不同于那些主要聚焦于算法和模型架构的资源,本书更强调机器学习系统运行的更广泛背景,包括数据工程、模型优化、硬件感知训练以及推理加速等内容。通过学习,读者将能够系统性地思考机器学习系统的体系结构,并掌握构建灵活、高效且鲁棒的机器学习系统所需的工程原理。
问题: 学生们通常学习如何训练人工智能模型,但很少有人真正理解如何构建能在生产环境中运行的系统。在教授机器学习系统概念时,学生往往只学到各个独立的组成部分,而未能把握整体架构——他们“只见树木,不见森林”。 未来: 随着人工智能变得越来越自主化,瓶颈将不再仅仅是算法本身,而是那些能够构建高效、可扩展且可持续系统的人工智能工程师。 我们的路径: 这一理念源自哈佛大学的 CS249r 课程,在该课程中,学生、教师与业界伙伴共同探索机器学习的系统层面内容。本书的内容由 2023 年秋季学期学生的真实贡献发展而来。最初只是一份课堂笔记,如今已成长为一份我们希望向全球分享的综合性教育资源。 想了解完整故事?请阅读我们的作者说明,了解支撑本项目的灵感与核心价值。
基础篇(第 2、3、4 章) —— 探讨算法与体系结构的基本原理,为理解系统层面的设计决策提供技术背景。这几章回答了“我们在构建什么?”这一问题,为后续“我们如何可靠地构建它?”奠定了基础。 支柱篇 —— 本书按照五大工程学科组织,每个支柱由若干章节组成,从基础内容逐步深入到高级主题。读者既可以线性地阅读全部章节,也可以聚焦于与自己工作最相关的特定支柱。不过,理解我们所讨论的“跨支柱依赖关系”有助于体会到一个支柱中的设计决策如何影响其他部分。 专题篇(第 18、19、20 章) —— 讨论机器学习系统工程在特定领域与新兴挑战中的应用,展示这一框架在多样化应用场景中的灵活性。 全书设有交叉引用系统,帮助读者在不同章节之间导航。当某一章提到另一个章节中已深入讲解的概念时,引用会指引你前往相关内容。这种互联结构反映了“AI 三角框架”的现实:机器学习系统工程需要理解数据、算法与基础设施之间的相互作用,而非将它们孤立研究。 若想了解更多关于本书的学习目标、目标读者、前置知识要求以及如何最大化学习体验的信息,请参阅“关于本书”部分,其中还提供了学习社区与扩展资源的详细说明。 这篇引言为后续内容奠定了概念基础。我们首先理解了人工智能(AI)作为愿景与机器学习(ML)作为方法论之间的关系;随后定义了机器学习系统这一“人工制品”——由数据、算法与基础设施组成的集成计算系统。通过“苦涩教训(The Bitter Lesson)”与人工智能的历史演进,我们认识到为什么系统工程已成为推动人工智能进步的根本,以及基于学习的方法为何主导了这一领域。由此,我们正式将**AI 工程(AI Engineering)**定义为一门独立学科,正如计算机工程(Computer Engineering)曾经的诞生一样——它专注于在各种计算平台上构建可靠、高效、可扩展的机器学习系统。 接下来的旅程将系统地探讨 AI 工程的各个支柱,在提供概念理解的同时,也带来构建生产级机器学习系统的实践技术。我们此前指出的挑战——性能隐性退化、数据漂移、模型复杂性、运维负担以及伦理问题——将在后续章节中反复出现,但这一次,它们将配以基于真实工程经验与最佳实践的具体解决方案。 引言
目标与意义
为什么我们必须掌握支撑具备学习、适应与大规模运行能力的系统之工程原理? 机器学习(Machine Learning, ML)代表了自可编程计算机问世以来计算领域最重要的范式转变——它让系统的行为不再依赖显式指令,而是从数据中“涌现”出来。这一变革要求新的工程基础,因为传统的软件工程原则无法充分应对那些能通过经验进行学习与自我适应的系统。 从气候建模、医学诊断到自主交通,每一个重大的技术挑战都依赖于能够处理海量数据并在不确定性中可靠运行的系统。理解机器学习系统工程(ML Systems Engineering)的原理,决定了我们是否具备解决超越人类认知能力的复杂问题的能力。 这一学科为构建能够跨越不同部署环境(从大型数据中心到资源受限的边缘设备)的系统奠定了基础,也确立了 21 世纪技术进步的工程基石。
💡 学习目标
将机器学习系统定义为由数据、算法与基础设施组成的集成计算系统 * 通过失败模式分析,区分机器学习系统工程与传统软件工程 * 解释 AI 三角框架(AI Triangle Framework),并分析数据、算法与计算基础设施之间的相互依赖关系 * 追溯人工智能范式的历史演进:从符号主义系统到统计学习,再到深度学习 * 评估 Sutton 的“苦涩教训”(The Bitter Lesson)对现代机器学习系统工程优先级的启示 * 比较机器学习系统中的“隐性性能退化(silent performance degradation)”与传统软件的失败模式 * 分析机器学习系统的生命周期阶段,并与传统软件开发流程进行对比 * 对机器学习系统中的现实挑战进行分类:数据、模型、系统与伦理四大维度 * 应用“五支柱工程框架(Five-Pillar Engineering Framework)”分析机器学习系统架构及其内在依赖关系
当今的工程实践正处在一个可与历史上最具变革性的时期相提并论的拐点。 工业革命确立了机械工程以管理物理力的学科体系;数字革命奠定了计算工程以处理算法复杂性的理论基础。而如今,人工智能系统要求一种新的工程范式,用以应对具备学习行为、自主适应能力、并在规模上远超传统软件工程方法的系统。 这一转变重新定义了“工程系统”的本质。 传统的确定性软件架构依赖于显式编程指令,对给定输入产生可预测的输出;而机器学习系统是一种概率性架构,其行为源自对训练数据中统计模式的学习。这一根本差异带来了新的工程挑战,也定义了机器学习系统工程这一新兴学科的使命: * 如何确保学习型系统的可靠性,而非仅依赖程序逻辑? * 如何让系统在处理 PB 级数据并同时服务数十亿用户时仍具可扩展性? * 当运行数据分布偏离训练分布时,如何维持鲁棒性?
这些问题构成了机器学习系统工程作为一门独立学科的理论与实践基础。本章旨在为理解这一领域的历史演化及其与传统软件架构的区别提供概念框架,并通过整合计算机科学、系统工程与统计学习理论的视角,建立系统化研究智能系统的框架。
我们的探讨从人工智能作为研究目标(AI as Vision)与机器学习作为实现方法(ML as Methodology)之间的关系出发,继而定义何谓机器学习系统——一种由数据、算法与基础设施组成的集成计算系统。通过回顾人工智能从符号推理系统到统计学习方法再到深度学习架构的历史演进,我们展示了每一次范式转变如何催生新的工程解决方案。 这一演进揭示了 Sutton 的“苦涩教训”:通用计算方法最终会超越人工设计的知识表示。这意味着,系统工程正逐渐成为推动人工智能进步的核心力量。 在此历史与技术基础上,我们正式将机器学习系统工程定义为一门独立学科。正如**计算机工程(Computer Engineering)**源自电气工程与计算机科学的融合,机器学习系统工程致力于在各种计算平台上构建可靠、高效且可扩展的机器学习系统。这一定义既确立了学科的命名规范,也明确了其实践范围。
在此基础上,本书引入了支撑全书分析的核心理论框架: * AI 三角模型(AI Triangle)——用于理解数据、算法与计算基础设施之间的相互作用; * 机器学习系统生命周期(ML System Lifecycle)——通过对比传统软件开发流程,突出问题定义、数据整理、模型开发、验证、部署与持续维护等阶段的独特性。
这些理论框架将通过典型的应用场景得到验证,展示不同领域中机器学习系统的多样化工程需求——从需在网络边缘低延迟运行的自动驾驶系统,到服务数十亿用户的云端推荐系统,这些案例揭示了部署环境如何塑造系统架构与工程权衡。
最后,本章识别出奠定机器学习系统工程作为一门“必要且复杂学科”的核心挑战: * 隐性性能退化,需要专门的监测与诊断机制; * 数据质量与分布漂移问题,削弱模型有效性; * 高风险场景下的鲁棒性与可解释性需求; * 超越传统分布式系统的基础设施可扩展性压力; * 伦理与社会责任,对系统设计提出新的工程约束。
这些挑战构成了本书的五支柱组织框架(Five-Pillar Organizational Framework)的基础,将机器学习系统工程划分为若干相互关联的子学科,共同支撑构建鲁棒、可扩展、负责任的人工智能系统。
本章为 第一部分:系统基础(Part I: Systems Foundations) 奠定理论基石,介绍了支撑后续分析的基本原理。这些概念框架将在随后的章节中得到深化与应用,最终形成一种可系统化地工程化智能系统的方法论,使人工智能能够在真实生产环境中可靠落地与持续进化。
本专著聚焦于塑造扩散模型(diffusion models)发展的核心原理,追溯其起源,并展示不同形式如何从共同的数学思想中演化而来。 扩散建模的起点是定义一个正向扰动过程(forward corruption process),该过程会逐步将数据转化为噪声。通过定义一系列连续的中间分布,这一正向过程将复杂的数据分布与简单的噪声分布相连接。扩散模型的核心目标是构建一个反向生成过程(reverse process),使其能够沿与正向扰动相反的方向运行,从噪声逐步还原出数据,同时复现与正向过程一致的中间分布。 我们从三种互补的视角对这一思想进行形式化阐述: * 变分视角(Variational view):受变分自编码器(VAE)的启发,将扩散过程视为逐步去噪的学习过程。模型通过一系列小的去噪目标(denoising objectives)学习如何一步步将噪声还原为数据。 * 基于得分的视角(Score-based view):源于能量模型(energy-based modeling),学习数据分布随时间演化的梯度,即“得分函数(score function)”,用于指示样本应朝哪些方向调整以进入更高概率区域。 * 基于流的视角(Flow-based view):与归一化流(normalizing flows)相关,将生成视为沿着由学习到的速度场(velocity field)控制的平滑路径,从噪声平滑地迁移至数据。
这三种视角共享一个共同的数学骨架:一个随时间变化的学习速度场(time-dependent velocity field),其流动将简单的先验分布传输到目标数据分布。在此基础上,采样过程可以被视为求解一个微分方程,使噪声沿着连续的生成轨迹演化为数据。 在此理论框架之上,专著进一步讨论了: * 可控生成的引导机制(guidance for controllable generation); * 高效采样的高级数值求解方法(advanced numerical solvers for efficient sampling); * 受扩散启发的流映射模型(diffusion-motivated flow-map models),这些模型能够直接学习生成轨迹上任意时刻之间的映射。
本书面向具有基础深度学习背景的读者,旨在提供一个清晰、概念化且数学上扎实的扩散模型理解框架。它系统阐明了扩散模型的理论基础,解释了不同公式化形式背后的思想逻辑,并为进一步研究提供稳固的理论支点。该专著既可作为研究者的系统参考资料,也可作为初学者进入这一快速发展的研究领域的易懂入门读物。
EMNLP 2025(The 2025 Conference on Empirical Methods in Natural Language Processing)于北京时间2025年8月21日公布了论文录用结果。****EMNLP是计算语言学和自然语言处理领域的顶级国际会议,每年举办一次,被列入中国人工智能学会A类推荐国际学术会议、中国计算机学会B类推荐国际学术会议。EMNLP 2025于2025年11月5日至9日在中国苏州召开。
本教程聚焦于大语言模型(LLM)高效推理(Efficient Inference)这一日益重要的主题,旨在从设计者的视角出发,系统性地阐释其关键原理与方法论。我们首先介绍现代大语言模型的基本概念与核心机制,以及相关的软件与硬件背景。随后,将对效率优化问题(efficiency optimization problem)进行形式化定义。为帮助听众建立“系统设计者思维(designer’s mindset)”,我们将讲解如何针对特定硬件上的具体工作负载,诊断模型推理的效率瓶颈。特别地,我们将演示如何利用理论屋顶线模型(roofline model)以及 NVIDIA 工具链(toolchain)来识别这些瓶颈。 在掌握这些分析工具之后,我们将从概念层面解析导致推理效率低下的关键因素,包括:自回归采样机制(autoregressive sampling scheme)、模型规模(model size)以及核心注意力算子(core attention operator)。接着,我们将介绍一个面向大语言模型高效推理的全栈分类体系(full-stack taxonomy),将相关方法划分为算法级(algorithm-level)、**模型级(model-level)与系统级(system-level)**三大类: 1. 算法级优化:涵盖高效解码方法(efficient decoding methods)、输入压缩方法(input compression methods),以及超越自回归生成范式的替代生成机制(alternative generative paradigms beyond autoregression); 1. 模型级优化:通过高效模型结构设计(efficient architecture design),或静态/动态地减少模型层级冗余(redundancy reduction),以提升推理效率; 1. 系统级优化:在不改变模型计算图(computation graph)的前提下,优化推理引擎或部署系统(inference engine / serving system),以提升整体性能。
我们将依次讲解各类别的代表性方法,每个子类别选择一至三个典型方案作为实例,深入剖析其设计逻辑以及所针对的主要低效因素。最后,教程将以若干实机演示、核心要点总结以及未来研究方向展望作为收尾,为听众提供全面的理解与启发。 https://haolibai.github.io/emnlp-2025-tutorial-efficiency/
人工智能(AI)近来在政策与学术讨论中既作为战略资产,也作为现代战争中复杂的伦理困境出现。它可能重塑军事能力,并重新定义必要的人类参与程度。AI对于自主武器系统(AWS)尤为关键,因为其日益增长的复杂性和能力要求重新审视机器自主性与人类决策之间的平衡。这些创新和新兴军事能力的核心,在于人类控制的程度或缺失所引发的不确定性。
为寻求这种平衡,“有意义的人类控制”(MHC)概念应需而生,它提供了一个框架来重新思考和界定人类在关键且时间敏感的决策中的参与。随着各国探索军事AI的潜力和实际应用,MHC已成为规范自主武器系统的核心焦点。然而,MHC的理念因其模糊性、有限的实际应用以及缺乏全球共识而存在显著挑战。尽管如此,它所代表的核心问题——人类决策在部署自主武器系统中的作用——对于AI和自主系统在军事行动中安全且合法的整合至关重要,无论使用何种术语。尽管学术界在MHC的概念化方面付出了巨大努力,但仍有大量工作有待完成。
推进人类控制在自主系统中的实际应用,需要仔细审视决策者及其在武器系统整个生命周期中所做的决策。许多参与者参与到武器系统的概念化、设计、开发、采购、部署和处置过程中,他们对于自主武器系统关键功能的重要性各不相同。识别和分析这些关键参与者并理解他们的角色,对于绘制人类参与、能力及潜在控制的网络至关重要。
本文是朝此方向迈出的一步。它是一个三部分系列文章的第三篇,该系列审视了在AI赋能的自主武器系统生命周期内人类控制的实际运作及其影响。
该系列文章审视自主武器系统(AWS)的生命周期,以理解关键决策者是谁,以及做出了哪些决策,从而评估人类控制如何能被整合到自主武器系统中。系列中的每篇文章探讨一个特定的生命周期阶段。第一篇文章探讨了在自主武器系统设计与开发阶段所做的决策,以审视软件开发者和工程师如何利用人类判断来建立机器学习模型内的参数。第二篇文章讨论了指挥官的角色和功能,以及通过确立自主武器系统适当使用的参数来嵌入人类判断的途径。这第三篇文章探讨了操作员作为人类控制关键代理人的角色和功能,包括监督自主武器系统所固有的认知挑战,以及操作员在战斗环境中运用人类判断操作自主武器系统的机会。
操作员始终处于人类控制讨论的中心。全球政策论坛,例如联合国致命自主武器系统政府专家组,已广泛考量了在国家和国际层面概念化和实施自主武器系统人类控制框架所面临的挑战。操作员在这些辩论中扮演关键角色,因为从历史上看,他们是人类控制存在于常规武器中的执行者。因此,历史上沿OODA循环(观察、调整、决策、行动)存在的操作员,直观地代表了在AI背景下有能力维持“控制”的人类。然而,正如本文详细阐述的,这种人类控制的愿景存在固有风险。清晰认识操作员在自主武器系统中的局限性和现实功能至关重要。
对操作员角色进行重新审视的部分原因在于本文所考察的自主武器类型。本系列考察的是AI赋能的自主武器,特别是那些具备“边缘学习”能力的系统,即系统能在操作环境中学习并优化。AI赋能的自主武器在质上的不同在于其“让武器决策”的能力。本系列文章仅关注具备边缘学习能力、且在观察-调整-决策-行动(OODA)循环的任何阶段均无需人工干预的武器系统。此类武器系统尚未(但)存在。然而,这些系统代表了一种人类控制程度最低的场景,并且是MHC支持者试图预防的场景。确实,部署这些假设性的武器系统存在重大关切,尤其是在边缘操作。然而,有必要承认,机器学习和边缘能力正在快速发展,这些武器系统可能不会永远是虚构的。在仍有机会吸纳基于研究的见解并制定全面且负责任的自主武器系统政策和实践之时,针对这种形式的自主武器系统提出关于人类判断与控制的作用和能力的复杂问题,是至关重要的。
本文后续安排如下。首先,详细阐述围绕人类控制与自主武器系统的关切、挑战和机遇的轮廓与辩论。其次,论证生命周期视角展示了关键决策者将人类判断嵌入自主武器系统的过程。通过更深入地探究参与未来自主武器系统开发与部署的“众多人类参与者”,研究人员可以理解更大的人类控制网络,该网络能为实施人类控制以及最终实现安全、合法和负责任的自主武器系统提供更佳的政策和实践信息。第三,详细说明操作员控制自主武器系统所特有的固有挑战,包括决策速度过快超出人类认知能力、决策过慢无法吸引人类认知参与,以及其他可能抑制操作员最佳表现或损害人类控制的认知偏差。第四,提出一个操作员功能框架,以提供对已部署自主武器系统中运用的操作员判断的现实看法。该框架包括操作员在作战环境中引导、观察和终止自主武器系统的角色。这些角色不同于先前描述的指挥官和软件开发者的角色,因而是操作员特有的功能。第五,本文进一步阐述了认识到人类控制网络的重要性对于未来政策制定者的关键性,因为AI能力持续创新,并且拥有自主武器系统的未来正变得越来越可能。
美空军部在采用大语言模型(LLM)时面临独特挑战。商用模型通常缺乏支持空军人员所需的领域专业知识,因为这些信息并未内置其中。为保持竞争优势,集成大语言模型以提升效率与决策能力已成为关键优先事项。本报告探讨两种创新方法,旨在将领域知识更有效地融入语言模型并提升相关信息发现能力。其一是实体图谱持续预训练技术,通过持续训练将专业知识嵌入语言模型;其二是GFM-RAG图谱检索增强生成框架,这是一种改进多跳检索与复杂信息连接的知识检索与合成新方法。通过定量与定性评估,衡量了它们对检索精度与响应相关性的影响。研究结果表明,这些定制化方法在简化信息获取、改进决策支持、更好满足空军部作战需求方面具有显著潜力。
人工智能融入军事作业的呼声不断高涨。然而,尽管商用大语言模型潜力巨大,但其处理涉密信息与适应特殊领域的能力不足,制约了在政府部门的推广应用。
美空军部非密级大语言模型(NIPRGPT)计划标志着国防部采纳该技术的重要进展。尽管如此,挑战依然存在,特别是满足各美国防部机构对细分领域定制模型日益增长的需求。这类模型将支持高智能体在垂直领域运作,为用户提供更精准的信息服务。
图1:NIPRGPT团队接收的定制化模型需求
传统的检索增强生成(RAG)方法通过外接文档检索增强大语言模型能力来应对这些挑战。但现有检索增强生成方案存在多重局限,包括多跳检索困难、数据稀疏性问题以及新信息合成复杂性。这些缺陷制约了大语言模型满足国防作战场景化需求的能力。
本研究评估两种方法论——实体图谱持续预训练与GFM图谱检索增强生成框架,通过将领域知识注入大语言模型,以提升其在空军作战环境中的性能。通过将这些框架应用于空军文档语料库,我们评估了其在检索精度、响应相关性和复杂信息合成方面的影响。初步结果表明,这些方法在专业任务的信息获取、决策支持和领域适应方面具有显著的提升潜力。
新技术的出现及军事能力——尤其是在人工智能(AI)和自主武器系统(AWS)方面——的核心挑战和关切点在于人类控制,或者说控制的缺失。AI在现代战争中既作为战略资产,也作为重大的伦理挑战,持续出现在政策和学术讨论中,它有可能重塑军事能力的边界,并重新审视人类参与的程度和要求。这一点在AWS的语境中最为关键,因为其日益增长的复杂性迫切需要深入审视机器自主性与人类决策者的角色及要求之间的平衡。
为追求这一平衡,"有意义的人类控制"(MHC)概念应运而生。这是一个源于必要性而产生的概念,并提供了一个平台来重新审视和界定人类在关键且时间敏感的决策中的参与范围。随着各国努力应对新兴军事AI的潜力和实际问题,MHC已成为AWS监管的一个决定性特征。然而,MHC作为一个概念和术语,因其模糊性、缺乏实践以及全球共识的缺失而存在重大障碍。尽管如此,MHC所代表的核心关切——即人类决策在AWS部署中的作用——对于负责任且合法地将AI和自主性整合到军事系统和流程中至关重要,无论使用什么术语。尽管学术界努力推动议程朝着MHC的概念化方向发展,其中许多努力是富有成效且必要的,但仍有大量工作有待完成。
为了在自主系统中切实推进人类控制的实际实现,需要仔细审慎地审视决策者是谁,以及他们在武器系统整个生命周期中做出哪些决策。从概念化、设计、开发、采购、部署到处置,有许多人参与到一个武器系统的过程中,其中对于与AWS性能最相关的关键功能而言,某些角色的决策比其他角色更为重要。然而,识别和审视这些关键参与者并理解他们的角色,对于绘制人类参与、人类能力以及(潜在的)人类控制的网络是必要的。
本文是三部分系列文章的第一篇,该系列解构武器系统生命周期的各个阶段,以特别探讨在三个阶段做出的关键决策:设计与开发、作战部署和战术接战。审视每个阶段有助于更好地理解谁在做出这些决策、这些决策是什么、这些决策在何时做出,以及这些决策对武器系统性能的总体影响。这对AWS来说尤为关键,因为正如本系列将展示的,人类的决策和判断以多种方式与自主系统互动,并被嵌入到AWS中。任何对人类控制及其后续法律和政策影响的严谨探讨,都必须首先考虑哪些决策塑造和定义了系统的开发与部署、这些决策如何直接关系到系统性能,以及这些决策如何像拼图一样,共同构成一幅关于人类在这种尖端能力中所扮演角色和能力的更大叙事。本系列文章正是朝着这个目标迈出的一步。
生命周期框架通常包括六个阶段:设计/开发、测试与评估、生产与采购、作战部署、处置以及使用后审查。人类控制可能在任何一个阶段丧失或被利用,这就是为什么更深入地考虑这个时间线至关重要。
虽然这个有限的系列只考察三个阶段,但这当然不是详尽无遗的。要全面理解生命周期每个阶段的人类参与和控制,还需要做更多的工作。本系列从作战和战术两个角度考察设计与开发以及作战部署阶段。然而,本文专门讨论第一阶段:设计与开发。
在评估人类控制时,仅关注机器学习系统,因为这些系统代表了大多数专家认为的人类控制程度最低的场景。以此方式,机器学习自主武器将代表实现MHC最具挑战性的案例。因此,这第一篇文章探讨设计/开发阶段,特别是多个机器学习过程,以及机器学习设计者、开发人员和工程师在创建这些模型时所做的决策。这展示了人类决策和参与在开发机器学习模型中的范围和潜力,从而说明人类判断如何能够体现并嵌入到机器学习AWS中。
本系列的第二篇文章将考察指挥官在作战规划过程中的决策,以此作为人类控制的一种体现。这包括对作战背景、进攻与防御规划以及法律问题的考量。从根本上说,它探讨了指挥官在规划阶段的决策,并详细说明了这些决策如何构成武器系统生命周期中的有意义的人类控制或嵌入式人类判断。
第三篇文章考察最常与MHC关联的阶段:负责使用AWS的操作员的决策。这是一个需要考虑的关键阶段,因为通常认为MHC存在于此处,或者说在AWS部署中MHC理应存在于此处。该文章探讨了那些现存的论点,并最终论证作战使用阶段本身不足以体现MHC或适当的人类判断,因为其范围极其有限;相反,它仅仅是更大的人类控制网络中的一部分。
本系列旨在证明,在机器学习自主武器系统的背景下,人类判断是由许多利益相关者在生命周期的许多阶段嵌入的。只有从整体上看,才能充分理解这个作为生命周期天然组成部分的人类判断网络。这并不是说AWS的开发或部署中没有剩余的法律关切或伦理挑战了——远非如此。相反,目标是敦促学术研究人员和政策制定者拓宽人类控制的范围,朝着一个整体或全面的图景发展,即理解自主系统是如何开发的、机器学习模型的能力是什么,以及整合这种新能力可能克服或新引入哪些法律和作战挑战。其他学者也曾主张拓宽关于新兴技术和人类角色的范围,但通常是为了将MHC问题扩展到武器语境之外,并探讨人类控制对于非武器化的军事AI系统(如用于目标选定周期的决策支持系统)同样复杂的情况。然而,更深入地探讨武器讨论,追踪人类控制在特定生命周期阶段如何被具体实现,以说明不同阶段的不同行动者如何为一个更大的人类控制网络做出贡献。简而言之,需要先拉近镜头审视决策者,然后才能拉远镜头以全面理解人类控制网络,并恰当地利用或规范它。
由于人类控制的理念仍然是学术界和政策界关于AWS讨论和辩论的核心,并且各国正试图实施人类控制的框架(例如澳大利亚和美国),因此认识到哪些因素和哪些人与实际且全面地理解人类控制相关,是至关重要的。
值得注意的是,在围绕AWS和人类控制的持续讨论和辩论中,存在许多各学科和对话之间相互错失交集的机会。这一领域充满了对AI或机器学习能力的误解,使用着不同的AWS定义,或者缺乏必要的技术知识来理解这种新兴技术及其军事应用所涉及的风险。本系列也旨在为关于这一关键问题的法律、作战和技术讨论与分析提供一个公平的竞争环境。跨学科的参与和知识交流对于更广泛地培育任何未来自主武器系统或军事AI的负责任和合法的整合至关重要。技术、法律和作战上的必要性在军事AI和自主武器的发展中紧密相连,这些文章并没有忽视这种复杂性,而是直接应对它。
作为三部分系列的第一篇,本文后续结构如下。首先,有必要理解有意义的人类控制(MHC)这一概念,其在政治领域的演变,以及制定或实施此类概念所面临的实际挑战。这包括简要描述各国围绕人类对AWS控制的立场,以及从技术、政策和军事角度选择合适术语所面临的挑战。
其次,借鉴那些应对人类在自主性之中及之上控制挑战的学科,本文探讨一个"嵌入式人类判断"的框架,以捕捉各学科在应对自主性中人类控制挑战时的共同点。
第三,本文讨论了国际法在MHC领域的相关性,并考量是否存在关于最低限度人类参与标准的法律要求。
第四,本文详细介绍了现代机器学习过程——它们是什么以及能做什么——以评估人类在当代机器学习模型设计和开发中的作用。
第五,本文考察了人类判断如何通过三个早期的设计和开发过程被嵌入到AWS中。这三个过程包括围绕训练数据、创建软件架构和设计系统界面的过程。目的并非详尽无遗地列出人类判断可能被嵌入AWS的所有途径,而是通过一些非技术受众可能不熟悉的例子,来审视这些决策以及做出这些决策的关键参与者。这有助于就该人类控制问题进行更细致、更知情的研究和参与。
为大规模军事行动制定有效的行动方案(COA)是军事决策流程(MDMP)中资源密集、耗时且关键的一环。当前的指挥控制(C2)流程主要依赖人工、速度缓慢,并在作战节奏加速、复杂性增加及对手能够快速利用机会窗口的背景下面临挑战。为此,推出COA-GPT 2.0,这是一种先进的代理式人工智能(AI)规划助手,它利用多模态大语言模型(LLM)、专用外部工具及人类专业知识,在军事决策流程期间快速支持指挥控制规划参谋,显著简化任务规划。本报告概述了COA-GPT 2.0的当前能力,呈现了军事主题专家(SME)对其军事决策流程产出物的评估,并明确了实现指挥所(CP)在精简人员编制下仍保持强大分析能力的前进路径。开发COA-GPT 2.0的目标是加速军事规划流程,同时使指挥官在压缩的决策时间线下保持决策优势,能够动态调整作战计划以应对新出现的威胁和不断变化的战场环境,适应现今及近未来复杂多域战场。
军事行动中行动方案(COA)的制定是营、旅、师、军及战区陆军层级的指挥官及其参谋面临的最关键和复杂的规划挑战之一。在这些较高指挥层级,军事决策流程(MDMP)作为条令框架构建了这一复杂的规划工作。该流程有意融入了多人性化特征,如重复性、多形式沟通和群体构思,以确保指挥官及其参谋形成足够的态势理解,从而维持在下级梯队于复杂多域作战空间行动时的努力统一。传统的军事决策流程方法需要大量的参谋资源、跨多个作战职能领域的专业知识以及显著的时间投入,以生成在可行性、适用性、可接受性和独特性之间取得平衡的可行行动方案选项——所有这些都在高压环境下进行,决策影响着数千名士兵,并可能决定广阔作战区域的任务成败,甚至可能涉及建议动用关键的国防和战略威慑能力。
然而,新出现的战场现实正迅速超越传统军事决策流程方法在所有层级上那种审慎的节奏。自主系统的激增、无处不在的传感器、人工智能(AI)和先进数据分析正在急剧加速作战节奏,同时使信息量和速度呈指数级增长。未来的多域作战将呈现转瞬即逝的机会窗口,这些窗口可能仅存在几分钟而非数小时或数天——这是通过耗时规划周期无法利用的窗口。此外,采用先进反介入/区域拒止(A2AD)能力的复杂对手将制造 contested 电磁环境,其中通信的拒止、降级、间歇与受限(DDIL)成为常态,而精准远程火力日益威胁大型静态指挥所(CP),驱动了对敏捷机动指挥节点的需求。通过COA-GPT 2.0应对这些挑战,这是一个代理式AI赋能的规划助手,它利用最新的生成式AI能力对大量数据进行推理,从而加速规划流程和行动方案生成。COA-GPT 1.0 [7]是第一代使用大语言模型(LLM)进行快速行动方案开发的生成式AI系统,在其第二次迭代中已取得实质性演进。与专注于使用单一LLM生成简单行动方案的COA-GPT 1.0不同,当前系统通过集成的多智能体架构全面支持所有军事决策流程步骤,生成全套条令规划产物,同时保持人工监督。
设想COA-GPT作为任务指挥信息系统内的智能助手,在数据输入和人类参谋之间充当中间层。通过由军事主题专家调优的多模态LLM承担常规数据处理和文件起草任务,规划人员可以专注于高阶分析和与指挥官的互动。受先前方法的启发,也旨在提供一个平台,让战争的科学由计算机处理,而战争的艺术仍保留在人类判断的领域,从而在保持军事指挥必要人性化要素的同时,提高决策的速度和质量。
图1:用于军事规划的分布式COA-GPT架构,根据不同指挥所(CP)的层级和可用连接性,同时利用本地和基于云端的大语言模型(LLM)。 该示意图展示了与驻地任务指挥(HSMC)及国家级数据库的集成,以及不同类型的指挥所:主指挥所(Main CP)、战术指挥所(TAC CP)、后方指挥所(Rear CP)、主指挥所/主要备用指挥所(MCP PACP)以及机动指挥组(CMD GRP)。
拟议的高层架构(如图1所示)是一个分布式生态系统,其中COA-GPT实例部署于各个指挥层级。这些实例之间的关键架构差异在于它们所采用的底层大语言模型(LLM)技术,这取决于其作战环境。在连接稳定的层级,COA-GPT可以利用最先进的基于云的LLM。这使得它们能够直接与国家层级数据库交互,并执行复杂的大规模数据合成以支持战略级规划。
图2:COA-GPT用于任务规划的多智能体生态系统,展示了自动化规划智能体、数据分析、模拟、规划参谋和指挥官之间的相互作用。
相反,部署在战场内的指挥层级则在通信拒止、降级、间歇与受限(DDIL)的假设下运作。对于这些单位(包括从军到旅级的各种指挥所(CP)),连接云端的可靠性无法保证,甚至由于电磁(EM)辐射担忧而不被期望。因此,这些层级配备了运行在自包含本地LLM上的COA-GPT实例。这一关键设计选择确保了每个指挥所都拥有有韧性的、独立的人工智能助手,在规划与决策支持方面保持完全功能,不受连接性影响。
图2说明了每个COA-GPT实例的多智能体生态系统,它协调自动化规划智能体、数据分析、模拟、规划参谋和指挥官以执行军事决策流程。与单一的LLM解决方案不同,COA-GPT采用多个专用智能体,以层级化、角色专门化的组织方式运作,镜像了军事规划参谋的职能。通过此集成规划架构,系统全面支持所有军事决策流程的步骤和子步骤,对军事规划中常见的大量非结构化数据进行推理,以生成高保真的产物和建议。
任务规划的初始阶段涉及摄取任务相关文档,这些文档通常以各种格式分发,如PDF、Microsoft Office文件(例如Word、PowerPoint、Excel)、GeoJSON和KML文件。COA-GPT的第一个组件是一个专门的数据解析器智能体,旨在应对这一挑战。该智能体从这些不同来源提取所有相关信息,并将非结构化的任务数据转换为标准化的结构格式。这一基础步骤对于确保数据一致性以供COA-GPT及其核心和专用智能体进行后续分析至关重要。在此摄取过程中,系统还会自动识别并标记所提供文档中的潜在差异,向规划参谋警示任何不一致之处。
COA-GPT的知识库还通过条令和历史数据得到增强。为提供条令背景,我们开发了一个军事检索增强生成(RAG)数据库,其中包含来自陆军出版局(APD)和其他可靠来源的大量出版物。对于历史背景,所有用户反馈和与COA-GPT的交互都会被存储,并在适用情况下用于未来任务的规划。在整个规划过程中,指挥控制规划参谋或指挥官还可以通过图形用户界面(GUI)上传额外的任务和想定相关文档。
系统在整个军事决策流程中产生全面的规划产物,包括敌我行动方案、同步矩阵、预警与作战命令、任务简报以及其他条令输出。一个专门的地理空间智能体从地图图像执行地形分析,而系统则维护运行评估并为任务执行生成最终战斗产物。系统还执行音频分析,并作为一个全面的数据管理系统,维护通用作战图(COP)并为任务执行生成最终战斗产物。这种集成方法确保所有规划要素保持同步,同时承担常规数据处理和文件起草任务,使人类规划人员能够专注于高阶分析和与指挥官的互动。
在此工作流下,规划参谋使用COA-GPT来摄取和分析任务文档,然后为军事决策流程每个规划步骤所需的条令产物生成初稿。COA-GPT使用其主规划智能体并结合我们军事数据集的RAG来生成初始的军事决策流程输出和产物。RAG系统确保这些初始产物基于军事条令和可用的任务数据。这些输出随后被发送到一个独立的评审员智能体,其职责是根据条令和主题专家 informed 的特定标准对主规划智能体进行批判并提供反馈。主规划智能体利用评审员提供的反馈生成修订后的输出,根据我们的经验,这些输出相比原始输出有显著改进。此迭代工作流可以重复进行以提高精炼度并产生更高质量的结果,但代价是额外的时间和计算资源。在规划过程中,主规划智能体会定期指派其他更专业的智能体执行各种军事决策流程任务。这些基于特殊角色或陆军作战职能的专用智能体,在军事决策流程的不同步骤和子步骤中被调用,具体取决于COA-GPT正在执行的规划任务类型。
为完成规划周期,COA-GPT促进行动方案分析与比较。一旦制定完成,行动方案被发送到模拟器进行兵棋推演并生成详细的性能指标。这些结果随后反馈给COA-GPT,由它呈现比较分析供参谋和指挥官评估。基于这些指标,指挥官可以批准一个行动方案,或者参谋可以提供反馈以修改行动方案并在模拟器中重新分析。最终行动方案选定后,COA-GPT协助规划参谋生成用于任务执行的最终命令,从而支持从初始数据摄取到命令生成的整个军事决策流程。
在规划过程的任何时刻,指挥控制参谋都可以在批准前检查并/或细化生成的军事决策流程产物,确保决策权和军事判断力保留在人类手中。此外,我们的系统由LLM驱动的一个关键优势是,规划参谋或指挥官可以直接指导或向COA-GPT下达指南,系统将根据该反馈细化其输出。COA-GPT的多智能体架构允许规划参谋直接与多个专用LLM和外部工具交互以执行军事决策流程。这种代理式设计镜像了人类军事参谋的结构,由专业参谋处理军事决策流程的不同方面。除了其规划能力,COA-GPT还作为一个全面的数据管理系统,适用于所有任务和条令文档,因为它转换非结构化数据并构建一个包含所有相关规划信息的结构化数据库。COA-GPT还维护一个规划通用作战图(COP)以展示其产物,管理战场条件和资源可用性的运行评估,并生成任务执行所需的最终战斗产物。这种集成方法使所有规划要素在整个军事决策流程中保持一致,为指挥官和参谋提供最新的决策信息,并通过使用陆军已在更高层级采用的相同流程来加速规划。
本文是三部分系列文章的第二篇,该系列探讨自主武器系统(AWS)整个生命周期中的人类控制。本系列旨在理解决策过程并识别关键决策者,以了解人类判断如何被嵌入到自主武器系统的参数中。本系列的每篇文章侧重于生命周期的不同阶段。第一篇文章讨论了软件开发者与设计师在设计与开发阶段的作用和责任。本文着眼于指挥官在与自主武器系统部署相关的决策中的作用。系列第三篇文章将考察在作战环境中部署自主武器系统时操作员的决策。
指挥官在人类控制的讨论中扮演着重要角色,但迄今为止,其角色的特殊性尚未得到充分审视。他们的角色通常在指挥责任这一独立的讨论中被考量,但较少将其作为人类控制的反映或组成部分,放在指挥决策的背景下考量。然而,正如本文所示,指挥官负责自主武器系统部署的关键要素,例如确定自主武器系统可接受的使用参数,并界定其运作的战略和作战环境。现有关于人类控制的研究大多聚焦于软件设计师和开发者及其在创建人工智能系统方面的功能。但指挥官决策是一个重要的连接点,它确立了在适当环境中使用的边界条件,并制定了将最终定义未来自主武器系统使用参数的协议和流程。因此,指挥官对于人类控制的贡献值得更多关注。
本系列第一篇文章考察了围绕自主武器系统的技术、政治和组织发展及演变,指出各国处于不同的技术能力、发展和政策实施水平。同样,各国也拥有不同的指挥结构和决策协议,因此很难涵盖不同武装力量的指挥官在部署自主武器系统时将涉及的所有可能途径。由于这一限制,除非另有说明,本分析的其余部分将主要讨论美国的自主武器系统政策、指挥结构和决策流程。这是因为美国是一个技术先进的国家,目前在军事人工智能领域处于领先地位,并且其自主武器系统政策的公开透明度相对较高。在适用的情况下,本文会纳入其他国家关于指挥决策和自主武器系统的观点或已公开的立场,但重点将主要放在美国。
美国指挥官的决策过程需要进一步澄清。指挥官存在不同层级,每个层级都有其自身的职责。在自主武器系统的背景下,关于不同层级指挥官实施这些新能力的协议存在不确定性。尽管如此,一些工作正在进行中,以解决这些不确定性并澄清每个指挥层级在部署自主武器系统时的角色和责任。本文讨论了三个层级的指挥决策。首先,回顾了美国国防部第3000.09号指令中概述的作战司令部司令的角色和职责。其次,考虑了战区级作战指挥官在制定交战规则(ROE)过程中评估和整合自主武器系统的作用。最后,着眼于战术级指挥官,他们通常对新武器系统拥有最丰富的经验,并负责训练、测试和监督新整合的自主武器系统。正如将进一步讨论的,战术层级很可能负责自主武器系统的维护,包括软件更新,以及处理战区内测试与评估(T&E)和已部署自主武器系统的法律审查所涉及的不确定性。
国家与非国家行为体发动的无人机攻击威胁始终存在且日益增长。无人机(或称无人航空系统)具有成本低廉、可消耗及可组网的特点,能够对军用与民用目标实施多种动能与非动能打击。由于无人机甚至能轻易穿透最坚固的一体化防空体系,各国在保护人员与基础设施免受无人机威胁方面面临严峻挑战。
在此威胁环境下,必须全力发展反无人机系统应对能力,并协助技术能力有限的伙伴进行能力建设与培训。制定反无人机解决方案的关键路径包括:威胁分类归整、经验技术整合、态势研判分析,以及通过训练推演创新战术战法。反制无人机的技术手段已然存在,部分曾遭遇无人机的一线官兵也积累了实战经验。全球范围内具有无人机实战经验或专业研究的军民人员,可为无人机运用与反制策略提供关键见解。
本文深入剖析无人机构成的威胁、美国当前监管环境,以及军民领域现有与潜在的反制措施。尽管反无人机技术对策存在交集,但两类应用场景面临的威胁与应对策略存在显著差异。虽然聚焦美国对无人机的运用与反制,但其中涉及的战法、法规与对策论述,经调整后可适用于其他国家的特定情境。从根本上缓解敌对势力掌握无人机带来的风险,需要全社会各层级的教育协同与协作共治。
美军当前为机动作战部队防范敌方无人机提供的条令支持较为有限。由陆军防空炮兵部队编著的《陆军技术条令(ATP)3.01-81:反无人机系统技术》,旨在提供以下指导:作战中防御低空、慢速、小型无人航空威胁的规划考量,以及将反无人机单兵任务纳入部队训练的实施指南。该条令为旅及以下部队在区域威胁评估包含小型无人机平台时提供规划指引。
正如该条令所表述的,美国陆军并未制定专门的反无人机战术技法规程,而是建议通过任务规划、情报报送与态势感知来应对无人机威胁。美军在作战与安保行动中运用无人机的目的与方法已明确,侦察人员可通过无人机航迹判定敌意图。该条令建议机动作战部队采用通用战术场景下的声光管控措施规避无人机侦测:运用光学与降噪手段削弱装备反光与噪声。例如用泥浆遮盖头灯、使用伪装网消除挡风玻璃反光……避免暴露己方阵地。设置隔音屏障与泡沫衬垫可降低作业设备噪音。
尽管符合战术逻辑,但该条令指南在遭遇无人机时往往难以落实。无人机操作手可快速升空无人机验证可疑敌情,使受侦测部队缺乏反应时间。此类侦察无人机通常配备光学探头,可持续追踪目标直至接获返航指令(或被地面目标摧毁)。因此,无论采用条令推荐的何种隐蔽技术,这类侦察平台仍可能识别目标。
反无人机条令明确指挥官有权依据交战规则采取必要防护措施,并授权单兵在遭遇小型无人机威胁时实施自主反击——这承认了使用直瞄火器打击的技术难度。单兵或小组若以单兵武器系统射击小型无人机,反而易暴露行踪。部分小型无人机时速可达70公里,击中它们更多依靠运气而非战术。条令第44-1-100号任务仅提供“运用全部轻武器(含机枪)对抗空中目标”这一单一战术,实战价值有限。该任务看似简单,但未清空射界即攻击小型无人机,极易造成误伤或附带损害。
该条令初衷虽好,但遗留关键问题未解:指挥官如何在本土军营有效组织反无人机训练?如何规避士兵误射高速无人机风险?城市环境中机动作战部队如何调整反无人机战术?应采用何种火力控制方案有效瘫痪无人机?若无人机已侦获部队行踪,应依据何种要素决策撤退或终止任务?最后,条令如何规范应对无人机群袭击的防御措施?在单架无人机即可导致全军暴露的当下,这些问题至关重要。
关于进攻性作战也涌现出关键问题。 应由何人监督进攻性无人机作战,其监督权限范围如何界定?地面机动部队与协同作战的指挥所之间对无人机视频影像的需求应如何协调?交战规则是否应考虑半自主或全自主无人航空系统(UAS)与友军协同作战的潜在应用?反无人机资产的调用权限归属何方?其使用需遵循哪些冲突规避要求与考量要素?核心关键在于思考如何武装并授权基层作战人员,使其能快速部署单架或多架第1类或第2类无人机。
2023年4月美国国会研究服务处发布的题为《国防部反无人航空系统》的报告体现了国家层面对此议题的关注。该报告为国会审议国防部(DOD)反无人机系统(C-UAS)的研发采购及安全协议提出若干潜在问题:
国防部门对反无人机系统的资金投入是否在研发项目与采购计划间取得适当平衡?国防部门指定反无人机系统执行机构在多大程度上(若存在)减少了采购冗余并提升了效率?国防部门在反无人机系统研发采购方面与国土安全部、司法部、能源部等其他部委机构的协调程度如何?为优化反无人机系统使用和/或与美军其他军事行动实现冲突规避,是否需要调整空域管理、作战概念、交战规则或战术?国防部与联邦航空管理局及国际民用航空机构在识别并减轻反无人机系统作战对民用机构成风险方面的协调程度如何?
战争形态的演变日益聚焦于第一人称视角(FPV)武装无人机的融合,其结合了低成本的可获得性与高精度的杀伤力。本文探讨了FPV战斗飞行的机理、战术角色和心理层面,特别是在高海拔区域(HAA)和控制线(LC)场景下的应用。与先进的无人机和制导弹药不同,FPV无人机在对抗性和GPS拒止环境中为操作员提供了实时手动控制、敏捷性和适应性。研究借鉴了近期冲突(如俄乌战争),重点阐述了FPV无人机在侦察和打击行动中的双重作用,同时也探讨了其局限性,包括有效载荷能力、电子战威胁和极端环境条件。未来的建议强调结构化的训练、部队选拔、AI辅助模拟和战场创新,以提升作战效能。FPV无人机正在重塑现代战争的战术和心理格局,并仍然是未来战斗结果的关键决定因素。
关键词:FPV无人机,战斗飞行,高海拔作战,乌克兰-俄罗斯冲突,无人机战术,电子战,步兵集成,战场创新
随着战争形态的演变,其背后的技术也在发展。自20世纪初以来,对飞行的追求改变了战场动态,如今在第一人称视角(FPV)武装无人机上达到顶峰。这些系统为飞行员提供了鸟瞰视角和无与伦比的敏捷性,使得一度仅属于战斗机飞行员的快速决策和精确打击成为可能。FPV飞行不仅仅是一种工具,更标志着一种战术和心理上的转变(Kozatskyi, 2023),在人机之间建立了近乎本能的连接。其影响在诸如俄乌战争等冲突中尤为明显,其中FPV无人机已被证明在侦察、火力支援和直接攻击敌方资产方面不可或缺(Ibrahim A., 2024)。与传统空中平台不同,这些无人机在对抗环境中表现出色,能够突破常规防空系统,以极高的精确度投送致命载荷。本文审视了FPV战斗飞行的复杂机理、这些无人机在高海拔战争(尤其是在LC场景下)中的战术角色、它们在HAA中面临的作战挑战,以及在现代战争中适应和发展无人机作战日益增长的需求。
FPV无人机和反坦克导弹(ATGM)都遵循飞行的基本原理(即俯仰、横滚、偏航和油门控制),但由于其设计和目的不同,在敏捷性和控制方面差异巨大。反坦克导弹主要遵循预定路径,机动性有限,仅能进行微小的飞行中修正。相比之下,FPV无人机是完全手动的,并利用六自由度(6DOF),允许进行实时、全方位的动态机动。无人机可以急剧调整俯仰角进行俯冲或掠地飞行,横滚以躲避障碍物,偏航以在飞行中重新调整方向,并通过调节油门实现悬停或立即加速。这种高水平的控制赋予FPV无人机显著的战术优势,尤其是在地形复杂且敌方防御需要高度适应性的高海拔环境中。反坦克导弹由于其可预测性而易受主动防护系统攻击,而FPV无人机凭借其不规则的飞行轨迹和实时操控,更难被跟踪或拦截(Ibrahim A., 2024)。此外,无人机更具成本效益,单价仅低于2.5万卢比,而反坦克导弹则需数十万卢比,同时它还提供双重功能——实时侦察和精确打击(Kozatskyi, 2023)。与反坦克导弹不同,它们不受后喷焰、最小射程或固定弹道的限制。能够重新定位、中止任务或从多角度攻击的能力,使得FPV无人机成为现代战争中一种多功能且经济实惠的选择。步兵在手动操控反坦克导弹时早已运用了飞行原理——如今,同样的本能和技能可以无缝转移到FPV无人机操作上。
全谱战争已演变为一个新兴概念,它介于混合战争、不对称战争和非常规战争之间的理论空间,尽管其在认识论领域尚未完全定型。该概念已出现在澳大利亚、美国、俄罗斯和中国的多份军事战略文件中,并逐步融入"全域主导""全谱工具"及"全谱防御"的概念体系。其核心内涵聚焦于突发性、不可预见的态势演变,以及"思考不可思考之事"和"未知的未知"领域中的创新要素。正开展跨学科研究,结合以色列、乌克兰、俄罗斯、美国当前实战案例,构建可操作的定义体系。研究方法包含认识论辨析,提炼全谱战争的独特性与附加值,并通过百科全书式的学术探讨厘清概念本质。
关键词:未知的未知;思考不可思考之事;全谱战争;突发性;不可预见演变
当前国际关系、安全研究和世界秩序的高度不确定性,亟需更完善的分析工具与创新理论框架,以界定和阐释(甚至预判)战略突发状况。前瞻性研究已提出若干要素,我们着重强调"未知的未知"和"思考不可思考之事"的理论价值,同时引入"黑天鹅事件"及相关概念参与学术对话。基于实战演进,本文提出全谱战争概念,其核心在于整合所有军事与非军事手段,甚至包含传统冲突中罕见的腐败、认知操纵、和平时期颠覆等非常规工具。
通过辨析预测学局限与前瞻研究模型,可从认识论层面厘清全谱战争与混合战争、非常规战争、不对称战争、非动能战争等概念的界限。该概念在不同文献中存在释义差异,需系统梳理。本文旨在明确全谱战争的核心特征,构建可用于安全研究的理论框架。
研究方法包含认识论辩论、特征提取与概念价值评估,并通过全景式学术探讨深化理解。聚焦突发性、未知的未知和思考不可思考之事三大维度,可精准界定全谱战争的适用场域,论证各类工具创造战略突袭(包括单次打击)的可行性。全谱攻防体系要求所有工具的协同整合,这也构成概念的重要内涵,体现了21世纪冲突演进的特征。
从概念定义(及其演变)、关联概念和官方文献三个层面构建理论体系,进而解构核心特征并提出操作定义,最后辨析与相似概念的关联性及本体论差异。全谱战争与全谱防御存在直接关联,后者要求抵御前者所有要素的冲击;而全域主导权则体现为对全谱战争各组成部分的防护、预防、反应与清除能力。
全谱战争不仅是多种应对工具的简单叠加,更强调建立统一的指挥控制体系、协同规划机制及预警感应网络,以应对跨频谱同步协调的复合攻击。其本质在于实现对抗手段的集成化协调,而非针对不同攻击频谱采取分散应对。
现有理论对全谱战争有多重解读:有观点认为其涵盖混合行为体可调用的国家军事/非军事力量与秘密行动谱系;美军将其"全域主导"定义为通过尖端战争机器实现对陆、海、空、天物理域的控制;该术语更深层指向人类安全的球形维度——安全即构建抵御外患的防护穹顶,而军事防护的终极形态正是通过间谍卫星和轨道武器掌控外太空。
对美军而言,全域主导是控制陆、海、空、天、网乃至心理空间的军事野心,其终极目标是在从常规战争到非常规战争的整个频谱保持绝对优势。该术语在克林顿时期指代从和平到常规战争的冲突阶段,要求具备全谱常规作战能力。拉姆斯菲尔德时期强调发展应对多元威胁的军事能力组合,规划覆盖所有潜在冲突类型的制胜方案,后更聚焦反恐和非常规战争领域。
澳大利亚的多域防御战略主张结合技术优势,依托通信、情报和天基能力构建五域一体防务体系,要求应对来自陆、海、空、天、网的多元军事威胁。俄罗斯虽理论建构较少,但实践了涵盖军事、信息、经济、能源频谱及政治影响行动的全谱冲突,有学者据此提出统合暴力/非暴力手段、贯穿和平至战争全强度谱系的冲突概念,强调需要中央统一指挥实现政治目标——若严格限定战争定义,诸如粮食制裁和偏见新闻传播等手段则不被纳入。
本研究探讨将大语言模型(LLM)整合到航空航天防御系统工程项目中,以实现两个关键流程的自动化:通过系统理论过程分析(STPA)获取需求,以及为航空航天防御系统需求分配合规方法(MoC)。其动机在于应对传统方法劳动密集且易出错的问题,这些方法高度依赖人工专业知识。该研究专门评估了在先进提示词工程技术和微调方法指导下的LLM(例如GPT-3.5和GPT-4)的可行性和性能。这些方法旨在达到或超越该领域专家通常实现的准确性和质量。所研究的问题是手动需求工程和合规流程的低效性和多变性,由于航空航天防御系统对安全性和可靠性有严格要求,这些问题在该领域尤为关键。研究以一个假设的“无人作战飞行器”(UCAV)作为案例,并将研究置于巴西空军(FAB)的背景下,因为这些挑战在该背景下尤为突出。该方法涉及通过定制的提示词自动化STPA的第一阶段以生成系统需求,并训练一个微调模型以准确分配合规方法。其性能以真实系统数据和领域专家的输出作为基准进行衡量。研究结果强调,经提示词工程指导的LLM能够生成满足或超越九项已评估质量属性中八项的需求,这些属性包括可测试性、完整性、清晰性和可修改性。微调后的“gpt-3.5-turbo”模型在合规方法分配任务中达到了80.18%的准确率。最后,借助适当的技术,能够从真实产品的技术文档生成初步危险分析(PHA)等安全评估报告。这项研究的意义深远。通过简化需求获取、合规方法分配和工程报告生成,LLM减少了相关工程流程的时间、人力和成本,同时保持了高度的严谨性和可靠性。这项工作增进了学术界对LLM在安全关键系统中应用的理解,引入了一个可扩展、可复制的框架用于将LLM集成到工程工作流中,并为航空航天防御行业提供了实用工具。
本文共分为七章:
第一章介绍研究主题,提供全面的背景知识,将研究置于当前学术和工业界图景中进行背景阐述,并确立其重要性。清晰阐述了研究问题,随后提出了旨在验证该假设的假设和具体研究目标。本章还探讨了人工智能应用在我们社会中的更广泛影响。
第二章提出理论框架,简要概述与本研究相关的关键概念。本章作为基础,涵盖了系统理论过程分析(STPA)、大语言模型(LLM)、提示词工程以及航空航天防御系统中的自动化合规性等基本主题,从而使读者具备必要的理论背景。
第三章包含文献综述,批判性分析了该领域近期的研究成果,并将本研究置于航空航天自动合规性与安全分析学术进展的更广阔图景中。本章重点指出了现有文献的贡献与不足,从而强调了本研究的原创性和必要性。
第四章详述了为实现第一章概述的研究目标所采用的方法论。它描述了具体技术,包括使用既定的提示词工程技术进行STPA分析,以及用于自动化合规方法(MoC)分配的微调过程,并解释了这些技术与研究目标的一致性。
第五章展示研究成果。本章批判性地审视了所遇到的局限性,探讨了基于人工智能的自动化技术的潜在影响,并验证了第四章所采用的方法论。
最后,第六章对全文进行总结,概括了本研究在该领域的贡献和意义。本章反思了研究目标在多大程度上得以实现,并为未来在航空航天防御系统中应用人工智能驱动的分析与合规性方面的潜在工作提供了见解。
通过这种结构化的组织,本论文旨在提供一个全面且连贯的论述,引导读者从基础理论和文献到实践方法、结果,以及对研究更广泛影响的思考。
大规模优化领域最持久的挑战之一在于如何突破可扩展性边界,同时不牺牲性能或严谨性。数十年来,计算能力的指数级增长提供了直接解决方案:更庞大的问题可由更强大的机器处理。然而近年来,单纯依靠算力已难以应对实际应用日益增长的复杂性与规模,这一趋势日益明显。此外,尽管通用线性与整数优化方法取得显著成功,但这些方法在涉及复杂动态、高维特性或需细粒度序列决策的领域仍面临挑战。由此引出关键问题:能否设计可扩展性更优的新型优化方法?本文提出融合动态规划、强化学习与列生成的实践路径,以应对多场景需求。首先在强化学习与动态规划框架内开发并完善方法论体系,继而拓展至列生成的应用实践,最终展示如何通过技术融合赋能基础机器学习方法,实现大规模优化目标。
第二章:探讨强化学习与博弈求解在扑克游戏中的应用。通过引入新颖的紧凑型扑克特征表征及全局最优决策树,解决状态空间表征问题并避免黑箱方法。本章将反事实遗憾最小化与上述技术结合,构建了可解释扑克智能体,其性能超越原世界冠军智能体Slumbot。
第三章:介绍动态规划求解超大规模问题的方法,并将其应用于广受欢迎的文字游戏Wordle。推导该游戏的数学模型及对应的贝尔曼方程,引入深度受限搜索与剪枝等优化技术,实现算法的大规模扩展以求解游戏。最终确定SALET为最优起始词,并证明最优策略最多使用5次猜测即可获胜——超越所有现有近似方法。
第四章:引入列生成与分支定价优化方法,在秒级时间内求解超大规模武器目标分配问题。将广义分配问题重构为适用于该方法的形式,并推导高效算法求解分支定价的各个组件。实验结果表明,相较现有方法实现多个数量级的加速。
第五章:将前几章开发的优化方法扩展至最优决策树训练领域。提出新颖的问题松弛形式,采用列生成与分支定价进行求解,并运用早期章节开发的动态规划方法高效处理分支定价的各个组件。将该方法推广至回归问题、广义损失函数及集成学习技术。实验证明相较现有方法实现数量级加速,且样本外性能超越传统方法,最终验证了该方法的优势。
第六章:将前述优化技术扩展至K均值聚类问题的最优求解。提出基于指数级规模公式的分支定价框架,包含可扩展求解器初始化策略与高效分支定界管理。针对定价问题提出创新的基于图的重构方法,显著降低计算复杂度,消除对数据维度的传统指数级依赖。通过将该方法扩展至k中心点聚类、鲁棒聚类变体,以及稠密子图、团优化等图挖掘问题,验证其广泛适用性。跨数据集综合实验表明,相较现有方法运行时间提升1-3个数量级,最优解相比启发式方法具有显著性能优势,验证了整体方法的鲁棒性与通用性。
第七章:总结本论文的核心贡献并给出结论性评述。
本文探讨了元宇宙对军事行动的变革性影响,重点聚焦于虚拟现实(VR)和增强现实(AR)技术如何彻底改变国防领域内的训练、通信与技术发展。元宇宙能够在无风险的虚拟环境中实现对战斗场景和军事行动的高度逼真模拟,从而提升决策能力与作战效能。它促进了地理上分散的人员之间的实时通信与协同,并为知情的战略规划提供详细的地形与资源分析。此外,元宇宙可作为先进军事技术的试验场,允许进行部署前的调整。案例研究,例如VR飞行员培训和指挥系统模拟,突显了其在提高训练成果和降低成本方面的有效性。
元宇宙是一个融合了虚拟现实(VR)、增强现实(AR)和混合现实(MR)的广阔虚拟环境,它正通过应对训练、通信和技术发展方面的关键挑战来重塑军事领域。这种沉浸式技术为逼真模拟提供了一个安全的互动空间,使军事人员能够练习和完善其技能,而无需承担与传统方法相关的风险和成本。适当的安全级别至关重要,因为过高的安全级别会导致额外的运营成本和/或功能缩减,而过低的安全级别则会导致用户不信任且不使用该系统(Dumitrache & Sandu, 2020)。在训练方面,元宇宙能够创建详细的战斗场景,士兵和指挥官可以在其中安全地演练战术机动和决策。它通过促进地理上分散的部队之间的实时互动来增强沟通与协作,从而改善协调与决策。此外,元宇宙可作为测试和开发新军事技术的平台,加速其在现实世界部署前的评估与完善。本章探讨了元宇宙对军事实践的变革性影响,重点阐述了其在提高效率、降低成本和增强作战效能方面的潜力。
元宇宙,这种扩展的、交互式的虚拟现实,近年来已成为众多领域广泛讨论和研究的话题。这项创新已引起IT行业、视频游戏、教育、医学、艺术、社交以及军事领域的关注。元宇宙发展历程中的一个关键时刻是迈克尔·齐达(Michael Zyda)于2000年代初在加州大学洛杉矶分校(UCLA)创立了第一个虚拟现实(VR)学术项目。该项目在为学生进入虚拟现实和模拟领域做准备方面发挥了开创性作用(Zyda, 2005a)。与此同时,阿尔伯特·里佐(Albert Rizzo)因其在利用虚拟现实治疗军人创伤后应激障碍(PTSD)方面的研究而闻名(Rizzo等人, 2017)。贝琳达·兰格(Belinda Lange)在军事训练和治疗的VR应用研究与开发方面做出了重大贡献,尤其侧重于压力和焦虑管理(Rizzo等人, 2011)。在同一背景下,谢里尔·布拉纳姆(Sheryl Brahnam)在人机交互和虚拟现实领域进行了显著的研究,并在军事背景下具有相关应用(Brahnam & Lakhmi, 2011)。
本文旨在审视元宇宙对军事研究与发展的影响,重点关注VR和AR技术如何有助于优化设计与测试流程、提高作战效能以及降低成本。通过研究这些方面,本文试图强调元宇宙在军事背景下的变革性益处,并全面理解其应用。
为引导读者,本文结构如下:第2节探讨元宇宙在军事领域的应用,包括其在训练、通信、分析和技术发展中的作用。第3节考察军事靶场上的虚拟训练与模拟,详述其演变和实际应用。第4节评估VR和AR技术对军事训练的影响,重点关注绩效评估、效能和成本降低。第5节讨论元宇宙在战场分析和决策中的作用,强调其对战术和战略规划的贡献。第6节深入探讨元宇宙内的研发工作,分析虚拟环境如何支持军事创新和技术测试。最后,第7节总结关键发现并反思元宇宙在军事研发中的未来潜力。这种结构化的方法旨在对元宇宙在军事实践的影响及其未来意义提供透彻的分析。
军事领域的元宇宙
元宇宙在军事背景下代表了一个充满前景的视角,它提供了一个扩展的、交互式的虚拟环境,可以改变军事人员与指挥官的互动、训练和实时决策方式。下文重点介绍了元宇宙在军事领域影响力的一些关键方面(Fawkes & Cheshire, 2019):
训练与模拟:元宇宙允许对战斗场景和军事行动进行逼真模拟。这种安全的虚拟环境为士兵和指挥官提供了训练和做出关键决策的机会,而无需危及生命或损耗昂贵的装备(Easley, 2022; Hajjami & Park, 2023)。
通信与协作:通过促进地理上分散的军事人员与指挥官之间的实时通信与协作,元宇宙优化了危急情况下的信息快速交换、行动协调和高效决策。获取更新信息和协调行动变得更为有效(Zhang等人, 2023)。
分析与规划:在军事行动前使用元宇宙对地形、目标和资源进行详细分析,增强了指挥官评估场景、制定战略和预测行动结果的能力。它为知情决策提供了全面的视角(Kenny, 2022)。
测试与技术发展:元宇宙成为测试和发展军事技术(如武器系统、监视设备或自主车辆)的理想场所。在虚拟环境中评估这些技术的效能,可以在其实施前进行调整(Wired, 2022)。
通过这些应用,元宇宙作为一种多功能工具脱颖而出,在转变军事实践和提高作战效能方面具有巨大潜力。