📘 内容简介

将**知识图谱(Knowledge Graphs, KG)大语言模型(Large Language Models, LLMs)**结合,以构建更强大、更可靠、且具可解释性的人工智能系统。 知识图谱通过建模对象、事件、概念及其相互关系,帮助你在数据中识别关键模式,从而做出更优决策。与 LLM 相结合,它们在处理结构化与非结构化企业数据、构建推荐系统、欺诈检测机制或客服对话系统等任务中展现出巨大潜力。

本书提供了系统的方法与工具,帮助读者高效地组织数据、建模知识图谱,并将其融入 LLM 的工作流程之中(反之亦然),实现互补增强


📖 你将学到:

使用自顶向下、需求驱动的迭代方法建模知识图谱 * 从本体(Ontology)分类体系(Taxonomy)结构化数据构建知识图谱 * 利用 LLM非结构化数据源中自动构建知识图谱 * 应用机器学习算法补全知识图谱并挖掘其中的洞见 * 在知识图谱上进行推理,并构建基于 KG 的 RAG 系统以增强 LLM


💡 技术亮点

结合知识图谱与 LLM 可显著: * **减少幻觉(Hallucination)**现象 * 提升输出的可解释性

增强推理与知识一致性

知识图谱通过自然地编码数据间的关系,使得 AI 系统即便在领域知识有限的情境下,也能保持更高的可靠性与准确性。


🧩 本书特色

展示如何在基于 LLM 的应用与 RAG 管线中引入来自结构化与非结构化源的知识图谱

提供涵盖医疗、金融风控等领域的真实案例研究

深入讨论知识表示推理策略的工程实践


🧠 书中内容一览

Part 1

知识图谱与 LLM:强强联合 1. 智能系统的混合范式

Part 2

  1. 从本体创建首个知识图谱

  2. 从简单网络到多源数据融合 Part 3

  3. 从非结构化数据中抽取领域知识

  4. 使用 LLM 构建知识图谱

  5. 实体消歧(Named Entity Disambiguation)

  6. 基于开放式 LLM 与领域本体的实体消歧 Part 4

  7. 知识图谱上的机器学习入门

  8. 图特征工程:手动与半自动方法

  9. 图表示学习与图神经网络(GNN)

  10. 节点分类与链接预测 Part 5

  11. 基于知识图谱的 RAG 系统

  12. 使用自然语言向知识图谱提问

  13. 利用 LangGraph 构建问答智能体


👩💻 读者对象

适合机器学习工程师、AI 工程师、数据科学家与数据工程师。 书中示例均使用 Python 实现。


👨🔬 作者简介

Dr. Alessandro Negro:GraphAware 首席科学家,《Graph-Powered Machine Learning》作者,GraphAware Hume 平台联合创始人。 * Dr. Vlastimil Kus:GraphAware 首席数据科学家,专长于 NLP 与图机器学习。 * Dr. Giuseppe Futia:GraphAware 高级数据科学家、意大利都灵理工大学博士,研究方向为图表示学习与知识图谱自动构建。 * Fabio Montagna:GraphAware 首席机器学习工程师,专注于将科研成果快速转化为工业应用。

成为VIP会员查看完整内容
73

《机器学习系统》提供了一个系统化的框架,用于理解与构建机器学习(ML)系统。这本教材弥合了理论基础与工程实践之间的鸿沟,强调从系统视角出发构建高效人工智能解决方案的思维方式。不同于那些主要聚焦于算法和模型架构的资源,本书更强调机器学习系统运行的更广泛背景,包括数据工程、模型优化、硬件感知训练以及推理加速等内容。通过学习,读者将能够系统性地思考机器学习系统的体系结构,并掌握构建灵活、高效且鲁棒的机器学习系统所需的工程原理。

问题: 学生们通常学习如何训练人工智能模型,但很少有人真正理解如何构建能在生产环境中运行的系统。在教授机器学习系统概念时,学生往往只学到各个独立的组成部分,而未能把握整体架构——他们“只见树木,不见森林”。 未来: 随着人工智能变得越来越自主化,瓶颈将不再仅仅是算法本身,而是那些能够构建高效、可扩展且可持续系统的人工智能工程师。 我们的路径: 这一理念源自哈佛大学的 CS249r 课程,在该课程中,学生、教师与业界伙伴共同探索机器学习的系统层面内容。本书的内容由 2023 年秋季学期学生的真实贡献发展而来。最初只是一份课堂笔记,如今已成长为一份我们希望向全球分享的综合性教育资源。 想了解完整故事?请阅读我们的作者说明,了解支撑本项目的灵感与核心价值。

基础篇(第 2、3、4 章) —— 探讨算法与体系结构的基本原理,为理解系统层面的设计决策提供技术背景。这几章回答了“我们在构建什么?”这一问题,为后续“我们如何可靠地构建它?”奠定了基础。 支柱篇 —— 本书按照五大工程学科组织,每个支柱由若干章节组成,从基础内容逐步深入到高级主题。读者既可以线性地阅读全部章节,也可以聚焦于与自己工作最相关的特定支柱。不过,理解我们所讨论的“跨支柱依赖关系”有助于体会到一个支柱中的设计决策如何影响其他部分。 专题篇(第 18、19、20 章) —— 讨论机器学习系统工程在特定领域与新兴挑战中的应用,展示这一框架在多样化应用场景中的灵活性。 全书设有交叉引用系统,帮助读者在不同章节之间导航。当某一章提到另一个章节中已深入讲解的概念时,引用会指引你前往相关内容。这种互联结构反映了“AI 三角框架”的现实:机器学习系统工程需要理解数据、算法与基础设施之间的相互作用,而非将它们孤立研究。 若想了解更多关于本书的学习目标、目标读者、前置知识要求以及如何最大化学习体验的信息,请参阅“关于本书”部分,其中还提供了学习社区与扩展资源的详细说明。 这篇引言为后续内容奠定了概念基础。我们首先理解了人工智能(AI)作为愿景与机器学习(ML)作为方法论之间的关系;随后定义了机器学习系统这一“人工制品”——由数据、算法与基础设施组成的集成计算系统。通过“苦涩教训(The Bitter Lesson)”与人工智能的历史演进,我们认识到为什么系统工程已成为推动人工智能进步的根本,以及基于学习的方法为何主导了这一领域。由此,我们正式将**AI 工程(AI Engineering)**定义为一门独立学科,正如计算机工程(Computer Engineering)曾经的诞生一样——它专注于在各种计算平台上构建可靠、高效、可扩展的机器学习系统。 接下来的旅程将系统地探讨 AI 工程的各个支柱,在提供概念理解的同时,也带来构建生产级机器学习系统的实践技术。我们此前指出的挑战——性能隐性退化、数据漂移、模型复杂性、运维负担以及伦理问题——将在后续章节中反复出现,但这一次,它们将配以基于真实工程经验与最佳实践的具体解决方案。 引言

目标与意义

为什么我们必须掌握支撑具备学习、适应与大规模运行能力的系统之工程原理? 机器学习(Machine Learning, ML)代表了自可编程计算机问世以来计算领域最重要的范式转变——它让系统的行为不再依赖显式指令,而是从数据中“涌现”出来。这一变革要求新的工程基础,因为传统的软件工程原则无法充分应对那些能通过经验进行学习与自我适应的系统。 从气候建模、医学诊断到自主交通,每一个重大的技术挑战都依赖于能够处理海量数据并在不确定性中可靠运行的系统。理解机器学习系统工程(ML Systems Engineering)的原理,决定了我们是否具备解决超越人类认知能力的复杂问题的能力。 这一学科为构建能够跨越不同部署环境(从大型数据中心到资源受限的边缘设备)的系统奠定了基础,也确立了 21 世纪技术进步的工程基石。


💡 学习目标

将机器学习系统定义为由数据、算法与基础设施组成的集成计算系统 * 通过失败模式分析,区分机器学习系统工程与传统软件工程 * 解释 AI 三角框架(AI Triangle Framework),并分析数据、算法与计算基础设施之间的相互依赖关系 * 追溯人工智能范式的历史演进:从符号主义系统到统计学习,再到深度学习 * 评估 Sutton 的“苦涩教训”(The Bitter Lesson)对现代机器学习系统工程优先级的启示 * 比较机器学习系统中的“隐性性能退化(silent performance degradation)”与传统软件的失败模式 * 分析机器学习系统的生命周期阶段,并与传统软件开发流程进行对比 * 对机器学习系统中的现实挑战进行分类:数据、模型、系统与伦理四大维度 * 应用“五支柱工程框架(Five-Pillar Engineering Framework)”分析机器学习系统架构及其内在依赖关系


1.1 人工智能的工程革命

当今的工程实践正处在一个可与历史上最具变革性的时期相提并论的拐点。 工业革命确立了机械工程以管理物理力的学科体系;数字革命奠定了计算工程以处理算法复杂性的理论基础。而如今,人工智能系统要求一种新的工程范式,用以应对具备学习行为、自主适应能力、并在规模上远超传统软件工程方法的系统。 这一转变重新定义了“工程系统”的本质。 传统的确定性软件架构依赖于显式编程指令,对给定输入产生可预测的输出;而机器学习系统是一种概率性架构,其行为源自对训练数据中统计模式的学习。这一根本差异带来了新的工程挑战,也定义了机器学习系统工程这一新兴学科的使命: * 如何确保学习型系统的可靠性,而非仅依赖程序逻辑? * 如何让系统在处理 PB 级数据并同时服务数十亿用户时仍具可扩展性? * 当运行数据分布偏离训练分布时,如何维持鲁棒性

这些问题构成了机器学习系统工程作为一门独立学科的理论与实践基础。本章旨在为理解这一领域的历史演化及其与传统软件架构的区别提供概念框架,并通过整合计算机科学、系统工程与统计学习理论的视角,建立系统化研究智能系统的框架。


我们的探讨从人工智能作为研究目标(AI as Vision)与机器学习作为实现方法(ML as Methodology)之间的关系出发,继而定义何谓机器学习系统——一种由数据、算法与基础设施组成的集成计算系统。通过回顾人工智能从符号推理系统统计学习方法再到深度学习架构的历史演进,我们展示了每一次范式转变如何催生新的工程解决方案。 这一演进揭示了 Sutton 的“苦涩教训”:通用计算方法最终会超越人工设计的知识表示。这意味着,系统工程正逐渐成为推动人工智能进步的核心力量。 在此历史与技术基础上,我们正式将机器学习系统工程定义为一门独立学科。正如**计算机工程(Computer Engineering)**源自电气工程与计算机科学的融合,机器学习系统工程致力于在各种计算平台上构建可靠、高效且可扩展的机器学习系统。这一定义既确立了学科的命名规范,也明确了其实践范围。


在此基础上,本书引入了支撑全书分析的核心理论框架: * AI 三角模型(AI Triangle)——用于理解数据、算法与计算基础设施之间的相互作用; * 机器学习系统生命周期(ML System Lifecycle)——通过对比传统软件开发流程,突出问题定义、数据整理、模型开发、验证、部署与持续维护等阶段的独特性。

这些理论框架将通过典型的应用场景得到验证,展示不同领域中机器学习系统的多样化工程需求——从需在网络边缘低延迟运行的自动驾驶系统,到服务数十亿用户的云端推荐系统,这些案例揭示了部署环境如何塑造系统架构与工程权衡


最后,本章识别出奠定机器学习系统工程作为一门“必要且复杂学科”的核心挑战: * 隐性性能退化,需要专门的监测与诊断机制; * 数据质量与分布漂移问题,削弱模型有效性; * 高风险场景下的鲁棒性与可解释性需求; * 超越传统分布式系统的基础设施可扩展性压力; * 伦理与社会责任,对系统设计提出新的工程约束。

这些挑战构成了本书的五支柱组织框架(Five-Pillar Organizational Framework)的基础,将机器学习系统工程划分为若干相互关联的子学科,共同支撑构建鲁棒、可扩展、负责任的人工智能系统


本章为 第一部分:系统基础(Part I: Systems Foundations) 奠定理论基石,介绍了支撑后续分析的基本原理。这些概念框架将在随后的章节中得到深化与应用,最终形成一种可系统化地工程化智能系统的方法论,使人工智能能够在真实生产环境中可靠落地与持续进化

成为VIP会员查看完整内容
72

本专著聚焦于塑造扩散模型(diffusion models)发展的核心原理,追溯其起源,并展示不同形式如何从共同的数学思想中演化而来。 扩散建模的起点是定义一个正向扰动过程(forward corruption process),该过程会逐步将数据转化为噪声。通过定义一系列连续的中间分布,这一正向过程将复杂的数据分布与简单的噪声分布相连接。扩散模型的核心目标是构建一个反向生成过程(reverse process),使其能够沿与正向扰动相反的方向运行,从噪声逐步还原出数据,同时复现与正向过程一致的中间分布。 我们从三种互补的视角对这一思想进行形式化阐述: * 变分视角(Variational view):受变分自编码器(VAE)的启发,将扩散过程视为逐步去噪的学习过程。模型通过一系列小的去噪目标(denoising objectives)学习如何一步步将噪声还原为数据。 * 基于得分的视角(Score-based view):源于能量模型(energy-based modeling),学习数据分布随时间演化的梯度,即“得分函数(score function)”,用于指示样本应朝哪些方向调整以进入更高概率区域。 * 基于流的视角(Flow-based view):与归一化流(normalizing flows)相关,将生成视为沿着由学习到的速度场(velocity field)控制的平滑路径,从噪声平滑地迁移至数据。

这三种视角共享一个共同的数学骨架:一个随时间变化的学习速度场(time-dependent velocity field),其流动将简单的先验分布传输到目标数据分布。在此基础上,采样过程可以被视为求解一个微分方程,使噪声沿着连续的生成轨迹演化为数据。 在此理论框架之上,专著进一步讨论了: * 可控生成的引导机制(guidance for controllable generation); * 高效采样的高级数值求解方法(advanced numerical solvers for efficient sampling); * 受扩散启发的流映射模型(diffusion-motivated flow-map models),这些模型能够直接学习生成轨迹上任意时刻之间的映射。

本书面向具有基础深度学习背景的读者,旨在提供一个清晰、概念化且数学上扎实的扩散模型理解框架。它系统阐明了扩散模型的理论基础,解释了不同公式化形式背后的思想逻辑,并为进一步研究提供稳固的理论支点。该专著既可作为研究者的系统参考资料,也可作为初学者进入这一快速发展的研究领域的易懂入门读物。

成为VIP会员查看完整内容
59

EMNLP 2025(The 2025 Conference on Empirical Methods in Natural Language Processing)于北京时间2025年8月21日公布了论文录用结果。****EMNLP是计算语言学和自然语言处理领域的顶级国际会议,每年举办一次,被列入中国人工智能学会A类推荐国际学术会议、中国计算机学会B类推荐国际学术会议。EMNLP 2025于2025年11月5日至9日在中国苏州召开。

本教程聚焦于大语言模型(LLM)高效推理(Efficient Inference)这一日益重要的主题,旨在从设计者的视角出发,系统性地阐释其关键原理与方法论。我们首先介绍现代大语言模型的基本概念与核心机制,以及相关的软件与硬件背景。随后,将对效率优化问题(efficiency optimization problem)进行形式化定义。为帮助听众建立“系统设计者思维(designer’s mindset)”,我们将讲解如何针对特定硬件上的具体工作负载,诊断模型推理的效率瓶颈。特别地,我们将演示如何利用理论屋顶线模型(roofline model)以及 NVIDIA 工具链(toolchain)来识别这些瓶颈。 在掌握这些分析工具之后,我们将从概念层面解析导致推理效率低下的关键因素,包括:自回归采样机制(autoregressive sampling scheme)模型规模(model size)以及核心注意力算子(core attention operator)。接着,我们将介绍一个面向大语言模型高效推理的全栈分类体系(full-stack taxonomy),将相关方法划分为算法级(algorithm-level)、**模型级(model-level)系统级(system-level)**三大类: 1. 算法级优化:涵盖高效解码方法(efficient decoding methods)、输入压缩方法(input compression methods),以及超越自回归生成范式的替代生成机制(alternative generative paradigms beyond autoregression); 1. 模型级优化:通过高效模型结构设计(efficient architecture design),或静态/动态地减少模型层级冗余(redundancy reduction),以提升推理效率; 1. 系统级优化:在不改变模型计算图(computation graph)的前提下,优化推理引擎或部署系统(inference engine / serving system),以提升整体性能。

我们将依次讲解各类别的代表性方法,每个子类别选择一至三个典型方案作为实例,深入剖析其设计逻辑以及所针对的主要低效因素。最后,教程将以若干实机演示、核心要点总结以及未来研究方向展望作为收尾,为听众提供全面的理解与启发。 https://haolibai.github.io/emnlp-2025-tutorial-efficiency/

成为VIP会员查看完整内容
36

为大规模军事行动制定有效的行动方案(COA)是军事决策流程(MDMP)中资源密集、耗时且关键的一环。当前的指挥控制(C2)流程主要依赖人工、速度缓慢,并在作战节奏加速、复杂性增加及对手能够快速利用机会窗口的背景下面临挑战。为此,推出COA-GPT 2.0,这是一种先进的代理式人工智能(AI)规划助手,它利用多模态大语言模型(LLM)、专用外部工具及人类专业知识,在军事决策流程期间快速支持指挥控制规划参谋,显著简化任务规划。本报告概述了COA-GPT 2.0的当前能力,呈现了军事主题专家(SME)对其军事决策流程产出物的评估,并明确了实现指挥所(CP)在精简人员编制下仍保持强大分析能力的前进路径。开发COA-GPT 2.0的目标是加速军事规划流程,同时使指挥官在压缩的决策时间线下保持决策优势,能够动态调整作战计划以应对新出现的威胁和不断变化的战场环境,适应现今及近未来复杂多域战场。

军事行动中行动方案(COA)的制定是营、旅、师、军及战区陆军层级的指挥官及其参谋面临的最关键和复杂的规划挑战之一。在这些较高指挥层级,军事决策流程(MDMP)作为条令框架构建了这一复杂的规划工作。该流程有意融入了多人性化特征,如重复性、多形式沟通和群体构思,以确保指挥官及其参谋形成足够的态势理解,从而维持在下级梯队于复杂多域作战空间行动时的努力统一。传统的军事决策流程方法需要大量的参谋资源、跨多个作战职能领域的专业知识以及显著的时间投入,以生成在可行性、适用性、可接受性和独特性之间取得平衡的可行行动方案选项——所有这些都在高压环境下进行,决策影响着数千名士兵,并可能决定广阔作战区域的任务成败,甚至可能涉及建议动用关键的国防和战略威慑能力。

然而,新出现的战场现实正迅速超越传统军事决策流程方法在所有层级上那种审慎的节奏。自主系统的激增、无处不在的传感器、人工智能(AI)和先进数据分析正在急剧加速作战节奏,同时使信息量和速度呈指数级增长。未来的多域作战将呈现转瞬即逝的机会窗口,这些窗口可能仅存在几分钟而非数小时或数天——这是通过耗时规划周期无法利用的窗口。此外,采用先进反介入/区域拒止(A2AD)能力的复杂对手将制造 contested 电磁环境,其中通信的拒止、降级、间歇与受限(DDIL)成为常态,而精准远程火力日益威胁大型静态指挥所(CP),驱动了对敏捷机动指挥节点的需求。通过COA-GPT 2.0应对这些挑战,这是一个代理式AI赋能的规划助手,它利用最新的生成式AI能力对大量数据进行推理,从而加速规划流程和行动方案生成。COA-GPT 1.0 [7]是第一代使用大语言模型(LLM)进行快速行动方案开发的生成式AI系统,在其第二次迭代中已取得实质性演进。与专注于使用单一LLM生成简单行动方案的COA-GPT 1.0不同,当前系统通过集成的多智能体架构全面支持所有军事决策流程步骤,生成全套条令规划产物,同时保持人工监督。

设想COA-GPT作为任务指挥信息系统内的智能助手,在数据输入和人类参谋之间充当中间层。通过由军事主题专家调优的多模态LLM承担常规数据处理和文件起草任务,规划人员可以专注于高阶分析和与指挥官的互动。受先前方法的启发,也旨在提供一个平台,让战争的科学由计算机处理,而战争的艺术仍保留在人类判断的领域,从而在保持军事指挥必要人性化要素的同时,提高决策的速度和质量。

图1:用于军事规划的分布式COA-GPT架构,根据不同指挥所(CP)的层级和可用连接性,同时利用本地和基于云端的大语言模型(LLM)。 该示意图展示了与驻地任务指挥(HSMC)及国家级数据库的集成,以及不同类型的指挥所:主指挥所(Main CP)、战术指挥所(TAC CP)、后方指挥所(Rear CP)、主指挥所/主要备用指挥所(MCP PACP)以及机动指挥组(CMD GRP)。

COA-GPT

拟议的高层架构(如图1所示)是一个分布式生态系统,其中COA-GPT实例部署于各个指挥层级。这些实例之间的关键架构差异在于它们所采用的底层大语言模型(LLM)技术,这取决于其作战环境。在连接稳定的层级,COA-GPT可以利用最先进的基于云的LLM。这使得它们能够直接与国家层级数据库交互,并执行复杂的大规模数据合成以支持战略级规划。

图2:COA-GPT用于任务规划的多智能体生态系统,展示了自动化规划智能体、数据分析、模拟、规划参谋和指挥官之间的相互作用。

相反,部署在战场内的指挥层级则在通信拒止、降级、间歇与受限(DDIL)的假设下运作。对于这些单位(包括从军到旅级的各种指挥所(CP)),连接云端的可靠性无法保证,甚至由于电磁(EM)辐射担忧而不被期望。因此,这些层级配备了运行在自包含本地LLM上的COA-GPT实例。这一关键设计选择确保了每个指挥所都拥有有韧性的、独立的人工智能助手,在规划与决策支持方面保持完全功能,不受连接性影响。

图2说明了每个COA-GPT实例的多智能体生态系统,它协调自动化规划智能体、数据分析、模拟、规划参谋和指挥官以执行军事决策流程。与单一的LLM解决方案不同,COA-GPT采用多个专用智能体,以层级化、角色专门化的组织方式运作,镜像了军事规划参谋的职能。通过此集成规划架构,系统全面支持所有军事决策流程的步骤和子步骤,对军事规划中常见的大量非结构化数据进行推理,以生成高保真的产物和建议。

任务规划的初始阶段涉及摄取任务相关文档,这些文档通常以各种格式分发,如PDF、Microsoft Office文件(例如Word、PowerPoint、Excel)、GeoJSON和KML文件。COA-GPT的第一个组件是一个专门的数据解析器智能体,旨在应对这一挑战。该智能体从这些不同来源提取所有相关信息,并将非结构化的任务数据转换为标准化的结构格式。这一基础步骤对于确保数据一致性以供COA-GPT及其核心和专用智能体进行后续分析至关重要。在此摄取过程中,系统还会自动识别并标记所提供文档中的潜在差异,向规划参谋警示任何不一致之处。

COA-GPT的知识库还通过条令和历史数据得到增强。为提供条令背景,我们开发了一个军事检索增强生成(RAG)数据库,其中包含来自陆军出版局(APD)和其他可靠来源的大量出版物。对于历史背景,所有用户反馈和与COA-GPT的交互都会被存储,并在适用情况下用于未来任务的规划。在整个规划过程中,指挥控制规划参谋或指挥官还可以通过图形用户界面(GUI)上传额外的任务和想定相关文档。

系统在整个军事决策流程中产生全面的规划产物,包括敌我行动方案、同步矩阵、预警与作战命令、任务简报以及其他条令输出。一个专门的地理空间智能体从地图图像执行地形分析,而系统则维护运行评估并为任务执行生成最终战斗产物。系统还执行音频分析,并作为一个全面的数据管理系统,维护通用作战图(COP)并为任务执行生成最终战斗产物。这种集成方法确保所有规划要素保持同步,同时承担常规数据处理和文件起草任务,使人类规划人员能够专注于高阶分析和与指挥官的互动。

在此工作流下,规划参谋使用COA-GPT来摄取和分析任务文档,然后为军事决策流程每个规划步骤所需的条令产物生成初稿。COA-GPT使用其主规划智能体并结合我们军事数据集的RAG来生成初始的军事决策流程输出和产物。RAG系统确保这些初始产物基于军事条令和可用的任务数据。这些输出随后被发送到一个独立的评审员智能体,其职责是根据条令和主题专家 informed 的特定标准对主规划智能体进行批判并提供反馈。主规划智能体利用评审员提供的反馈生成修订后的输出,根据我们的经验,这些输出相比原始输出有显著改进。此迭代工作流可以重复进行以提高精炼度并产生更高质量的结果,但代价是额外的时间和计算资源。在规划过程中,主规划智能体会定期指派其他更专业的智能体执行各种军事决策流程任务。这些基于特殊角色或陆军作战职能的专用智能体,在军事决策流程的不同步骤和子步骤中被调用,具体取决于COA-GPT正在执行的规划任务类型。

为完成规划周期,COA-GPT促进行动方案分析与比较。一旦制定完成,行动方案被发送到模拟器进行兵棋推演并生成详细的性能指标。这些结果随后反馈给COA-GPT,由它呈现比较分析供参谋和指挥官评估。基于这些指标,指挥官可以批准一个行动方案,或者参谋可以提供反馈以修改行动方案并在模拟器中重新分析。最终行动方案选定后,COA-GPT协助规划参谋生成用于任务执行的最终命令,从而支持从初始数据摄取到命令生成的整个军事决策流程。

在规划过程的任何时刻,指挥控制参谋都可以在批准前检查并/或细化生成的军事决策流程产物,确保决策权和军事判断力保留在人类手中。此外,我们的系统由LLM驱动的一个关键优势是,规划参谋或指挥官可以直接指导或向COA-GPT下达指南,系统将根据该反馈细化其输出。COA-GPT的多智能体架构允许规划参谋直接与多个专用LLM和外部工具交互以执行军事决策流程。这种代理式设计镜像了人类军事参谋的结构,由专业参谋处理军事决策流程的不同方面。除了其规划能力,COA-GPT还作为一个全面的数据管理系统,适用于所有任务和条令文档,因为它转换非结构化数据并构建一个包含所有相关规划信息的结构化数据库。COA-GPT还维护一个规划通用作战图(COP)以展示其产物,管理战场条件和资源可用性的运行评估,并生成任务执行所需的最终战斗产物。这种集成方法使所有规划要素在整个军事决策流程中保持一致,为指挥官和参谋提供最新的决策信息,并通过使用陆军已在更高层级采用的相同流程来加速规划。

成为VIP会员查看完整内容
28

美空军部在采用大语言模型(LLM)时面临独特挑战。商用模型通常缺乏支持空军人员所需的领域专业知识,因为这些信息并未内置其中。为保持竞争优势,集成大语言模型以提升效率与决策能力已成为关键优先事项。本报告探讨两种创新方法,旨在将领域知识更有效地融入语言模型并提升相关信息发现能力。其一是实体图谱持续预训练技术,通过持续训练将专业知识嵌入语言模型;其二是GFM-RAG图谱检索增强生成框架,这是一种改进多跳检索与复杂信息连接的知识检索与合成新方法。通过定量与定性评估,衡量了它们对检索精度与响应相关性的影响。研究结果表明,这些定制化方法在简化信息获取、改进决策支持、更好满足空军部作战需求方面具有显著潜力。

人工智能融入军事作业的呼声不断高涨。然而,尽管商用大语言模型潜力巨大,但其处理涉密信息与适应特殊领域的能力不足,制约了在政府部门的推广应用。

美空军部非密级大语言模型(NIPRGPT)计划标志着国防部采纳该技术的重要进展。尽管如此,挑战依然存在,特别是满足各美国防部机构对细分领域定制模型日益增长的需求。这类模型将支持高智能体在垂直领域运作,为用户提供更精准的信息服务。

图1:NIPRGPT团队接收的定制化模型需求

传统的检索增强生成(RAG)方法通过外接文档检索增强大语言模型能力来应对这些挑战。但现有检索增强生成方案存在多重局限,包括多跳检索困难、数据稀疏性问题以及新信息合成复杂性。这些缺陷制约了大语言模型满足国防作战场景化需求的能力。

本研究评估两种方法论——实体图谱持续预训练与GFM图谱检索增强生成框架,通过将领域知识注入大语言模型,以提升其在空军作战环境中的性能。通过将这些框架应用于空军文档语料库,我们评估了其在检索精度、响应相关性和复杂信息合成方面的影响。初步结果表明,这些方法在专业任务的信息获取、决策支持和领域适应方面具有显著的提升潜力。

成为VIP会员查看完整内容
29

国家与非国家行为体发动的无人机攻击威胁始终存在且日益增长。无人机(或称无人航空系统)具有成本低廉、可消耗及可组网的特点,能够对军用与民用目标实施多种动能与非动能打击。由于无人机甚至能轻易穿透最坚固的一体化防空体系,各国在保护人员与基础设施免受无人机威胁方面面临严峻挑战。

在此威胁环境下,必须全力发展反无人机系统应对能力,并协助技术能力有限的伙伴进行能力建设与培训。制定反无人机解决方案的关键路径包括:威胁分类归整、经验技术整合、态势研判分析,以及通过训练推演创新战术战法。反制无人机的技术手段已然存在,部分曾遭遇无人机的一线官兵也积累了实战经验。全球范围内具有无人机实战经验或专业研究的军民人员,可为无人机运用与反制策略提供关键见解。

本文深入剖析无人机构成的威胁、美国当前监管环境,以及军民领域现有与潜在的反制措施。尽管反无人机技术对策存在交集,但两类应用场景面临的威胁与应对策略存在显著差异。虽然聚焦美国对无人机的运用与反制,但其中涉及的战法、法规与对策论述,经调整后可适用于其他国家的特定情境。从根本上缓解敌对势力掌握无人机带来的风险,需要全社会各层级的教育协同与协作共治。

现行美军条令作何规定?

美军当前为机动作战部队防范敌方无人机提供的条令支持较为有限。由陆军防空炮兵部队编著的《陆军技术条令(ATP)3.01-81:反无人机系统技术》,旨在提供以下指导:作战中防御低空、慢速、小型无人航空威胁的规划考量,以及将反无人机单兵任务纳入部队训练的实施指南。该条令为旅及以下部队在区域威胁评估包含小型无人机平台时提供规划指引。

正如该条令所表述的,美国陆军并未制定专门的反无人机战术技法规程,而是建议通过任务规划、情报报送与态势感知来应对无人机威胁。美军在作战与安保行动中运用无人机的目的与方法已明确,侦察人员可通过无人机航迹判定敌意图。该条令建议机动作战部队采用通用战术场景下的声光管控措施规避无人机侦测:运用光学与降噪手段削弱装备反光与噪声。例如用泥浆遮盖头灯、使用伪装网消除挡风玻璃反光……避免暴露己方阵地。设置隔音屏障与泡沫衬垫可降低作业设备噪音。

尽管符合战术逻辑,但该条令指南在遭遇无人机时往往难以落实。无人机操作手可快速升空无人机验证可疑敌情,使受侦测部队缺乏反应时间。此类侦察无人机通常配备光学探头,可持续追踪目标直至接获返航指令(或被地面目标摧毁)。因此,无论采用条令推荐的何种隐蔽技术,这类侦察平台仍可能识别目标。

反无人机条令明确指挥官有权依据交战规则采取必要防护措施,并授权单兵在遭遇小型无人机威胁时实施自主反击——这承认了使用直瞄火器打击的技术难度。单兵或小组若以单兵武器系统射击小型无人机,反而易暴露行踪。部分小型无人机时速可达70公里,击中它们更多依靠运气而非战术。条令第44-1-100号任务仅提供“运用全部轻武器(含机枪)对抗空中目标”这一单一战术,实战价值有限。该任务看似简单,但未清空射界即攻击小型无人机,极易造成误伤或附带损害。

该条令初衷虽好,但遗留关键问题未解:指挥官如何在本土军营有效组织反无人机训练?如何规避士兵误射高速无人机风险?城市环境中机动作战部队如何调整反无人机战术?应采用何种火力控制方案有效瘫痪无人机?若无人机已侦获部队行踪,应依据何种要素决策撤退或终止任务?最后,条令如何规范应对无人机群袭击的防御措施?在单架无人机即可导致全军暴露的当下,这些问题至关重要。

关于进攻性作战也涌现出关键问题。 应由何人监督进攻性无人机作战,其监督权限范围如何界定?地面机动部队与协同作战的指挥所之间对无人机视频影像的需求应如何协调?交战规则是否应考虑半自主或全自主无人航空系统(UAS)与友军协同作战的潜在应用?反无人机资产的调用权限归属何方?其使用需遵循哪些冲突规避要求与考量要素?核心关键在于思考如何武装并授权基层作战人员,使其能快速部署单架或多架第1类或第2类无人机。

2023年4月美国国会研究服务处发布的题为《国防部反无人航空系统》的报告体现了国家层面对此议题的关注。该报告为国会审议国防部(DOD)反无人机系统(C-UAS)的研发采购及安全协议提出若干潜在问题:

国防部门对反无人机系统的资金投入是否在研发项目与采购计划间取得适当平衡?国防部门指定反无人机系统执行机构在多大程度上(若存在)减少了采购冗余并提升了效率?国防部门在反无人机系统研发采购方面与国土安全部、司法部、能源部等其他部委机构的协调程度如何?为优化反无人机系统使用和/或与美军其他军事行动实现冲突规避,是否需要调整空域管理、作战概念、交战规则或战术?国防部与联邦航空管理局及国际民用航空机构在识别并减轻反无人机系统作战对民用机构成风险方面的协调程度如何?

成为VIP会员查看完整内容
24

战争形态的演变日益聚焦于第一人称视角(FPV)武装无人机的融合,其结合了低成本的可获得性与高精度的杀伤力。本文探讨了FPV战斗飞行的机理、战术角色和心理层面,特别是在高海拔区域(HAA)和控制线(LC)场景下的应用。与先进的无人机和制导弹药不同,FPV无人机在对抗性和GPS拒止环境中为操作员提供了实时手动控制、敏捷性和适应性。研究借鉴了近期冲突(如俄乌战争),重点阐述了FPV无人机在侦察和打击行动中的双重作用,同时也探讨了其局限性,包括有效载荷能力、电子战威胁和极端环境条件。未来的建议强调结构化的训练、部队选拔、AI辅助模拟和战场创新,以提升作战效能。FPV无人机正在重塑现代战争的战术和心理格局,并仍然是未来战斗结果的关键决定因素。

关键词:FPV无人机,战斗飞行,高海拔作战,乌克兰-俄罗斯冲突,无人机战术,电子战,步兵集成,战场创新

随着战争形态的演变,其背后的技术也在发展。自20世纪初以来,对飞行的追求改变了战场动态,如今在第一人称视角(FPV)武装无人机上达到顶峰。这些系统为飞行员提供了鸟瞰视角和无与伦比的敏捷性,使得一度仅属于战斗机飞行员的快速决策和精确打击成为可能。FPV飞行不仅仅是一种工具,更标志着一种战术和心理上的转变(Kozatskyi, 2023),在人机之间建立了近乎本能的连接。其影响在诸如俄乌战争等冲突中尤为明显,其中FPV无人机已被证明在侦察、火力支援和直接攻击敌方资产方面不可或缺(Ibrahim A., 2024)。与传统空中平台不同,这些无人机在对抗环境中表现出色,能够突破常规防空系统,以极高的精确度投送致命载荷。本文审视了FPV战斗飞行的复杂机理、这些无人机在高海拔战争(尤其是在LC场景下)中的战术角色、它们在HAA中面临的作战挑战,以及在现代战争中适应和发展无人机作战日益增长的需求。

无人机 vs 反坦克导弹:战术与功能优势

FPV无人机和反坦克导弹(ATGM)都遵循飞行的基本原理(即俯仰、横滚、偏航和油门控制),但由于其设计和目的不同,在敏捷性和控制方面差异巨大。反坦克导弹主要遵循预定路径,机动性有限,仅能进行微小的飞行中修正。相比之下,FPV无人机是完全手动的,并利用六自由度(6DOF),允许进行实时、全方位的动态机动。无人机可以急剧调整俯仰角进行俯冲或掠地飞行,横滚以躲避障碍物,偏航以在飞行中重新调整方向,并通过调节油门实现悬停或立即加速。这种高水平的控制赋予FPV无人机显著的战术优势,尤其是在地形复杂且敌方防御需要高度适应性的高海拔环境中。反坦克导弹由于其可预测性而易受主动防护系统攻击,而FPV无人机凭借其不规则的飞行轨迹和实时操控,更难被跟踪或拦截(Ibrahim A., 2024)。此外,无人机更具成本效益,单价仅低于2.5万卢比,而反坦克导弹则需数十万卢比,同时它还提供双重功能——实时侦察和精确打击(Kozatskyi, 2023)。与反坦克导弹不同,它们不受后喷焰、最小射程或固定弹道的限制。能够重新定位、中止任务或从多角度攻击的能力,使得FPV无人机成为现代战争中一种多功能且经济实惠的选择。步兵在手动操控反坦克导弹时早已运用了飞行原理——如今,同样的本能和技能可以无缝转移到FPV无人机操作上。

成为VIP会员查看完整内容
26

全谱战争已演变为一个新兴概念,它介于混合战争、不对称战争和非常规战争之间的理论空间,尽管其在认识论领域尚未完全定型。该概念已出现在澳大利亚、美国、俄罗斯和中国的多份军事战略文件中,并逐步融入"全域主导""全谱工具"及"全谱防御"的概念体系。其核心内涵聚焦于突发性、不可预见的态势演变,以及"思考不可思考之事"和"未知的未知"领域中的创新要素。正开展跨学科研究,结合以色列、乌克兰、俄罗斯、美国当前实战案例,构建可操作的定义体系。研究方法包含认识论辨析,提炼全谱战争的独特性与附加值,并通过百科全书式的学术探讨厘清概念本质。

关键词:未知的未知;思考不可思考之事;全谱战争;突发性;不可预见演变

当前国际关系、安全研究和世界秩序的高度不确定性,亟需更完善的分析工具与创新理论框架,以界定和阐释(甚至预判)战略突发状况。前瞻性研究已提出若干要素,我们着重强调"未知的未知"和"思考不可思考之事"的理论价值,同时引入"黑天鹅事件"及相关概念参与学术对话。基于实战演进,本文提出全谱战争概念,其核心在于整合所有军事与非军事手段,甚至包含传统冲突中罕见的腐败、认知操纵、和平时期颠覆等非常规工具。

通过辨析预测学局限与前瞻研究模型,可从认识论层面厘清全谱战争与混合战争、非常规战争、不对称战争、非动能战争等概念的界限。该概念在不同文献中存在释义差异,需系统梳理。本文旨在明确全谱战争的核心特征,构建可用于安全研究的理论框架。

研究方法包含认识论辩论、特征提取与概念价值评估,并通过全景式学术探讨深化理解。聚焦突发性、未知的未知和思考不可思考之事三大维度,可精准界定全谱战争的适用场域,论证各类工具创造战略突袭(包括单次打击)的可行性。全谱攻防体系要求所有工具的协同整合,这也构成概念的重要内涵,体现了21世纪冲突演进的特征。

全谱战争概念建构

从概念定义(及其演变)、关联概念和官方文献三个层面构建理论体系,进而解构核心特征并提出操作定义,最后辨析与相似概念的关联性及本体论差异。全谱战争与全谱防御存在直接关联,后者要求抵御前者所有要素的冲击;而全域主导权则体现为对全谱战争各组成部分的防护、预防、反应与清除能力。

全谱战争不仅是多种应对工具的简单叠加,更强调建立统一的指挥控制体系、协同规划机制及预警感应网络,以应对跨频谱同步协调的复合攻击。其本质在于实现对抗手段的集成化协调,而非针对不同攻击频谱采取分散应对。

现有理论对全谱战争有多重解读:有观点认为其涵盖混合行为体可调用的国家军事/非军事力量与秘密行动谱系;美军将其"全域主导"定义为通过尖端战争机器实现对陆、海、空、天物理域的控制;该术语更深层指向人类安全的球形维度——安全即构建抵御外患的防护穹顶,而军事防护的终极形态正是通过间谍卫星和轨道武器掌控外太空。

对美军而言,全域主导是控制陆、海、空、天、网乃至心理空间的军事野心,其终极目标是在从常规战争到非常规战争的整个频谱保持绝对优势。该术语在克林顿时期指代从和平到常规战争的冲突阶段,要求具备全谱常规作战能力。拉姆斯菲尔德时期强调发展应对多元威胁的军事能力组合,规划覆盖所有潜在冲突类型的制胜方案,后更聚焦反恐和非常规战争领域。

澳大利亚的多域防御战略主张结合技术优势,依托通信、情报和天基能力构建五域一体防务体系,要求应对来自陆、海、空、天、网的多元军事威胁。俄罗斯虽理论建构较少,但实践了涵盖军事、信息、经济、能源频谱及政治影响行动的全谱冲突,有学者据此提出统合暴力/非暴力手段、贯穿和平至战争全强度谱系的冲突概念,强调需要中央统一指挥实现政治目标——若严格限定战争定义,诸如粮食制裁和偏见新闻传播等手段则不被纳入。

成为VIP会员查看完整内容
24

本研究探讨将大语言模型(LLM)整合到航空航天防御系统工程项目中,以实现两个关键流程的自动化:通过系统理论过程分析(STPA)获取需求,以及为航空航天防御系统需求分配合规方法(MoC)。其动机在于应对传统方法劳动密集且易出错的问题,这些方法高度依赖人工专业知识。该研究专门评估了在先进提示词工程技术和微调方法指导下的LLM(例如GPT-3.5和GPT-4)的可行性和性能。这些方法旨在达到或超越该领域专家通常实现的准确性和质量。所研究的问题是手动需求工程和合规流程的低效性和多变性,由于航空航天防御系统对安全性和可靠性有严格要求,这些问题在该领域尤为关键。研究以一个假设的“无人作战飞行器”(UCAV)作为案例,并将研究置于巴西空军(FAB)的背景下,因为这些挑战在该背景下尤为突出。该方法涉及通过定制的提示词自动化STPA的第一阶段以生成系统需求,并训练一个微调模型以准确分配合规方法。其性能以真实系统数据和领域专家的输出作为基准进行衡量。研究结果强调,经提示词工程指导的LLM能够生成满足或超越九项已评估质量属性中八项的需求,这些属性包括可测试性、完整性、清晰性和可修改性。微调后的“gpt-3.5-turbo”模型在合规方法分配任务中达到了80.18%的准确率。最后,借助适当的技术,能够从真实产品的技术文档生成初步危险分析(PHA)等安全评估报告。这项研究的意义深远。通过简化需求获取、合规方法分配和工程报告生成,LLM减少了相关工程流程的时间、人力和成本,同时保持了高度的严谨性和可靠性。这项工作增进了学术界对LLM在安全关键系统中应用的理解,引入了一个可扩展、可复制的框架用于将LLM集成到工程工作流中,并为航空航天防御行业提供了实用工具。

本文共分为七章:

第一章介绍研究主题,提供全面的背景知识,将研究置于当前学术和工业界图景中进行背景阐述,并确立其重要性。清晰阐述了研究问题,随后提出了旨在验证该假设的假设和具体研究目标。本章还探讨了人工智能应用在我们社会中的更广泛影响。

第二章提出理论框架,简要概述与本研究相关的关键概念。本章作为基础,涵盖了系统理论过程分析(STPA)、大语言模型(LLM)、提示词工程以及航空航天防御系统中的自动化合规性等基本主题,从而使读者具备必要的理论背景。

第三章包含文献综述,批判性分析了该领域近期的研究成果,并将本研究置于航空航天自动合规性与安全分析学术进展的更广阔图景中。本章重点指出了现有文献的贡献与不足,从而强调了本研究的原创性和必要性。

第四章详述了为实现第一章概述的研究目标所采用的方法论。它描述了具体技术,包括使用既定的提示词工程技术进行STPA分析,以及用于自动化合规方法(MoC)分配的微调过程,并解释了这些技术与研究目标的一致性。

第五章展示研究成果。本章批判性地审视了所遇到的局限性,探讨了基于人工智能的自动化技术的潜在影响,并验证了第四章所采用的方法论。

最后,第六章对全文进行总结,概括了本研究在该领域的贡献和意义。本章反思了研究目标在多大程度上得以实现,并为未来在航空航天防御系统中应用人工智能驱动的分析与合规性方面的潜在工作提供了见解。

通过这种结构化的组织,本论文旨在提供一个全面且连贯的论述,引导读者从基础理论和文献到实践方法、结果,以及对研究更广泛影响的思考。

成为VIP会员查看完整内容
25

大规模优化领域最持久的挑战之一在于如何突破可扩展性边界,同时不牺牲性能或严谨性。数十年来,计算能力的指数级增长提供了直接解决方案:更庞大的问题可由更强大的机器处理。然而近年来,单纯依靠算力已难以应对实际应用日益增长的复杂性与规模,这一趋势日益明显。此外,尽管通用线性与整数优化方法取得显著成功,但这些方法在涉及复杂动态、高维特性或需细粒度序列决策的领域仍面临挑战。由此引出关键问题:能否设计可扩展性更优的新型优化方法?本文提出融合动态规划、强化学习与列生成的实践路径,以应对多场景需求。首先在强化学习与动态规划框架内开发并完善方法论体系,继而拓展至列生成的应用实践,最终展示如何通过技术融合赋能基础机器学习方法,实现大规模优化目标。

第二章:探讨强化学习与博弈求解在扑克游戏中的应用。通过引入新颖的紧凑型扑克特征表征及全局最优决策树,解决状态空间表征问题并避免黑箱方法。本章将反事实遗憾最小化与上述技术结合,构建了可解释扑克智能体,其性能超越原世界冠军智能体Slumbot。

第三章:介绍动态规划求解超大规模问题的方法,并将其应用于广受欢迎的文字游戏Wordle。推导该游戏的数学模型及对应的贝尔曼方程,引入深度受限搜索与剪枝等优化技术,实现算法的大规模扩展以求解游戏。最终确定SALET为最优起始词,并证明最优策略最多使用5次猜测即可获胜——超越所有现有近似方法。

第四章:引入列生成与分支定价优化方法,在秒级时间内求解超大规模武器目标分配问题。将广义分配问题重构为适用于该方法的形式,并推导高效算法求解分支定价的各个组件。实验结果表明,相较现有方法实现多个数量级的加速。

第五章:将前几章开发的优化方法扩展至最优决策树训练领域。提出新颖的问题松弛形式,采用列生成与分支定价进行求解,并运用早期章节开发的动态规划方法高效处理分支定价的各个组件。将该方法推广至回归问题、广义损失函数及集成学习技术。实验证明相较现有方法实现数量级加速,且样本外性能超越传统方法,最终验证了该方法的优势。

第六章:将前述优化技术扩展至K均值聚类问题的最优求解。提出基于指数级规模公式的分支定价框架,包含可扩展求解器初始化策略与高效分支定界管理。针对定价问题提出创新的基于图的重构方法,显著降低计算复杂度,消除对数据维度的传统指数级依赖。通过将该方法扩展至k中心点聚类、鲁棒聚类变体,以及稠密子图、团优化等图挖掘问题,验证其广泛适用性。跨数据集综合实验表明,相较现有方法运行时间提升1-3个数量级,最优解相比启发式方法具有显著性能优势,验证了整体方法的鲁棒性与通用性。

第七章:总结本论文的核心贡献并给出结论性评述。

成为VIP会员查看完整内容
24

在逼真的空战模拟中实现任务目标极具挑战性,这源于态势感知的不完善和非线性飞行动力学。本文提出一种新型三维多智能体空战环境及分层多智能体强化学习框架以应对这些挑战。我们的方法融合了异构智能体动力学、课程学习、联赛式训练以及新改进的训练算法。该决策过程被组织为两个抽象层级:底层策略学习精确的飞控机动,而高层策略根据任务目标发布战术指令。实证结果表明,在复杂近距空战场景中,我们的分层方法提升了学习效率和作战性能。关键词——多智能体强化学习、分层策略、课程学习、空战模拟。

强化学习(RL)在复杂决策任务中展现出显著潜力。洛克希德·马丁公司的研究[1]是其有效性的典范——RL智能体在模拟空战场景中超越人类飞行员,成为该领域的里程碑。多智能体近距空战作为战斗机之间的近距离空中对抗,涉及快速机动、高速接战与精确协同。其固有复杂性源于部分可观测性、非线性动力学和对抗性交互,这使得近距空战成为多智能体强化学习(MARL)研究中极具挑战性的领域,要求精确控制和高级战术推理。

为应对这些挑战,开发了定制化的三维多智能体空战环境,该环境集成JSBSim飞行动力学模型[2],可实现物理精确且空气动力学精准的飞行器行为模拟。为有效学习复杂机动,我们采用分层多智能体强化学习(HMARL)方法,将决策过程构建为两个抽象层级:底层策略处理连续飞行器控制,高层策略发布引导战略行动与接战决策的战术指令。这种分层结构支持可解释的推理过程,促进复杂空战战术的涌现。我们进一步引入异构智能体以反映真实对抗中的多样化能力和作战角色。本文主要贡献包括:

• 提出适用于异构动力学条件下MARL模拟的逼真空战环境;
• 构建有效HMARL框架以学习竞争性空战中的高级策略;
• 改进新近提出的简单策略优化(SPO)算法[3]以适应多智能体场景;
• 通过实证验证模型优势并论证设计选择的合理性。

成为VIP会员查看完整内容
23

近日,中国信息通信研究院人工智能研究所联合中国人工智能产业发展联盟共同发布《大模型一体机应用研究报告(2025年)》。

在“人工智能+”的政策背景下,大模型技术快速发展,成为推动产业智能化升级的核心引擎。大模型一体机作为一种集成化、场景化的产品形态,凭借其行业化落地快速、安全可控、易用性强等优势,正成为促进人工智能与实体经济深度融合的关键基础设施,为千行百业的智能化转型提供高效、便捷的技术支撑。 过去一年,全球大模型技术与产业生态加速演进,大模型一体机作为技术落地的重要载体,在技术、应用与产业协同层面迎来重要进展。技术层面,大模型一体机通过软硬协同设计、优化算力调度与资源管理、集成全栈开发工具链与预置行业模型,支持数据处理、私有化部署和全开发流程加速,持续突破高性能与高安全性的技术瓶颈。产业层面,服务器厂商、云服务提供商、行业应用开发商及大模型技术供应商等纷纷入局,硬件-软件-服务一体化产业链初步形成,围绕大模型一体机的研发、生产、部署和服务的产业链条正在快速形成并联动发展,产业生态加速完善。应用层面,大模型一体机加速向千行百业渗透,覆盖政务、医疗、金融、制造、能源等关键领域,降低行业企业智能化应用门槛,各类创新应用层出不穷,规模化效应逐步凸显。

总体来看,我国大模型一体机技术能力持续突破、产业生态初具规模、应用场景百花齐放,但仍面临技术自主创新能力较为薄弱、应用场景适配难、安全隐私保障机制待完善等挑战。展望未来,随着大模型技术突破和行业需求爆发,大模型一体机有望成为大模型技术普惠化的重要突破口,为“人工智能+”行动提供坚实支撑。

图片 图片 图片 图片 图片 图片 图片 图片 图片 图片 图片 图片 图片

成为VIP会员查看完整内容
20

本文探讨了元宇宙对军事行动的变革性影响,重点聚焦于虚拟现实(VR)和增强现实(AR)技术如何彻底改变国防领域内的训练、通信与技术发展。元宇宙能够在无风险的虚拟环境中实现对战斗场景和军事行动的高度逼真模拟,从而提升决策能力与作战效能。它促进了地理上分散的人员之间的实时通信与协同,并为知情的战略规划提供详细的地形与资源分析。此外,元宇宙可作为先进军事技术的试验场,允许进行部署前的调整。案例研究,例如VR飞行员培训和指挥系统模拟,突显了其在提高训练成果和降低成本方面的有效性。

元宇宙是一个融合了虚拟现实(VR)、增强现实(AR)和混合现实(MR)的广阔虚拟环境,它正通过应对训练、通信和技术发展方面的关键挑战来重塑军事领域。这种沉浸式技术为逼真模拟提供了一个安全的互动空间,使军事人员能够练习和完善其技能,而无需承担与传统方法相关的风险和成本。适当的安全级别至关重要,因为过高的安全级别会导致额外的运营成本和/或功能缩减,而过低的安全级别则会导致用户不信任且不使用该系统(Dumitrache & Sandu, 2020)。在训练方面,元宇宙能够创建详细的战斗场景,士兵和指挥官可以在其中安全地演练战术机动和决策。它通过促进地理上分散的部队之间的实时互动来增强沟通与协作,从而改善协调与决策。此外,元宇宙可作为测试和开发新军事技术的平台,加速其在现实世界部署前的评估与完善。本章探讨了元宇宙对军事实践的变革性影响,重点阐述了其在提高效率、降低成本和增强作战效能方面的潜力。

元宇宙,这种扩展的、交互式的虚拟现实,近年来已成为众多领域广泛讨论和研究的话题。这项创新已引起IT行业、视频游戏、教育、医学、艺术、社交以及军事领域的关注。元宇宙发展历程中的一个关键时刻是迈克尔·齐达(Michael Zyda)于2000年代初在加州大学洛杉矶分校(UCLA)创立了第一个虚拟现实(VR)学术项目。该项目在为学生进入虚拟现实和模拟领域做准备方面发挥了开创性作用(Zyda, 2005a)。与此同时,阿尔伯特·里佐(Albert Rizzo)因其在利用虚拟现实治疗军人创伤后应激障碍(PTSD)方面的研究而闻名(Rizzo等人, 2017)。贝琳达·兰格(Belinda Lange)在军事训练和治疗的VR应用研究与开发方面做出了重大贡献,尤其侧重于压力和焦虑管理(Rizzo等人, 2011)。在同一背景下,谢里尔·布拉纳姆(Sheryl Brahnam)在人机交互和虚拟现实领域进行了显著的研究,并在军事背景下具有相关应用(Brahnam & Lakhmi, 2011)。

本文旨在审视元宇宙对军事研究与发展的影响,重点关注VR和AR技术如何有助于优化设计与测试流程、提高作战效能以及降低成本。通过研究这些方面,本文试图强调元宇宙在军事背景下的变革性益处,并全面理解其应用。

为引导读者,本文结构如下:第2节探讨元宇宙在军事领域的应用,包括其在训练、通信、分析和技术发展中的作用。第3节考察军事靶场上的虚拟训练与模拟,详述其演变和实际应用。第4节评估VR和AR技术对军事训练的影响,重点关注绩效评估、效能和成本降低。第5节讨论元宇宙在战场分析和决策中的作用,强调其对战术和战略规划的贡献。第6节深入探讨元宇宙内的研发工作,分析虚拟环境如何支持军事创新和技术测试。最后,第7节总结关键发现并反思元宇宙在军事研发中的未来潜力。这种结构化的方法旨在对元宇宙在军事实践的影响及其未来意义提供透彻的分析。

军事领域的元宇宙

元宇宙在军事背景下代表了一个充满前景的视角,它提供了一个扩展的、交互式的虚拟环境,可以改变军事人员与指挥官的互动、训练和实时决策方式。下文重点介绍了元宇宙在军事领域影响力的一些关键方面(Fawkes & Cheshire, 2019):

  1. 训练与模拟:元宇宙允许对战斗场景和军事行动进行逼真模拟。这种安全的虚拟环境为士兵和指挥官提供了训练和做出关键决策的机会,而无需危及生命或损耗昂贵的装备(Easley, 2022; Hajjami & Park, 2023)。

  2. 通信与协作:通过促进地理上分散的军事人员与指挥官之间的实时通信与协作,元宇宙优化了危急情况下的信息快速交换、行动协调和高效决策。获取更新信息和协调行动变得更为有效(Zhang等人, 2023)。

  3. 分析与规划:在军事行动前使用元宇宙对地形、目标和资源进行详细分析,增强了指挥官评估场景、制定战略和预测行动结果的能力。它为知情决策提供了全面的视角(Kenny, 2022)。

  4. 测试与技术发展:元宇宙成为测试和发展军事技术(如武器系统、监视设备或自主车辆)的理想场所。在虚拟环境中评估这些技术的效能,可以在其实施前进行调整(Wired, 2022)。

通过这些应用,元宇宙作为一种多功能工具脱颖而出,在转变军事实践和提高作战效能方面具有巨大潜力。

成为VIP会员查看完整内容
22

多模态基础模型——在视觉、语言及其他模态的多样化数据上训练的大规模神经网络——已成为处理、理解与生成多模态信息的强大工具。然而,我们对其基本属性及其在加速科学研究流程中的潜力仍缺乏深入理解。本论文从两个互相关联的方向出发,致力于弥补这一空白:推进多模态基础模型的科学研究,以及将其应用于科学发现

首先,我通过分析多模态基础模型的内部表征行为模式,加深了对其科学机理的理解。针对基于嵌入的多模态对比模型,我揭示并缓解了“模态鸿沟”问题——即视觉与语言表征之间持久存在的几何分离——并展示了消除这一鸿沟如何支持诸如跨模态检索多模态诊断等应用。针对生成式多模态大语言模型,我发现并应对了其在图像分类等核心能力上的意外弱点,并提出了更精确的评估策略。

其次,我探讨了这些模型如何加速科学发现过程——即揭示关于世界的未知知识的过程。我展示了多模态基础模型可作为交互式智能体,自动化复杂数据分析;也可作为虚拟实验环境,在计算机中模拟实验结果。例如,VisDi! 能识别由数千张图像组成的图像集中的细微差异,而 CellFlux 则可创建“虚拟细胞”,预测细胞对扰动的反应。这些进展为一种自动化科学发现框架铺平了道路,使系统能够自主地分析数据、生成假设、设计实验,并在仿真环境中进行快速验证。

综上所述,这两个研究方向形成了一个自我强化的循环:理论理解推动实践应用,而实践应用又反哺理论发展。这种协同效应将严谨的科学探究与变革性的现实影响相结合,为多模态智能与自动化科学的未来铺设了基础。

成为VIP会员查看完整内容
24
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员