摘 要 自主无人系统是一类具有自主感知和决策能力的智能系统, 在国防安全、航空航天、高性能机器人等方面有着广 泛的应用. 近年来, 基于 Transformer 架构的各类大模型快速革新, 极大地推动了自主无人系统的发展. 目前, 自主无人系 统正迎来一场以“具身智能”为核心的新一代技术革命. 大模型需要借助无人系统的物理实体来实现“具身化”, 无人系统可 以利用大模型技术来实现“智能化”. 本文阐述具身智能自主无人系统的发展现状, 详细探讨包含大模型驱动的多模态感知、 面向具身任务的推理与决策、基于动态交互的机器人学习与控制、三维场景具身模拟器等具身智能领域的关键技术. 最后, 指出目前具身智能无人系统所面临的挑战, 并展望未来的研究方向.

关键词 自主无人系统, 具身智能, 大语言模型,

人工智能具身智能的核心内涵是要求系统具备完整的自 主环境感知与认知能力、流畅的人机交互能力、可 靠的智能决策和运动操纵规划能力[1] , 能够通过与 环境的交互实现能力的泛化和对新场景的适应[2] . 具身智能的发展可以追溯到 20 世纪中期, Wiener[3] 提出的系统自我调节理念, 以及 Turing[4] 提出 的智能需要通过环境交互才能涌现的观点, 均强调 了智能系统与物理世界互动的重要性, 为具身智能 的发展提供了关键指导. 随着新一轮科技革命和产业变革的到来, 自主 无人系统逐渐成为具身智能技术的主要载体和应用 平台, 在国防军事、城市治理、精准医疗等多个领域 发挥着不可替代的重要作用[5−7] . 在俄乌军事冲突 中, 俄罗斯将“柳叶刀”无人机投入战场, 作为打击 装甲车辆和火炮系统的重要武器. 截至 2024 年 2 月 28 日, 俄军使用搭载高爆弹头的“柳叶刀”无人机进行了 1 163 次攻击, 共摧毁了 363 个目标, 并严 重破坏了 615 个目标, 这使得“柳叶刀”无人机成为 俄军中最有效率的精确制导武器之一. 与此同时, 反无人机系统的发展也在加速, 成为保护军事和民 用设施免受无人机威胁的关键手段[8] . 2023 年美国 研制生产了“模块化监视侦察反无人机系统” (亦称 “吸血鬼”系统). 该系统可安装在地面机动平台或固 定地点, 主要探测装置为球状光电模块化传感器和 激光指示器, 能够快速识别并拦截多种类型的无人 机, 确保在复杂环境中的有效防御[9] . 自主无人系统 已经成为提升综合国力的重要技术支撑[10−12] . 目前, 自主无人系统正迈入以“具身智能”为核 心的新一代技术革命阶段[13−14] . 传统的面向特定任 务、封闭场景的无人系统设计思路已不能满足社会 生产与军事应用的需求. 相比之下, 面向开放交互 环境的具身智能无人系统成为了未来的发展趋势[15] . 非结构化、未知、动态、开放的任务环境要求自主无 人系统具有自主学习能力, 可以在与环境交互中提 取有效信息, 实时调整和优化自身行为策略. 近年来, 基于 Transformer 架构的各类大模型快速革新[16−19] , 使得无人系统不仅可以准确理解自然语言指令、视 觉图像以及连续传感器状态等感知信息, 还能驱动 系统完成与开放环境的交互, 这极大地推动了无人 系统具身智能的发展. 在大语言模型的驱动下, 新一代具身智能无人系统的发展具有如下特征: 1) 在 应用场景上, 从封闭单一任务场景向开放任务场景 发展; 2) 在适用范围上, 从特定单一任务向通用任 务发展; 3) 在系统设计理念上, 从孤立的感知、控制、 决策模块向大模型驱动的各模块深度融合发展 (见 图 1). 本文内容安排如下: 第 1 节介绍具身智能无人 系统的发展现状, 概述近年来的重要成果; 第 2 节 针对具身智能无人系统的关键技术展开论述; 第 3 节综述具身智能无人系统两项典型的研究任务; 第 4 节展望具身智能无人系统的未来研究方向; 第 5 节总结全文.

成为VIP会员查看完整内容
0

相关内容

具身智能是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。
景象匹配无人机视觉定位
专知会员服务
19+阅读 · 2月20日
深度长尾学习研究综述
专知会员服务
24+阅读 · 2月12日
面向多源自主导航的智能学习方法研究
专知会员服务
27+阅读 · 2024年12月15日
从规则驱动到群智涌现: 多机器人空地协同研究综述
专知会员服务
29+阅读 · 2024年11月17日
专知会员服务
61+阅读 · 2021年7月5日
多源数据行人重识别研究综述
专知会员服务
41+阅读 · 2020年11月2日
专知会员服务
71+阅读 · 2020年10月2日
专知会员服务
122+阅读 · 2020年6月12日
3D目标检测进展综述
专知会员服务
193+阅读 · 2020年4月24日
图像修复研究进展综述
专知
19+阅读 · 2021年3月9日
领域知识图谱研究综述
专知
16+阅读 · 2020年8月2日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
30+阅读 · 2019年7月7日
国外有人/无人平台协同作战概述
无人机
111+阅读 · 2019年5月28日
【学科发展报告】无人船
中国自动化学会
28+阅读 · 2019年1月8日
无人机蜂群作战概念研究
无人机
55+阅读 · 2018年7月9日
智能无人机集群技术概述
无人机
42+阅读 · 2018年2月28日
国外无人水下航行器装备与技术现状及展望
无人机
13+阅读 · 2018年1月11日
水下无人系统发展现状及关键技术
无人机
21+阅读 · 2018年1月5日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
Arxiv
168+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
454+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
167+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
景象匹配无人机视觉定位
专知会员服务
19+阅读 · 2月20日
深度长尾学习研究综述
专知会员服务
24+阅读 · 2月12日
面向多源自主导航的智能学习方法研究
专知会员服务
27+阅读 · 2024年12月15日
从规则驱动到群智涌现: 多机器人空地协同研究综述
专知会员服务
29+阅读 · 2024年11月17日
专知会员服务
61+阅读 · 2021年7月5日
多源数据行人重识别研究综述
专知会员服务
41+阅读 · 2020年11月2日
专知会员服务
71+阅读 · 2020年10月2日
专知会员服务
122+阅读 · 2020年6月12日
3D目标检测进展综述
专知会员服务
193+阅读 · 2020年4月24日
相关资讯
图像修复研究进展综述
专知
19+阅读 · 2021年3月9日
领域知识图谱研究综述
专知
16+阅读 · 2020年8月2日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
30+阅读 · 2019年7月7日
国外有人/无人平台协同作战概述
无人机
111+阅读 · 2019年5月28日
【学科发展报告】无人船
中国自动化学会
28+阅读 · 2019年1月8日
无人机蜂群作战概念研究
无人机
55+阅读 · 2018年7月9日
智能无人机集群技术概述
无人机
42+阅读 · 2018年2月28日
国外无人水下航行器装备与技术现状及展望
无人机
13+阅读 · 2018年1月11日
水下无人系统发展现状及关键技术
无人机
21+阅读 · 2018年1月5日
相关基金
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员