空战机动模拟《动态对抗博弈中的单目标和多目标强化学习》240页 - 专知VIP

会员服务 ·

79

AI与军事 · 多目标强化学习 · 博弈对抗 · 博士论文 · 空战机动 ·

2024 年 3 月 11 日

空战机动模拟《动态对抗博弈中的单目标和多目标强化学习》240页

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本论文利用强化学习（RL）来解决空战机动模拟中的动态对抗博弈问题。空战机动模拟是运筹学领域常见的一种顺序决策问题，传统上依赖于智能体编程方法，需要将大量领域知识手动编码到模拟环境中。这些方法适用于确定现有战术在不同模拟场景中的有效性。然而，为了最大限度地发挥新技术（如自动驾驶飞机）的优势，需要发现新的战术。作为解决连续决策问题的成熟技术，RL 有可能发现这些新战术。

本论文探讨了四种 RL 方法--表式、深度、离散到深度和多目标--作为在空战机动模拟中发现新行为的机制。它实现并测试了每种方法的几种方法，并从学习时间、基准和比较性能以及实现复杂性等方面对这些方法进行了比较。除了评估现有方法对空战机动这一特定任务的实用性外，本论文还提出并研究了两种新型方法，即离散到深度监督策略学习（D2D-SPL）和离散到深度监督 Q 值学习（D2D-SQL），这两种方法可以更广泛地应用。D2D-SPL 和 D2D-SQL 以更接近表格方法的成本提供了深度 RL 的通用性。

贡献

本文有助于以下研究领域：

设计奖励信号以推动空战机动领域的学习，以及确定最有效信号的相应评估。
第 6 章中介绍的结合 RL 和监督学习的新方法，可加速深度 RL 并超越基准算法。考虑到 RL 的训练是一项非常昂贵和资源密集型的操作，这些缩短学习时间的新方法是本论文最重要的贡献。
优于单目标智能体的多目标 RL 智能体，在第 7 章中介绍。这是一个非常重要的贡献，因为它证明了多目标 RL 这一相对较新的发明可以在不增加学习时间的情况下超越单目标 RL 的性能。
用于训练和测试单目标和多目标 RL 智能体的开源框架。

成为VIP会员查看完整内容

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

计算机生成兵力《计算生成动作：生成空战行为》249页

计算机生成兵力《计算生成动作：生成空战行为》249页

专知会员服务

105+阅读 · 2024年3月20日

《视距内空对空作战中遥控飞机指挥和控制延迟的影响》122页

《视距内空对空作战中遥控飞机指挥和控制延迟的影响》122页

专知会员服务

70+阅读 · 2024年3月13日

《分布式海战中的人机协同作战》142页报告

《分布式海战中的人机协同作战》142页报告

专知会员服务

224+阅读 · 2023年9月19日

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

专知会员服务

34+阅读 · 2023年6月24日

《基于强化学习开发战斗行为》美国海军研究生院

《基于强化学习开发战斗行为》美国海军研究生院

专知会员服务

99+阅读 · 2022年6月27日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

57+阅读 · 2023年4月6日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

109+阅读 · 2023年4月5日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

39+阅读 · 2022年10月30日

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

专知

47+阅读 · 2022年8月31日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

63+阅读 · 2022年8月25日

风切变诱发飞行失控的包线估计及保护控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

复杂战场环境下的几个目标跟踪新问题研究

国家自然科学基金

63+阅读 · 2014年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

基于动态贝叶斯网络的空天态势评估方法研究

国家自然科学基金

44+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

107+阅读 · 2023年4月11日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

180+阅读 · 2023年3月24日

VIP会员

相关主题

多目标强化学习

相关VIP内容

计算机生成兵力《计算生成动作：生成空战行为》249页

计算机生成兵力《计算生成动作：生成空战行为》249页

专知会员服务

105+阅读 · 2024年3月20日

《视距内空对空作战中遥控飞机指挥和控制延迟的影响》122页

《视距内空对空作战中遥控飞机指挥和控制延迟的影响》122页

专知会员服务

70+阅读 · 2024年3月13日

《分布式海战中的人机协同作战》142页报告

《分布式海战中的人机协同作战》142页报告

专知会员服务

224+阅读 · 2023年9月19日

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

专知会员服务

34+阅读 · 2023年6月24日

《基于强化学习开发战斗行为》美国海军研究生院

《基于强化学习开发战斗行为》美国海军研究生院

专知会员服务

99+阅读 · 2022年6月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机系统 - 反无人机系统：测试方法》364页

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

美军低成本无人作战攻击系统（LUCAS）：扩大无人机战争规模

《将空中力量带向海洋：美国海军航空发展的四条竞争路径及其教训》报告

相关资讯

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

57+阅读 · 2023年4月6日

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

《利用边缘高性能计算 (HPC) 加速战术决策过程》美国陆军，43页报告

专知

109+阅读 · 2023年4月5日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

39+阅读 · 2022年10月30日

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

专知

47+阅读 · 2022年8月31日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

63+阅读 · 2022年8月25日

相关基金

风切变诱发飞行失控的包线估计及保护控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

复杂战场环境下的几个目标跟踪新问题研究

国家自然科学基金

63+阅读 · 2014年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

基于动态贝叶斯网络的空天态势评估方法研究

国家自然科学基金

44+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

107+阅读 · 2023年4月11日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

180+阅读 · 2023年3月24日

微信扫码咨询专知VIP会员