《利用强化学习为多领域大规模疏散行动提供决策支持》 - 专知VIP

会员服务 ·

15

AI与军事 · 强化学习 · 大规模疏散行动 ·

《利用强化学习为多领域大规模疏散行动提供决策支持》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文研究了这样一种情景：大量处于不同程度医疗困境的人员被困在偏远地区（如北极），必须进行疏散。在此背景下，研究了一种多域行动，即通过直升机或船只两种方式之一进行人员疏散，每种方式都有各自的能力限制。这项研究的目的是确定一种决策策略，其目标是最大限度地增加幸存者人数。为了实现这一目标，我们需要寻求一种策略，在整个行动过程中有效协调直升机撤离和轮船撤离的选择。我们的贡献有两个方面。首先，我们将多领域大规模疏散行动表述为马尔可夫决策过程。其次，由于 "维度诅咒"（curse of dimensionality）使得精确方法不适用，我们采用了人工智能框架，即强化学习（RL），也称为运筹学中的近似动态规划（ADP），来学习近乎最优的策略。利用基于状态聚合的价值函数近似值，我们设计了一种 ADP 算法，以便在具有代表性的规划场景中学习策略。然后，我们在一系列测试场景中应用该策略，并将结果与非协调基准策略进行比较。虽然我们学习到的策略并没有优于所有基准，但我们的结果表明了人工智能可如何用于评估候选策略，并在多领域行动中提供决策支持。

成为VIP会员查看完整内容

21

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《重新思考战斗人工智能和人类监督》

《重新思考战斗人工智能和人类监督》

专知会员服务

51+阅读 · 5月5日

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

专知会员服务

31+阅读 · 3月24日

《基于自然语言的人工智能军事决策支持》

《基于自然语言的人工智能军事决策支持》

专知会员服务

77+阅读 · 1月25日

《JADC2中实现分布式执行：单元级情报案例研究》中文版

《JADC2中实现分布式执行：单元级情报案例研究》中文版

专知会员服务

90+阅读 · 2023年8月22日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

96+阅读 · 2023年7月10日

《结合机器人行为以实现安全、智能的执行》

《结合机器人行为以实现安全、智能的执行》

专知会员服务

14+阅读 · 2023年7月4日

军事跨组织协调《协调形式之间的转变：能力和组织结构的作用》

军事跨组织协调《协调形式之间的转变：能力和组织结构的作用》

专知会员服务

18+阅读 · 2023年6月14日

《军事背景下能力规划的概念模型》

《军事背景下能力规划的概念模型》

专知会员服务

114+阅读 · 2023年3月28日

《自主系统的人为控制》

《自主系统的人为控制》

专知会员服务

50+阅读 · 2023年2月13日

中文版《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

中文版《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知会员服务

85+阅读 · 2022年6月1日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

32+阅读 · 2023年4月6日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

17+阅读 · 2022年11月25日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

31+阅读 · 2022年11月19日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

34+阅读 · 2022年11月5日

《基于军事能力规划的计算机辅助兵棋推演》18页论文，北约总部盟军最高指挥官转型

《基于军事能力规划的计算机辅助兵棋推演》18页论文，北约总部盟军最高指挥官转型

专知

23+阅读 · 2022年10月16日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

29+阅读 · 2022年10月6日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

39+阅读 · 2022年8月25日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

28+阅读 · 2022年8月11日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

41+阅读 · 2022年4月25日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

33+阅读 · 2022年1月8日

投资者有限关注与证券市场监管：基于大数据和计算实验的方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于多轴飞行器航拍数据的植物生长分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于高效蒙特卡罗策略的最优化方法及应用研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

29+阅读 · 2015年12月31日

PPP项目争端谈判及其治理机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

4+阅读 · 2014年12月31日

绿色创新的路径依赖与解锁策略：基于过程视角的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

2+阅读 · 2014年12月31日

残缺判断信息下专家共识群决策理论、方法及应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

15+阅读 · 2012年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

134+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

30+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

141+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

52+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

328+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

90+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

54+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

56+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

115+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

16+阅读 · 2023年3月17日

VIP会员

相关主题

大规模疏散行动

相关VIP内容

《重新思考战斗人工智能和人类监督》

《重新思考战斗人工智能和人类监督》

专知会员服务

51+阅读 · 5月5日

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

专知会员服务

31+阅读 · 3月24日

《基于自然语言的人工智能军事决策支持》

《基于自然语言的人工智能军事决策支持》

专知会员服务

77+阅读 · 1月25日

《JADC2中实现分布式执行：单元级情报案例研究》中文版

《JADC2中实现分布式执行：单元级情报案例研究》中文版

专知会员服务

90+阅读 · 2023年8月22日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

96+阅读 · 2023年7月10日

《结合机器人行为以实现安全、智能的执行》

《结合机器人行为以实现安全、智能的执行》

专知会员服务

14+阅读 · 2023年7月4日

军事跨组织协调《协调形式之间的转变：能力和组织结构的作用》

军事跨组织协调《协调形式之间的转变：能力和组织结构的作用》

专知会员服务

18+阅读 · 2023年6月14日

《军事背景下能力规划的概念模型》

《军事背景下能力规划的概念模型》

专知会员服务

114+阅读 · 2023年3月28日

《自主系统的人为控制》

《自主系统的人为控制》

专知会员服务

50+阅读 · 2023年2月13日

中文版《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

中文版《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知会员服务

85+阅读 · 2022年6月1日

热门VIP内容

相关资讯

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

32+阅读 · 2023年4月6日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

17+阅读 · 2022年11月25日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

31+阅读 · 2022年11月19日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

34+阅读 · 2022年11月5日

《基于军事能力规划的计算机辅助兵棋推演》18页论文，北约总部盟军最高指挥官转型

《基于军事能力规划的计算机辅助兵棋推演》18页论文，北约总部盟军最高指挥官转型

专知

23+阅读 · 2022年10月16日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

29+阅读 · 2022年10月6日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

39+阅读 · 2022年8月25日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

28+阅读 · 2022年8月11日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

41+阅读 · 2022年4月25日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

33+阅读 · 2022年1月8日

相关基金

投资者有限关注与证券市场监管：基于大数据和计算实验的方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于多轴飞行器航拍数据的植物生长分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于高效蒙特卡罗策略的最优化方法及应用研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

29+阅读 · 2015年12月31日

PPP项目争端谈判及其治理机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

4+阅读 · 2014年12月31日

绿色创新的路径依赖与解锁策略：基于过程视角的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

2+阅读 · 2014年12月31日

残缺判断信息下专家共识群决策理论、方法及应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

15+阅读 · 2012年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

134+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

30+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

141+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

52+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

328+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

90+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

54+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

56+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

115+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

16+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员