《对抗性几何规划研究》2022最新论文，捷克理工大学 - 专知VIP

会员服务 ·

12

AI与军事 · 几何规划 · 对抗性几何规划 · 捷克国防大学 ·

2022 年 10 月 30 日

《对抗性几何规划研究》2022最新论文，捷克理工大学

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人工智能的主要目标之一是构建智能Agent，如计算机游戏中的对手或将包裹送到客户手中的无人驾驶飞行器。这些智能Agent在各种环境中感知和行动以实现其目标。例如，在电脑游戏的情况下，目标是击败玩家。在包裹运送无人机的情况下，目标是将包裹及时送到客户手中。

Agent感知环境的状态，并需要决定下一步该做什么。一种可能的方法是强化学习[36]，即Agent从与环境的互动中学习。这种方法在一些领域是成功的，在围棋[60]、《星际争霸》[66]或Atari游戏[41]中取得了超人的表现。Agent如何在环境中行动的另一种方法是事先创建一个行动计划。对于一个给定的目标，Agent计算出导致它的行动序列。自动计划在许多领域都是成功的，如深空1号[4]或火星探测器任务[1]。自动规划的一个缺点是，当环境意外改变时，Agent通常不能再向目标前进。这种情况要么是随机发生的，要么是由其他对手Agent的行动引起的。为了明确地推理其他Agent并找到一个稳健的计划，必须使用博弈论方法[59]，如 double-oracle（DO，见图1）。博弈论算法在实践中有几个成功的应用，例如，在物理安全[64]或保护野生动物[19]领域。我们关注的更多案例是战斗情况，如用无人机保卫核电站，抵御侵略者。

这项工作的主要目标是通过加强几何推理来推进自动对抗性规划的算法。尽管规划域定义语言（PDDL）[39]是一个富有表现力的建模工具，但对行动的结构有一个重要的限制：行动的参数被限制在有限（实际上是明确列举的）域的值上。这种限制的动机是，它确保了有基础的行动集合是有限的，而且，忽略持续时间，在一个状态下的行动选择的分支因素也是有限的。尽管持续时间参数可以使这种选择无限大，但很少有规划者支持这种可能性，而是将自己限制在固定的持续时间上。像吉普车穿越未知宽度的沙漠这样的问题是无法解决的[32]。

图 1：对抗性规划、资源分配、双预言机算法、几何导航（从左到右）。

我们提议对PDDL进行扩展，以丰富具有几何特征的行动。我们实现了能够将推理提升到空间领域的规划器，并将其应用于对抗性环境。我们说明这些方法可以解决有趣的问题，并将这项工作应用于任务和运动规划场景（图2），以表明我们的工作有很大的潜力，可以重新发明机器人技术中使用任务规划器的方式。即使没有对手，几何学也是有效的，但在DO算法中，规划器被多次调用以获得最佳响应，所以作为一个乘数，我们有，如果对手的规划域是几何学的，可溶性和扩展性会变得更好。

图 2：几何任务-运动规划：循环、线性近似、检查运动规划（从左到右）。

成为VIP会员查看完整内容

32

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

专知会员服务

50+阅读 · 2022年11月22日

【集群机器人】《考虑对手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑对手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知会员服务

251+阅读 · 2022年11月21日

《美国防部对抗性机器学习》34页slides，卡内基梅隆大学

《美国防部对抗性机器学习》34页slides，卡内基梅隆大学

专知会员服务

65+阅读 · 2022年11月12日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知会员服务

105+阅读 · 2022年9月22日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

104+阅读 · 2022年9月21日

【博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知会员服务

99+阅读 · 2022年9月21日

【含源码】《用于对抗性机器学习的兵棋推演框架（Ares）》纽约州立大学石溪分校

【含源码】《用于对抗性机器学习的兵棋推演框架（Ares）》纽约州立大学石溪分校

专知会员服务

56+阅读 · 2022年9月1日

【知识论概念】《理由论的进展》鲁汶大学2022最新220页博士论文

【知识论概念】《理由论的进展》鲁汶大学2022最新220页博士论文

专知会员服务

15+阅读 · 2022年8月9日

《异质性在自主周界防御问题中的影响》美国陆军研究实验室支持，麻省理工、普林斯顿、南加州等高校联合发表27页论文

《异质性在自主周界防御问题中的影响》美国陆军研究实验室支持，麻省理工、普林斯顿、南加州等高校联合发表27页论文

专知会员服务

25+阅读 · 2022年5月28日

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

专知会员服务

88+阅读 · 2020年12月17日

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

专知

5+阅读 · 2022年11月24日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

27+阅读 · 2022年11月23日

【量子强化学习】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

【量子强化学习】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

专知

3+阅读 · 2022年10月11日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知

8+阅读 · 2022年9月22日

推荐！【博士论文】《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》2022最新325页论文

推荐！【博士论文】《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》2022最新325页论文

专知

7+阅读 · 2022年9月20日

【工业知识图谱 - 195页博士论文】《基于知识图谱的工业4.0集成方法》波恩大学

【工业知识图谱 - 195页博士论文】《基于知识图谱的工业4.0集成方法》波恩大学

专知

4+阅读 · 2022年8月27日

时隔五年，普林斯顿大学经典书《在线凸优化导论》第二版发表

时隔五年，普林斯顿大学经典书《在线凸优化导论》第二版发表

机器之心

2+阅读 · 2021年12月29日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

InfoQ

3+阅读 · 2021年12月20日

机器也能学会如何学习？——元学习介绍

机器也能学会如何学习？——元学习介绍

AINLP

19+阅读 · 2019年9月22日

大学生实习失度性研究

国家自然科学基金

1+阅读 · 2014年12月31日

非光滑矩阵优化问题的理论与算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

智能车驾驶脑认知技术、平台与转化研究

国家自然科学基金

2+阅读 · 2013年12月31日

热害隧道全长粘结式锚杆力学性能及损伤机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于场景的构件行为建模和组合研究

国家自然科学基金

2+阅读 · 2012年12月31日

非线性反馈移位寄存器序列子簇的研究

国家自然科学基金

0+阅读 · 2012年12月31日

组合优化问题的组合：问题、算法和复杂性

国家自然科学基金

5+阅读 · 2012年12月31日

基于交互式动态影响图的未知对手模型学习

国家自然科学基金

3+阅读 · 2012年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于自适应动态规划的波形优化方法及在雷达通信中的应用

国家自然科学基金

2+阅读 · 2008年12月31日

End-to-end Wind Turbine Wake Modelling with Deep Graph Representation Learning

Arxiv

0+阅读 · 2022年12月17日

S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction

Arxiv

0+阅读 · 2022年12月14日

Collision-free Source Seeking Control Methods for Unicycle Robots

Arxiv

0+阅读 · 2022年12月14日

ContrastMask: Contrastive Learning to Segment Every Thing

Arxiv

15+阅读 · 2022年3月18日

Unsupervised Multi-Source Domain Adaptation for Person Re-Identification

Arxiv

14+阅读 · 2021年4月27日

DOC2PPT: Automatic Presentation Slides Generation from Scientific Documents

Arxiv

14+阅读 · 2021年2月14日

已删除

Arxiv

32+阅读 · 2020年3月23日

Knowledge Graph Transfer Network for Few-Shot Recognition

Arxiv

15+阅读 · 2019年11月21日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Learning Embedding Adaptation for Few-Shot Learning

Learning Embedding Adaptation for Few-Shot Learning

Arxiv

17+阅读 · 2018年12月10日

VIP会员

相关主题

对抗性几何规划

捷克国防大学

相关VIP内容

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

专知会员服务

50+阅读 · 2022年11月22日

【集群机器人】《考虑对手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑对手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知会员服务

251+阅读 · 2022年11月21日

《美国防部对抗性机器学习》34页slides，卡内基梅隆大学

《美国防部对抗性机器学习》34页slides，卡内基梅隆大学

专知会员服务

65+阅读 · 2022年11月12日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知会员服务

105+阅读 · 2022年9月22日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

104+阅读 · 2022年9月21日

【博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知会员服务

99+阅读 · 2022年9月21日

【含源码】《用于对抗性机器学习的兵棋推演框架（Ares）》纽约州立大学石溪分校

【含源码】《用于对抗性机器学习的兵棋推演框架（Ares）》纽约州立大学石溪分校

专知会员服务

56+阅读 · 2022年9月1日

【知识论概念】《理由论的进展》鲁汶大学2022最新220页博士论文

【知识论概念】《理由论的进展》鲁汶大学2022最新220页博士论文

专知会员服务

15+阅读 · 2022年8月9日

《异质性在自主周界防御问题中的影响》美国陆军研究实验室支持，麻省理工、普林斯顿、南加州等高校联合发表27页论文

《异质性在自主周界防御问题中的影响》美国陆军研究实验室支持，麻省理工、普林斯顿、南加州等高校联合发表27页论文

专知会员服务

25+阅读 · 2022年5月28日

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

专知会员服务

88+阅读 · 2020年12月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICML2025】用于持续多模态指令微调的动态课程化LoRA专家混合机制

生成模型中持续学习的综合综述

【斯坦福博士论文】通过以人为本的自然语言界面拓展 AI 的可及性

【新书】《LangChain生成式AI实战：使用 Python 与 LangGraph 构建大语言模型应用与高级智能体》

相关资讯

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

专知

5+阅读 · 2022年11月24日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

27+阅读 · 2022年11月23日

【量子强化学习】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

【量子强化学习】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

专知

3+阅读 · 2022年10月11日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知

8+阅读 · 2022年9月22日

推荐！【博士论文】《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》2022最新325页论文

推荐！【博士论文】《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》2022最新325页论文

专知

7+阅读 · 2022年9月20日

【工业知识图谱 - 195页博士论文】《基于知识图谱的工业4.0集成方法》波恩大学

【工业知识图谱 - 195页博士论文】《基于知识图谱的工业4.0集成方法》波恩大学

专知

4+阅读 · 2022年8月27日

时隔五年，普林斯顿大学经典书《在线凸优化导论》第二版发表

时隔五年，普林斯顿大学经典书《在线凸优化导论》第二版发表

机器之心

2+阅读 · 2021年12月29日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

InfoQ

3+阅读 · 2021年12月20日

机器也能学会如何学习？——元学习介绍

机器也能学会如何学习？——元学习介绍

AINLP

19+阅读 · 2019年9月22日

相关基金

大学生实习失度性研究

国家自然科学基金

1+阅读 · 2014年12月31日

非光滑矩阵优化问题的理论与算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

智能车驾驶脑认知技术、平台与转化研究

国家自然科学基金

2+阅读 · 2013年12月31日

热害隧道全长粘结式锚杆力学性能及损伤机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于场景的构件行为建模和组合研究

国家自然科学基金

2+阅读 · 2012年12月31日

非线性反馈移位寄存器序列子簇的研究

国家自然科学基金

0+阅读 · 2012年12月31日

组合优化问题的组合：问题、算法和复杂性

国家自然科学基金

5+阅读 · 2012年12月31日

基于交互式动态影响图的未知对手模型学习

国家自然科学基金

3+阅读 · 2012年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于自适应动态规划的波形优化方法及在雷达通信中的应用

国家自然科学基金

2+阅读 · 2008年12月31日

相关论文

End-to-end Wind Turbine Wake Modelling with Deep Graph Representation Learning

Arxiv

0+阅读 · 2022年12月17日

S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction

Arxiv

0+阅读 · 2022年12月14日

Collision-free Source Seeking Control Methods for Unicycle Robots

Arxiv

0+阅读 · 2022年12月14日

ContrastMask: Contrastive Learning to Segment Every Thing

Arxiv

15+阅读 · 2022年3月18日

Unsupervised Multi-Source Domain Adaptation for Person Re-Identification

Arxiv

14+阅读 · 2021年4月27日

DOC2PPT: Automatic Presentation Slides Generation from Scientific Documents

Arxiv

14+阅读 · 2021年2月14日

已删除

Arxiv

32+阅读 · 2020年3月23日

Knowledge Graph Transfer Network for Few-Shot Recognition

Arxiv

15+阅读 · 2019年11月21日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Learning Embedding Adaptation for Few-Shot Learning

Learning Embedding Adaptation for Few-Shot Learning

Arxiv

17+阅读 · 2018年12月10日

微信扫码咨询专知VIP会员