《深度强化学习在集群系统中的应用》31页论文 - 专知VIP

会员服务 ·

32

AI与军事 · 深度强化学习 · 多智能体 · 集群系统 ·

2023 年 3 月 14 日

《深度强化学习在集群系统中的应用》31页论文

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近，深度强化学习（RL）方法已被成功应用于多智能体场景。通常情况下，分布式决策的观测向量是由一个智能体收集的关于其他智能体（局部）信息的串联来表示。然而，串联法在具有大量同质智能体的集群系统中的扩展性很差，因为它没有利用这些系统固有的基本特性：（i）集群中的智能体是可以互换的；（ii）集群中智能体的确切数量是不相关的。因此，我们提出了一种新的基于分布式均值嵌入的深度多智能体RL状态表示，我们将智能体视为样本，并使用经验的均值嵌入作为分布式策略的输入。我们使用直方图、径向基函数和端到端训练的神经网络来定义均值嵌入的不同特征空间。我们对集群文献中的两个著名问题--交会和追赶逃避--在全局和局部可观察的设置中评估了该表示。对于本地设置，我们进一步引入了简单的通信协议。在所有的方法中，使用神经网络特征的平均嵌入表示能够在相邻的智能体之间进行最丰富的信息交流，促进复杂的集体策略的开发。

成为VIP会员查看完整内容

59

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

专知会员服务

141+阅读 · 2023年3月25日

【阿姆斯特丹博士论文】为强化学习和计算机视觉应用构建深度学习模型，216页pdf

【阿姆斯特丹博士论文】为强化学习和计算机视觉应用构建深度学习模型，216页pdf

专知会员服务

50+阅读 · 2023年3月22日

《分布式多智能体深度强化学习：竞争性博弈》最新论文

《分布式多智能体深度强化学习：竞争性博弈》最新论文

专知会员服务

127+阅读 · 2023年3月16日

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

专知会员服务

43+阅读 · 2023年2月2日

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

89+阅读 · 2022年12月12日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

《多智能体任务规划》2022博士论文

《多智能体任务规划》2022博士论文

专知会员服务

282+阅读 · 2022年11月20日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知会员服务

268+阅读 · 2022年10月5日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知会员服务

50+阅读 · 2022年9月2日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【DARPA终身学习机器（L2M）计划】《终身学习衡量标准》约翰霍普金斯大学应用物理实验室2022最新23页论文

【DARPA终身学习机器（L2M）计划】《终身学习衡量标准》约翰霍普金斯大学应用物理实验室2022最新23页论文

专知

3+阅读 · 2022年11月8日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

49+阅读 · 2022年10月6日

《探索多行动回合制兵棋的学习分类系统行为》美国空军学院2022最新102页论文

《探索多行动回合制兵棋的学习分类系统行为》美国空军学院2022最新102页论文

专知

7+阅读 · 2022年9月28日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知

3+阅读 · 2022年9月3日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

24+阅读 · 2022年7月5日

【论文笔记】基于强化学习的人机对话

【论文笔记】基于强化学习的人机对话

专知

20+阅读 · 2019年9月21日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

OpenAI ICLR 2018论文汇总：主要兴趣为强化学习

OpenAI ICLR 2018论文汇总：主要兴趣为强化学习

论智

19+阅读 · 2018年5月1日

干货｜深度强化学习在面向任务的对话管理中的应用

干货｜深度强化学习在面向任务的对话管理中的应用

全球人工智能

13+阅读 · 2017年9月14日

基于二值特征描述符的目标表示及其应用

国家自然科学基金

2+阅读 · 2014年12月31日

时延异构多自主体系统的一致性研究及其在混合无人机/无人车系统中的应用

国家自然科学基金

5+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于跨域深度学习的复杂视频场景分类方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于集值函数描述的移动机器人自主行为基础问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于矩阵与图理论的多智能体一致性分析研究

国家自然科学基金

2+阅读 · 2011年12月31日

跨姿态人脸识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于"非监督-监督-激励"集成学习模式的机器人行为自主学习系统研究

国家自然科学基金

1+阅读 · 2010年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

Short definitions in constraint languages

Arxiv

0+阅读 · 2023年5月3日

Judgment Sieve: Reducing Uncertainty in Group Judgments through Interventions Targeting Ambiguity versus Disagreement

Arxiv

0+阅读 · 2023年5月2日

AQ-GT: a Temporally Aligned and Quantized GRU-Transformer for Co-Speech Gesture Synthesis

Arxiv

0+阅读 · 2023年5月2日

SIHR: Statistical Inference in High-Dimensional Linear and Logistic Regression Models

Arxiv

0+阅读 · 2023年5月2日

Neural Stein critics with staged $L^2$-regularization

Arxiv

0+阅读 · 2023年5月2日

H2CGL: Modeling Dynamics of Citation Network for Impact Prediction

Arxiv

0+阅读 · 2023年4月16日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

CausalVAE: Disentangled Representation Learning via Neural Structural Causal Models

Arxiv

17+阅读 · 2021年3月23日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

VIP会员

相关主题

深度强化学习

相关VIP内容

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

专知会员服务

141+阅读 · 2023年3月25日

【阿姆斯特丹博士论文】为强化学习和计算机视觉应用构建深度学习模型，216页pdf

【阿姆斯特丹博士论文】为强化学习和计算机视觉应用构建深度学习模型，216页pdf

专知会员服务

50+阅读 · 2023年3月22日

《分布式多智能体深度强化学习：竞争性博弈》最新论文

《分布式多智能体深度强化学习：竞争性博弈》最新论文

专知会员服务

127+阅读 · 2023年3月16日

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

专知会员服务

43+阅读 · 2023年2月2日

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

89+阅读 · 2022年12月12日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

《多智能体任务规划》2022博士论文

《多智能体任务规划》2022博士论文

专知会员服务

282+阅读 · 2022年11月20日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知会员服务

268+阅读 · 2022年10月5日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知会员服务

50+阅读 · 2022年9月2日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

【DARPA终身学习机器（L2M）计划】《终身学习衡量标准》约翰霍普金斯大学应用物理实验室2022最新23页论文

【DARPA终身学习机器（L2M）计划】《终身学习衡量标准》约翰霍普金斯大学应用物理实验室2022最新23页论文

专知

3+阅读 · 2022年11月8日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

49+阅读 · 2022年10月6日

《探索多行动回合制兵棋的学习分类系统行为》美国空军学院2022最新102页论文

《探索多行动回合制兵棋的学习分类系统行为》美国空军学院2022最新102页论文

专知

7+阅读 · 2022年9月28日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知

3+阅读 · 2022年9月3日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

24+阅读 · 2022年7月5日

【论文笔记】基于强化学习的人机对话

【论文笔记】基于强化学习的人机对话

专知

20+阅读 · 2019年9月21日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

OpenAI ICLR 2018论文汇总：主要兴趣为强化学习

OpenAI ICLR 2018论文汇总：主要兴趣为强化学习

论智

19+阅读 · 2018年5月1日

干货｜深度强化学习在面向任务的对话管理中的应用

干货｜深度强化学习在面向任务的对话管理中的应用

全球人工智能

13+阅读 · 2017年9月14日

相关基金

基于二值特征描述符的目标表示及其应用

国家自然科学基金

2+阅读 · 2014年12月31日

时延异构多自主体系统的一致性研究及其在混合无人机/无人车系统中的应用

国家自然科学基金

5+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于跨域深度学习的复杂视频场景分类方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于集值函数描述的移动机器人自主行为基础问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于矩阵与图理论的多智能体一致性分析研究

国家自然科学基金

2+阅读 · 2011年12月31日

跨姿态人脸识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于"非监督-监督-激励"集成学习模式的机器人行为自主学习系统研究

国家自然科学基金

1+阅读 · 2010年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Short definitions in constraint languages

Arxiv

0+阅读 · 2023年5月3日

Judgment Sieve: Reducing Uncertainty in Group Judgments through Interventions Targeting Ambiguity versus Disagreement

Arxiv

0+阅读 · 2023年5月2日

AQ-GT: a Temporally Aligned and Quantized GRU-Transformer for Co-Speech Gesture Synthesis

Arxiv

0+阅读 · 2023年5月2日

SIHR: Statistical Inference in High-Dimensional Linear and Logistic Regression Models

Arxiv

0+阅读 · 2023年5月2日

Neural Stein critics with staged $L^2$-regularization

Arxiv

0+阅读 · 2023年5月2日

H2CGL: Modeling Dynamics of Citation Network for Impact Prediction

Arxiv

0+阅读 · 2023年4月16日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

CausalVAE: Disentangled Representation Learning via Neural Structural Causal Models

Arxiv

17+阅读 · 2021年3月23日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

微信扫码咨询专知VIP会员