《分布式多智能体强化学习的编码》加州大学等 - 专知VIP

会员服务 ·

23

AI与军事 · 多智能体 · 强化学习 · 加州大学 (University of California) ·

2022 年 11 月 2 日

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

DCIST联盟成员的一篇论文开发了一种多智能体强化学习（MARL）算法，该算法使用编码理论来减轻分布式训练中的滞留者效应。滞留者是指延迟的、无反应的或被破坏的计算节点，由于通信瓶颈和对抗性条件，在分布式学习系统中经常发生。编码技术已经被用来加速存在散兵游勇的分布式计算任务，如矩阵乘法和逆问题。他们提出的编码分布式学习框架可以与任何策略梯度方法一起应用，在存在散兵游勇的情况下为MARL问题训练策略。他们开发了多智能体深度确定性策略梯度（MADDPG）的编码分布式版本，这是一种最先进的MARL算法。为了全面了解编码在分布式MARL中的好处，他们研究了各种编码方案，包括最大距离可分离（MDS）编码、随机稀疏编码、基于复制的编码和常规低密度奇偶校验（LDPC）编码。所有这些方法都在几个多机器人问题的模拟中实现，包括协作导航、捕食者-猎物、物理欺骗和远离任务。他们的方法实现了相同的训练精度，同时大大加快了策略梯度算法的训练速度。

图 1：MARL 的未编码分布式学习示意图。

成为VIP会员查看完整内容

52

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

85+阅读 · 2022年12月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

105+阅读 · 2022年10月6日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

96+阅读 · 2022年9月21日

斯坦福博士韩松毕业论文：面向深度学习的高效方法与硬件

斯坦福博士韩松毕业论文：面向深度学习的高效方法与硬件

专知会员服务

53+阅读 · 2022年9月6日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知会员服务

46+阅读 · 2022年9月2日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知会员服务

139+阅读 · 2022年7月8日

【伯克利博士论文】机器人机械搜索的操作与感知策略

【伯克利博士论文】机器人机械搜索的操作与感知策略

专知会员服务

13+阅读 · 2022年6月4日

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

专知会员服务

113+阅读 · 2022年5月7日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

53+阅读 · 2021年10月16日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

123+阅读 · 2020年8月27日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

专知

7+阅读 · 2022年11月2日

一文读懂字符编码

一文读懂字符编码

阿里技术

0+阅读 · 2022年10月12日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

8+阅读 · 2022年10月6日

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知

8+阅读 · 2022年9月22日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

5+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

20+阅读 · 2022年9月19日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知

5+阅读 · 2022年7月8日

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

专知

62+阅读 · 2022年7月7日

基于压缩感知的通信信号处理理论研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向屏幕视频的编码技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

舰船泵-桨-舵鲁棒智能协调控制技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向空间信息网络的马尔科夫编码传输理论与技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

大规模群体感知和软件协同适应技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

分布式超紧GPS/SINS组合架构下的信号处理方法和完好性评估机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

以腔QED为节点的分布式量子计算及其相关问题的研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向XML数据的关键字查询算法辅助生成技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

不确定多智能体系统一致性的分布式自适应控制

国家自然科学基金

6+阅读 · 2012年12月31日

计算资源受限情况下视频编码新标准HEVC的关键优化问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

SlimFL: Federated Learning with Superposition Coding over Slimmable Neural Networks

Arxiv

0+阅读 · 2022年12月22日

Strategic multi-task coordination over regular networks of robots with limited computation and communication capabilities

Strategic multi-task coordination over regular networks of robots with limited computation and communication capabilities

Arxiv

0+阅读 · 2022年12月21日

Estimating Rate of Change for nonlinear Trajectories in the Framework of Individual Measurement Occasions: A New Perspective on Growth Curves

Arxiv

0+阅读 · 2022年12月20日

Decentralized and Communication-Free Multi-Robot Navigation through Distributed Games

Arxiv

39+阅读 · 2021年9月15日

A continual learning survey: Defying forgetting in classification tasks

Arxiv

32+阅读 · 2021年4月16日

Coding for Distributed Multi-Agent Reinforcement Learning

Arxiv

32+阅读 · 2021年1月7日

Subgraph Neural Networks

Arxiv

27+阅读 · 2020年6月19日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

How Powerful are Graph Neural Networks?

Arxiv

23+阅读 · 2018年10月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

加州大学 (University of California)

相关VIP内容

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

85+阅读 · 2022年12月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

105+阅读 · 2022年10月6日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

96+阅读 · 2022年9月21日

斯坦福博士韩松毕业论文：面向深度学习的高效方法与硬件

斯坦福博士韩松毕业论文：面向深度学习的高效方法与硬件

专知会员服务

53+阅读 · 2022年9月6日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知会员服务

46+阅读 · 2022年9月2日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知会员服务

139+阅读 · 2022年7月8日

【伯克利博士论文】机器人机械搜索的操作与感知策略

【伯克利博士论文】机器人机械搜索的操作与感知策略

专知会员服务

13+阅读 · 2022年6月4日

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

专知会员服务

113+阅读 · 2022年5月7日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

53+阅读 · 2021年10月16日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

123+阅读 · 2020年8月27日

热门VIP内容

相关资讯

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

专知

7+阅读 · 2022年11月2日

一文读懂字符编码

一文读懂字符编码

阿里技术

0+阅读 · 2022年10月12日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

8+阅读 · 2022年10月6日

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知

8+阅读 · 2022年9月22日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

5+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

20+阅读 · 2022年9月19日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知

5+阅读 · 2022年7月8日

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

专知

62+阅读 · 2022年7月7日

相关基金

基于压缩感知的通信信号处理理论研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向屏幕视频的编码技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

舰船泵-桨-舵鲁棒智能协调控制技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向空间信息网络的马尔科夫编码传输理论与技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

大规模群体感知和软件协同适应技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

分布式超紧GPS/SINS组合架构下的信号处理方法和完好性评估机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

以腔QED为节点的分布式量子计算及其相关问题的研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向XML数据的关键字查询算法辅助生成技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

不确定多智能体系统一致性的分布式自适应控制

国家自然科学基金

6+阅读 · 2012年12月31日

计算资源受限情况下视频编码新标准HEVC的关键优化问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

SlimFL: Federated Learning with Superposition Coding over Slimmable Neural Networks

Arxiv

0+阅读 · 2022年12月22日

Strategic multi-task coordination over regular networks of robots with limited computation and communication capabilities

Strategic multi-task coordination over regular networks of robots with limited computation and communication capabilities

Arxiv

0+阅读 · 2022年12月21日

Estimating Rate of Change for nonlinear Trajectories in the Framework of Individual Measurement Occasions: A New Perspective on Growth Curves

Arxiv

0+阅读 · 2022年12月20日

Decentralized and Communication-Free Multi-Robot Navigation through Distributed Games

Arxiv

39+阅读 · 2021年9月15日

A continual learning survey: Defying forgetting in classification tasks

Arxiv

32+阅读 · 2021年4月16日

Coding for Distributed Multi-Agent Reinforcement Learning

Arxiv

32+阅读 · 2021年1月7日

Subgraph Neural Networks

Arxiv

27+阅读 · 2020年6月19日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

How Powerful are Graph Neural Networks?

Arxiv

23+阅读 · 2018年10月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

微信扫码咨询专知VIP会员