多Agent深度强化学习综述(中文版)，21页pdf - 专知VIP

会员服务 ·

57

深度强化学习 ·

2021 年 1 月 1 日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来, 深度强化学习(Deep reinforcement learning, DRL)在诸多复杂序贯决策问题中取得巨大突破.由于融合了深度学习强大的表征能力和强化学习有效的策略搜索能力, 深度强化学习已经成为实现人工智能颇有前景的学习范式.然而, 深度强化学习在多Agent系统的研究与应用中, 仍存在诸多困难和挑战, 以StarCraft Ⅱ为代表的部分观测环境下的多Agent学习仍然很难达到理想效果.本文简要介绍了深度Q网络、深度策略梯度算法等为代表的深度强化学习算法和相关技术.同时, 从多Agent深度强化学习中通信过程的角度对现有的多Agent深度强化学习算法进行归纳, 将其归纳为全通信集中决策、全通信自主决策、欠通信自主决策3种主流形式.从训练架构、样本增强、鲁棒性以及对手建模等方面探讨了多Agent深度强化学习中的一些关键问题, 并分析了多Agent深度强化学习的研究热点和发展前景.

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180372

成为VIP会员查看完整内容

相关内容

「元学习」最新研究综述(中文版)，25页pdf

专知会员服务

192+阅读 · 2021年2月4日

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

深度生成模型综述(中文版)，43页pdf

专知会员服务

184+阅读 · 2020年11月23日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

189+阅读 · 2020年5月5日

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

35页自然语言处理深度学习综述，带你纵览NLP知识全貌

35页自然语言处理深度学习综述，带你纵览NLP知识全貌

专知

88+阅读 · 2018年8月1日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

PettingZoo: Gym for Multi-Agent Reinforcement Learning

Arxiv

2+阅读 · 2021年2月25日

Deep Image Retrieval: A Survey

Arxiv

16+阅读 · 2021年1月27日

A Survey on Edge Computing Systems and Tools

Arxiv

36+阅读 · 2019年11月7日

Neural Architecture Search: A Survey

Arxiv

12+阅读 · 2018年9月5日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

VIP会员

相关主题

深度强化学习

相关VIP内容

「元学习」最新研究综述(中文版)，25页pdf

专知会员服务

192+阅读 · 2021年2月4日

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

深度生成模型综述(中文版)，43页pdf

专知会员服务

184+阅读 · 2020年11月23日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

189+阅读 · 2020年5月5日

热门VIP内容

开通专知VIP会员享更多权益服务

【MIT博士论文】弱监督学习：理论、方法与应用

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

锚定情报：合成欺骗时代的地面真相

NeurIPS 2025 | NMKE：基于神经元归因与动态稀疏掩码的终身知识编辑

相关资讯

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

35页自然语言处理深度学习综述，带你纵览NLP知识全貌

35页自然语言处理深度学习综述，带你纵览NLP知识全貌

专知

88+阅读 · 2018年8月1日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

相关论文

PettingZoo: Gym for Multi-Agent Reinforcement Learning

Arxiv

2+阅读 · 2021年2月25日

Deep Image Retrieval: A Survey

Arxiv

16+阅读 · 2021年1月27日

A Survey on Edge Computing Systems and Tools

Arxiv

36+阅读 · 2019年11月7日

Neural Architecture Search: A Survey

Arxiv

12+阅读 · 2018年9月5日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

微信扫码咨询专知VIP会员