摘要: 强化学习作为一种用于解决无模型序列决策问题的方法已经有数十年的历史, 但强化学习方法在处理高维变量问题时常常会面临巨大挑战. 近年来, 深度学习迅猛发展, 使得强化学习方法为复杂高维的多智能体系统提供优化的决策策略、在充满挑战的环境中高效执行目标任务成为可能. 本文综述了强化学习和深度强化学习方法的原理, 提出学习系统的闭环控制框架, 分析了多智能体深度强化学习中存在的若干重要问题和解决方法, 包括多智能体强化学习的算法结构、环境非静态和部分可观性等问题, 对所调查方法的优缺点和相关应用进行分析和讨论. 最后提供多智能体深度强化学习未来的研究方向, 为开发更强大、更易应用的多智能体强化学习控制系统提供一些思路.

成为VIP会员查看完整内容
172

相关内容

多智能体系统(multi-agent system,MAS) 是一种全新的分布式计算技术。自20 世纪70年代出现以来得到迅速发展,目前已经成为一种进行复杂系统分析与模拟的思想方法与工具。
最新《智能交通系统的深度强化学习》综述论文,22页pdf
人机对抗智能技术
专知会员服务
188+阅读 · 2020年5月3日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
《强化学习》简介小册,24页pdf
专知会员服务
261+阅读 · 2020年4月19日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
专知会员服务
198+阅读 · 2019年8月30日
当深度强化学习遇见图神经网络
专知
224+阅读 · 2019年10月21日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
29+阅读 · 2019年7月7日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
深度强化学习简介
专知
29+阅读 · 2018年12月3日
深度强化学习的弱点和局限
论智
6+阅读 · 2018年2月27日
深度强化学习的弱点和局限(上)
论智
8+阅读 · 2018年2月26日
入门 | 从Q学习到DDPG,一文简述多种强化学习算法
Arxiv
6+阅读 · 2019年7月29日
Deep Learning for Energy Markets
Arxiv
8+阅读 · 2019年4月10日
Paraphrase Generation with Deep Reinforcement Learning
Arxiv
4+阅读 · 2018年4月30日
VIP会员
相关VIP内容
最新《智能交通系统的深度强化学习》综述论文,22页pdf
人机对抗智能技术
专知会员服务
188+阅读 · 2020年5月3日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
《强化学习》简介小册,24页pdf
专知会员服务
261+阅读 · 2020年4月19日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
专知会员服务
198+阅读 · 2019年8月30日
相关资讯
当深度强化学习遇见图神经网络
专知
224+阅读 · 2019年10月21日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
29+阅读 · 2019年7月7日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
深度强化学习简介
专知
29+阅读 · 2018年12月3日
深度强化学习的弱点和局限
论智
6+阅读 · 2018年2月27日
深度强化学习的弱点和局限(上)
论智
8+阅读 · 2018年2月26日
入门 | 从Q学习到DDPG,一文简述多种强化学习算法
微信扫码咨询专知VIP会员