我们的世界代表了一个巨大的多智能体系统(MAS),由大量的智能体组成,这些智能体在不确定性下做决策以实现特定目标。智能体之间的互动不断地以多种方式影响着我们的世界,导致了像生命形式和文明这样多年能持续并能承受各种干扰的有趣现象的出现。构建能够像自然MAS一样适应和生存的人工MAS是人工智能中的一个主要目标,因为像自动驾驶、多智能体仓库和网络物理生产系统这样的一系列潜在的现实世界应用可以直接地被建模为MAS。多智能体强化学习(MARL)是构建此类系统的一个有前景的方法,近年来已取得了显著的进展。然而,最先进的MARL通常在最佳情况下优化性能而忽视与现实世界相关的其他方面。 在这篇论文中,我们讨论了在MARL中的突现性和韧性,这是构建像自然MAS一样有效地适应和生存的人工MAS的重要方面。我们首先关注来自自私智能体的局部互动的突现合作,并介绍了一种基于相互认可的激励方法。然后,我们提出利用突现现象进一步提高大型合作性MAS通过分布式计划或分层价值函数因子分解的协调性。为了在与经典分布式系统类似的局部变化存在的情况下维持多智能体协调,我们提出对抗性方法以提高和评估MARL中的韧性。最后,我们简要地涵盖了一系列与推进MARL向现实世界适用性方面相关的其他主题。

成为VIP会员查看完整内容
53

相关内容

【剑桥大学博士论文】情感机器人的持续学习,270页pdf
专知会员服务
27+阅读 · 2023年5月6日
【UIUC博士论文】高效多智能体深度强化学习,130页pdf
专知会员服务
65+阅读 · 2023年1月14日
【布朗大学David Abel博士论文】强化学习抽象理论,297页pdf
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
89+阅读 · 2020年9月28日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
Arxiv
131+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
326+阅读 · 2023年3月31日
Arxiv
54+阅读 · 2023年3月26日
Arxiv
111+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员