本文研究具有已知动力学和对抗性干扰动态系统的多智能体控制问题。我们的研究重点是没有集中的预计算策略的最优控制,而是对不同的智能体只配备一个稳定控制器的自适应控制策略。我们给出了一个从任何(标准)遗憾最小化控制方法到分布式算法的还原方法。该还原法保证了所产生的分布式算法相对于最佳预计算的联合策略具有较低的遗憾。我们的方法包括将在线凸优化推广到多智能体环境中,并应用最近从非随机控制中得出的单智能体工具。我们在一个过度行动的飞机模型上对我们的方法进行了经验评估。我们表明,分布式方法对故障和动态中的对抗性扰动是稳健的。

成为VIP会员查看完整内容
18

相关内容

ICLR 2022 放出了本届会议的论文接收结果:共有 54 篇 Oral(口头报告)论文和 176 篇 Spolight 论文,论文接收总数 1095 篇,最终投稿量 3391 篇,论文接收率 32.3%。
【AAMAS2022教程】多智能体分布式约束优化,235页ppt
专知会员服务
73+阅读 · 2022年5月15日
专知会员服务
18+阅读 · 2021年7月28日
CVPR 2022 | 元学习在图像回归任务的表现
PaperWeekly
1+阅读 · 2022年6月11日
ICLR’22 最佳脑洞奖提名:《GPT 如何进行布朗运动?》
夕小瑶的卖萌屋
0+阅读 · 2022年4月26日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
BoxShrink: From Bounding Boxes to Segmentation Masks
Arxiv
1+阅读 · 2022年8月4日
Generalized Out-of-Distribution Detection: A Survey
Arxiv
15+阅读 · 2021年10月21日
已删除
Arxiv
31+阅读 · 2020年3月23日
Arxiv
21+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员