In this paper, we define a new class of dynamic games played in large populations of anonymous agents. The behavior of agents in these games depends on a time-homogeneous type and a time-varying state, which are private to each agent and characterize their available actions and motifs. We consider finite type, state, and action spaces. On the individual agent level, the state evolves in discrete-time as the agent participates in interactions, in which the state transitions are affected by the agent's individual action and the distribution of other agents' states and actions. On the societal level, we consider that the agents form a continuum of mass and that interactions occur either synchronously or asynchronously, and derive models for the evolution of the agents' state distribution. We characterize the stationary equilibrium as the solution concept in our games, which is a condition where all agents are playing their best response and the state distribution is stationary. At least one stationary equilibrium is guaranteed to exist in every dynamic population game. Our approach intersects with previous works on anonymous sequential games, mean-field games, and Markov decision evolutionary games, but it is novel in how we relate the dynamic setting to a classical, static population game setting. In particular, stationary equilibria can be reduced to standard Nash equilibria in classical population games. This simplifies the analysis of these games and inspires the formulation of an evolutionary model for the coupled dynamics of both the agents' actions and states.


翻译:在本文中,我们定义了在大量匿名代理人中玩的新型动态游戏。 在这些游戏中,代理商的行为取决于时间和时间变化状态,它们对于每个代理商来说都是私人的,并且具有其可用动作和动作的特点。 我们把固定平衡视为我们游戏中的解决方案概念。 在单个代理商一级,随着该代理商参与互动,随着该代理商参与互动,国家转型会受到该代理商个人行动和其他代理商国家和行动分布的影响。在社会层面,我们认为代理商形成一个质量连续体,相互作用是同步或不同步的,并且为该代理商国家分布的演变提供模型。我们把固定平衡视为我们游戏中的解决方案概念,这是所有代理商发挥最佳反应的条件,国家分布是静止的。在每一个动态人口游戏中,至少有一个固定平衡模式可以存在。我们的方法与先前的匿名连续游戏、中场游戏、以及马克·思科(Mark ) 货币演进式游戏的游戏,但是,我们把固定的游戏的游戏和正轨动性运动器与这个稳定的游戏运动场中,我们如何将这些稳定的游戏和正态运动的动态联系起来。

0
下载
关闭预览

相关内容

因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Arxiv
0+阅读 · 2021年6月18日
Arxiv
0+阅读 · 2021年6月17日
Arxiv
0+阅读 · 2021年6月17日
Arxiv
5+阅读 · 2018年6月12日
VIP会员
相关资讯
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Top
微信扫码咨询专知VIP会员