【CMU大神Noam博士论文】大型对抗性不完全信息博弈的均衡发现,附230页pdf与slides

2020 年 9 月 23 日 专知
昨日,Noam Brown在推特上宣布答辩完成了卡耐基梅隆大学(CMU)的 230页 超硬核博士论文:
《Equilibrium Finding for Large Adversarial Imperfect-Information Games》



大型对抗性不完全信息博弈的均衡发现



不完全信息博弈模型是指具有私有信息的多个主体之间的交互作用。在这种情况下,一个典型的目标是接近一个均衡,在这个均衡中,所有主体的策略都是最优的。本文描述了大型对抗不完全信息博弈均衡计算方面的若干进展。这些新技术使人工智能智能体首次有可能在全规模扑克游戏中击败顶级人类专业人员。几十年来,扑克一直是人工智能和博弈论领域的一大挑战。


我们首先介绍了反事实后悔最小化(CFR)的改进,这是一种收敛于双方零和博弈纳什均衡的迭代算法。我们描述了CFR的新变种,使用折现来显著加快收敛速度。这些新的CFR变体现在是大型对抗非完全信息博弈的最先进的均衡发现算法。我们还介绍了第一种热启动CFR的通用技术。最后,我们介绍理论健全的剪枝技术,可以在大型博弈中数量级地加速收敛。


接下来,我们将描述通过自动抽象和函数近似将CFR扩展到大型游戏的新方法。特别地,我们介绍了第一个在不完全信息博弈中离散连续动作空间的算法。我们将其扩展到求解具有连续动作空间博弈的算法中。


之后,我们介绍了Deep CFR,一种使用神经网络函数近似而不是基于bucketing的抽象形式。Deep CFR是第一个可扩展到大型游戏的non-tabular形式的CFR,它使CFR能够在几乎没有领域知识的情况下成功部署。最后,我们提出了一种新的不完全信息博弈搜索技术,以确保智能体的搜索策略不会被对手利用。方法,它在计算上比以前的方法要代价要少得多。最最后,我们提出了一种在训练和测试时结合强化学习和搜索的算法ReBeL。它朝着弥合完全信息游戏和不完全信息游戏研究之间的差距迈出了重要的一步。


论文目录:





专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“LAEF” 可以获取《【CMU大神Noam博士论文】大型对抗性不完全信息博弈的均衡发现,附230页pdf与slides》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
1

相关内容

【Alma Mate博士论文】深度架构持续学习,附150页pdf与Slides
专知会员服务
44+阅读 · 2020年11月18日
【2020新书】概率机器学习,附212页pdf与slides
专知会员服务
100+阅读 · 2020年11月12日
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
89+阅读 · 2020年9月28日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
152+阅读 · 2020年9月20日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
92+阅读 · 2020年6月19日
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
80+阅读 · 2020年5月5日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
168+阅读 · 2020年2月8日
自然语言处理ACL2020论文列表
专知
12+阅读 · 2020年6月23日
最新《动态网络嵌入》综述论文,25页pdf
专知
31+阅读 · 2020年6月17日
【新书册】贝叶斯神经网络,41页pdf
专知
25+阅读 · 2020年6月3日
【资源】知识图谱本体构建论文合集
专知
61+阅读 · 2019年10月9日
深度学习了解一下(附53页Slides)
专知
48+阅读 · 2019年5月20日
最新《生成式对抗网络GAN进展》论文
专知
94+阅读 · 2019年4月5日
VIP会员
相关VIP内容
【Alma Mate博士论文】深度架构持续学习,附150页pdf与Slides
专知会员服务
44+阅读 · 2020年11月18日
【2020新书】概率机器学习,附212页pdf与slides
专知会员服务
100+阅读 · 2020年11月12日
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
89+阅读 · 2020年9月28日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
152+阅读 · 2020年9月20日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
92+阅读 · 2020年6月19日
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
80+阅读 · 2020年5月5日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
168+阅读 · 2020年2月8日
Top
微信扫码咨询专知VIP会员