【NIPS2017最佳论文三分钟视频简介】CMU「冷扑大师」不完美信息博弈研究

点击上方“专知”关注获取专业AI知识!

【导读】NIPS 2017 开幕还有几天,最佳论文已经公布,CMU教授Tuomas Sandholm 和其博士生 Noam Brown 《Safe and Nested Subgame Solving for Imperfect-Information Games》获得了 NIPS-17 最佳论文。近日Noam Brown发布视频解读论文「冷扑大师」不完美信息博弈研究


▌视频




视频带英文字幕地址:https://v.qq.com/x/page/m0512q8uppm.html


▌文章信息




Safe and Nested Subgame Solving for Imperfect-Information Games

论文链接:https://arxiv.org/abs/1705.02955


和完美信息博弈不同,不完美信息博弈不能通过将博弈分解为可独立求解的子博弈而求得占优策略。因此我们越来越多地使用计算密集的均衡判定技术,并且所有的决策必须将博弈的策略当做一个整体。由于不能通过精确的分解来解决不完美信息博弈,人们开始考虑近似解,或通过解决不相交的子博弈提升当前结果。这个过程被称为子博弈求解(subgame solving)。我们提出了一种无论在理论上还是在实践上都超越了之前方法的子博弈求解技术。我们还展示了如何对它们和以前的子博弈求解技术进行调整,以对超出初始行动提取(original action abstraction)的对手的行动做出应答;这远远超越了之前的顶尖方法,即行动转化(action translation)。最后,我们展示了当博弈沿着博弈树向下进行时,子博弈求解可能会重复进行,从而大大降低可利用性。我们应用这些技术开发了能在一对一无限注德州扑克单挑中打败顶尖人类选手的第一个 AI。

-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域23个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫关注专知公众号,获取人工智能的专业知识。

请加专知小助手微信(Rancho_Fang),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等,或者加小助手咨询入群)交流~


点击“阅读原文”,使用专知!

展开全文
Top
微信扫码咨询专知VIP会员