Title: 加速解决方案概念：使用神经均衡求解器求解NE、CE和CCE Abstract: 纳什均衡、相关均衡和粗略相关均衡等解决方案概念是许多多智能体机器学习算法的有用组件。不幸的是，解决一个法博形式的博弈可能需要禁止性的或非确定性的时间来收敛，甚至可能失败。我们介绍了神经均衡求解器，利用特殊的等变神经网络体系结构来近似解决固定形状的所有博弈空间，以加速并提高确定性。我们定义了一个灵活的均衡选择框架，能够唯一选择最小相对熵或最大福利的均衡。该网络无需生成任何监督训练数据即可进行训练。我们展示了对更大博弈的惊人的零样本推广表现。我们认为这样的网络是许多可能的多智能体算法的强大组件。 (Turbocharging Solution Concepts: Solving NEs, CEs and CCEs with Neural Equilibrium Solvers) - 专知论文

会员服务 ·

0

均衡 · 博弈 · 相对熵 · 多智能体 · 网络体系结构 ·

2023 年 4 月 15 日

Turbocharging Solution Concepts: Solving NEs, CEs and CCEs with Neural Equilibrium Solvers

翻译：Title: 加速解决方案概念：使用神经均衡求解器求解NE、CE和CCE Abstract: 纳什均衡、相关均衡和粗略相关均衡等解决方案概念是许多多智能体机器学习算法的有用组件。不幸的是，解决一个法博形式的博弈可能需要禁止性的或非确定性的时间来收敛，甚至可能失败。我们介绍了神经均衡求解器，利用特殊的等变神经网络体系结构来近似解决固定形状的所有博弈空间，以加速并提高确定性。我们定义了一个灵活的均衡选择框架，能够唯一选择最小相对熵或最大福利的均衡。该网络无需生成任何监督训练数据即可进行训练。我们展示了对更大博弈的惊人的零样本推广表现。我们认为这样的网络是许多可能的多智能体算法的强大组件。

Luke Marris,Ian Gemp,Thomas Anthony,Andrea Tacchetti,Siqi Liu,Karl Tuyls

from arxiv, NeurIPS 2022

Solution concepts such as Nash Equilibria, Correlated Equilibria, and Coarse Correlated Equilibria are useful components for many multiagent machine learning algorithms. Unfortunately, solving a normal-form game could take prohibitive or non-deterministic time to converge, and could fail. We introduce the Neural Equilibrium Solver which utilizes a special equivariant neural network architecture to approximately solve the space of all games of fixed shape, buying speed and determinism. We define a flexible equilibrium selection framework, that is capable of uniquely selecting an equilibrium that minimizes relative entropy, or maximizes welfare. The network is trained without needing to generate any supervised training data. We show remarkable zero-shot generalization to larger games. We argue that such a network is a powerful component for many possible multiagent algorithms.

翻译：

0

相关内容

【2022新书】高效深度学习，Efficient Deep Learning Book

【2022新书】高效深度学习，Efficient Deep Learning Book

专知会员服务

125+阅读 · 2022年4月21日

剑桥大学《数据科学: 原理与实践》课程，附PPT下载

剑桥大学《数据科学: 原理与实践》课程，附PPT下载

专知会员服务

53+阅读 · 2021年1月20日

【ACML2020】张量网络机器学习:最近的进展和前沿，109页ppt

【ACML2020】张量网络机器学习:最近的进展和前沿，109页ppt

专知会员服务

55+阅读 · 2020年12月15日

纽约大学最新《语音识别Speech Recognition》2020课程，不可错过！

纽约大学最新《语音识别Speech Recognition》2020课程，不可错过！

专知会员服务

44+阅读 · 2020年11月2日

UC.Berkeley CS189讲义教材:《机器学习全面指南》，185页pdf

专知会员服务

162+阅读 · 2020年1月16日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

量化金融强化学习论文集合

量化金融强化学习论文集合

专知

14+阅读 · 2019年12月18日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

AI/ML/DNN硬件加速设计怎么入门？

AI/ML/DNN硬件加速设计怎么入门？

StarryHeavensAbove

11+阅读 · 2018年12月4日

OpenAI丨深度强化学习关键论文列表

OpenAI丨深度强化学习关键论文列表

中国人工智能学会

17+阅读 · 2018年11月10日

机器学习的Pytorch实现资源集合

机器学习的Pytorch实现资源集合

专知

11+阅读 · 2018年9月1日

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

全球人工智能

19+阅读 · 2017年12月17日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

李超代数中若干问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

集值优化问题的逼近解及二阶最优性条件

国家自然科学基金

0+阅读 · 2014年12月31日

关于Lp多调和边值问题的若干研究

国家自然科学基金

0+阅读 · 2013年12月31日

Calderon问题和边界刚性问题

国家自然科学基金

0+阅读 · 2013年12月31日

惯性约束核聚变的离子驱动快点火方案理论与数值模拟研究

国家自然科学基金

0+阅读 · 2013年12月31日

常微分方程中的几个经典问题

国家自然科学基金

2+阅读 · 2012年12月31日

函数域中的Vinogradov中值定理

国家自然科学基金

0+阅读 · 2012年12月31日

一种基于偏微分方程面片的三维几何模型参数表示方案

国家自然科学基金

0+阅读 · 2012年12月31日

石杉科药用植物内生放线菌多样性和分离、分类研究

国家自然科学基金

0+阅读 · 2011年12月31日

安全的多方计算几何的研究

国家自然科学基金

0+阅读 · 2009年12月31日

A Mini-Batch Method for Solving Nonlinear PDEs with Gaussian Processes

Arxiv

0+阅读 · 2023年6月1日

Scalable Learning of Latent Language Structure With Logical Offline Cycle Consistency

Scalable Learning of Latent Language Structure With Logical Offline Cycle Consistency

Arxiv

0+阅读 · 2023年5月31日

Neural Markov Jump Processes

Arxiv

0+阅读 · 2023年5月31日

STAP: Sequencing Task-Agnostic Policies

Arxiv

0+阅读 · 2023年5月31日

Joint Bayesian Inference of Graphical Structure and Parameters with a Single Generative Flow Network

Arxiv

0+阅读 · 2023年5月30日

Convolutional Neural Operators for robust and accurate learning of PDEs

Arxiv

0+阅读 · 2023年5月30日

Generalized equivalences between subsampling and ridge regularization

Arxiv

0+阅读 · 2023年5月29日

Constrained Optimization via Exact Augmented Lagrangian and Randomized Iterative Sketching

Arxiv

0+阅读 · 2023年5月28日

Neural Task Synthesis for Visual Programming

Arxiv

0+阅读 · 2023年5月26日

A Survey of Quantization Methods for Efficient Neural Network Inference

Arxiv

22+阅读 · 2021年6月21日

VIP会员

文章信息

相关主题

网络体系结构

相关VIP内容

【2022新书】高效深度学习，Efficient Deep Learning Book

【2022新书】高效深度学习，Efficient Deep Learning Book

专知会员服务

125+阅读 · 2022年4月21日

剑桥大学《数据科学: 原理与实践》课程，附PPT下载

剑桥大学《数据科学: 原理与实践》课程，附PPT下载

专知会员服务

53+阅读 · 2021年1月20日

【ACML2020】张量网络机器学习:最近的进展和前沿，109页ppt

【ACML2020】张量网络机器学习:最近的进展和前沿，109页ppt

专知会员服务

55+阅读 · 2020年12月15日

纽约大学最新《语音识别Speech Recognition》2020课程，不可错过！

纽约大学最新《语音识别Speech Recognition》2020课程，不可错过！

专知会员服务

44+阅读 · 2020年11月2日

UC.Berkeley CS189讲义教材:《机器学习全面指南》，185页pdf

专知会员服务

162+阅读 · 2020年1月16日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

新质生成式AI赋能产业变革的实践与路径

用于多模态大模型的离散标记化：全面综述

Nature综述：金融网络中的物理学

【CMU博士论文】通信高效且差分隐私的优化方法

相关资讯

量化金融强化学习论文集合

量化金融强化学习论文集合

专知

14+阅读 · 2019年12月18日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

AI/ML/DNN硬件加速设计怎么入门？

AI/ML/DNN硬件加速设计怎么入门？

StarryHeavensAbove

11+阅读 · 2018年12月4日

OpenAI丨深度强化学习关键论文列表

OpenAI丨深度强化学习关键论文列表

中国人工智能学会

17+阅读 · 2018年11月10日

机器学习的Pytorch实现资源集合

机器学习的Pytorch实现资源集合

专知

11+阅读 · 2018年9月1日

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

全球人工智能

19+阅读 · 2017年12月17日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关论文

A Mini-Batch Method for Solving Nonlinear PDEs with Gaussian Processes

Arxiv

0+阅读 · 2023年6月1日

Scalable Learning of Latent Language Structure With Logical Offline Cycle Consistency

Scalable Learning of Latent Language Structure With Logical Offline Cycle Consistency

Arxiv

0+阅读 · 2023年5月31日

Neural Markov Jump Processes

Arxiv

0+阅读 · 2023年5月31日

STAP: Sequencing Task-Agnostic Policies

Arxiv

0+阅读 · 2023年5月31日

Joint Bayesian Inference of Graphical Structure and Parameters with a Single Generative Flow Network

Arxiv

0+阅读 · 2023年5月30日

Convolutional Neural Operators for robust and accurate learning of PDEs

Arxiv

0+阅读 · 2023年5月30日

Generalized equivalences between subsampling and ridge regularization

Arxiv

0+阅读 · 2023年5月29日

Constrained Optimization via Exact Augmented Lagrangian and Randomized Iterative Sketching

Arxiv

0+阅读 · 2023年5月28日

Neural Task Synthesis for Visual Programming

Arxiv

0+阅读 · 2023年5月26日

A Survey of Quantization Methods for Efficient Neural Network Inference

Arxiv

22+阅读 · 2021年6月21日

相关基金

李超代数中若干问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

集值优化问题的逼近解及二阶最优性条件

国家自然科学基金

0+阅读 · 2014年12月31日

关于Lp多调和边值问题的若干研究

国家自然科学基金

0+阅读 · 2013年12月31日

Calderon问题和边界刚性问题

国家自然科学基金

0+阅读 · 2013年12月31日

惯性约束核聚变的离子驱动快点火方案理论与数值模拟研究

国家自然科学基金

0+阅读 · 2013年12月31日

常微分方程中的几个经典问题

国家自然科学基金

2+阅读 · 2012年12月31日

函数域中的Vinogradov中值定理

国家自然科学基金

0+阅读 · 2012年12月31日

一种基于偏微分方程面片的三维几何模型参数表示方案

国家自然科学基金

0+阅读 · 2012年12月31日

石杉科药用植物内生放线菌多样性和分离、分类研究

国家自然科学基金

0+阅读 · 2011年12月31日

安全的多方计算几何的研究

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员