We introduce Pathfinder, a variational method for approximately sampling from differentiable log densities. Starting from a random initialization, Pathfinder locates normal approximations to the target density along a quasi-Newton optimization path, with local covariance estimated using the inverse Hessian estimates produced by the optimizer. Pathfinder returns draws from the approximation with the lowest estimated Kullback-Leibler (KL) divergence to the true posterior. We evaluate Pathfinder on a wide range of posterior distributions, demonstrating that its approximate draws are better than those from automatic differentiation variational inference (ADVI) and comparable to those produced by short chains of dynamic Hamiltonian Monte Carlo (HMC), as measured by 1-Wasserstein distance. Compared to ADVI and short dynamic HMC runs, Pathfinder requires one to two orders of magnitude fewer log density and gradient evaluations, with greater reductions for more challenging posteriors. Importance resampling over multiple runs of Pathfinder improves the diversity of approximate draws, reducing 1-Wasserstein distance further and providing a measure of robustness to optimization failures on plateaus, saddle points, or in minor modes. The Monte Carlo KL-divergence estimates are embarrassingly parallelizable in the core Pathfinder algorithm, as are multiple runs in the resampling version, further increasing Pathfinder's speed advantage with multiple cores.


翻译:我们引入了“ 引导器 ”, 这是一种从不同日志密度进行大致抽样的变异方法。 从随机初始化开始, 引导器在准牛顿优化路径上将正常近似点定位到目标密度, 在准牛顿优化路径上将目标密度定位为正常近似点, 使用优化者生成的逆向黑森估计值进行本地共变估算。 引导器的返回从最低估计 Kllback- Leiber (KL) 偏差的近似点提取到真实的远端。 我们从最低估计的 Kllback- Leibel (KL) 与真实的远端值估算值相比, 我们从最低估计的 Kullback- Leiber (KL) 和真正的后端值的偏差值取来。 我们从一系列后端分布的“ ” 评估中评估“, 显示其近端分布优于自动差异变异感( ADDVI) 的近点, 并且比由动态汉密尔顿· 蒙特卡洛(HMC) 的短路路段短路段产生的短路段 。,, 方向的软缩缩缩缩缩缩缩缩缩为方向的误。

0
下载
关闭预览

相关内容

剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
76+阅读 · 2020年7月26日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
106+阅读 · 2020年5月15日
CCF推荐 | 国际会议信息10条
Call4Papers
7+阅读 · 2019年5月27日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
Science 一周论文导读 | 2018 年 8 月 4 日
科研圈
7+阅读 · 2018年8月11日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Spatio-Temporal Variational Gaussian Processes
Arxiv
0+阅读 · 2021年11月2日
Arxiv
0+阅读 · 2021年10月29日
Arxiv
3+阅读 · 2018年1月10日
VIP会员
相关资讯
CCF推荐 | 国际会议信息10条
Call4Papers
7+阅读 · 2019年5月27日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
Science 一周论文导读 | 2018 年 8 月 4 日
科研圈
7+阅读 · 2018年8月11日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Top
微信扫码咨询专知VIP会员