【剑桥大学博士论文】深度贝叶斯模型改进的变分推断方法，226页pdf

深度学习在过去的十年里引领了革命性的进展，它在各种任务的前沿，包括计算机视觉、自然语言处理和强化学习等领域取得了非凡的成就。然而，众所周知，通过最大似然估计训练的深度模型往往过于自信，并给出校准不良的预测。贝叶斯深度学习试图通过在模型参数上放置先验，然后与似然结合来执行后验推断来解决这个问题。不幸的是，对于深度模型来说，真实的后验是难以处理的，迫使用户不得不求助于近似。在这篇论文中，我们探讨了作为近似的变分推断的使用，因为它在同时近似后验和提供边缘似然的下界方面是独一无二的。如果这个下界足够紧，就可以用来优化超参数和促进模型选择。然而，这种能力在贝叶斯神经网络中很少被充分利用，可能是因为实践中通常使用的近似后验缺乏有效限制边缘似然的灵活性。因此，我们探索了深度模型的贝叶斯学习的三个方面。首先，我们的调查从询问是否有必要对尽可能多的参数进行推断开始，或者是否合理地将许多参数作为超参数，我们通过边缘似然来优化它们。这将带来显著的计算节省；然而，我们观察到这可能导致病态行为和严重的过拟合，表明尽可能“完全贝叶斯”是更好的选择。我们继续我们的论文，提出了一种变分后验，它为贝叶斯神经网络和深度高斯过程中的推断提供了统一的视角，我们展示了它有足够的灵活性来利用添加的先验超参数。最后，我们展示了如何在某些深度高斯过程模型中通过从后验中解析去除对称性，并对格拉姆矩阵而不是特征进行推断来改进变分推断。虽然我们没有直接调查我们的改进在模型选择中的使用，但我们希望我们的贡献将为将来充分实现变分推断的承诺提供一个跳板。

成为VIP会员查看完整内容

相关内容

博士论文

关注 116

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【剑桥大学博士论文】朝向深度贝叶斯模型的改进变分推断，226页pdf

专知会员服务

36+阅读 · 2024年1月29日

【牛津大学博士论文】用于因果学习与推理的可处理概率模型，240页pdf

专知会员服务

45+阅读 · 2023年9月20日

【剑桥大学博士论文】机器学习中的分布外泛化，214页pdf

专知会员服务

86+阅读 · 2023年9月13日

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

专知会员服务

48+阅读 · 2023年2月1日