【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法 - 专知VIP

会员服务 ·

25

哈佛大学 (Harvard University) · 博士论文 · 深度学习理论 ·

2022 年 11 月 28 日

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

尽管在深度学习方面已经取得了巨大的实践进展，但我们对是什么使深度学习工作得很好以及为什么这样做缺乏清晰的理论理解。在本文中，我们采用“自然科学”的方法来构建深度学习的理论。我们首先确定在跨越各种不同背景的实际深度网络中出现的各种经验属性。然后，我们讨论了这些实证发现可以如何用来通知理论。具体而言，我们证明:(1)与监督学习相比，经过自监督学习训练的先进深度网络尽管过度参数化，但在特定条件下仍能实现有限的泛化差距。(2)具有相似性能和架构的模型通常会收敛到相似的内部表示，即使它们的训练方法有很大的不同(例如:监督学习和自监督学习)(3)插值分类器服从一种分布泛化形式——它们从训练分布中收敛到一种条件采样器类型。(4)深度网络的数据扩展特性对训练数据集的结构和噪声水平的变化具有鲁棒性。

https://dash.harvard.edu/handle/1/37372168

我们的发现强调，尽管缺乏最坏情况的保证，深度网络隐含地以可预测的、结构化的方式运行，从而为未来的理论分析奠定了基础。

成为VIP会员查看完整内容

49

相关内容

哈佛大学 (Harvard University)

哈佛大学 (Harvard University)

哈佛大学（Harvard University）是一所位于美国马萨诸塞州剑桥市（波士顿郊外）的私立大学，常春藤盟校成员之一。它的历史比美国悠久，是北美洲第一所大学，绰号为深红。哈佛与临近的麻省理工学院在世界上享有一流大学的声誉、财富和影响力，在英语系大学中的排名尤其突出。

【悉尼大学博士论文】基于图神经网络的几何信号处理，187页pdf

【悉尼大学博士论文】基于图神经网络的几何信号处理，187页pdf

专知会员服务

34+阅读 · 2022年12月28日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

59+阅读 · 2022年6月27日

信息论揭开深度学习黑匣子？纽约大学Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知会员服务

98+阅读 · 2022年2月21日

【哈佛大学】深度学习理论实证探究

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

专知

9+阅读 · 2022年11月28日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【伯克利博士论文】机器学习模型泛化性什么时候良好? 从信号处理视角分析，191页pdf

【伯克利博士论文】机器学习模型泛化性什么时候良好? 从信号处理视角分析，191页pdf

专知

2+阅读 · 2022年8月19日

图、深度学习与贝叶斯如何结合？Errica博士论文《图贝叶斯深度学习》阐述方法框架，附201页pdf与Slides

图、深度学习与贝叶斯如何结合？Errica博士论文《图贝叶斯深度学习》阐述方法框架，附201页pdf与Slides

专知

6+阅读 · 2022年3月2日

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知

7+阅读 · 2022年2月21日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

分类体系不确定的机器学习研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于后验预测分布的Bayes推断及相关问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

高阶多元Markov链及其非负张量模型的理论与数值分析

国家自然科学基金

1+阅读 · 2012年12月31日

主流形理论和算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

Bayesian Self-Supervised Contrastive Learning

Arxiv

0+阅读 · 2023年1月27日

BayesSpeech: A Bayesian Transformer Network for Automatic Speech Recognition

Arxiv

0+阅读 · 2023年1月16日

Graph Self-Supervised Learning: A Survey

Arxiv

15+阅读 · 2021年8月5日

Self-Supervised Learning of Graph Neural Networks: A Unified Review

Arxiv

38+阅读 · 2021年2月23日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

VIP会员

相关主题

哈佛大学 (Harvard University)

深度学习理论

相关VIP内容

【悉尼大学博士论文】基于图神经网络的几何信号处理，187页pdf

【悉尼大学博士论文】基于图神经网络的几何信号处理，187页pdf

专知会员服务

34+阅读 · 2022年12月28日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

59+阅读 · 2022年6月27日

信息论揭开深度学习黑匣子？纽约大学Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知会员服务

98+阅读 · 2022年2月21日

【哈佛大学】深度学习理论实证探究

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《北约认知战概念报告》

《预测促成大规模货运无人机的技术趋势与影响》报告

美海军放弃星座级转而采用国家安全巡逻舰设计

《北约作战弹性概念》报告

相关资讯

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

专知

9+阅读 · 2022年11月28日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【伯克利博士论文】机器学习模型泛化性什么时候良好? 从信号处理视角分析，191页pdf

【伯克利博士论文】机器学习模型泛化性什么时候良好? 从信号处理视角分析，191页pdf

专知

2+阅读 · 2022年8月19日

图、深度学习与贝叶斯如何结合？Errica博士论文《图贝叶斯深度学习》阐述方法框架，附201页pdf与Slides

图、深度学习与贝叶斯如何结合？Errica博士论文《图贝叶斯深度学习》阐述方法框架，附201页pdf与Slides

专知

6+阅读 · 2022年3月2日

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知

7+阅读 · 2022年2月21日

相关基金

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

分类体系不确定的机器学习研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于后验预测分布的Bayes推断及相关问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

高阶多元Markov链及其非负张量模型的理论与数值分析

国家自然科学基金

1+阅读 · 2012年12月31日

主流形理论和算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Bayesian Self-Supervised Contrastive Learning

Arxiv

0+阅读 · 2023年1月27日

BayesSpeech: A Bayesian Transformer Network for Automatic Speech Recognition

Arxiv

0+阅读 · 2023年1月16日

Graph Self-Supervised Learning: A Survey

Arxiv

15+阅读 · 2021年8月5日

Self-Supervised Learning of Graph Neural Networks: A Unified Review

Arxiv

38+阅读 · 2021年2月23日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

微信扫码咨询专知VIP会员