【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解 - 专知VIP

会员服务 ·

37

AI与医学 · 博士论文 · 自监督学习 · 深度学习 · 泛化性 ·

2022 年 7 月 9 日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度学习在经验上非常有影响力，但在理论理解上滞后。神经网络在结构和训练算法上都比传统的机器学习模型复杂得多，所以传统的理论直觉可能不适用。本文旨在从理论上更好地理解深度学习中的泛化问题。在论文的第一部分，我们研究了所有数据都有标签的监督设置下的泛化。我们的主要工具是泛化界:通过推导和研究泛化界，我们可以深入了解深度学习中影响泛化的各种因素。

首先，我们比较了正则化神经网络和神经正切核(NTK)的统计特性。通过建立神经网络常见的正则化训练损失与基于输出边际的泛化界之间的联系，我们证明了正则化神经网络比NTK解具有更好的泛化效果。其次，我们基于边缘的新概念——全层边缘，推导出神经网络的新泛化边界。与传统的基于规范的泛化测度相比，这些边界更依赖于数据，更具有深度，并突出了数据依赖的Lipschitzness在泛化中的重要作用。我们以经验证明，这些边界对于激励新的训练目标和理解和解密现有的正则化策略是有用的。

在论文的第二部分，我们把我们的焦点转向涉及未标记数据的设置。在这些情况下，很难证明为什么许多算法可以工作，尽管它们有广泛的经验成功。

首先，我们研究了视觉设置，并提出了一个理论框架来理解最近的半监督学习和领域适应的自训练算法。通过利用自然图像的现实结构属性，我们表明，在未标记数据上的自训练导致可证明的准确性增益。此外，我们的理论框架和相关假设可以用来表明，自监督对比学习在线性探针评价下获得了可证明的良好特征。最后，我们研究了为什么预训练语言模型可以帮助处理NLP设置中的下游任务。我们通过潜在的潜在变量生成模型来考虑预训练和下游任务相关的设置。我们表明，当这个生成模型是HMM或记忆增强HMM时，预训练允许解决下游任务的可证明保证。

https://searchworks.stanford.edu/view/14230987

成为VIP会员查看完整内容

89

相关内容

AI与医学

医学领域的人工智能是使用机器学习模型搜索医疗数据，发现洞察，从而帮助改善健康状况和患者体验。得益于近年来计算机科学和信息技术的发展，人工智能 (AI) 正迅速成为现代医学中不可或缺的一部分。由人工智能支持的人工智能算法和其他应用程序正在为临床和研究领域的医学专业人员提供支持。

【斯坦福大学博士论文】凸优化和图算法的新基元，404页pdf

【斯坦福大学博士论文】凸优化和图算法的新基元，404页pdf

专知会员服务

62+阅读 · 2022年8月18日

如何理解统计学习理论、优化与神经网络？伯克利Spencer Frei最新演讲报告，附58页ppt与视频

如何理解统计学习理论、优化与神经网络？伯克利Spencer Frei最新演讲报告，附58页ppt与视频

专知会员服务

45+阅读 · 2022年8月13日

【CMU博士论文】多媒体内容解纠缠表示，100页pdf

【CMU博士论文】多媒体内容解纠缠表示，100页pdf

专知会员服务

21+阅读 · 2022年8月8日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

58+阅读 · 2022年6月27日

多模态时序数据如何自监督？墨尔本理工等最新《自监督表示学习：多模态与时序数据》，全面阐述最新方法体系

多模态时序数据如何自监督？墨尔本理工等最新《自监督表示学习：多模态与时序数据》，全面阐述最新方法体系

专知会员服务

91+阅读 · 2022年6月13日

【NeurIPS 2021 】学习理论(有时)可以解释图神经网络中的泛化

【NeurIPS 2021 】学习理论(有时)可以解释图神经网络中的泛化

专知会员服务

30+阅读 · 2021年12月13日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

KDD2021最佳博士论文奖揭晓！斯坦福Aditya博士获得《在有限监督条件下的学习表征和推理》

KDD2021最佳博士论文奖揭晓！斯坦福Aditya博士获得《在有限监督条件下的学习表征和推理》

专知会员服务

30+阅读 · 2021年8月7日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

专知会员服务

94+阅读 · 2020年6月19日

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

专知

6+阅读 · 2022年8月4日

何为机器学习公平性？Tel-Aviv大学最新《机器学习公平性》ACM-CSUR综述论文阐述七大类公平机器学习算法

何为机器学习公平性？Tel-Aviv大学最新《机器学习公平性》ACM-CSUR综述论文阐述七大类公平机器学习算法

专知

1+阅读 · 2022年3月29日

布朗大学华人统计30个会议，25年最佳论文：微软第一，清北排名30开外

布朗大学华人统计30个会议，25年最佳论文：微软第一，清北排名30开外

新智元

1+阅读 · 2022年1月11日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知

75+阅读 · 2020年6月29日

论文荐读：理解图表示学习中的负采样

论文荐读：理解图表示学习中的负采样

学术头条

29+阅读 · 2020年5月29日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

专知

18+阅读 · 2019年3月24日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知

26+阅读 · 2019年1月1日

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

新智元

16+阅读 · 2018年2月5日

紧区间上保向微分同胚的光滑嵌入流

国家自然科学基金

0+阅读 · 2015年12月31日

纤锌矿结构砷化镓纳米线表面缺陷研究

国家自然科学基金

0+阅读 · 2014年12月31日

协方差阵的推断及在方向数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向数据表示的深度稀疏保持学习

国家自然科学基金

7+阅读 · 2013年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

高维数据的图模型学习与统计推断

国家自然科学基金

8+阅读 · 2012年12月31日

弱监督在线学习方法及其在视觉目标跟踪中的应用

国家自然科学基金

4+阅读 · 2011年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于损失函数的统计机器学习算法及其应用研究

国家自然科学基金

7+阅读 · 2009年12月31日

Balanced Contrastive Learning for Long-Tailed Visual Recognition

Arxiv

0+阅读 · 2022年8月26日

Confusion Matrices and Accuracy Statistics for Binary Classifiers Using Unlabeled Data: The Diagnostic Test Approach

Arxiv

0+阅读 · 2022年8月26日

Meta Objective Guided Disambiguation for Partial Label Learning

Arxiv

0+阅读 · 2022年8月26日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

Unifying Vision-and-Language Tasks via Text Generation

Arxiv

10+阅读 · 2021年2月4日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

Few-Shot Graph Classification with Model Agnostic Meta-Learning

Arxiv

23+阅读 · 2020年3月18日

X-BERT: eXtreme Multi-label Text Classification with BERT

X-BERT: eXtreme Multi-label Text Classification with BERT

Arxiv

12+阅读 · 2019年7月4日

Order-Free RNN with Visual Attention for Multi-Label Classification

Arxiv

16+阅读 · 2017年12月20日

VIP会员

相关主题

自监督学习

相关VIP内容

【斯坦福大学博士论文】凸优化和图算法的新基元，404页pdf

【斯坦福大学博士论文】凸优化和图算法的新基元，404页pdf

专知会员服务

62+阅读 · 2022年8月18日

如何理解统计学习理论、优化与神经网络？伯克利Spencer Frei最新演讲报告，附58页ppt与视频

如何理解统计学习理论、优化与神经网络？伯克利Spencer Frei最新演讲报告，附58页ppt与视频

专知会员服务

45+阅读 · 2022年8月13日

【CMU博士论文】多媒体内容解纠缠表示，100页pdf

【CMU博士论文】多媒体内容解纠缠表示，100页pdf

专知会员服务

21+阅读 · 2022年8月8日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

58+阅读 · 2022年6月27日

多模态时序数据如何自监督？墨尔本理工等最新《自监督表示学习：多模态与时序数据》，全面阐述最新方法体系

多模态时序数据如何自监督？墨尔本理工等最新《自监督表示学习：多模态与时序数据》，全面阐述最新方法体系

专知会员服务

91+阅读 · 2022年6月13日

【NeurIPS 2021 】学习理论(有时)可以解释图神经网络中的泛化

【NeurIPS 2021 】学习理论(有时)可以解释图神经网络中的泛化

专知会员服务

30+阅读 · 2021年12月13日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

KDD2021最佳博士论文奖揭晓！斯坦福Aditya博士获得《在有限监督条件下的学习表征和推理》

KDD2021最佳博士论文奖揭晓！斯坦福Aditya博士获得《在有限监督条件下的学习表征和推理》

专知会员服务

30+阅读 · 2021年8月7日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

专知会员服务

94+阅读 · 2020年6月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军特种作战条令》最新102页

《洛克希德SR-71“黑鸟”侦察机动力系统》21页slides

美空军作战实验室通过人工智能和指挥控制技术创新推进杀伤链

《指挥控制能力分析方法论》最新报告

相关资讯

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

专知

6+阅读 · 2022年8月4日

何为机器学习公平性？Tel-Aviv大学最新《机器学习公平性》ACM-CSUR综述论文阐述七大类公平机器学习算法

何为机器学习公平性？Tel-Aviv大学最新《机器学习公平性》ACM-CSUR综述论文阐述七大类公平机器学习算法

专知

1+阅读 · 2022年3月29日

布朗大学华人统计30个会议，25年最佳论文：微软第一，清北排名30开外

布朗大学华人统计30个会议，25年最佳论文：微软第一，清北排名30开外

新智元

1+阅读 · 2022年1月11日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知

75+阅读 · 2020年6月29日

论文荐读：理解图表示学习中的负采样

论文荐读：理解图表示学习中的负采样

学术头条

29+阅读 · 2020年5月29日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

专知

18+阅读 · 2019年3月24日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知

26+阅读 · 2019年1月1日

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

新智元

16+阅读 · 2018年2月5日

相关基金

紧区间上保向微分同胚的光滑嵌入流

国家自然科学基金

0+阅读 · 2015年12月31日

纤锌矿结构砷化镓纳米线表面缺陷研究

国家自然科学基金

0+阅读 · 2014年12月31日

协方差阵的推断及在方向数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向数据表示的深度稀疏保持学习

国家自然科学基金

7+阅读 · 2013年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

高维数据的图模型学习与统计推断

国家自然科学基金

8+阅读 · 2012年12月31日

弱监督在线学习方法及其在视觉目标跟踪中的应用

国家自然科学基金

4+阅读 · 2011年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于损失函数的统计机器学习算法及其应用研究

国家自然科学基金

7+阅读 · 2009年12月31日

相关论文

Balanced Contrastive Learning for Long-Tailed Visual Recognition

Arxiv

0+阅读 · 2022年8月26日

Confusion Matrices and Accuracy Statistics for Binary Classifiers Using Unlabeled Data: The Diagnostic Test Approach

Arxiv

0+阅读 · 2022年8月26日

Meta Objective Guided Disambiguation for Partial Label Learning

Arxiv

0+阅读 · 2022年8月26日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

Unifying Vision-and-Language Tasks via Text Generation

Arxiv

10+阅读 · 2021年2月4日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

Few-Shot Graph Classification with Model Agnostic Meta-Learning

Arxiv

23+阅读 · 2020年3月18日

X-BERT: eXtreme Multi-label Text Classification with BERT

X-BERT: eXtreme Multi-label Text Classification with BERT

Arxiv

12+阅读 · 2019年7月4日

Order-Free RNN with Visual Attention for Multi-Label Classification

Arxiv

16+阅读 · 2017年12月20日

微信扫码咨询专知VIP会员