【普林斯顿博士论文】深度神经网络在监督学习、生成建模和自适应数据分析中的泛化，134页pdf - 专知VIP

会员服务 ·

26

深度神经网络 · 监督学习 · 泛化性 ·

2023 年 4 月 18 日

【普林斯顿博士论文】深度神经网络在监督学习、生成建模和自适应数据分析中的泛化，134页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

为什么在小数据集上训练的具有大量参数的神经网络仍然可以准确地对未见过的数据进行分类?这种"泛化之谜"已经成为深度学习中的一个核心问题。除了传统的监督学习设置，深度学习的成功扩展到许多其他体制，在这些体制中，我们对泛化行为的理解甚至更加难以捉摸。本文从监督学习开始，最终目的是通过提出新的理论框架和实用工具，阐明深度神经网络在生成式建模和自适应数据分析中的泛化性能。

https://dataspace.princeton.edu/handle/88435/dsp01k35697481

首先，证明了有监督深度神经网络的泛化界，建立在经验观察的基础上，即在真实数据集上训练的深度网络的推理计算对噪声具有高度的抵抗力。根据信息理论的原则，噪声稳定性表明冗余和可压缩性，我们提出了一种新的训练网络的简洁压缩，这导致了更好的泛化估计。建立了生成对抗网络(GANs)的有限容量分析。该研究对GANs学习分布能力的局限性进行了深入的了解，并提供了经验证据，表明著名的GANs方法确实会导致退化解决方案。尽管结果消极，但本文继续展示了GANs的一个令人惊讶的积极用例:可以使用在相同训练集上训练的GAN模型生成的合成数据准确预测深度神经网络分类器的测试性能。

最后，探讨了深度学习模型在经过多年的数据重用后是否会过度拟合ImageNet等标准数据集的问题。我们提供了一个简单的估计，Rip Van Winkle 's Razor，用于测量由于数据过度使用而导致的过拟合。它依赖于一个新的概念，即必须提供给一个熟悉该领域和相关数学的专家裁判的信息量，他在创建测试集的时候刚刚睡着(就像童话故事中那样)。在许多ImageNet模型中，这种估计是非空的。

成为VIP会员查看完整内容

56

相关内容

深度神经网络

深度神经网络

深度神经网络（DNN）是深度学习的一种框架，它是一种具备至少一个隐层的神经网络。与浅层神经网络类似，深度神经网络也能够为复杂非线性系统提供建模，但多出的层次为模型提供了更高的抽象层次，因而提高了模型的能力。

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

专知会员服务

29+阅读 · 2023年4月23日

【剑桥大学博士论文】机器学习安全性，148页pdf

【剑桥大学博士论文】机器学习安全性，148页pdf

专知会员服务

42+阅读 · 2023年2月13日

【普林斯顿博士论文】构建高效深度神经网络，195页pdf

【普林斯顿博士论文】构建高效深度神经网络，195页pdf

专知会员服务

69+阅读 · 2023年2月8日

【普林斯顿博士论文】深度学习中的模型和数据效率，177页pdf

【普林斯顿博士论文】深度学习中的模型和数据效率，177页pdf

专知会员服务

63+阅读 · 2023年2月4日

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

专知会员服务

54+阅读 · 2023年2月3日

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

专知会员服务

53+阅读 · 2023年2月1日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知会员服务

136+阅读 · 2022年10月4日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

专知

3+阅读 · 2022年11月12日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

专知

7+阅读 · 2022年10月16日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

11+阅读 · 2022年10月15日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知

9+阅读 · 2022年10月4日

MNIST入门：贝叶斯方法

MNIST入门：贝叶斯方法

Python程序员

23+阅读 · 2017年7月3日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

生物医学研究中列联表数据在逆抽样条件下的统计推断

国家自然科学基金

2+阅读 · 2014年12月31日

适应大数据处理的概率特征映射研究

国家自然科学基金

0+阅读 · 2013年12月31日

高维数据的非参数经验贝叶斯方法

国家自然科学基金

1+阅读 · 2012年12月31日

代谢组学数据融合与建模新方法及在糖尿病肾病研究中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

用于交互式视频检索的教练式主动学习模型

国家自然科学基金

0+阅读 · 2012年12月31日

非平稳时间序列的非参数预测回归

国家自然科学基金

7+阅读 · 2012年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Coin Sampling: Gradient-Based Bayesian Inference without Learning Rates

Arxiv

0+阅读 · 2023年6月1日

TorchRL: A data-driven decision-making library for PyTorch

Arxiv

0+阅读 · 2023年6月1日

Learning Task-preferred Inference Routes for Gradient De-conflict in Multi-output DNNs

Arxiv

0+阅读 · 2023年5月31日

Optimal Geometries of Dual-Polarized Arrays for Large Point-to-Point MIMO Channels

Arxiv

0+阅读 · 2023年5月30日

Pathology Synthesis of 3D-Consistent Cardiac MR Images using 2D VAEs and GANs

Arxiv

0+阅读 · 2023年5月30日

On the Impact of Operators and Populations within Evolutionary Algorithms for the Dynamic Weighted Traveling Salesperson Problem

Arxiv

0+阅读 · 2023年5月30日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

VIP会员

相关主题

深度神经网络

相关VIP内容

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

专知会员服务

29+阅读 · 2023年4月23日

【剑桥大学博士论文】机器学习安全性，148页pdf

【剑桥大学博士论文】机器学习安全性，148页pdf

专知会员服务

42+阅读 · 2023年2月13日

【普林斯顿博士论文】构建高效深度神经网络，195页pdf

【普林斯顿博士论文】构建高效深度神经网络，195页pdf

专知会员服务

69+阅读 · 2023年2月8日

【普林斯顿博士论文】深度学习中的模型和数据效率，177页pdf

【普林斯顿博士论文】深度学习中的模型和数据效率，177页pdf

专知会员服务

63+阅读 · 2023年2月4日

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

专知会员服务

54+阅读 · 2023年2月3日

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

专知会员服务

53+阅读 · 2023年2月1日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知会员服务

136+阅读 · 2022年10月4日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

热门VIP内容

开通专知VIP会员享更多权益服务

【NTU博士论文】利用强化学习与生成模型推进可靠且可泛化的决策

美海军研发“增强侦察与态势评估系统（ARES）”应用程序以优化作战规划（附研究论文）

【NeurIPS2025】DNA-DetectLLM：基于 DNA 启发的“突变-修复”范式揭示 AI 生成文本

面向深度研究系统的强化学习基础：综述

相关资讯

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

【牛津大学博士论文】识别和开发可靠的深度学习结构，262页pdf

专知

3+阅读 · 2022年11月12日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

专知

7+阅读 · 2022年10月16日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

11+阅读 · 2022年10月15日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知

9+阅读 · 2022年10月4日

MNIST入门：贝叶斯方法

MNIST入门：贝叶斯方法

Python程序员

23+阅读 · 2017年7月3日

相关基金

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

生物医学研究中列联表数据在逆抽样条件下的统计推断

国家自然科学基金

2+阅读 · 2014年12月31日

适应大数据处理的概率特征映射研究

国家自然科学基金

0+阅读 · 2013年12月31日

高维数据的非参数经验贝叶斯方法

国家自然科学基金

1+阅读 · 2012年12月31日

代谢组学数据融合与建模新方法及在糖尿病肾病研究中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

用于交互式视频检索的教练式主动学习模型

国家自然科学基金

0+阅读 · 2012年12月31日

非平稳时间序列的非参数预测回归

国家自然科学基金

7+阅读 · 2012年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

Coin Sampling: Gradient-Based Bayesian Inference without Learning Rates

Arxiv

0+阅读 · 2023年6月1日

TorchRL: A data-driven decision-making library for PyTorch

Arxiv

0+阅读 · 2023年6月1日

Learning Task-preferred Inference Routes for Gradient De-conflict in Multi-output DNNs

Arxiv

0+阅读 · 2023年5月31日

Optimal Geometries of Dual-Polarized Arrays for Large Point-to-Point MIMO Channels

Arxiv

0+阅读 · 2023年5月30日

Pathology Synthesis of 3D-Consistent Cardiac MR Images using 2D VAEs and GANs

Arxiv

0+阅读 · 2023年5月30日

On the Impact of Operators and Populations within Evolutionary Algorithms for the Dynamic Weighted Traveling Salesperson Problem

Arxiv

0+阅读 · 2023年5月30日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

微信扫码咨询专知VIP会员