【UCLA博士论文】神经网络捕获的信息:与记忆和泛化的联系，143页pdf - 专知VIP

会员服务 ·

28

加州大学洛杉矶分校 ( UCLA ) · 神经网络 · 深度学习 ·

2023 年 7 月 3 日

【UCLA博士论文】神经网络捕获的信息:与记忆和泛化的联系，143页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

尽管深度学习广受欢迎并且取得了成功，但我们对于神经网络何时、如何以及为何能够泛化到未见过的示例的理解仍然有限。由于学习可以被视为从数据中提取信息，我们正式研究神经网络在训练过程中捕获的信息。具体来说，我们首先从信息论的角度来看待在存在噪声标签的情况下的学习，并推导出一种限制权重中标签噪声信息的学习算法。然后，我们定义了一个概念，即单个样本对深度网络训练提供的唯一信息，这为我们理解神经网络在处理非典型、模糊或属于代表性不足的子群体的示例时的行为提供了一些启示。我们通过推导出非空泛化差距界限，将示例的信息量与泛化能力联系起来。最后，通过研究知识蒸馏，我们强调了数据和标签复杂性在泛化中的重要作用。总的来说，我们的发现有助于更深入地理解神经网络泛化的底层机制。

在过去的十年里，深度学习在广泛的应用领域取得了显著的成功，包括计算机视觉、自然语言处理、语音识别、机器人技术和生成建模。使用随机梯度下降变体训练的大型神经网络展示出卓越的泛化能力，尽管它们具有足够的容量来记忆其训练集[Zhang et al., 2017]。虽然我们在理解深度学习方面取得了一些进步，但对于神经网络何时、为何以及如何泛化的全面理解仍然难以捉摸。

成为VIP会员查看完整内容

41

相关内容

加州大学洛杉矶分校 ( UCLA )

加州大学洛杉矶分校 ( UCLA )

加州大学洛杉矶分校（University of California, Los Angeles，缩写UCLA）是位于美国加利福尼亚州洛杉矶的公立研究型大学，创办于1919年，是加利福尼亚大学系统中的第二所大学。UCLA校园面积1.7平方公里，里面共有超过174栋大楼。它坐落于洛杉矶西部，日落大道的南部，是洛杉矶地区最精华的地段，最安全及时尚的区域。

神经网络宽度是什么？EPFL博士论文《有限宽度神经网络的理论：泛化、缩放定律和损失观》，197页pdf

神经网络宽度是什么？EPFL博士论文《有限宽度神经网络的理论：泛化、缩放定律和损失观》，197页pdf

专知会员服务

35+阅读 · 2023年8月24日

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

专知会员服务

41+阅读 · 2023年8月8日

【普林斯顿博士论文】高维强化学习与最优控制问题，121页pdf

【普林斯顿博士论文】高维强化学习与最优控制问题，121页pdf

专知会员服务

50+阅读 · 2023年7月25日

【普林斯顿博士论文】智能体和机制的学习算法，201页pdf

【普林斯顿博士论文】智能体和机制的学习算法，201页pdf

专知会员服务

52+阅读 · 2023年4月18日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知会员服务

72+阅读 · 2022年10月29日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知会员服务

60+阅读 · 2022年9月3日

【MIT博士论文】控制神经语言生成，147页pdf

【MIT博士论文】控制神经语言生成，147页pdf

专知会员服务

22+阅读 · 2022年9月2日

【CMU博士论文】语言、视觉和听觉模式的鲁棒多模态学习,148页pdf

【CMU博士论文】语言、视觉和听觉模式的鲁棒多模态学习,148页pdf

专知会员服务

78+阅读 · 2021年10月31日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

专知

9+阅读 · 2022年11月28日

【斯坦福大学博士论文】深度学习医学图像解译，205页pdf

【斯坦福大学博士论文】深度学习医学图像解译，205页pdf

专知

4+阅读 · 2022年11月18日

【MIT博士论文】具有结构化域先验的神经时间序列生成模型，187页pdf

【MIT博士论文】具有结构化域先验的神经时间序列生成模型，187页pdf

专知

6+阅读 · 2022年11月13日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

专知

9+阅读 · 2022年10月19日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知

4+阅读 · 2022年9月20日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知

2+阅读 · 2022年9月3日

【MIT博士论文】控制神经语言生成，147页pdf

【MIT博士论文】控制神经语言生成，147页pdf

专知

1+阅读 · 2022年9月2日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

大脑地形连接组图的张量研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

自然刺激下的多维度与多尺度脑电信号处理方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

生物神经系统的若干问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

218+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

148+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

VIP会员

相关主题

加州大学洛杉矶分校 ( UCLA )

相关VIP内容

神经网络宽度是什么？EPFL博士论文《有限宽度神经网络的理论：泛化、缩放定律和损失观》，197页pdf

神经网络宽度是什么？EPFL博士论文《有限宽度神经网络的理论：泛化、缩放定律和损失观》，197页pdf

专知会员服务

35+阅读 · 2023年8月24日

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

专知会员服务

41+阅读 · 2023年8月8日

【普林斯顿博士论文】高维强化学习与最优控制问题，121页pdf

【普林斯顿博士论文】高维强化学习与最优控制问题，121页pdf

专知会员服务

50+阅读 · 2023年7月25日

【普林斯顿博士论文】智能体和机制的学习算法，201页pdf

【普林斯顿博士论文】智能体和机制的学习算法，201页pdf

专知会员服务

52+阅读 · 2023年4月18日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知会员服务

72+阅读 · 2022年10月29日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知会员服务

60+阅读 · 2022年9月3日

【MIT博士论文】控制神经语言生成，147页pdf

【MIT博士论文】控制神经语言生成，147页pdf

专知会员服务

22+阅读 · 2022年9月2日

【CMU博士论文】语言、视觉和听觉模式的鲁棒多模态学习,148页pdf

【CMU博士论文】语言、视觉和听觉模式的鲁棒多模态学习,148页pdf

专知会员服务

78+阅读 · 2021年10月31日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型中的检索与结构化增强生成综述

《实现多层防御多轮交战机制的扩展型随机齐射模型》2025年最新83页

【CMU博士论文】交互驱动的人体动作估计与生成

如何避免生成式人工智能在作战中失控失效

相关资讯

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

专知

9+阅读 · 2022年11月28日

【斯坦福大学博士论文】深度学习医学图像解译，205页pdf

【斯坦福大学博士论文】深度学习医学图像解译，205页pdf

专知

4+阅读 · 2022年11月18日

【MIT博士论文】具有结构化域先验的神经时间序列生成模型，187页pdf

【MIT博士论文】具有结构化域先验的神经时间序列生成模型，187页pdf

专知

6+阅读 · 2022年11月13日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

专知

9+阅读 · 2022年10月19日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知

4+阅读 · 2022年9月20日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知

2+阅读 · 2022年9月3日

【MIT博士论文】控制神经语言生成，147页pdf

【MIT博士论文】控制神经语言生成，147页pdf

专知

1+阅读 · 2022年9月2日

相关基金

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

大脑地形连接组图的张量研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

自然刺激下的多维度与多尺度脑电信号处理方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

生物神经系统的若干问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

218+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

148+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

微信扫码咨询专知VIP会员