裴健等SDM2021「深度学习模型复杂性」教程,100页PPT阐述深度学习模型框架、模型规模、优化过程和数据复杂性

2021 年 5 月 3 日 专知



深度学习在许多应用中具有破坏性,主要是由于其优越的性能。与此同时,关于深度学习的许多基本问题仍未得到解答。深度神经网络的模型复杂度就是其中之一。模型复杂性是指一个深度模型能够表达的问题有多复杂,以及具有给定参数的模型的函数有多非线性和复杂。


在机器学习、数据挖掘和深度学习中,模型复杂性一直是一个重要的基本问题。模型复杂度影响模型对特定问题和数据的可学习性,也影响模型对未知数据的泛化能力。此外,学习模型的复杂性不仅受到模型体系结构本身的影响,还受到数据分布、数据复杂性和信息量的影响。近年来,模型复杂性已成为一个越来越活跃的方向,并在模型体系结构搜索、图表示、泛化研究和模型压缩等许多领域发展了理论指导意义。


我们提出这个教程来概述关于深度学习模型复杂性的最新研究。本文将模型复杂性研究分为模型表达能力有效模型复杂性两个方向,并对这两个方向的最新进展进行了综述。此外,我们还介绍了深度学习模型复杂性的一些应用实例,以说明其实用性。


目录内容:

  • Part 1: 深度学习模型复杂度 Deep Learning Model Complexity 

  • Part 2: 表示容量 Expressive Capacity

  • Part 3: 有效性复杂度 Effective Complexity 

  • Part 4: 应用实例 Application Examples

  • Part 5: Conclusion 


https://www.sfu.ca/~huxiah/sdm21_tutorial.html



模型复杂性是深度学习的一个基本问题。


本文对深度学习中模型复杂性的最新研究进行了系统的综述。深度学习的模型复杂度可分为表达能力和有效模型复杂度。


模型框架、模型规模、优化过程和数据复杂性四个方面回顾了现有的研究成果。我们还讨论了深度学习模型复杂性的应用,包括理解模型泛化能力、模型优化、模型选择和设计


最后,我们提出几个有趣的未来方向。


https://www.zhuanzhi.ai/paper/f7c683dfd6eb2f07eba0ed31d337345c


引言

主要由于其优越的性能,深度学习在许多应用中具有破坏性,如计算机视觉[40]、自然语言处理[55]和计算金融[91]。然而,与此同时,关于深度学习模型的一系列基本问题仍然存在,如为什么深度学习的表达能力比经典机器学习模型有很大提高,如何理解和量化深度模型的泛化能力,如何理解和改进优化过程等。深度学习的模型复杂性是一个核心问题,与许多基础性问题有关。


深度学习的模型复杂性关注的是,对于某种深度学习体系结构,深度学习模型能够表达多复杂的问题[15,44,70,89]。理解深度模型的复杂性是准确理解模型的能力和局限性的关键。探索模型复杂性不仅是理解深度模型本身的必要条件,也是研究许多其他相关基本问题的必要条件。例如,从统计学习理论的观点来看,利用模型的表达能力来限制泛化误差[69]。最近一些研究提出了基于范数的模型复杂度[60]和基于灵敏度的模型复杂度[76,81]来探讨深度模型的泛化能力。此外,在训练过程中检测模型复杂性的变化可以为理解和提高模型优化和正则化的性能提供见解[44,74,89]。


对机器学习模型复杂性的研究可以追溯到几十年前。20世纪90年代的一系列早期研究讨论了经典机器学习模型的复杂性[16,20,21,98]。其中具有代表性的模型是决策树[19],其复杂性总是通过树的深度[20]和叶节点数量[16]来度量的。模型复杂性分析的另一个常见课题是逻辑回归,它是大量参数化模型的基础。从Vapnik-Chervonenicks理论[26,96]、Rademacher复杂性[46]、Fisher信息矩阵[21]和[6]模型的razor等角度研究logistic回归模型的复杂性。在这里,模型剃刀是一个理论指标,比较一个参数模型家族的真实分布的复杂性。然而,深度学习模型与几十年前讨论的经典机器学习模型有很大的不同[70]。经典机器学习模型的复杂性分析不能直接应用或直接推广到深度模型。


近年来,深度学习中的模型复杂性受到了越来越多的关注[13,60,70,78,81,89]。然而,据我们所知,目前还没有关于深度学习中模型复杂性的研究。缺乏对这一新兴和重要课题的调研促使我们对最新研究进行调查。在本文中,我们交替使用术语“深度学习模型”和“深度神经网络”。几十年前就有大量关于经典机器学习模型复杂性的研究,优秀的研究综述了这些研究[20,21,61,93]。在本节中,我们将非常简要地回顾几个典型模型的复杂性,包括决策树、逻辑回归和贝叶斯网络模型。讨论了深度神经网络的模型复杂度与其他模型的不同之处。


深度学习模型在结构上与传统的机器学习模型不同,具有更多的参数。深度学习模型总是比传统模型复杂得多。因此,以往对传统机器学习模型的复杂性建模方法不能直接应用于深度学习模型,以获得有效的复杂性测度。例如,用树的深度[20,98]和叶节点数[16,61]来衡量决策树的复杂性显然不适用于深度学习模型。通过[46]可训练参数的数量来衡量模型的复杂性对深度学习模型的影响非常有限,因为深度学习模型往往过于参数化。


本次综述的其余部分组织如下。

在第2节中,我们介绍了深度学习模型的复杂性以及这两类模型的表达能力和有效模型复杂性。

在第3节中,我们回顾了关于深度学习模型表达能力的现有研究。

在第4节中,我们综述了关于深度学习模型有效复杂性的现有研究。

在第5节中,我们将讨论深度学习模型复杂性的应用。

在第6节中,我们总结了这一研究并讨论了一些未来的方向。





专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DMC” 就可以获取裴健等SDM2021「深度学习模型复杂性」教程,100页PPT阐述深度学习模型框架、模型规模、优化过程和数据复杂性》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!


欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

专知会员服务
51+阅读 · 2021年6月17日
专知会员服务
29+阅读 · 2021年2月26日
【WWW2021】用优化框架解释和统一图神经网络
专知会员服务
44+阅读 · 2021年2月1日
专知会员服务
88+阅读 · 2021年1月17日
最新《自动微分》综述教程,71页ppt
专知会员服务
21+阅读 · 2020年11月22日
最新《图嵌入组合优化》综述论文,40页pdf
专知会员服务
75+阅读 · 2020年8月31日
专知会员服务
106+阅读 · 2020年8月28日
最新《图嵌入组合优化》综述论文,40页pdf
深度学习模型可解释性的研究进展
专知
22+阅读 · 2020年8月1日
异质图神经网络:模型与应用,附PPT
专知
5+阅读 · 2020年2月21日
异质图神经网络:模型与应用
图与推荐
4+阅读 · 2020年1月16日
图神经网络综述:模型与应用
PaperWeekly
195+阅读 · 2018年12月26日
入门 | 深度学习模型的简单优化技巧
机器之心
9+阅读 · 2018年6月10日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Techniques for Automated Machine Learning
Arxiv
4+阅读 · 2019年7月21日
Arxiv
5+阅读 · 2019年4月25日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关VIP内容
专知会员服务
51+阅读 · 2021年6月17日
专知会员服务
29+阅读 · 2021年2月26日
【WWW2021】用优化框架解释和统一图神经网络
专知会员服务
44+阅读 · 2021年2月1日
专知会员服务
88+阅读 · 2021年1月17日
最新《自动微分》综述教程,71页ppt
专知会员服务
21+阅读 · 2020年11月22日
最新《图嵌入组合优化》综述论文,40页pdf
专知会员服务
75+阅读 · 2020年8月31日
专知会员服务
106+阅读 · 2020年8月28日
相关资讯
最新《图嵌入组合优化》综述论文,40页pdf
深度学习模型可解释性的研究进展
专知
22+阅读 · 2020年8月1日
异质图神经网络:模型与应用,附PPT
专知
5+阅读 · 2020年2月21日
异质图神经网络:模型与应用
图与推荐
4+阅读 · 2020年1月16日
图神经网络综述:模型与应用
PaperWeekly
195+阅读 · 2018年12月26日
入门 | 深度学习模型的简单优化技巧
机器之心
9+阅读 · 2018年6月10日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
Top
微信扫码咨询专知VIP会员