深度学习是科学还是炼金术？LeCun 最新演讲（视频 + PPT）

会员服务 ·

深度学习是科学还是炼金术？LeCun 最新演讲（视频 + PPT）

2019 年 3 月 4 日 新智元

新智元报道

编辑：肖琴

【新智元导读】Facebook AI 研究总监 Yann LeCun 近日在普林斯顿高等研究所进行了一次演讲，题为《深度学习认识论》，重点讨论了深度学习思想的早期历史和动态，强调理论理解在深度学习研究中的重要意义。

更好的理论理解，将有助于深度学习研究的发展。

近日，Facebook AI 研究总监 Yann LeCun 在普林斯顿高等研究所进行了一次演讲，题为《深度学习认识论》(The Epistemology of Deep Learning)，重点讨论了深度学习思想的早期历史和动态。

LeCun 认为，深度学习在一定程度上是一门 “工程科学”，我们通过理论洞见、直觉、灵感和经验探索来创造新的工件。但是理解深度学习在一定程度上是 “物理科学”，需要理解这个工件的一般属性。

科学和技术的历史有很多技术工件先于理论理解的例子：透镜的发明在光学理论之前，蒸汽机的发明在热力学之前，飞机在空气动力学之前，无线电通信再信息理论之前，可编程计算器在计算机科学之前。

LeCun 演讲的两个要点是：

(1) 经验主义是一种完全合适的研究方法，尽管它效率低下；

(2) 我们面临的挑战是为学习和智能开发一种理论，对应于蒸汽机的热力学理论。

有了理论基础，即使只是概念上的基础，也将大大加快该领域的研究进展，但必须认识到一般理论的实际影响有限。

演讲视频：

深度学习：工程科学还是自然科学？

2017 年 Ali Rahimi 在 NIPS 的演讲中批判深度学习是 “炼金术”（Alchemy），引起机器学习界大讨论。当时反驳他的代表、深度学习领军人物 Yann LeCun 在自己的主页上回应 Ali，说自己完全不同意 Ali 的说法。

LeCun 表示，那次大争论很有意思，但他认为 Ali Rahami 混淆了两个概念，即 “炼金术” 和 “工程”。Ali 所指的 “炼金术” 实际上是工程学。

炼金术 & 工程

工程科学是关于发明新工件 (new artifacts) 的，你有很多方法可以用来发明新东西。比如望远镜、蒸汽机、电磁体、飞机、无线电等新发明，显然有方法被用来创造它们。这是一种创造性的活动，其方法如创造、直觉、探测、实验等等。如果我们对这些现象有一些理论上的理解，这些发明创造显然能够更加高效。

这与今天的神经科学也有相似之处。神经科学是关于发现、学习和解释现象的，其方法如在控制条件下的可复现实验、数学、统计学、系统性实验等，同样也由理论性、概念性和直觉理解所指导。

而理论往往是在发明之后构建起来的，比如：透镜的发明在光学理论之前，蒸汽机的发明在热力学之前，飞机在空气动力学之前，无线电通信再信息理论之前，可编程计算器在计算机科学之前。

如此，现代世界的种种神奇在人们完全理解它们之前就已经被发明出来了。这和我们告诉学生的故事有些不同，我们会告诉他们去做数学运算，要理解所有的理论，只有这样你才能利用那些理论去发明东西。但现实从来不是这样。

来自大脑的启发

上面这张 PPT 展示了深度学习的根源，即启发了深度学习的一些理论。

McCulloch & Pitts (1943) : 二元神经元网络可以做逻辑运算
Donald Hebt (1947) : Hebbian 发现突触可塑性的基本机制（赫布理论）
Norbert Wiener (1948) ：控制论，最佳滤波器，反馈，自动生成，自动组织
Frank Rosenblatt (1957): 感知机

今天的 AI 大部分是监督学习

其运作方式是：向系统提供样本以训练机器，而非直接编程。

当输出错误时，则调整参数。

这是模式识别的一个标准范式

从 1969 到 1985 年，是深度学习的第一个 “冬天”。当时提出的多层网络并不学习，原因包括使用了错误的 “神经元”，而二元神经元阻碍了人们往 gradient-based 的方法去想。

不过到 80 年代早期，出现了神经网络的第二次热潮。当时提出了 Hopfield nets、玻尔兹曼机。到 1985/86 年，反向传播 (Backprop) 出现了，深度学习迎来转机。

来自生物学的启发

深度学习为什么需要理论

理论是好东西，因为它使得实验有效。

理论允许我们修补、完善经验。一些理论甚至能让我们预测现象。

多层神经网络和深度学习

卷积网络启发自视觉皮层

卷积网络能够识别多个物体

其中，所有层都是卷积的，神经网络同时进行分割和识别。

80、90 年代时的神经网络硬件

深度学习的第二个冬天

1996~2006 年的 10 年间，是神经网络的第二个冬天。这期间，很少有团队能够训练大型神经网络。

原因有很多

硬件在浮点计算方面很慢
数据稀缺，数据成本昂贵，而神经网络是数据饥渴性的
交互式的软件工具必须从头开始构建
在互联网时代之前，开源并不常见

学习理论

理论可能会限制我们的创造性思维

更多阅读

【加入社群】

新智元AI技术+产业社群招募中，欢迎对AI技术+产业落地感兴趣的同学，加小助手微信号：aiera2015_2 入群;通过审核后我们将邀请进群，加入社群后务必修改群备注（姓名 - 公司 - 职位;专业群审核较严，敬请谅解）

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

Yoshua Bengio最新《深度学习》MLSS2020教程，附104页PPT及视频

专知会员服务

126+阅读 · 2020年7月10日

【MLSS2020硬核课】机器学习「因果性」，德国Bernhard Schölkopf教授，177页ppt

专知会员服务

108+阅读 · 2020年7月2日

最新《深度学习自动驾驶》技术综述论文，28页pdf

专知会员服务

153+阅读 · 2020年6月14日

少标签数据学习，54页ppt

专知会员服务

194+阅读 · 2020年5月22日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

178+阅读 · 2020年3月16日

MIT公开课-Vivienne Sze教授《深度学习硬件加速器》，86页ppt

专知会员服务

64+阅读 · 2020年2月18日

CMU-Ruslan 教授《深度学习基础：监督学习与生成模型》教程，127页ppt

专知会员服务

47+阅读 · 2020年2月14日

最新！Yann Lecun 纽约大学Spring2020深度学习课程，附PPT下载

专知会员服务

45+阅读 · 2020年1月28日

【大佬约架】Yoshua Bengio与Gary Marcus之圣诞AI论战「 AI 之道」，附视频地址与slides下载

专知会员服务

23+阅读 · 2019年12月25日

【华山论剑：Gary Marcus与Bengio之圣诞AI论战 - 视频与PPT】DEBATE : Yoshua Bengio | Gary Marcus

专知会员服务

25+阅读 · 2019年12月25日

【图灵奖得主Yann Lecun最新演讲】基于能量的自监督学习，68页ppt，了解后深度学习发展趋势

专知

41+阅读 · 2019年11月25日

乱！Bengio一席话引发Marcus与LeCun「舌战」，还有DL帝国主义？

机器之心

4+阅读 · 2018年11月23日

我们还缺多少基础理论，才能在高中开设深度学习课程？

深度学习世界

5+阅读 · 2018年4月19日

一文读懂神经网络(附PPT、视频)

数据派THU

17+阅读 · 2018年3月25日

【深度学习】LeCun亲授的深度学习入门课：从飞行器的发明到卷积神经网络

产业智能官

4+阅读 · 2018年3月16日

Yann LeCun爆惊人言论：深度学习已死？

雷锋网

7+阅读 · 2018年1月7日

Yann LeCun：深度学习已死，可微分编程万岁！

新智元

4+阅读 · 2018年1月6日

【NIPS2017】深度学习真的不需要理论指导了？图灵奖得主讲座无人问津，贝叶斯之父Judea Pearl落寞身影背后引人深思

新智元

8+阅读 · 2017年12月10日

【NIPS2017】深度学习真的不需要理论指导了？图灵奖得主讲座无人问津，贝叶斯之父Judea Pearl落寞身影背后引人深思

专知

4+阅读 · 2017年12月9日

【LeCun再怼阿里】NIPS机器学习炼金术之争，Twitter机器学习研究员参战

新智元

3+阅读 · 2017年12月8日

Advances in Online Audio-Visual Meeting Transcription

Arxiv

4+阅读 · 2019年12月10日

Discovery and recognition of motion primitives in human activities

Arxiv

4+阅读 · 2019年2月4日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

4+阅读 · 2018年9月25日

Fine-tuning CNN Image Retrieval with No Human Annotation

Arxiv

4+阅读 · 2018年7月10日

Planar Object Tracking in the Wild: A Benchmark

Arxiv

5+阅读 · 2018年5月22日

Improving Image Captioning with Conditional Generative Adversarial Nets

Arxiv

9+阅读 · 2018年5月18日

Interpretable Convolutional Neural Networks

Arxiv

21+阅读 · 2018年2月14日

An Iterative Spanning Forest Framework for Superpixel Segmentation

Arxiv

9+阅读 · 2018年1月30日

Improving Multiple Object Tracking with Optical Flow and Edge Preprocessing

Arxiv

10+阅读 · 2018年1月29日

Interpreting CNN Knowledge via an Explanatory Graph

Arxiv

10+阅读 · 2017年11月22日

VIP会员