这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载) - 专知

会员服务 ·

0

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

2019 年 1 月 7 日 专知

【导读】一份深度学习精髓宝典。

作者 | Jeff Macaluso

编译 | Xiaowen

当我第一次在研究生院学习神经网络的时候，我问我的教授是否有选择架构和超参数的经验法则。我期望他的回答是“嗯，有点，但不是真的”……毕竟，神经网络比其他机器学习算法有更多的选择！当我阅读 Ian Goodfellow, Yoshua Bengio, 和 Aaaron Courville的深度学习书时，我一直在思考这个问题，并决定在这本书中列出一份规则清单。事实证明，它们有很多……主要是因为它们可以完成很多类型的神经网络和任务。

https://jeffmacaluso.github.io/post/DeepLearningRulesOfThumb/

有趣的是，许多这些经验法则并没有得到很好的确立-深度学习仍然是一个相对较新的活跃研究领域，所以下面列出的很多规则只是研究人员最近发现的。除此之外，这本书中还有很多领域，作者要么说(用更多的学术术语)“我们不知道这是为什么，但我们可以看到这是真的”或者“我们知道这不是最好的方法，但这是一个活跃的研究领域，我们目前还不知道更好的方法“。

下面是我在阅读深度学习过程中所做的更实际的笔记。

TL：DR

如果可能的话，使用迁移学习。如果没有，并且要处理一个已经被广泛研究过的问题，那么从复制架构开始。

网络体系结构最终应该通过实验来决定，并由验证误差来决定。更深(更多层more layers)、更薄(smaller layers)的网络更难优化，但往往会产生更好的泛化误差。

总是要early stopping

两种早期停止方法

在整个数据集上使用新的参数重新训练模型，在早期停止点达到与前一个模型相同的训练步骤时停止。
保持在早期停止时获得的参数，继续使用所有数据进行训练，当平均训练误差降到前一个早期停止点的训练误差以下时停止训练。

使用Dropout可能是个好主意

输入层用0.8的概率，隐藏层用0.5。
Dropout可能需要更大的网络，需要与更多的迭代训练。

ReLUs是理想的激活函数。当然它们还是存在缺陷，因此使用leaky或noisy ReLUs 可以获得性能增益，而代价是需要调整更多的参数。

要获得可接受的性能，每个类别至少需要5，000次观察。

如果你的观察量少于10万，使用k折交叉验证代替训练/验证/测试分割。

使用GPU内存所能处理的批处理大小

尝试不同的批次大小，每次增加2倍，从32开始(或者在大网络里先用16开始)，增加到256。

具有动量和衰减学习率的随机梯度下降是一种较好的优化算法。
……
……
…………还有很多很多……还有19页PDF…………翻译不完了……这段话老板千万别看见……

查看完整内容：

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知）

后台回复“TLDR” 就可以获取花书深度学习笔记的下载链接~
专知2019年1月将开设一门《深度学习：算法到实战》讲述相关深度学习基础与前沿技术及实战，欢迎报名！

专知开课啦!《深度学习: 算法到实战》, 中科院博士为你讲授！

-END-

专 · 知

专知开课啦!《深度学习: 算法到实战》, 中科院博士为你讲授！

请加专知小助手微信（扫一扫如下二维码添加），咨询《深度学习:算法到实战》参团限时优惠报名~

欢迎微信扫一扫加入专知人工智能知识星球群，获取专业知识教程视频资料和与专家交流咨询！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

点击“阅读原文”，了解报名专知《深度学习:算法到实战》课程

登录查看更多

42

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

专知会员服务

154+阅读 · 2020年6月27日

【经典书】机器学习高斯过程，266页pdf

【经典书】机器学习高斯过程，266页pdf

专知会员服务

200+阅读 · 2020年5月2日

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

专知会员服务

130+阅读 · 2020年3月15日

【综述】金融领域中的深度学习，附52页论文下载

【综述】金融领域中的深度学习，附52页论文下载

专知会员服务

165+阅读 · 2020年2月27日

【新书】傻瓜式入门深度学习，371页pdf

【新书】傻瓜式入门深度学习，371页pdf

专知会员服务

193+阅读 · 2019年12月28日

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知会员服务

62+阅读 · 2019年12月25日

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

专知会员服务

160+阅读 · 2019年12月18日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

286+阅读 · 2019年12月2日

深度学习界圣经“花书”《Deep Learning》中文版来了

深度学习界圣经“花书”《Deep Learning》中文版来了

专知会员服务

240+阅读 · 2019年10月26日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

深度学习面试100题（第41-45题）

深度学习面试100题（第41-45题）

七月在线实验室

15+阅读 · 2018年7月18日

深度学习面试100题（第31-35题）

深度学习面试100题（第31-35题）

七月在线实验室

8+阅读 · 2018年7月16日

入门 | 深度学习模型的简单优化技巧

入门 | 深度学习模型的简单优化技巧

机器之心

10+阅读 · 2018年6月10日

深度学习入门笔记

深度学习入门笔记

论智

7+阅读 · 2018年3月31日

【下载】深度学习DL4j实战指南《Deep Learning—A Practitioner's Approach》

【下载】深度学习DL4j实战指南《Deep Learning—A Practitioner's Approach》

专知

48+阅读 · 2017年12月9日

入门 | 一文概览深度学习中的激活函数

入门 | 一文概览深度学习中的激活函数

机器之心

7+阅读 · 2017年11月2日

《模型汇总-20》深度学习背后的秘密：初学者指南-深度学习激活函数大全

《模型汇总-20》深度学习背后的秘密：初学者指南-深度学习激活函数大全

深度学习与NLP

8+阅读 · 2017年8月29日

RNN | RNN实践指南（3）

RNN | RNN实践指南（3）

KingsGarden

7+阅读 · 2017年6月5日

Continual Unsupervised Representation Learning

Continual Unsupervised Representation Learning

Arxiv

7+阅读 · 2019年10月31日

Unsupervised Data Augmentation for Consistency Training

Arxiv

5+阅读 · 2019年7月10日

One-Shot Federated Learning

One-Shot Federated Learning

Arxiv

9+阅读 · 2019年3月5日

Single-frame Regularization for Temporally Stable CNNs

Single-frame Regularization for Temporally Stable CNNs

Arxiv

3+阅读 · 2019年2月27日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Neural Approaches to Conversational AI

Neural Approaches to Conversational AI

Arxiv

8+阅读 · 2018年12月13日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Online Deep Metric Learning

Arxiv

8+阅读 · 2018年5月15日

Self Paced Deep Learning for Weakly Supervised Object Detection

Arxiv

8+阅读 · 2018年2月21日

VIP会员

相关主题

机器学习算法

相关VIP内容

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

专知会员服务

154+阅读 · 2020年6月27日

【经典书】机器学习高斯过程，266页pdf

【经典书】机器学习高斯过程，266页pdf

专知会员服务

200+阅读 · 2020年5月2日

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

专知会员服务

130+阅读 · 2020年3月15日

【综述】金融领域中的深度学习，附52页论文下载

【综述】金融领域中的深度学习，附52页论文下载

专知会员服务

165+阅读 · 2020年2月27日

【新书】傻瓜式入门深度学习，371页pdf

【新书】傻瓜式入门深度学习，371页pdf

专知会员服务

193+阅读 · 2019年12月28日

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知会员服务

62+阅读 · 2019年12月25日

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

【开放书】《自动化机器学习：方法，系统与挑战》，附223页pdf下载

专知会员服务

160+阅读 · 2019年12月18日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

286+阅读 · 2019年12月2日

深度学习界圣经“花书”《Deep Learning》中文版来了

深度学习界圣经“花书”《Deep Learning》中文版来了

专知会员服务

240+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型中的检索与结构化增强生成综述

《实现多层防御多轮交战机制的扩展型随机齐射模型》2025年最新83页

【CMU博士论文】交互驱动的人体动作估计与生成

如何避免生成式人工智能在作战中失控失效

相关资讯

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

深度学习面试100题（第41-45题）

深度学习面试100题（第41-45题）

七月在线实验室

15+阅读 · 2018年7月18日

深度学习面试100题（第31-35题）

深度学习面试100题（第31-35题）

七月在线实验室

8+阅读 · 2018年7月16日

入门 | 深度学习模型的简单优化技巧

入门 | 深度学习模型的简单优化技巧

机器之心

10+阅读 · 2018年6月10日

深度学习入门笔记

深度学习入门笔记

论智

7+阅读 · 2018年3月31日

【下载】深度学习DL4j实战指南《Deep Learning—A Practitioner's Approach》

【下载】深度学习DL4j实战指南《Deep Learning—A Practitioner's Approach》

专知

48+阅读 · 2017年12月9日

入门 | 一文概览深度学习中的激活函数

入门 | 一文概览深度学习中的激活函数

机器之心

7+阅读 · 2017年11月2日

《模型汇总-20》深度学习背后的秘密：初学者指南-深度学习激活函数大全

《模型汇总-20》深度学习背后的秘密：初学者指南-深度学习激活函数大全

深度学习与NLP

8+阅读 · 2017年8月29日

RNN | RNN实践指南（3）

RNN | RNN实践指南（3）

KingsGarden

7+阅读 · 2017年6月5日

相关论文

Continual Unsupervised Representation Learning

Continual Unsupervised Representation Learning

Arxiv

7+阅读 · 2019年10月31日

Unsupervised Data Augmentation for Consistency Training

Arxiv

5+阅读 · 2019年7月10日

One-Shot Federated Learning

One-Shot Federated Learning

Arxiv

9+阅读 · 2019年3月5日

Single-frame Regularization for Temporally Stable CNNs

Single-frame Regularization for Temporally Stable CNNs

Arxiv

3+阅读 · 2019年2月27日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Neural Approaches to Conversational AI

Neural Approaches to Conversational AI

Arxiv

8+阅读 · 2018年12月13日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Online Deep Metric Learning

Arxiv

8+阅读 · 2018年5月15日

Self Paced Deep Learning for Weakly Supervised Object Detection

Arxiv

8+阅读 · 2018年2月21日

大家都在搜

大型语言模型

IJCAI2025教程

无人机系统

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员