【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf - 专知VIP

会员服务 ·

8

机器学习 · 机器学习训练 · 加州大学伯克利分校 (UC Berkeley) ·

2020 年 8 月 4 日

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

过去的十年见证了深度学习(DL)应用数据量的巨大增长。因此，深度神经网络(DNNs)的训练时间过长已经成为机器学习(ML)开发者和研究者的瓶颈。例如，在8个P100 gpu上完成90-epoch ImageNet/ResNet-50的训练需要29个小时。在16个v3 TPU芯片上完成BERT预训练需要81小时。本文主要研究的是快速准确的ML训练。尽管生产团队希望充分利用超级计算机来加速训练过程，但传统的优化器无法扩展到数千个处理器。在本论文中，我们设计了一系列基本的优化算法来提高DL系统的并行度。我们的算法为谷歌、英特尔、腾讯、英伟达等最先进的分布式系统提供支持。本文的重点是弥合高性能计算(HPC)和ML之间的差距。

在2017年HPC和ML之间有很大的差距。一方面，我们拥有强大的超级计算机，每秒可以执行2x10^17个浮点运算。另一方面，我们甚至不能充分利用1%的计算能力来训练一个最先进的机器学习模型。原因是超级计算机需要极高的并行度才能达到其峰值性能。然而，高并行性导致ML优化器的收敛性很差。为了解决这个问题，我和我的合著者提出了LARS优化器、LAMB优化器和CA-SVM框架。这些新方法使ML训练扩展到数千个处理器而不会失去准确性。在过去的三年里，我们观察到ResNet-50的训练时间从29小时下降到67.1秒。事实上，自2017年12月以来，所有最先进的ImageNet训练速度记录都是由LARS创造的。LARS在MLPerf v0.6中成为行业指标。此外，即使没有超级计算机，我们的方法也比现有的求解器要快。如果我们固定训练预算(例如1个GPU 1小时)，我们的优化器可以达到一个更高的精度比最先进的基线。

成为VIP会员查看完整内容

54

相关内容

机器学习

“机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。很多推论问题属于无程序可循难度，所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【MIT】约束最小-最大优化的复杂性，84页pdf

专知会员服务

44+阅读 · 2020年9月25日

最新《深度持续学习》综述论文，32页pdf

最新《深度持续学习》综述论文，32页pdf

专知会员服务

87+阅读 · 2020年9月6日

【耶鲁2020新书】凸优化算法, 328页pdf

专知会员服务

203+阅读 · 2020年9月1日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【ICML2020】机器学习无参数在线优化，294页ppt

【ICML2020】机器学习无参数在线优化，294页ppt

专知会员服务

55+阅读 · 2020年8月1日

【斯坦福大学博士论文】大规模和高维统计学习方法和算法，147页pdf

【斯坦福大学博士论文】大规模和高维统计学习方法和算法，147页pdf

专知会员服务

104+阅读 · 2020年6月13日

最新《深度半监督学习》综述论文，43页pdf

最新《深度半监督学习》综述论文，43页pdf

专知会员服务

156+阅读 · 2020年6月12日

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

专知会员服务

61+阅读 · 2020年5月31日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知会员服务

34+阅读 · 2019年10月26日

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

专知会员服务

44+阅读 · 2019年8月16日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

专知

27+阅读 · 2019年9月15日

ICCV 2019 | 四小时搜索NN结构，厦大提出快速NAS检索方法

ICCV 2019 | 四小时搜索NN结构，厦大提出快速NAS检索方法

极市平台

8+阅读 · 2019年9月7日

伯克利《深度强化学习》更新 | 第四讲：强化学习简介

伯克利《深度强化学习》更新 | 第四讲：强化学习简介

AI研习社

5+阅读 · 2019年3月22日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知

30+阅读 · 2019年1月2日

Deeplearning4j 快速入门

Deeplearning4j 快速入门

人工智能头条

14+阅读 · 2018年12月24日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

20+阅读 · 2018年12月21日

当前训练神经网络最快的方式：AdamW优化算法+超级收敛

当前训练神经网络最快的方式：AdamW优化算法+超级收敛

中国人工智能学会

6+阅读 · 2018年7月4日

算法优化｜梯度下降和随机梯度下降 — 从0开始

算法优化｜梯度下降和随机梯度下降 — 从0开始

全球人工智能

8+阅读 · 2017年12月25日

2017年深度学习优化算法最新综述

2017年深度学习优化算法最新综述

计算机视觉战队

7+阅读 · 2017年12月18日

Go Wide, Then Narrow: Efficient Training of Deep Thin Networks

Arxiv

15+阅读 · 2020年7月1日

DPGN: Distribution Propagation Graph Network for Few-shot Learning

Arxiv

12+阅读 · 2020年3月31日

Unsupervised Learning of Graph Hierarchical Abstractions with Differentiable Coarsening and Optimal Transport

Unsupervised Learning of Graph Hierarchical Abstractions with Differentiable Coarsening and Optimal Transport

Arxiv

3+阅读 · 2019年12月24日

EfficientDet: Scalable and Efficient Object Detection

EfficientDet: Scalable and Efficient Object Detection

Arxiv

6+阅读 · 2019年11月20日

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Arxiv

14+阅读 · 2019年8月8日

End to End Video Segmentation for Driving : Lane Detection For Autonomous Car

Arxiv

3+阅读 · 2018年12月13日

GPU-Accelerated Robotic Simulation for Distributed Reinforcement Learning

GPU-Accelerated Robotic Simulation for Distributed Reinforcement Learning

Arxiv

4+阅读 · 2018年10月24日

Zero-Shot Object Detection

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年7月27日

Large-Scale Stochastic Sampling from the Probability Simplex

Arxiv

3+阅读 · 2018年6月19日

Discriminability objective for training descriptive captions

Arxiv

9+阅读 · 2018年3月12日

VIP会员

相关主题

机器学习训练

加州大学伯克利分校 (UC Berkeley)

相关VIP内容

【MIT】约束最小-最大优化的复杂性，84页pdf

专知会员服务

44+阅读 · 2020年9月25日

最新《深度持续学习》综述论文，32页pdf

最新《深度持续学习》综述论文，32页pdf

专知会员服务

87+阅读 · 2020年9月6日

【耶鲁2020新书】凸优化算法, 328页pdf

专知会员服务

203+阅读 · 2020年9月1日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【ICML2020】机器学习无参数在线优化，294页ppt

【ICML2020】机器学习无参数在线优化，294页ppt

专知会员服务

55+阅读 · 2020年8月1日

【斯坦福大学博士论文】大规模和高维统计学习方法和算法，147页pdf

【斯坦福大学博士论文】大规模和高维统计学习方法和算法，147页pdf

专知会员服务

104+阅读 · 2020年6月13日

最新《深度半监督学习》综述论文，43页pdf

最新《深度半监督学习》综述论文，43页pdf

专知会员服务

156+阅读 · 2020年6月12日

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

专知会员服务

61+阅读 · 2020年5月31日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知会员服务

34+阅读 · 2019年10月26日

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

专知会员服务

44+阅读 · 2019年8月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

【加州大学伯克利分校】自动机器学习流程设计技术报告，105页pdf

专知

27+阅读 · 2019年9月15日

ICCV 2019 | 四小时搜索NN结构，厦大提出快速NAS检索方法

ICCV 2019 | 四小时搜索NN结构，厦大提出快速NAS检索方法

极市平台

8+阅读 · 2019年9月7日

伯克利《深度强化学习》更新 | 第四讲：强化学习简介

伯克利《深度强化学习》更新 | 第四讲：强化学习简介

AI研习社

5+阅读 · 2019年3月22日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知

30+阅读 · 2019年1月2日

Deeplearning4j 快速入门

Deeplearning4j 快速入门

人工智能头条

14+阅读 · 2018年12月24日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

20+阅读 · 2018年12月21日

当前训练神经网络最快的方式：AdamW优化算法+超级收敛

当前训练神经网络最快的方式：AdamW优化算法+超级收敛

中国人工智能学会

6+阅读 · 2018年7月4日

算法优化｜梯度下降和随机梯度下降 — 从0开始

算法优化｜梯度下降和随机梯度下降 — 从0开始

全球人工智能

8+阅读 · 2017年12月25日

2017年深度学习优化算法最新综述

2017年深度学习优化算法最新综述

计算机视觉战队

7+阅读 · 2017年12月18日

相关论文

Go Wide, Then Narrow: Efficient Training of Deep Thin Networks

Arxiv

15+阅读 · 2020年7月1日

DPGN: Distribution Propagation Graph Network for Few-shot Learning

Arxiv

12+阅读 · 2020年3月31日

Unsupervised Learning of Graph Hierarchical Abstractions with Differentiable Coarsening and Optimal Transport

Unsupervised Learning of Graph Hierarchical Abstractions with Differentiable Coarsening and Optimal Transport

Arxiv

3+阅读 · 2019年12月24日

EfficientDet: Scalable and Efficient Object Detection

EfficientDet: Scalable and Efficient Object Detection

Arxiv

6+阅读 · 2019年11月20日

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Arxiv

14+阅读 · 2019年8月8日

End to End Video Segmentation for Driving : Lane Detection For Autonomous Car

Arxiv

3+阅读 · 2018年12月13日

GPU-Accelerated Robotic Simulation for Distributed Reinforcement Learning

GPU-Accelerated Robotic Simulation for Distributed Reinforcement Learning

Arxiv

4+阅读 · 2018年10月24日

Zero-Shot Object Detection

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年7月27日

Large-Scale Stochastic Sampling from the Probability Simplex

Arxiv

3+阅读 · 2018年6月19日

Discriminability objective for training descriptive captions

Arxiv

9+阅读 · 2018年3月12日

微信扫码咨询专知VIP会员