谷歌出品EfficientNet：比现有卷积网络小84倍，比GPipe快6.1倍 - 专知

会员服务 ·

0

谷歌出品EfficientNet：比现有卷积网络小84倍，比GPipe快6.1倍

2019 年 6 月 2 日 新智元

新智元报道

来源：GoogleAI

编辑：鹏飞

【新智元导读】谷歌AI研究部门华人科学家再发论文《EfficientNet：重新思考CNN模型缩放》，模型缩放的传统做法是任意增加CNN的深度和宽度，或使用更大的输入图像分辨率进行训练，而使用EfficientNet使用一组固定额缩放系数统一缩放每个维度，超越了当先最先进图像识别网络的准确率，效率提高了10倍，而且更小。

目前提高CNN精度的方法，主要是通过任意增加CNN深度或宽度，或使用更大的输入图像分辨率进行训练和评估。

以固定的资源成本开发，然后按比例放大，以便在获得更多资源时实现更好的准确性。例如ResNet可以通过增加层数从ResNet-18扩展到ResNet-200。

再比如开源大规模神经网络模型高效训练库GPipe，通过将基线CNN扩展四倍来实现84.3％ ImageNet top-1精度。

这种方法的优势在于确实可以提高精度，但劣势也很明显。这个时候往往需要进行繁琐的微调。一点点的摸黑去试、还经常的徒劳无功。这绝对不是一件能够让人身心愉快的事情，对于谷歌科学家们也一样。

这就是为什么，谷歌人工智能研究部门的科学家们正在研究一种新的“更结构化”的方式，来“扩展”卷积神经网络。他们给这个新的网络命名为：EfficientNet（效率网络）。

代码已开源，论文刚刚上线arXiv，并将在6月11日，作为poster亮相ICML 2019。

比现有卷积网络小84倍，比GPipe快6.1倍

为了理解扩展网络的效果，谷歌的科学家系统地研究了缩放模型不同维度的影响。模型缩放并确定仔细平衡网络深度后，发现只要对网络的深度、宽度和分辨率进行合理地平衡，就能带来更好的性能。基于这一观察，科学家提出了一种新的缩放方法，使用简单但高效的复合系数均匀地缩放深度、宽度和分辨率的所有尺寸。

据悉，EfficientNet-B7在ImageNet上实现了最先进精度的84.4％ Top 1/97.1％ Top 5，同时比最好的现有ConvNet小84倍，推理速度快6.1倍；在CIFAR-100（91.7％），Flower（98.8％）和其他3个迁移学习数据集上，也能很好地传输和实现最先进的精度。参数减少一个数量级，效率却提高了10倍（更小，更快）。

与流行的ResNet-50相比，另一款EfficientNet-B4使用了类似的FLOPS，同时将ResNet-50的最高精度从76.3％提高到82.6％。

这么优秀的成绩是如何做到的

这种复合缩放方法的第一步是执行网格搜索，在固定资源约束下找到基线网络的不同缩放维度之间的关系（例如，2倍FLOPS），这样做的目的是为了找出每个维度的适当缩放系数。然后应用这些系数，将基线网络扩展到所需的目标模型大小或算力预算。

与传统的缩放方法相比，这种复合缩放方法可以持续提高扩展模型的准确性和效率，和传统方法对比结果：MobileNet（+ 1.4％ imagenet精度），ResNet（+ 0.7％）。

新模型缩放的有效性，很大程度上也依赖基线网络。

为了进一步提高性能，研究团队还通过使用AutoML MNAS框架执行神经架构搜索来开发新的基线网络，该框架优化了准确性和效率（FLOPS）。

由此产生的架构使用移动倒置瓶颈卷积（MBConv），类似于MobileNetV2和MnasNet，但由于FLOP预算增加而略大。然后，通过扩展基线网络以获得一系列模型，被称为EfficientNets。

不仅局限于ImageNet

EfficientNets在ImageNet上的良好表现，让谷歌的科学家希望将其应用于更广泛的网络中，造福更多的人。

在8个广泛使用的迁移学习数据集上测试之后，EfficientNet在其中的5个网络实现了最先进的精度。例如，在参数减少21倍的情况下，实现了CIFAR-100（91.7％）和Flowers（98.8％）。

看到这样的结果，谷歌科学家预计EfficientNet可能成为未来计算机视觉任务的新基础，因此将EfficientNet开源。

华人做出了重要贡献

论文的两位作者，都和中国有关。

第一作者是谷歌的高级软件工程师Mingming Tan，北大博士，在康奈尔大学获得博士后学位。

第二作者Quoc V. Le现在是谷歌的一名软件工程师，在斯坦福获得博士学位，师从著名的人工智能领袖吴恩达。

他在越南农村长大，会英语、普通话、吴语和广东话。小时候家里连电都没有。但他住的地方附近有一个图书馆。Le在图书馆里，如饥似渴的阅读那些伟大发明，小小年纪便梦想有朝一日自己的名字，也能铭刻在人类伟大发明家名人堂上。

14岁的时候，他就幻想一个足够聪明的机器能够帮助人类。这个幻想让他走上了人工智能的道路。

论文链接：

https://arxiv.org/abs/1905.11946

Github：

https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet

新智元春季招聘开启，一起弄潮AI之巅！

岗位详情请戳：

【加入社群】

新智元AI技术+产业社群招募中，欢迎对AI技术+产业落地感兴趣的同学，加小助手微信号：aiera2015_2 入群;通过审核后我们将邀请进群，加入社群后务必修改群备注（姓名 - 公司 - 职位;专业群审核较严，敬请谅解）。

登录查看更多

8

相关内容

EfficientNet

[ICML-Google]先宽后窄:对深度薄网络的有效训练

[ICML-Google]先宽后窄:对深度薄网络的有效训练

专知会员服务

33+阅读 · 2020年7月5日

紧凑的神经网络模型设计研究综述

专知会员服务

72+阅读 · 2020年5月21日

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

专知会员服务

55+阅读 · 2020年5月4日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

43+阅读 · 2020年4月17日

【CVPR2020-Facebook AI】扩展架构的高效视频识别，X3D: Expanding Architectures

【CVPR2020-Facebook AI】扩展架构的高效视频识别，X3D: Expanding Architectures

专知会员服务

21+阅读 · 2020年4月11日

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

专知会员服务

25+阅读 · 2020年4月7日

【CVPR2020-清华大学】分辨率自适应网络的有效推理，Resolution Adaptive Networks

【CVPR2020-清华大学】分辨率自适应网络的有效推理，Resolution Adaptive Networks

专知会员服务

21+阅读 · 2020年3月17日

【ICLR-2020】网络反卷积，NETWORK DECONVOLUTION

【ICLR-2020】网络反卷积，NETWORK DECONVOLUTION

专知会员服务

37+阅读 · 2020年2月21日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

16+阅读 · 2019年12月24日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

26+阅读 · 2019年11月24日

【神经网络】怎样设计最优的卷积神经网络架构？卷积神经网络的训练过程

【神经网络】怎样设计最优的卷积神经网络架构？卷积神经网络的训练过程

产业智能官

6+阅读 · 2019年8月8日

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

泡泡机器人SLAM

23+阅读 · 2019年6月12日

谷歌开源新模型EfficientNet：图像识别效率提升10倍，参数减少88%

谷歌开源新模型EfficientNet：图像识别效率提升10倍，参数减少88%

AI前线

15+阅读 · 2019年6月9日

谷歌提出新型卷积网络EfficientNet：推理速度提升5.1倍，参数减少88%（附论文&代码）

谷歌提出新型卷积网络EfficientNet：推理速度提升5.1倍，参数减少88%（附论文&代码）

数据派THU

6+阅读 · 2019年6月8日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

谷歌开发EfficientNets，扩大CNN并与AutoML结合，效率提升10倍|一周AI最火论文

谷歌开发EfficientNets，扩大CNN并与AutoML结合，效率提升10倍|一周AI最火论文

大数据文摘

9+阅读 · 2019年6月4日

推理速度提升5.1倍，参数减少88%：谷歌提出新型卷积网络EfficientNet（附代码）

推理速度提升5.1倍，参数减少88%：谷歌提出新型卷积网络EfficientNet（附代码）

机器之心

6+阅读 · 2019年5月31日

重磅！谷歌大脑提出EfficientNet平衡模型扩展三个维度，取得精度-效率的最大化！

重磅！谷歌大脑提出EfficientNet平衡模型扩展三个维度，取得精度-效率的最大化！

GAN生成式对抗网络

5+阅读 · 2019年5月30日

已删除

将门创投

4+阅读 · 2019年5月8日

李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

全球人工智能

5+阅读 · 2019年1月14日

Learning to See Through Obstructions

Learning to See Through Obstructions

Arxiv

7+阅读 · 2020年4月2日

AutoML: A Survey of the State-of-the-Art

AutoML: A Survey of the State-of-the-Art

Arxiv

67+阅读 · 2019年8月14日

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

Arxiv

3+阅读 · 2019年5月28日

Anonymized BERT: An Augmentation Approach to the Gendered Pronoun Resolution Challenge

Anonymized BERT: An Augmentation Approach to the Gendered Pronoun Resolution Challenge

Arxiv

4+阅读 · 2019年5月6日

MultiResUNet : Rethinking the U-Net Architecture for Multimodal Biomedical Image Segmentation

MultiResUNet : Rethinking the U-Net Architecture for Multimodal Biomedical Image Segmentation

Arxiv

8+阅读 · 2019年2月11日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

Retrospective correction of Rigid and Non-Rigid MR motion artifacts using GANs

Retrospective correction of Rigid and Non-Rigid MR motion artifacts using GANs

Arxiv

3+阅读 · 2018年9月17日

Capsule Networks against Medical Imaging Data Challenges

Capsule Networks against Medical Imaging Data Challenges

Arxiv

3+阅读 · 2018年7月19日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Arxiv

17+阅读 · 2018年5月31日

VIP会员

相关主题

图像分辨率

卷积神经网络

相关VIP内容

[ICML-Google]先宽后窄:对深度薄网络的有效训练

[ICML-Google]先宽后窄:对深度薄网络的有效训练

专知会员服务

33+阅读 · 2020年7月5日

紧凑的神经网络模型设计研究综述

专知会员服务

72+阅读 · 2020年5月21日

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

专知会员服务

55+阅读 · 2020年5月4日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

43+阅读 · 2020年4月17日

【CVPR2020-Facebook AI】扩展架构的高效视频识别，X3D: Expanding Architectures

【CVPR2020-Facebook AI】扩展架构的高效视频识别，X3D: Expanding Architectures

专知会员服务

21+阅读 · 2020年4月11日

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

专知会员服务

25+阅读 · 2020年4月7日

【CVPR2020-清华大学】分辨率自适应网络的有效推理，Resolution Adaptive Networks

【CVPR2020-清华大学】分辨率自适应网络的有效推理，Resolution Adaptive Networks

专知会员服务

21+阅读 · 2020年3月17日

【ICLR-2020】网络反卷积，NETWORK DECONVOLUTION

【ICLR-2020】网络反卷积，NETWORK DECONVOLUTION

专知会员服务

37+阅读 · 2020年2月21日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

16+阅读 · 2019年12月24日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

26+阅读 · 2019年11月24日

热门VIP内容

相关资讯

【神经网络】怎样设计最优的卷积神经网络架构？卷积神经网络的训练过程

【神经网络】怎样设计最优的卷积神经网络架构？卷积神经网络的训练过程

产业智能官

6+阅读 · 2019年8月8日

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

泡泡机器人SLAM

23+阅读 · 2019年6月12日

谷歌开源新模型EfficientNet：图像识别效率提升10倍，参数减少88%

谷歌开源新模型EfficientNet：图像识别效率提升10倍，参数减少88%

AI前线

15+阅读 · 2019年6月9日

谷歌提出新型卷积网络EfficientNet：推理速度提升5.1倍，参数减少88%（附论文&代码）

谷歌提出新型卷积网络EfficientNet：推理速度提升5.1倍，参数减少88%（附论文&代码）

数据派THU

6+阅读 · 2019年6月8日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

谷歌开发EfficientNets，扩大CNN并与AutoML结合，效率提升10倍|一周AI最火论文

谷歌开发EfficientNets，扩大CNN并与AutoML结合，效率提升10倍|一周AI最火论文

大数据文摘

9+阅读 · 2019年6月4日

推理速度提升5.1倍，参数减少88%：谷歌提出新型卷积网络EfficientNet（附代码）

推理速度提升5.1倍，参数减少88%：谷歌提出新型卷积网络EfficientNet（附代码）

机器之心

6+阅读 · 2019年5月31日

重磅！谷歌大脑提出EfficientNet平衡模型扩展三个维度，取得精度-效率的最大化！

重磅！谷歌大脑提出EfficientNet平衡模型扩展三个维度，取得精度-效率的最大化！

GAN生成式对抗网络

5+阅读 · 2019年5月30日

已删除

将门创投

4+阅读 · 2019年5月8日

李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

全球人工智能

5+阅读 · 2019年1月14日

相关论文

Learning to See Through Obstructions

Learning to See Through Obstructions

Arxiv

7+阅读 · 2020年4月2日

AutoML: A Survey of the State-of-the-Art

AutoML: A Survey of the State-of-the-Art

Arxiv

67+阅读 · 2019年8月14日

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

Arxiv

3+阅读 · 2019年5月28日

Anonymized BERT: An Augmentation Approach to the Gendered Pronoun Resolution Challenge

Anonymized BERT: An Augmentation Approach to the Gendered Pronoun Resolution Challenge

Arxiv

4+阅读 · 2019年5月6日

MultiResUNet : Rethinking the U-Net Architecture for Multimodal Biomedical Image Segmentation

MultiResUNet : Rethinking the U-Net Architecture for Multimodal Biomedical Image Segmentation

Arxiv

8+阅读 · 2019年2月11日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

Retrospective correction of Rigid and Non-Rigid MR motion artifacts using GANs

Retrospective correction of Rigid and Non-Rigid MR motion artifacts using GANs

Arxiv

3+阅读 · 2018年9月17日

Capsule Networks against Medical Imaging Data Challenges

Capsule Networks against Medical Imaging Data Challenges

Arxiv

3+阅读 · 2018年7月19日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Arxiv

17+阅读 · 2018年5月31日

大家都在搜

精益管理体系

无人地面车辆

生成式人工智能

MIT博士论文

性别年龄戴眼镜识别论文

微信扫码咨询专知VIP会员