【ICLR2021】自监督蒸馏学习视觉表示 - 专知VIP

会员服务 ·

1

自监督学习 · 轻量型模型 · 自监督蒸馏 ·

2021 年 4 月 14 日

【ICLR2021】自监督蒸馏学习视觉表示

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文主要聚焦于小模型(即轻量型模型)的自监督学习问题，作者通过实证发现：对比自监督学习方法在大模型训练方面表现出了很大进展，然这些方法在小模型上的表现并不好。

为解决上述问题，本文提出了一种新的学习框架：自监督蒸馏(SElf-SupErvised Distillation, SEED)，它通过自监督方式(SSL)将老师模型的知识表达能力迁移给学生模型。不同于直接在无监督数据上的直接学习，我们训练学生模型去模拟老师模型在一组示例上的相似度得分分布。

所提SEED的简洁性与灵活性不言而喻，包含这样三点：(1) 无需任何聚类/元计算步骤生成伪标签/隐类；(2) 老师模型可以通过优秀的自监督学习（比如MoCo-V2、SimCLR、SWAV等）方法进行预训练；(3)老师模型的知识表达能力可以蒸馏到任意小模型中(比如更浅、更细，甚至可以是完全不同的架构)。

实验表明：SEED可以提升小模型在下游任务上的性能表现。相比自监督基准MoCo-V2方案，在ImageNet数据集上，SEED可以将EfficientNet-B0的精度从42.2%提升到67.6%，将MobileNetV3-Large的精度从36.3%提升到68.2%，见下图对比。

https://arxiv.org/pdf/2101.04731.pdf

成为VIP会员查看完整内容

33

相关内容

自监督学习

自监督学习

自监督学习（self-supervised learning）可以被看作是机器学习的一种“理想状态”，模型直接从无标签数据中自行学习，无需标注数据。

ICLR2021 | 初探GNN的表示能力

专知会员服务

27+阅读 · 2021年5月2日

SiT: 自监督视觉Transformer

专知会员服务

62+阅读 · 2021年4月11日

【ICLR2021】基于返回的对比表示征学习在强化学习中的应用

专知会员服务

16+阅读 · 2021年2月24日

【ICLR2021】一种基于距离度量学习及行为正则化的完全离线的元强化学习方法

专知会员服务

16+阅读 · 2021年2月9日

【ICLR2021】基于图信息瓶颈的子图识别

专知会员服务

17+阅读 · 2021年2月8日

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

专知会员服务

14+阅读 · 2020年9月30日

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

专知会员服务

30+阅读 · 2020年9月30日

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

专知会员服务

40+阅读 · 2020年7月21日

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

专知会员服务

37+阅读 · 2020年2月25日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

31+阅读 · 2020年2月15日

【ICLR2021】通过多种自监督方式提升GAT中注意力

【ICLR2021】通过多种自监督方式提升GAT中注意力

专知

18+阅读 · 2021年2月27日

牛津大学VGG组论文解读：自动发现和学习新的视觉类别

牛津大学VGG组论文解读：自动发现和学习新的视觉类别

极市平台

25+阅读 · 2020年3月25日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

几种句子表示方法的比较

几种句子表示方法的比较

AINLP

15+阅读 · 2019年9月21日

解耦强化学习的值函数学习

解耦强化学习的值函数学习

CreateAMind

5+阅读 · 2019年9月5日

华为美研所提出自动编码变换网络AET：用无监督逼近全监督效果

华为美研所提出自动编码变换网络AET：用无监督逼近全监督效果

AI前线

6+阅读 · 2019年3月2日

CMU最新视觉特征自监督学习模型——TextTopicNet

CMU最新视觉特征自监督学习模型——TextTopicNet

人工智能头条

9+阅读 · 2018年7月29日

香港中大-商汤科技联合实验室AAAI录用论文详解：自监督语义分割的混合与匹配调节

香港中大-商汤科技联合实验室AAAI录用论文详解：自监督语义分割的混合与匹配调节

商汤科技

3+阅读 · 2018年2月26日

【AAAI2018】通过动态融合方式学习多模态词表示，中科院自动化所宗成庆老师团队最新工作

【AAAI2018】通过动态融合方式学习多模态词表示，中科院自动化所宗成庆老师团队最新工作

专知

6+阅读 · 2018年2月19日

A Thorough View of Exact Inference in Graphs from the Degree-4 Sum-of-Squares Hierarchy

Arxiv

0+阅读 · 2021年6月1日

Dense Contrastive Learning for Self-Supervised Visual Pre-Training

Arxiv

18+阅读 · 2021年4月4日

Removing the Background by Adding the Background: Towards Background Robust Self-supervised Video Representation Learning

Arxiv

10+阅读 · 2021年3月3日

Towards Backward-Compatible Representation Learning

Arxiv

5+阅读 · 2020年3月26日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

Unsupervised Cross-lingual Representation Learning at Scale

Arxiv

4+阅读 · 2019年11月5日

Unsupervised Image Captioning

Arxiv

7+阅读 · 2018年11月27日

Understanding disentangling in $β$-VAE

Arxiv

4+阅读 · 2018年4月10日

Disentangled Person Image Generation

Arxiv

7+阅读 · 2018年1月21日

Fluency-Guided Cross-Lingual Image Captioning

Arxiv

3+阅读 · 2017年8月15日

VIP会员

相关主题

自监督学习

轻量型模型

自监督蒸馏

相关VIP内容

ICLR2021 | 初探GNN的表示能力

专知会员服务

27+阅读 · 2021年5月2日

SiT: 自监督视觉Transformer

专知会员服务

62+阅读 · 2021年4月11日

【ICLR2021】基于返回的对比表示征学习在强化学习中的应用

专知会员服务

16+阅读 · 2021年2月24日

【ICLR2021】一种基于距离度量学习及行为正则化的完全离线的元强化学习方法

专知会员服务

16+阅读 · 2021年2月9日

【ICLR2021】基于图信息瓶颈的子图识别

专知会员服务

17+阅读 · 2021年2月8日

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

专知会员服务

14+阅读 · 2020年9月30日

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

专知会员服务

30+阅读 · 2020年9月30日

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

专知会员服务

40+阅读 · 2020年7月21日

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

专知会员服务

37+阅读 · 2020年2月25日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

31+阅读 · 2020年2月15日

热门VIP内容

相关资讯

【ICLR2021】通过多种自监督方式提升GAT中注意力

【ICLR2021】通过多种自监督方式提升GAT中注意力

专知

18+阅读 · 2021年2月27日

牛津大学VGG组论文解读：自动发现和学习新的视觉类别

牛津大学VGG组论文解读：自动发现和学习新的视觉类别

极市平台

25+阅读 · 2020年3月25日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

几种句子表示方法的比较

几种句子表示方法的比较

AINLP

15+阅读 · 2019年9月21日

解耦强化学习的值函数学习

解耦强化学习的值函数学习

CreateAMind

5+阅读 · 2019年9月5日

华为美研所提出自动编码变换网络AET：用无监督逼近全监督效果

华为美研所提出自动编码变换网络AET：用无监督逼近全监督效果

AI前线

6+阅读 · 2019年3月2日

CMU最新视觉特征自监督学习模型——TextTopicNet

CMU最新视觉特征自监督学习模型——TextTopicNet

人工智能头条

9+阅读 · 2018年7月29日

香港中大-商汤科技联合实验室AAAI录用论文详解：自监督语义分割的混合与匹配调节

香港中大-商汤科技联合实验室AAAI录用论文详解：自监督语义分割的混合与匹配调节

商汤科技

3+阅读 · 2018年2月26日

【AAAI2018】通过动态融合方式学习多模态词表示，中科院自动化所宗成庆老师团队最新工作

【AAAI2018】通过动态融合方式学习多模态词表示，中科院自动化所宗成庆老师团队最新工作

专知

6+阅读 · 2018年2月19日

相关论文

A Thorough View of Exact Inference in Graphs from the Degree-4 Sum-of-Squares Hierarchy

Arxiv

0+阅读 · 2021年6月1日

Dense Contrastive Learning for Self-Supervised Visual Pre-Training

Arxiv

18+阅读 · 2021年4月4日

Removing the Background by Adding the Background: Towards Background Robust Self-supervised Video Representation Learning

Arxiv

10+阅读 · 2021年3月3日

Towards Backward-Compatible Representation Learning

Arxiv

5+阅读 · 2020年3月26日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

Unsupervised Cross-lingual Representation Learning at Scale

Arxiv

4+阅读 · 2019年11月5日

Unsupervised Image Captioning

Arxiv

7+阅读 · 2018年11月27日

Understanding disentangling in $β$-VAE

Arxiv

4+阅读 · 2018年4月10日

Disentangled Person Image Generation

Arxiv

7+阅读 · 2018年1月21日

Fluency-Guided Cross-Lingual Image Captioning

Arxiv

3+阅读 · 2017年8月15日

微信扫码咨询专知VIP会员