会员服务 ·

0

牛津大学VGG组论文解读：自动发现和学习新的视觉类别

2020 年 3 月 25 日 极市平台

加入极市专业CV交流群，与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。关注 极市平台 公众号，回复 加群，立刻申请入群~

作者：bingo

知乎链接：https://zhuanlan.zhihu.com/p/108448214

本文已由作者授权转载，未经允许，不得二次转载。

最近看到ICLR2020关于特征学习和计算机视觉的论文，发现VGG组Andrew Zisserman (做CV领域应该都知道，不知道的请自行补课)和Andrea Vedaldi(用过VLFeat的应该知道)两位大佬挂名了一篇论文："AUTOMATICALLY DISCOVERING AND LEARNING NEW VISUAL CATEGORIES WITH RANKING STATISTICS"。这篇论文的问题和想法比较有意思，所以就写一个笔记记录一下。

论文：https://openreview.net/pdf?id=BJl2_nVFPB

发现新的视觉类别（Discover New Visual Categories）

New Visual Categories Discovery这个问题的定义如图1，首先我们给定有标签的已知类别图像数据，目标是对未知并且无标签的图像集合进行聚类（视觉类别发现），使聚类结果尽可能接近图像的真实语义类别。视觉类别发现与半监督学习以及领域自适应等问题的区别在于，这里无监督数据和有监督数据的类别是不同的。

需要指出，视觉类别发现区别于简单聚类任务，这里有监督的数据是必不可少的。直观的理解如图2，如果没有任何先验知识，那么聚类结果不具有唯一性。根据颜色、形状、边框类型，我们分别可以得到不同且合理的聚类结果。有了有标签数据之后，我们可以得到关于视觉类别的先验知识作为聚类参考，从而消除了很多歧义和不合理的聚类。

方法介绍

作者提出的方法主要包括三个贡献：

如果只在有标签数据上面进行特征预训练，很容易使特征表示偏向于有标签集合，不利于聚类和视觉发现。作者提出通过在有标签+无标签数据上进行自监督预训练来解决这个问题。

使用排序统计指标作为成对数据相似性度量标准，产生有噪声伪标签用于训练。

将有标签数据的分类任务和无标签数据的聚类任务，放到一个统一的优化目标进行训练，使得他们相互促进。

0. 问题和相关符号

给定有标签和无标签数据如下：

我们的目标是通过自动聚类，发现无标签数据的潜在类别

。

为了进行训练，在深度网络最后一层接两个分类器，如下：

Step1 自监督学习

作者采用的是旋转预测的方式进行自监督预训练。

Step2 有监督训练

使用有监督数据和cross entropy loss进行特征学习（只学习最高层的feature，因为自监督学习已经使底层特征就有很好的表达能力）

Step3-1 通过排序统计计算成对数据相似性

首先，对每个图片的特征的各个维度进行排序，然后根据下面方法计算相似性：

如果两个图片特征的最大的k个维度相同，那么就认为他们来自同一个类别。有了成对相似性之后，可以计算Binary Cross-Entropy的损失：

Step3-2 特征一致性和联合训练

为了使得统计排序更加稳定，引入变换一致性的损失函数：就是数据变换之后的分类或者聚类结果和原始图像的结果应该尽可能接近（相似思想在SimCLR中也有体现）

最后，将BCE，MSE以及有监督数据上面的CE损失函数放到一起进行优化。

。

总结

自监督学习最近得到越来越多的关注，而且在不同任务里面得到了体现，包括但不限于提升特征表达能力、提高模型稳定性、防止过拟合等等。

视觉类别发现，是一个比较有意思的任务。

相关论文：

1. AUTOMATICALLY DISCOVERING AND LEARNING NEW VISUAL CATEGORIES WITH RANKING STATISTICS, ICLR2020

2. Learning to Discover Novel Visual Categories via Deep Transfer Clustering, ICCV2019

-END -

推荐阅读：

极市平台视觉算法季度赛，提供真实应用场景数据和免费算力，特殊时期，一起在家打比赛吧！

添加极市小助手微信（ID : cv-mart），备注：研究方向-姓名-学校/公司-城市（如：目标检测-小极-北大-深圳），即可申请加入目标检测、目标跟踪、人脸、工业检测、医学影像、三维&SLAM、图像分割等极市技术交流群，更有每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、行业技术交流，一起来让思想之光照的更远吧~

△长按添加极市小助手

△长按关注极市平台，获取最新CV干货

觉得有用麻烦给个在看啦~

登录查看更多

26

相关内容

VGG

【ICLR2020-牛津大学】自动发现和学习新的视觉类别与排名统计，13页pdf，Automatically Discovering and Learning New Visual Categories with Ranking Statistics

【ICLR2020-牛津大学】自动发现和学习新的视觉类别与排名统计，13页pdf，Automatically Discovering and Learning New Visual Categories with Ranking Statistics

专知会员服务

10+阅读 · 2020年2月15日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

172+阅读 · 2020年2月13日

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

专知会员服务

121+阅读 · 2019年11月30日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知会员服务

30+阅读 · 2019年10月26日

腾讯58篇论文入选CVPR 2019，涵盖视觉对抗学习等方向

腾讯58篇论文入选CVPR 2019，涵盖视觉对抗学习等方向

AI前线

4+阅读 · 2019年3月8日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知

26+阅读 · 2019年1月1日

超分辨率技术如何发展？这6篇ECCV 18论文带你一次尽览

超分辨率技术如何发展？这6篇ECCV 18论文带你一次尽览

极市平台

23+阅读 · 2018年10月15日

春节囤货清单 | 15篇近期值得读的AI论文

春节囤货清单 | 15篇近期值得读的AI论文

AI100

3+阅读 · 2018年2月18日

论文 | 15篇近期值得读的AI论文

论文 | 15篇近期值得读的AI论文

黑龙江大学自然语言处理实验室

16+阅读 · 2018年2月12日

Zero-Shot Object Detection

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年7月27日

Transferring Common-Sense Knowledge for Object Detection

Arxiv

12+阅读 · 2018年4月3日

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Arxiv

6+阅读 · 2018年3月21日

Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Arxiv

9+阅读 · 2018年3月13日

Large-Scale Object Discovery and Detector Adaptation from Unlabeled Video

Arxiv

3+阅读 · 2017年12月23日

VIP会员

相关主题

牛津大学 (University of Oxford)

相关VIP内容

【ICLR2020-牛津大学】自动发现和学习新的视觉类别与排名统计，13页pdf，Automatically Discovering and Learning New Visual Categories with Ranking Statistics

【ICLR2020-牛津大学】自动发现和学习新的视觉类别与排名统计，13页pdf，Automatically Discovering and Learning New Visual Categories with Ranking Statistics

专知会员服务

10+阅读 · 2020年2月15日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

172+阅读 · 2020年2月13日

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

专知会员服务

121+阅读 · 2019年11月30日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知会员服务

30+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型中的事件抽取：方法、模态与未来展望的全面综述

美海军作战管理系统：变革战场空间的二十年

【MIT博士论文】以语言为中心的医学影像理解

俄罗斯“沙希德”/“天竺葵”攻击无人机

相关资讯

腾讯58篇论文入选CVPR 2019，涵盖视觉对抗学习等方向

腾讯58篇论文入选CVPR 2019，涵盖视觉对抗学习等方向

AI前线

4+阅读 · 2019年3月8日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知

26+阅读 · 2019年1月1日

超分辨率技术如何发展？这6篇ECCV 18论文带你一次尽览

超分辨率技术如何发展？这6篇ECCV 18论文带你一次尽览

极市平台

23+阅读 · 2018年10月15日

春节囤货清单 | 15篇近期值得读的AI论文

春节囤货清单 | 15篇近期值得读的AI论文

AI100

3+阅读 · 2018年2月18日

论文 | 15篇近期值得读的AI论文

论文 | 15篇近期值得读的AI论文

黑龙江大学自然语言处理实验室

16+阅读 · 2018年2月12日

相关论文

Zero-Shot Object Detection

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年7月27日

Transferring Common-Sense Knowledge for Object Detection

Arxiv

12+阅读 · 2018年4月3日

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Arxiv

6+阅读 · 2018年3月21日

Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Arxiv

9+阅读 · 2018年3月13日

Large-Scale Object Discovery and Detector Adaptation from Unlabeled Video

Arxiv

3+阅读 · 2017年12月23日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员