目标检测领域中的数据不均衡问题综述

2020 年 5 月 18 日 极市平台

加入极市专业CV交流群,与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度 等名校名企视觉开发者互动交流!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~

来源| 3D视觉工坊


参考:Imbalance Problems in Object Detection

paper:https://arxiv.org/abs/1909.00169.pdf

主要内容和相关背景


本文主要介绍了目标检测领域的八个数据不平衡问题,并将这些问题分类为四种主要类型:类别不平衡、规模不平衡、空间不平衡和目标不平衡。


当与不同类别相关的示例数量之间存在显著的不平等时,就会出现类别不平衡。虽然这方面的经典例子是前景到背景的不平衡,但前景(正)类之间也存在不平衡。当对象具有不同的比例和属于不同比例的不同数量的示例时,就会出现比例不平衡。空间不平衡是指与bounding box的空间特性有关的一组因素,比如回归惩罚、定位和IoU相关。最后,当存在最小化多个损失函数时,会出现客观不平衡(各个损失函数的权重不均衡),这在OD中通常是如此(例如分类和回归损失)。


现主要有两种目标检测方法:自上而下和自下而上。尽管自上而下和自下而上的方法在深度学习时代之前都很流行,但目前,对象检测方法的大多数都遵循自上而下的方法;自下而上的方法是最近才提出的。本文围绕这两类思路,开展了研究讨论。

目标检测中的四大类数据不均衡问题


主要几种在类别不均衡、尺度不均衡、空间不均衡、优化目标不均衡,详细如下图所示,基于四大类不均衡问题又扩展成8类子问题:前景背景类别不均衡、前景和前景类别不均衡、物体/box尺度上的不均衡、特征层的不均衡、回归损失下的不均衡、IOU分布不均衡、物体位置的不均衡、优化目标的不均衡。


1、类别不均衡

这个问题可以表现为“前景-背景不平衡”,其中背景实例的数量明显超过正实例;或者“前景-前景不平衡”,其中通常只有一小部分类占整个数据集的一大部分。类不平衡通常在检测pipelines中的“采样”阶段处理。

2、尺度不均衡

当对象实例具有不同的比例和与不同比例相关的不同数量时,可以观察到尺度比例不平衡。这个问题是物体在本质上具有不同维度这一事实的自然结果。规模也可能导致特征级别的不平衡(通常在“特征提取”阶段处理),不同抽象层(即高级别和低级别)的贡献不平衡。尺度不平衡问题表明,单一尺度的视觉处理不足以检测不同尺度的目标。

3、空间不均衡

空间不平衡是指与bounding box的空间属性相关的一组因素。基于这些空间性质,我们确定了三种空间不平衡的亚类型:(i)“回归损失不平衡”是关于个别例子对回归损失的贡 献,与损失函数设计有关(ii)“IoU分布不平衡”(iii)“物体位置不平衡”

4、优化目标不均衡

当有多个目标(损失函数)要最小化时(每个目标用于特定任务,例如分类和框回归),就会出现目标不平衡。由于不同的目标在其范围和最佳解决方案方面可能不兼容,因此必须制定一个平衡的策略,以找到一个所有目标都可接受的解决方案。

类别不均衡及解决方法


1、 前景背景不均衡

在前景背景类不平衡的情况下,过表示类和欠表示类分别是背景类和前景类。这种类型的问题是不可避免的,因为大多数边界框被边界框匹配和标记模块标记为背景(即负)类。前景背景不平衡问题发生在训练期间,并且不依赖于数据集中每个类的示例数,因为它们不包括背景上的任何注释。

我们可以将背景类不平衡的解决方案分为四类:(i)硬采样方法,(ii)软采样方法,(iii)无采样方法和(iv)生成方法,详细方法汇总如下图所示:


硬采样的思路:设置指定数量或者比例的正负样本(RCNN系列)。

软采样的思路:软抽样通过对训练过程的相对重要性来调整每个样本的贡献(设定样本损失权重)。

无采样方式:设立新的分支,根据前面的样本,预测后面样本的权重。

生成方法:主要基于GAN。

2、前景前景不均衡

主要集中在数据集上的类别不均衡,和每个bacth内的类别不均衡。

基于类别不均衡,论文阐述此情况不可避免,可以通过生成新的图像和类别进行解决。

基于batch内的类别不均衡:可以使用在线前景均衡(OFB)抽样,通过给每个要抽样的bounding box分配概率,可以在批处理级别上缓解前景类不平衡问题,从而使批处理中不同类的分布是均匀的。换言之,该方法旨在提升抽样过程中阳性样本数较少的类。虽然该方法是有效的,但性能改善并不显著。

尺度不均衡及解决方法


object/box级别的比例不平衡,主要包括物体和输入box的比例分布不平衡以及特征不平衡(分析了特征提取层存在的问题,并对金字塔特征提取方法进行了研究)

1、基于box/物体尺度的不均衡问题

当对象或输入bounding box的某些大小在数据集中过度表示时,会发生尺度平衡。已经证明,这会影响总体检测性能。下图显示了MS-COCO数据集中对象的相对宽度、高度和面积;


解决方法主要包括:基于backbone特征层次的预测方法、基于特征金字塔的方法、图像金字塔方式、图像金字塔与特征金字塔相结合的方法。

2、特征层次的不平衡

针对FPN结构中的特征层次,有几种方法可以解决FPN体系结构中的不平衡问题,从设计改进的自顶向下通道连接到完全新颖的体系结构。论文考虑了使用新的架构来缓解特征级不平衡问题的方法,根据它们作为基础的用途将它们分为两类:使用金字塔或backbone特征作为bias。


空间不均衡及解决方法


尺寸、形状、位置(相对于图像或另一个框)和IoU是边界框的空间属性。这些属性的任何不平衡都可能影响训练和泛化性能。例如,如果不采用适当的损失函数,位置的轻微变化可能导致回归(局部化)损失的剧烈变化,从而导致损失值的不平衡。在这一部分中,我们将具体讨论这些空间属性和回归损失问题。


1、回归损失的不均衡

目标检测的回归损失主要有两类:第一类是基于Lp-norm-based(例如L1,L2)的损失函数,第二个是基于IoU的损失函数。上表显示了广泛使用的回归损失函数的比较。(不断解决了各类损失函数优化问题)

2、IoU分布的不均衡

解决方式:Cascade R-CNN、Hierarchical Shot Detector (HSD)、IoU-uniform R-CNN、pRoI Generator

3、物体位置的不均衡

主要从anchor的尺寸和位置着手优化。


优化目标不均衡及解决方法


目标不平衡是指在训练过程中最小化的目标(损失)函数。通过定义,目标检测需要多任务丢失,以便同时解决分类和回归任务。然而,不同的任务可能会导致不平衡,这是因为以下的差异:(i)梯度的规范对于任务可能是不同的,并且一个任务可以支配训练。(二)不同任务的损失函数范围不同,影响任务的一致性和均衡性优化。(iii)任务的难度可能不同,这会影响学习任务的速度,从而阻碍训练过程。

解决方法:最常见的解决方案是任务权重,它通过一个额外的超参数作为权重因子来平衡损失项。使用验证集选择超参数。当然,增加任务的数量,就像两级检测器一样,会增加权重因子的数量和搜索空间的维度(注意,两级检测器中有四个任务,一级检测器中有两个任务)。由多任务性质引起的一个问题是不同的函数之间可能存在一致性。对于例如,在AP损耗中,smooth L1(由于损耗的输入通常在应用对数变换后提供)与[0,∞)一起用于回归,而LAP∈[0,1]。另一个例子是GIoU loss,它在[-1,1]范围内,与交叉熵损失一起使用。作者将GIoU loss的权重因子设为10,并利用正则化方法来平衡这种幅度差异,保证训练的均衡性。


推荐阅读:



添加极市小助手微信(ID : cv-mart),备注:研究方向-姓名-学校/公司-城市(如:AI移动应用-小极-北大-深圳),即可申请加入AI移动应用极市技术交流群,更有每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、行业技术交流一起来让思想之光照的更远吧~


△长按添加极市小助手


△长按关注极市平台,获取最新CV干货


觉得有用麻烦给个在看啦~  

登录查看更多
6

相关内容

目标检测,也叫目标提取,是一种与计算机视觉和图像处理有关的计算机技术,用于检测数字图像和视频中特定类别的语义对象(例如人,建筑物或汽车)的实例。深入研究的对象检测领域包括面部检测和行人检测。 对象检测在计算机视觉的许多领域都有应用,包括图像检索和视频监视。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
深度学习目标检测方法综述
专知会员服务
259+阅读 · 2020年8月1日
最新《医学图像深度语义分割》综述论文
专知会员服务
94+阅读 · 2020年6月7日
3D目标检测进展综述
专知会员服务
187+阅读 · 2020年4月24日
【综述】交通流量预测,附15页论文下载
专知会员服务
128+阅读 · 2020年4月23日
专知会员服务
155+阅读 · 2020年4月21日
专知会员服务
53+阅读 · 2020年3月16日
零样本图像分类综述 : 十年进展
专知会员服务
123+阅读 · 2019年11月16日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
115+阅读 · 2019年6月16日
小目标检测相关技巧总结
极市平台
28+阅读 · 2019年8月15日
最全综述 | 图像分割算法
极市平台
23+阅读 · 2019年6月23日
继往开来!目标检测二十年技术综述
极市平台
29+阅读 · 2019年5月17日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
36+阅读 · 2019年4月18日
目标检测小tricks之样本不均衡处理
PaperWeekly
49+阅读 · 2019年4月5日
CVPR2019目标检测方法进展综述
极市平台
45+阅读 · 2019年3月20日
学界 | 一文概览卷积神经网络中的类别不均衡问题
深度学习时代的目标检测算法综述
AI前线
10+阅读 · 2017年9月22日
干货|深度学习目标检测的主要问题和挑战!
全球人工智能
6+阅读 · 2017年9月6日
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
8+阅读 · 2018年5月17日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
深度学习目标检测方法综述
专知会员服务
259+阅读 · 2020年8月1日
最新《医学图像深度语义分割》综述论文
专知会员服务
94+阅读 · 2020年6月7日
3D目标检测进展综述
专知会员服务
187+阅读 · 2020年4月24日
【综述】交通流量预测,附15页论文下载
专知会员服务
128+阅读 · 2020年4月23日
专知会员服务
155+阅读 · 2020年4月21日
专知会员服务
53+阅读 · 2020年3月16日
零样本图像分类综述 : 十年进展
专知会员服务
123+阅读 · 2019年11月16日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
115+阅读 · 2019年6月16日
相关资讯
小目标检测相关技巧总结
极市平台
28+阅读 · 2019年8月15日
最全综述 | 图像分割算法
极市平台
23+阅读 · 2019年6月23日
继往开来!目标检测二十年技术综述
极市平台
29+阅读 · 2019年5月17日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
36+阅读 · 2019年4月18日
目标检测小tricks之样本不均衡处理
PaperWeekly
49+阅读 · 2019年4月5日
CVPR2019目标检测方法进展综述
极市平台
45+阅读 · 2019年3月20日
学界 | 一文概览卷积神经网络中的类别不均衡问题
深度学习时代的目标检测算法综述
AI前线
10+阅读 · 2017年9月22日
干货|深度学习目标检测的主要问题和挑战!
全球人工智能
6+阅读 · 2017年9月6日
相关论文
Top
微信扫码咨询专知VIP会员