（CVPR2021）基于结构保持的弱监督目标定位 - 专知VIP

会员服务 ·

2

CVPR 2021 · 弱监督目标定位 ·

2021 年 5 月 1 日

（CVPR2021）基于结构保持的弱监督目标定位

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

基于CAM的弱监督定位方法主要通过多样的空间正则提高目标响应区域，忽略了模型中隐含的目标结构信息。我们提出了基于高阶相似性的目标定位方法 (SPA)，充分挖掘了模型隐含的目标结构信息，显著提高了弱监督目标定位准确度。

目前代码已开源：

https://github.com/Panxjia/SPA_CVPR2021

弱监督目标检测近年来逐渐受到国内外研究机构以及工业界关注。基于全监督的目标检测方法需要耗费大量的人力、物力获取大量准确的标注信息，对于任务更新以及迁移极其不友好。近年来，全世界范围内的研究者试图从弱监督学习方面突破标注数据的限制，为目标检测寻找一种更加高效、低廉的解决框架

弱监督定位研究如何仅利用图像的类别标签对图像中目标进行定位。

2014年MIT提出的类别响应图CAM，得到目标的响应掩模，之后通过最小包围框得到目标的定位结果。CAM得到的类别响应掩模只能覆盖目标最具判别性的局部区域，如图1第二行所示。后续的研究工作多通过空间正则技术，如通过擦除、多分支补充等方法试图扩大类别响应区域。虽然在响应区域上有一定的改善，但是现有的工作均忽略了保持目标结构特性的重要性，无法刻画目标的边缘、形状等特性。另外，现有方法的分类网络均采用Global Average Pooling(GAP)结构对特征进行聚合，这在一定程度上损失了目标的结构信息。

本文提出了一种两阶段的弱监督目标定位方法(SPA)，从模型结构与类别响应图两个方面优化定位结果，提高响应掩模的准确度。整体方法框架如图2所示。

具体地，从模型结构方面，我们提出了受限激活模块。

现有方法中往往采用Global Average Pooling (GAP)+Softmax的分类结构，这种结构导致模型丢失目标结构信息，主要原因包括：

一，GAP结构将前景目标与背景区域混为一谈，限制了模型定位前景目标的能力；

二，无限制的类别响应特征图往往出现局部极高响应误导模型分类的现象，不利于模型准确定位到目标的位置。

因此，我们设计了一个简单有效的受限激活模块，主要包括两个部分：

一，我们首先通过计算每个特征位置在类别响应图上的方差分布得到粗略的伪mask, 用以区分前背景；

二，我们利用Sigmoid操作对类别响应特征图进行归一化，之后利用提出的受限激活损失函数引导模型关注目标前景区域。

成为VIP会员查看完整内容

21

相关内容

CVPR 2021

【CVPR2021】基于结构保持的弱监督目标定位

专知会员服务

16+阅读 · 2021年6月6日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

【CVPR2021】探索图像超分辨率中的稀疏性以实现高效推理

【CVPR2021】探索图像超分辨率中的稀疏性以实现高效推理

专知会员服务

28+阅读 · 2021年4月17日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【AAAI2021】基于双任务一致性的半监督医学图像分割

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

31+阅读 · 2021年2月7日

【AAAI2021】基于图神经网络的文本语义匹配算法

【AAAI2021】基于图神经网络的文本语义匹配算法

专知会员服务

50+阅读 · 2021年1月30日

【NeurIPS 2020】对比学习全局和局部医学图像分割特征

【NeurIPS 2020】对比学习全局和局部医学图像分割特征

专知会员服务

44+阅读 · 2020年10月20日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

ECCV 2020 Oral | 苏黎世联邦理工学院提出：弱监督语义分割新网络

ECCV 2020 Oral | 苏黎世联邦理工学院提出：弱监督语义分割新网络

CVer

12+阅读 · 2020年7月18日

大规模多标签目标检测新算法，改善多标签竞争问题｜CVPR 20 Oral

大规模多标签目标检测新算法，改善多标签竞争问题｜CVPR 20 Oral

极市平台

10+阅读 · 2020年5月17日

CVPR 2020 | 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

CVPR 2020 | 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

AI科技评论

4+阅读 · 2020年3月9日

ICCV 2019 | 精确的端到端的弱监督目标检测网络

ICCV 2019 | 精确的端到端的弱监督目标检测网络

AI科技评论

11+阅读 · 2019年12月9日

【泡泡点云时空】SqueezeSegV2：改进模型结构和无监督领域自适应的激光雷达点云道路目标分割方法

【泡泡点云时空】SqueezeSegV2：改进模型结构和无监督领域自适应的激光雷达点云道路目标分割方法

泡泡机器人SLAM

11+阅读 · 2019年9月12日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

【学界】北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

【学界】北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

GAN生成式对抗网络

7+阅读 · 2019年5月1日

性能大幅度提升（速度&遮挡） | 基于区域分解&集成的目标检测

性能大幅度提升（速度&遮挡） | 基于区域分解&集成的目标检测

计算机视觉战队

4+阅读 · 2019年3月7日

ECCV18 | UC伯克利提出基于自适应相似场的语义分割（附代码）

ECCV18 | UC伯克利提出基于自适应相似场的语义分割（附代码）

极市平台

6+阅读 · 2018年8月31日

IJCAI Oral：弱监督实现精确目标检测，上交大提出协同学习框架

IJCAI Oral：弱监督实现精确目标检测，上交大提出协同学习框架

新智元

8+阅读 · 2018年5月14日

$C^3$: Compositional Counterfactual Constrastive Learning for Video-grounded Dialogues

Arxiv

0+阅读 · 2021年6月16日

SiamAPN++: Siamese Attentional Aggregation Network for Real-Time UAV Tracking

SiamAPN++: Siamese Attentional Aggregation Network for Real-Time UAV Tracking

Arxiv

0+阅读 · 2021年6月16日

Contrastive Learning for Compact Single Image Dehazing

Arxiv

4+阅读 · 2021年4月19日

CompFeat: Comprehensive Feature Aggregation for Video Instance Segmentation

Arxiv

8+阅读 · 2020年12月7日

Deep learning for cardiac image segmentation: A review

Deep learning for cardiac image segmentation: A review

Arxiv

21+阅读 · 2019年11月9日

Reverse Attention for Salient Object Detection

Arxiv

11+阅读 · 2019年4月15日

Efficient Tracking Proposals using 2D-3D Siamese Networks on LIDAR

Arxiv

4+阅读 · 2019年3月25日

SuperDepth: Self-Supervised, Super-Resolved Monocular Depth Estimation

Arxiv

5+阅读 · 2018年10月3日

Learning Instance Segmentation by Interaction

Arxiv

6+阅读 · 2018年6月21日

Arxiv

7+阅读 · 2018年1月24日

VIP会员

相关主题

弱监督目标定位

相关VIP内容

【CVPR2021】基于结构保持的弱监督目标定位

专知会员服务

16+阅读 · 2021年6月6日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

【CVPR2021】探索图像超分辨率中的稀疏性以实现高效推理

【CVPR2021】探索图像超分辨率中的稀疏性以实现高效推理

专知会员服务

28+阅读 · 2021年4月17日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【AAAI2021】基于双任务一致性的半监督医学图像分割

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

31+阅读 · 2021年2月7日

【AAAI2021】基于图神经网络的文本语义匹配算法

【AAAI2021】基于图神经网络的文本语义匹配算法

专知会员服务

50+阅读 · 2021年1月30日

【NeurIPS 2020】对比学习全局和局部医学图像分割特征

【NeurIPS 2020】对比学习全局和局部医学图像分割特征

专知会员服务

44+阅读 · 2020年10月20日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

热门VIP内容

开通专知VIP会员享更多权益服务

《美国海军陆战队软件定义网络应用案例：分布式防火墙自动化系统》148页

《多体环境下定位导航授时（PNT）系统研究》228页

软件定义无线电（SDR）：商业与军事领域的技术、应用及未来趋势

《攻势防空作战中无人追击者/规避者最优轨迹研究（含动态交战区建模）》95页

相关资讯

ECCV 2020 Oral | 苏黎世联邦理工学院提出：弱监督语义分割新网络

ECCV 2020 Oral | 苏黎世联邦理工学院提出：弱监督语义分割新网络

CVer

12+阅读 · 2020年7月18日

大规模多标签目标检测新算法，改善多标签竞争问题｜CVPR 20 Oral

大规模多标签目标检测新算法，改善多标签竞争问题｜CVPR 20 Oral

极市平台

10+阅读 · 2020年5月17日

CVPR 2020 | 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

CVPR 2020 | 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

AI科技评论

4+阅读 · 2020年3月9日

ICCV 2019 | 精确的端到端的弱监督目标检测网络

ICCV 2019 | 精确的端到端的弱监督目标检测网络

AI科技评论

11+阅读 · 2019年12月9日

【泡泡点云时空】SqueezeSegV2：改进模型结构和无监督领域自适应的激光雷达点云道路目标分割方法

【泡泡点云时空】SqueezeSegV2：改进模型结构和无监督领域自适应的激光雷达点云道路目标分割方法

泡泡机器人SLAM

11+阅读 · 2019年9月12日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

【学界】北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

【学界】北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

GAN生成式对抗网络

7+阅读 · 2019年5月1日

性能大幅度提升（速度&遮挡） | 基于区域分解&集成的目标检测

性能大幅度提升（速度&遮挡） | 基于区域分解&集成的目标检测

计算机视觉战队

4+阅读 · 2019年3月7日

ECCV18 | UC伯克利提出基于自适应相似场的语义分割（附代码）

ECCV18 | UC伯克利提出基于自适应相似场的语义分割（附代码）

极市平台

6+阅读 · 2018年8月31日

IJCAI Oral：弱监督实现精确目标检测，上交大提出协同学习框架

IJCAI Oral：弱监督实现精确目标检测，上交大提出协同学习框架

新智元

8+阅读 · 2018年5月14日

相关论文

$C^3$: Compositional Counterfactual Constrastive Learning for Video-grounded Dialogues

Arxiv

0+阅读 · 2021年6月16日

SiamAPN++: Siamese Attentional Aggregation Network for Real-Time UAV Tracking

SiamAPN++: Siamese Attentional Aggregation Network for Real-Time UAV Tracking

Arxiv

0+阅读 · 2021年6月16日

Contrastive Learning for Compact Single Image Dehazing

Arxiv

4+阅读 · 2021年4月19日

CompFeat: Comprehensive Feature Aggregation for Video Instance Segmentation

Arxiv

8+阅读 · 2020年12月7日

Deep learning for cardiac image segmentation: A review

Deep learning for cardiac image segmentation: A review

Arxiv

21+阅读 · 2019年11月9日

Reverse Attention for Salient Object Detection

Arxiv

11+阅读 · 2019年4月15日

Efficient Tracking Proposals using 2D-3D Siamese Networks on LIDAR

Arxiv

4+阅读 · 2019年3月25日

SuperDepth: Self-Supervised, Super-Resolved Monocular Depth Estimation

Arxiv

5+阅读 · 2018年10月3日

Learning Instance Segmentation by Interaction

Arxiv

6+阅读 · 2018年6月21日

Arxiv

7+阅读 · 2018年1月24日

微信扫码咨询专知VIP会员