首篇弱监督显著性实例检测！获得BMVC 2020 最佳学生论文提名奖

会员服务 ·

首篇弱监督显著性实例检测！获得BMVC 2020 最佳学生论文提名奖

2020 年 9 月 22 日 CVer

点击上方“CVer”，选择加"星标"置顶

重磅干货，第一时间送达

本文作者：Uno Whoiam | 公众号：林木蔚然读书会

https://zhuanlan.zhihu.com/p/248422583

本文已由原作者授权，不得擅自二次转载

论文：Weakly-supervised Salient Instance Detection

https://www.bmvc2020-conference.com/assets/papers/0430.pdf

图像分割领域近年来竞争激烈，该论文则是在红海之中寻找蓝海的一篇文章。整体的算法框架基本上是扎根于ICCV2019的 IRNet，针对的任务是尚未有人涉足的弱监督显著性实例检测，并且取得了较好的结果。建议阅读本文之前先了解：

IRNet：弱监督实例分割 | 步步为营，隔山打牛

一、要解决的问题（Why）

显著性实例检测和图像实例分割有着很高的相似性，可以将显著性实例检测看做只有一类物体的实例分割任务。该论文要解决的问题是显著性实例检测依赖大量像素级标注数据，从而导致标注成本较高的问题。

二、解决的办法（What）

该论文的解决方法是使用成本较低的 image-level + object counts (论文中称 subitizing information) 替代 instance-level pixel-wise label 训练网络。

三、如何实现（How）

和 IRNet 一样，该网络也有三个分支，一个预测物体边缘，一个输出CAM，一个预测物体中心偏移，关于三个分支分别是怎么预测、训练的，基本上可以参考 IRNet：

IRNet：弱监督实例分割 | 步步为营，隔山打牛

这里主要讲讲其改进之处：

其一是引入了新的 loss：

其中指中心偏移预测分支中提取的物体数量，表示真实物体数量。该 loss 利用了训练数据中带有的物体数量标签进行训练，带来的提升如下：

其二是在物体边缘预测上，融合了Canny的结果：

带来的提升如下：

其三是提出了Double Attention Module，相比 DANet 的 Dual Attention 显然计算量更小，但同样可以达到各通道各位置进行链接的作用，基本是基于 CBAM 改动一下得到：

DANet 中的 Dual Attention：

参考论文：
[CVPR2019] Dual Attention Network for Scene Segmentation
[ECCV2018] CBAM: Convolutional Block Attention Module

double attention 带来的提升：

最后还有一个不起眼的地方，就是它还用了条件随机场 CRF 对 CAM 的结果进行了优化。

参考论文：
Efficient inference in fully connected crfs with gaussian edge potentials

四、效果如何？（How much）

相较于以往的弱监督方法的确具有显著的优势。

在性能贡献上，Boundary Enhancement module 对性能影像最大，其次是引入的新Loss。

五、启示（What Then）

本论文最让我印象深刻的应该是 Boundary Enhancement module，将传统边缘检测算子的结果嵌入网络模型，以提高最终的结果。一方面能将传统方法与深度学习融合的确会让人眼前一亮，促使 Reviewer 给出更好的评价；另一方面在深度学习竞争激烈的现在，向传统方法借力是一个很好的选择。

论文PDF下载

本文论文PDF已打包好，公众号后台回复：WSID-Net，即可下载访问

下载1

在CVer公众号后台回复：PRML，即可下载758页《模式识别和机器学习》PRML电子书和源码。该书是机器学习领域中的第一本教科书，全面涵盖了该领域重要的知识点。本书适用于机器学习、计算机视觉、自然语言处理、统计学、计算机科学、信号处理等方向。

PRML

下载2

在CVer公众号后台回复：CVPR2020，即可下载CVPR2020 2020代码开源的论文合集

在CVer公众号后台回复：ECCV2020，即可下载ECCV 2020代码开源的论文合集

重磅！CVer-图像分割 微信交流群已成立

扫码添加CVer助手，可申请加入CVer-图像分割 微信交流群，目前已汇集1500人！涵盖语义分割、实例分割、全景分割、医学图像分割等。互相交流，一起进步！

同时也可申请加入CVer大群和细分方向技术群，细分方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如图像分割+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲长按加群

▲长按关注我们

整理不易，请给CVer点赞和在看！

登录查看更多

相关内容

BMVC

关注 129

British Machine Vision Conference为在英国从事机器视觉、图像处理和模式识别的个人和组织提供了一个国家论坛。其主要目的是：提高机器视觉和模式识别知识、鼓励技术的实际应用、促进研究成果迅速向产业转移、在国内外代表英国机器视觉界官网链接：https://britishmachinevisionassociation.github.io/

图像分割方法综述

专知会员服务

56+阅读 · 2020年11月22日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

36+阅读 · 2020年9月2日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日