【ECCV2020】OCRNet化解语义分割上下文信息缺失难题 - 专知VIP

会员服务 ·

1

语义分割 · ECCV 2020 ·

2020 年 8 月 24 日

【ECCV2020】OCRNet化解语义分割上下文信息缺失难题

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

微软亚洲研究院提出的 OCR 方法的主要思想是显式地把像素分类问题转化成物体区域分类问题，这与语义分割问题的原始定义是一致的，即每一个像素的类别就是该像素属于的物体的类别，换言之，与 PSPNet 和 DeepLabv3 的上下文信息最主要的不同就在于 OCR 方法显式地增强了物体信息。

OCR 方法的实现主要包括3个阶段：(1) 根据网络中间层的特征表示估测一个粗略的语义分割结果作为 OCR 方法的一个输入，即软物体区域（Soft Object Regions），(2) 根据粗略的语义分割结果和网络最深层的特征表示计算出 K 组向量，即物体区域表示（Object Region Representations），其中每一个向量对应一个语义类别的特征表示，(3) 计算网络最深层输出的像素特征表示（Pixel Representations）与计算得到的物体区域特征表示（Object Region Representation）之间的关系矩阵，然后根据每个像素和物体区域特征表示在关系矩阵中的数值把物体区域特征加权求和，得到最后的物体上下文特征表示 OCR (Object Contextual Representation) 。当把物体上下文特征表示 OCR 与网络最深层输入的特征表示拼接之后作为上下文信息增强的特征表示（Augmented Representation），可以基于增强后的特征表示预测每个像素的语义类别，具体算法框架可以参考图6。综上，OCR 可计算一组物体区域的特征表达，然后根据物体区域特征表示与像素特征表示之间的相似度将这些物体区域特征表示传播给每一个像素。

OCRNet 框架: https://www.zhuanzhi.ai/paper/e2dfdc82307194b70ba81ef91a6f82d4

成为VIP会员查看完整内容

17

相关内容

语义分割

语义分割，在机器学习上，多指对一段文本或者一张图片，提取其中有意义的部分，我们将这些有意义的部分称为语义单元，将这些语义单元提取出来的过程，称为语义分割。

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【ECCV2020-旷视】利用边界特征做检测的BorderDet

专知会员服务

13+阅读 · 2020年9月19日

【ECCV2020】基于场景图分解的自然语言描述生成

【ECCV2020】基于场景图分解的自然语言描述生成

专知会员服务

24+阅读 · 2020年9月3日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知会员服务

18+阅读 · 2020年8月23日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

近期必读的5篇顶会CVPR 2020【场景图+图神经网络（SG+GNN）】相关论文

近期必读的5篇顶会CVPR 2020【场景图+图神经网络（SG+GNN）】相关论文

专知会员服务

51+阅读 · 2020年5月12日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

专知会员服务

37+阅读 · 2020年1月10日

必读的7篇 IJCAI 2019【图神经网络（GNN）】相关论文

必读的7篇 IJCAI 2019【图神经网络（GNN）】相关论文

专知会员服务

92+阅读 · 2020年1月10日

PSPNet ——语义分割及场景分析

PSPNet ——语义分割及场景分析

AI科技评论

20+阅读 · 2019年8月20日

语义分割 | context relation

语义分割 | context relation

极市平台

8+阅读 · 2019年2月9日

ECCV 2018 | 迈向完全可学习的物体检测器：可学习区域特征提取方法

ECCV 2018 | 迈向完全可学习的物体检测器：可学习区域特征提取方法

微软研究院AI头条

6+阅读 · 2018年8月30日

《pyramid Attention Network for Semantic Segmentation》

《pyramid Attention Network for Semantic Segmentation》

统计学习与视觉计算组

44+阅读 · 2018年8月30日

ECCV 2018 | CornerNet：目标检测算法新思路

ECCV 2018 | CornerNet：目标检测算法新思路

极市平台

13+阅读 · 2018年8月11日

【CVPR2018】物体检测中的结构推理网络

【CVPR2018】物体检测中的结构推理网络

深度学习大讲堂

6+阅读 · 2018年7月30日

Relation Networks for Object Detection 论文笔记

Relation Networks for Object Detection 论文笔记

统计学习与视觉计算组

16+阅读 · 2018年4月18日

DeepLabv3+：语义分割领域的新高峰

DeepLabv3+：语义分割领域的新高峰

极市平台

4+阅读 · 2018年3月3日

专栏 | CVPR 2017论文解读：Instance-Aware图像语义分割

专栏 | CVPR 2017论文解读：Instance-Aware图像语义分割

机器之心

3+阅读 · 2017年7月28日

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

炼数成金订阅号

26+阅读 · 2017年7月10日

Object-Contextual Representations for Semantic Segmentation

Object-Contextual Representations for Semantic Segmentation

Arxiv

7+阅读 · 2019年11月19日

Inverse Visual Question Answering with Multi-Level Attentions

Inverse Visual Question Answering with Multi-Level Attentions

Arxiv

4+阅读 · 2019年9月17日

Hierarchically-Refined Label Attention Network for Sequence Labeling

Hierarchically-Refined Label Attention Network for Sequence Labeling

Arxiv

3+阅读 · 2019年8月23日

Relation-aware Graph Attention Network for Visual Question Answering

Arxiv

4+阅读 · 2019年3月29日

Multimodal Deep Network Embedding with Integrated Structure and Attribute Information

Multimodal Deep Network Embedding with Integrated Structure and Attribute Information

Arxiv

4+阅读 · 2019年3月28日

Knowledge-Embedded Routing Network for Scene Graph Generation

Arxiv

5+阅读 · 2019年3月8日

Two Stream 3D Semantic Scene Completion

Two Stream 3D Semantic Scene Completion

Arxiv

4+阅读 · 2018年7月16日

A Fully Convolutional Two-Stream Fusion Network for Interactive Image Segmentation

A Fully Convolutional Two-Stream Fusion Network for Interactive Image Segmentation

Arxiv

5+阅读 · 2018年7月6日

Path Aggregation Network for Instance Segmentation

Arxiv

3+阅读 · 2018年3月5日

A Question-Focused Multi-Factor Attention Network for Question Answering

Arxiv

6+阅读 · 2018年1月25日

VIP会员

相关主题

相关VIP内容

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【ECCV2020-旷视】利用边界特征做检测的BorderDet

专知会员服务

13+阅读 · 2020年9月19日

【ECCV2020】基于场景图分解的自然语言描述生成

【ECCV2020】基于场景图分解的自然语言描述生成

专知会员服务

24+阅读 · 2020年9月3日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知会员服务

18+阅读 · 2020年8月23日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

近期必读的5篇顶会CVPR 2020【场景图+图神经网络（SG+GNN）】相关论文

近期必读的5篇顶会CVPR 2020【场景图+图神经网络（SG+GNN）】相关论文

专知会员服务

51+阅读 · 2020年5月12日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

专知会员服务

37+阅读 · 2020年1月10日

必读的7篇 IJCAI 2019【图神经网络（GNN）】相关论文

必读的7篇 IJCAI 2019【图神经网络（GNN）】相关论文

专知会员服务

92+阅读 · 2020年1月10日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

PSPNet ——语义分割及场景分析

PSPNet ——语义分割及场景分析

AI科技评论

20+阅读 · 2019年8月20日

语义分割 | context relation

语义分割 | context relation

极市平台

8+阅读 · 2019年2月9日

ECCV 2018 | 迈向完全可学习的物体检测器：可学习区域特征提取方法

ECCV 2018 | 迈向完全可学习的物体检测器：可学习区域特征提取方法

微软研究院AI头条

6+阅读 · 2018年8月30日

《pyramid Attention Network for Semantic Segmentation》

《pyramid Attention Network for Semantic Segmentation》

统计学习与视觉计算组

44+阅读 · 2018年8月30日

ECCV 2018 | CornerNet：目标检测算法新思路

ECCV 2018 | CornerNet：目标检测算法新思路

极市平台

13+阅读 · 2018年8月11日

【CVPR2018】物体检测中的结构推理网络

【CVPR2018】物体检测中的结构推理网络

深度学习大讲堂

6+阅读 · 2018年7月30日

Relation Networks for Object Detection 论文笔记

Relation Networks for Object Detection 论文笔记

统计学习与视觉计算组

16+阅读 · 2018年4月18日

DeepLabv3+：语义分割领域的新高峰

DeepLabv3+：语义分割领域的新高峰

极市平台

4+阅读 · 2018年3月3日

专栏 | CVPR 2017论文解读：Instance-Aware图像语义分割

专栏 | CVPR 2017论文解读：Instance-Aware图像语义分割

机器之心

3+阅读 · 2017年7月28日

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

炼数成金订阅号

26+阅读 · 2017年7月10日

相关论文

Object-Contextual Representations for Semantic Segmentation

Object-Contextual Representations for Semantic Segmentation

Arxiv

7+阅读 · 2019年11月19日

Inverse Visual Question Answering with Multi-Level Attentions

Inverse Visual Question Answering with Multi-Level Attentions

Arxiv

4+阅读 · 2019年9月17日

Hierarchically-Refined Label Attention Network for Sequence Labeling

Hierarchically-Refined Label Attention Network for Sequence Labeling

Arxiv

3+阅读 · 2019年8月23日

Relation-aware Graph Attention Network for Visual Question Answering

Arxiv

4+阅读 · 2019年3月29日

Multimodal Deep Network Embedding with Integrated Structure and Attribute Information

Multimodal Deep Network Embedding with Integrated Structure and Attribute Information

Arxiv

4+阅读 · 2019年3月28日

Knowledge-Embedded Routing Network for Scene Graph Generation

Arxiv

5+阅读 · 2019年3月8日

Two Stream 3D Semantic Scene Completion

Two Stream 3D Semantic Scene Completion

Arxiv

4+阅读 · 2018年7月16日

A Fully Convolutional Two-Stream Fusion Network for Interactive Image Segmentation

A Fully Convolutional Two-Stream Fusion Network for Interactive Image Segmentation

Arxiv

5+阅读 · 2018年7月6日

Path Aggregation Network for Instance Segmentation

Arxiv

3+阅读 · 2018年3月5日

A Question-Focused Multi-Factor Attention Network for Question Answering

Arxiv

6+阅读 · 2018年1月25日

微信扫码咨询专知VIP会员