用于在线视频实例分割的混合实例觉知时序融合方法

Hybrid Instance-aware Temporal Fusion for Online Video Instance Segmentation

论文摘要:本文提出了一种基于实例的时序内容融合方法,用于在线视频实例分割框架。首先,我们利用图像分割的一种表示,基于实例的全局编码和 CNN 特征图来表示实例级和像素级特征。基于这种表示,我们引入了一种无需裁剪的时序融合方法来对视频帧之间的时间一致性进行建模。具体地,我们在实例编码中对全局实例信息进行编码,并通过实例编码和 CNN 特征图之间的混合注意力机制建模帧间的上下文融合。利用学习到的混合时间一致性,我们能够直接检索和维护跨帧的实例身份,去除了先前方法中复杂的逐帧实例匹配方案。在 Youtube-VIS-19/21 数据集,我们的模型在所有在线视频实例分割方法中取得了最佳性能。

论文开创性突破与核心贡献:用于实时视频实力分割的高效时序融合方法,在所有在线视频实例分割方法中取得了最佳性能。

https://www.zhuanzhi.ai/paper/7ea2959c252c2c2e8bbc5614bc159ef3

成为VIP会员查看完整内容
11

相关内容

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准
专知会员服务
34+阅读 · 2022年4月2日
【CVPR2022】基于序列对比学习的长视频帧方向动作表示
专知会员服务
9+阅读 · 2022年3月29日
【CVPR2022】UniVIP:自监督视觉预训练的统一框架
专知会员服务
27+阅读 · 2022年3月16日
【CVPR2022】弱监督语义分割的类重新激活图
专知会员服务
16+阅读 · 2022年3月7日
【NeurIPS 2021】实例依赖的偏标记学习
专知会员服务
10+阅读 · 2021年11月28日
专知会员服务
44+阅读 · 2021年1月31日
【AAAI2021】记忆门控循环网络
专知会员服务
47+阅读 · 2020年12月28日
【NeurIPS 2021】实例依赖的偏标记学习
专知
1+阅读 · 2021年11月28日
【CVPR2021】基于Transformer的视频分割领域
专知
2+阅读 · 2021年4月16日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
VIP会员
相关VIP内容
【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准
专知会员服务
34+阅读 · 2022年4月2日
【CVPR2022】基于序列对比学习的长视频帧方向动作表示
专知会员服务
9+阅读 · 2022年3月29日
【CVPR2022】UniVIP:自监督视觉预训练的统一框架
专知会员服务
27+阅读 · 2022年3月16日
【CVPR2022】弱监督语义分割的类重新激活图
专知会员服务
16+阅读 · 2022年3月7日
【NeurIPS 2021】实例依赖的偏标记学习
专知会员服务
10+阅读 · 2021年11月28日
专知会员服务
44+阅读 · 2021年1月31日
【AAAI2021】记忆门控循环网络
专知会员服务
47+阅读 · 2020年12月28日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员