【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法 - 专知VIP

会员服务 ·

1

AAAI 2022 · 视频实例分割 · 时序融合 · 论文 ·

2022 年 1 月 29 日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

用于在线视频实例分割的混合实例觉知时序融合方法

Hybrid Instance-aware Temporal Fusion for Online Video Instance Segmentation

论文摘要：本文提出了一种基于实例的时序内容融合方法，用于在线视频实例分割框架。首先，我们利用图像分割的一种表示，基于实例的全局编码和 CNN 特征图来表示实例级和像素级特征。基于这种表示，我们引入了一种无需裁剪的时序融合方法来对视频帧之间的时间一致性进行建模。具体地，我们在实例编码中对全局实例信息进行编码，并通过实例编码和 CNN 特征图之间的混合注意力机制建模帧间的上下文融合。利用学习到的混合时间一致性，我们能够直接检索和维护跨帧的实例身份，去除了先前方法中复杂的逐帧实例匹配方案。在 Youtube-VIS-19/21 数据集，我们的模型在所有在线视频实例分割方法中取得了最佳性能。

论文开创性突破与核心贡献：用于实时视频实力分割的高效时序融合方法，在所有在线视频实例分割方法中取得了最佳性能。

https://www.zhuanzhi.ai/paper/7ea2959c252c2c2e8bbc5614bc159ef3

成为VIP会员查看完整内容

12

相关内容

AAAI 2022

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知会员服务

10+阅读 · 2022年3月29日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【CVPR2022】弱监督语义分割的类重新激活图

【CVPR2022】弱监督语义分割的类重新激活图

专知会员服务

17+阅读 · 2022年3月7日

【CVPR2022】基于联合表示学习和在线聚类的无监督活动分割

【CVPR2022】基于联合表示学习和在线聚类的无监督活动分割

专知会员服务

13+阅读 · 2022年3月2日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知会员服务

24+阅读 · 2022年2月6日

【NeurIPS 2021】实例依赖的偏标记学习

【NeurIPS 2021】实例依赖的偏标记学习

专知会员服务

11+阅读 · 2021年11月28日

【ICCV2021】用于视频目标分割的联合归纳式和直推式学习

专知会员服务

10+阅读 · 2021年8月12日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【AAAI2021】记忆门控循环网络

【AAAI2021】记忆门控循环网络

专知会员服务

50+阅读 · 2020年12月28日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知

4+阅读 · 2022年4月2日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知

1+阅读 · 2022年3月30日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知

1+阅读 · 2022年3月16日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知

0+阅读 · 2022年2月6日

【AAAI2022】推荐系统应用中的上下文老虎机中的上下文不确定性

【AAAI2022】推荐系统应用中的上下文老虎机中的上下文不确定性

专知

0+阅读 · 2022年2月4日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知

1+阅读 · 2022年1月29日

【NeurIPS 2021】实例依赖的偏标记学习

【NeurIPS 2021】实例依赖的偏标记学习

专知

1+阅读 · 2021年11月28日

直播 | NeurIPS 2021论文解读：实例依赖的偏标记学习

直播 | NeurIPS 2021论文解读：实例依赖的偏标记学习

PaperWeekly

0+阅读 · 2021年11月25日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

基于深度信念网络的高光谱遥感影像变化检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全认证的掌纹掌脉特征融合识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉感知的HEVC优化策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于动态图模型与多元结构化在线学习的视觉目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

基于蚁群算法面向对象的遥感图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

多维时滞非线性协议下的多智能体系统一致性及协调控制

国家自然科学基金

0+阅读 · 2012年12月31日

融合推荐攻击在线集成检测和多维信任机制的可信推荐模型及关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于多特征融合与多级多模式分类的人体动作识别技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于在线数据与专家知识的燃煤锅炉混合智能建模及模型更新研究

国家自然科学基金

0+阅读 · 2012年12月31日

A Survey on Non-Autoregressive Generation for Neural Machine Translation and Beyond

Arxiv

0+阅读 · 2022年4月20日

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Arxiv

0+阅读 · 2022年4月19日

Unsupervised Contrastive Domain Adaptation for Semantic Segmentation

Arxiv

0+阅读 · 2022年4月18日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

DialAug: Mixing up Dialogue Contexts in Contrastive Learning for Robust Conversational Modeling

Arxiv

0+阅读 · 2022年4月15日

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

Arxiv

0+阅读 · 2022年4月15日

VideoDG: Generalizing Temporal Relations in Videos to Novel Domains

Arxiv

14+阅读 · 2021年9月17日

Dense Contrastive Learning for Self-Supervised Visual Pre-Training

Arxiv

18+阅读 · 2021年4月4日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

VIP会员

相关主题

视频实例分割

相关VIP内容

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知会员服务

10+阅读 · 2022年3月29日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【CVPR2022】弱监督语义分割的类重新激活图

【CVPR2022】弱监督语义分割的类重新激活图

专知会员服务

17+阅读 · 2022年3月7日

【CVPR2022】基于联合表示学习和在线聚类的无监督活动分割

【CVPR2022】基于联合表示学习和在线聚类的无监督活动分割

专知会员服务

13+阅读 · 2022年3月2日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知会员服务

24+阅读 · 2022年2月6日

【NeurIPS 2021】实例依赖的偏标记学习

【NeurIPS 2021】实例依赖的偏标记学习

专知会员服务

11+阅读 · 2021年11月28日

【ICCV2021】用于视频目标分割的联合归纳式和直推式学习

专知会员服务

10+阅读 · 2021年8月12日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【AAAI2021】记忆门控循环网络

【AAAI2021】记忆门控循环网络

专知会员服务

50+阅读 · 2020年12月28日

热门VIP内容

开通专知VIP会员享更多权益服务

《用计算图变换加速实际工程设计优化》MIT 400页

《支持战术零信任架构实施的自动化零样本数据标记生成式人工智能方法》

如何快速获取数百万架无人机？

“掌控天空：反无人机系统（C-UAS）战略的最佳实践”研讨会13份幻灯片

相关资讯

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知

4+阅读 · 2022年4月2日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知

1+阅读 · 2022年3月30日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知

1+阅读 · 2022年3月16日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知

0+阅读 · 2022年2月6日

【AAAI2022】推荐系统应用中的上下文老虎机中的上下文不确定性

【AAAI2022】推荐系统应用中的上下文老虎机中的上下文不确定性

专知

0+阅读 · 2022年2月4日

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

【AAAI2022】用于在线视频实例分割的混合实例觉知时序融合方法

专知

1+阅读 · 2022年1月29日

【NeurIPS 2021】实例依赖的偏标记学习

【NeurIPS 2021】实例依赖的偏标记学习

专知

1+阅读 · 2021年11月28日

直播 | NeurIPS 2021论文解读：实例依赖的偏标记学习

直播 | NeurIPS 2021论文解读：实例依赖的偏标记学习

PaperWeekly

0+阅读 · 2021年11月25日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

相关基金

基于深度信念网络的高光谱遥感影像变化检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全认证的掌纹掌脉特征融合识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉感知的HEVC优化策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于动态图模型与多元结构化在线学习的视觉目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

基于蚁群算法面向对象的遥感图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

多维时滞非线性协议下的多智能体系统一致性及协调控制

国家自然科学基金

0+阅读 · 2012年12月31日

融合推荐攻击在线集成检测和多维信任机制的可信推荐模型及关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于多特征融合与多级多模式分类的人体动作识别技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于在线数据与专家知识的燃煤锅炉混合智能建模及模型更新研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

A Survey on Non-Autoregressive Generation for Neural Machine Translation and Beyond

Arxiv

0+阅读 · 2022年4月20日

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Arxiv

0+阅读 · 2022年4月19日

Unsupervised Contrastive Domain Adaptation for Semantic Segmentation

Arxiv

0+阅读 · 2022年4月18日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

DialAug: Mixing up Dialogue Contexts in Contrastive Learning for Robust Conversational Modeling

Arxiv

0+阅读 · 2022年4月15日

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

Arxiv

0+阅读 · 2022年4月15日

VideoDG: Generalizing Temporal Relations in Videos to Novel Domains

Arxiv

14+阅读 · 2021年9月17日

Dense Contrastive Learning for Self-Supervised Visual Pre-Training

Arxiv

18+阅读 · 2021年4月4日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

微信扫码咨询专知VIP会员