相关运算在视觉目标跟踪领域中发挥了重要作用,相关运算通过简单的相似性比较,来完成模板特征和搜索区域特征的交互,输出相似度图。然而,相关运算本身是一个局部的线性匹配,导致了语义信息的丢失和全局信息的缺乏。针对相关运算的局限性,本工作提出了基于Transformer的特征融合模型,通过建立非线性语义融合和挖掘远距离特征关联有效聚合目标和搜索区域的全局信息,显著提升了算法的精准度。TransT在多个跟踪数据集上达到目前最先进的性能,速度可达50 fps。

https://www.zhuanzhi.ai/paper/7dc7d2e7e635f18776db3f04e7c58bbb

成为VIP会员查看完整内容
22

相关内容

【CVPR2021】基于Transformer的视频分割领域
专知会员服务
38+阅读 · 2021年4月16日
专知会员服务
21+阅读 · 2021年4月2日
【Google】多模态Transformer视频检索,Multi-modal Transformer
专知会员服务
103+阅读 · 2020年7月22日
ICCV2019 | 高精度,高效率点云三维重建 PointMVSNet
计算机视觉life
23+阅读 · 2019年9月5日
论文笔记之Meta-Tracker(ECCV2018)
统计学习与视觉计算组
16+阅读 · 2018年8月24日
STRCF for Visual Object Tracking
统计学习与视觉计算组
15+阅读 · 2018年5月29日
上下文感知相关滤波跟踪
统计学习与视觉计算组
7+阅读 · 2017年6月17日
Arxiv
17+阅读 · 2021年3月29日
Arxiv
5+阅读 · 2018年4月30日
Arxiv
6+阅读 · 2018年2月8日
VIP会员
相关VIP内容
【CVPR2021】基于Transformer的视频分割领域
专知会员服务
38+阅读 · 2021年4月16日
专知会员服务
21+阅读 · 2021年4月2日
【Google】多模态Transformer视频检索,Multi-modal Transformer
专知会员服务
103+阅读 · 2020年7月22日
相关资讯
ICCV2019 | 高精度,高效率点云三维重建 PointMVSNet
计算机视觉life
23+阅读 · 2019年9月5日
论文笔记之Meta-Tracker(ECCV2018)
统计学习与视觉计算组
16+阅读 · 2018年8月24日
STRCF for Visual Object Tracking
统计学习与视觉计算组
15+阅读 · 2018年5月29日
上下文感知相关滤波跟踪
统计学习与视觉计算组
7+阅读 · 2017年6月17日
相关论文
Arxiv
17+阅读 · 2021年3月29日
Arxiv
5+阅读 · 2018年4月30日
Arxiv
6+阅读 · 2018年2月8日
微信扫码咨询专知VIP会员