基于深度学习的视觉多目标跟踪算法综述

2021 年 4 月 15 日 专知


视觉多目标跟踪是计算机视觉领域的热点问题,然而,场景中目标数量的不确定、目标之间的相互遮挡、目标特征区分度不高等多种难题导致了视觉多目标跟踪现实应用进展缓慢。近年来,随着视觉智能处理研究的不断深入,涌现出多种多样的深度学习类视觉多目标跟踪算法。在分析了视觉多目标跟踪面临的挑战和难点基础上,将算法分为基于检测跟踪(Detection-Based-Tracking,DBT)、联合检测跟踪(Joint-Detection-Tracking,JDT)两大类及六个子类,研究不同类别算法的优缺点。分析表明,DBT类算法结构简单,但算法各子环节的关联度不高,JDT类算法融合多模块联合学习,在多项跟踪评价指标中占优。DBT类算法中特征提取模块是解决目标遮挡问题的关键,但损失了算法速度,JDT类算法对检测模块更为依赖。目前,多目标跟踪跟踪总体是从DBT类算法向JDT发展,分阶段实现算法准确度与速度的均衡。提出多目标跟踪算法未来在数据集、各子模块、具体场景应用等方面的发展方向。 


随着人工智能技术的飞速发展,基于计算机视觉 技术的智能监控系统、自动驾驶领域较以往取得了重 大的突破,进一步减少了人力资源的浪费,提高了安 防和交通领域的安全性。视觉多目标跟踪技术是这些 领域中的关键基础性技术之一,视觉多目标跟踪算法 的准确鲁棒性对于进一步提升高层智能应用的安全有 效性具有重要意义。然而,当前视觉多目标跟踪技术 还面临着较大的挑战,首先,视觉多目标跟踪需要解 决单目标跟踪中存在的诸如目标形变、场景环境变化 等挑战之外,还面临着由于目标数量不确定所带来的 实时目标数量更新及维持目标各自身份(Identity,ID) 的任务,因此视觉多目标跟踪还需要处理更为复杂关 键的问题诸如:目标数量不确定、频繁目标遮挡、同 类目标的相似度区分等。具体来说,在安防监控和自 动驾驶应用中,目标频繁进出视野是普遍且正常的行 为,这就导致了多目标跟踪所面对的目标数量是不确 定的,这就要求多目标跟踪算法必须具备实时检测定 位场景中出现的感兴趣目标数量。在场景复杂的情况 下,背景对于目标的遮挡,以及目标与目标的遮挡会 造成目标遮挡再出现时目标身份切换(ID Switch,IDs), 这就要求算法必须提取到鲁棒的目标特征,在短时和 长时的遮挡过后,保持遮挡前后目标 ID 一致性。多 目标跟踪任务要求维持同一目标的 ID,同类目标表观 相似度较高且具备相似的行为,对稳定维持正确目标 ID 带来了进一步的挑战,算法必须具备提取同类目标 可分性特征。


视觉多目标跟踪的目的是利用数字图像处理技 术稳定跟踪图像序列中的多个感兴趣目标,得到各个 目标在每一时刻正确位置。近几年随着基于深度学习 检测算法的精度较传统算法性能大幅度提高,视觉多 目标跟踪随之取得了较大的突破。基于深度学习的视 觉多目标跟踪算法的应用基本覆盖了空海地多个典型 场景[1-3],但较为详细的关于视觉多目标跟踪综述论文 较少,已有的相关综述[4-5]一部分是基于传统方法的在 雷达领域应用较多且运算比较复杂的数据关联算法, 与当前主流的多目标跟踪方法存在较大的差异,另一 部分较新的关注了基于深度学习的视觉多目标跟踪方 法,重点是基于检测的多目标跟踪方法[6-7]。本文根据 视觉多目标跟踪框架的不同,将基于深度学习的视觉 多目标跟踪方法分为 DBT 与 JDT 两类算法展开论述,阐述深度学习在两种框架中的模块功能及优缺点,结 合公开数据集对比分析基于深度学习的视觉多目标跟 踪方法,通过进一步提升检测器性能、更好地在多目 标跟踪任务中融合单目标跟踪、拓展基于深度学习的 数据关联等方面提升多目标跟踪的性能。


本文的其余部分的安排如下。第 1 节首先对基于 深度学习的视觉多目标跟踪技术及相关数据集进行总 体概述,然后在第 2 节和第 3 节分别阐述基于深度学 习的 DBT 与 JDT 两种视觉多目标跟踪框架,第 4 节 对近年来在公开数据集中性能优异的视觉多目标跟踪 方法进行实验比较分析,第 5 节基于前面的讨论,对 未来可能研究方向进行展望。



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DMOD” 就可以获取基于深度学习的视觉多目标跟踪算法综述述》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!


欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询

点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
5

相关内容

基于深度学习的视频目标检测综述
专知会员服务
78+阅读 · 2021年5月19日
专知会员服务
117+阅读 · 2021年4月29日
基于深度学习的行人检测方法综述
专知会员服务
68+阅读 · 2021年4月14日
专知会员服务
44+阅读 · 2021年3月19日
专知会员服务
111+阅读 · 2021年1月11日
专知会员服务
29+阅读 · 2021年1月9日
专知会员服务
45+阅读 · 2020年12月4日
深度学习目标检测方法综述
专知会员服务
259+阅读 · 2020年8月1日
基于深度学习的表面缺陷检测方法综述
专知会员服务
84+阅读 · 2020年5月31日
基于深度学习的手语识别综述
专知会员服务
45+阅读 · 2020年5月18日
最全综述 | 图像分割算法
计算机视觉life
13+阅读 · 2019年6月20日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
36+阅读 · 2019年4月18日
深度学习目标检测算法综述
AI研习社
24+阅读 · 2019年2月1日
AI综述专栏 | 基于深度学习的目标检测算法综述
人工智能前沿讲习班
12+阅读 · 2018年12月7日
AI综述专栏 | 人脸检测算法综述
人工智能前沿讲习班
6+阅读 · 2018年9月10日
博客 | 基于深度学习的目标检测算法综述(二)
AI研习社
11+阅读 · 2018年8月22日
干货 | 基于深度学习的目标检测算法综述(二)
AI科技评论
21+阅读 · 2018年8月20日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
Arxiv
7+阅读 · 2020年10月7日
Arxiv
29+阅读 · 2020年3月16日
Deep Learning in Video Multi-Object Tracking: A Survey
Arxiv
55+阅读 · 2019年7月31日
Deep Face Recognition: A Survey
Arxiv
17+阅读 · 2019年2月12日
Arxiv
135+阅读 · 2018年10月8日
Deep Learning for Generic Object Detection: A Survey
Arxiv
13+阅读 · 2018年9月6日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
基于深度学习的视频目标检测综述
专知会员服务
78+阅读 · 2021年5月19日
专知会员服务
117+阅读 · 2021年4月29日
基于深度学习的行人检测方法综述
专知会员服务
68+阅读 · 2021年4月14日
专知会员服务
44+阅读 · 2021年3月19日
专知会员服务
111+阅读 · 2021年1月11日
专知会员服务
29+阅读 · 2021年1月9日
专知会员服务
45+阅读 · 2020年12月4日
深度学习目标检测方法综述
专知会员服务
259+阅读 · 2020年8月1日
基于深度学习的表面缺陷检测方法综述
专知会员服务
84+阅读 · 2020年5月31日
基于深度学习的手语识别综述
专知会员服务
45+阅读 · 2020年5月18日
相关资讯
最全综述 | 图像分割算法
计算机视觉life
13+阅读 · 2019年6月20日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
36+阅读 · 2019年4月18日
深度学习目标检测算法综述
AI研习社
24+阅读 · 2019年2月1日
AI综述专栏 | 基于深度学习的目标检测算法综述
人工智能前沿讲习班
12+阅读 · 2018年12月7日
AI综述专栏 | 人脸检测算法综述
人工智能前沿讲习班
6+阅读 · 2018年9月10日
博客 | 基于深度学习的目标检测算法综述(二)
AI研习社
11+阅读 · 2018年8月22日
干货 | 基于深度学习的目标检测算法综述(二)
AI科技评论
21+阅读 · 2018年8月20日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
相关论文
Arxiv
7+阅读 · 2020年10月7日
Arxiv
29+阅读 · 2020年3月16日
Deep Learning in Video Multi-Object Tracking: A Survey
Arxiv
55+阅读 · 2019年7月31日
Deep Face Recognition: A Survey
Arxiv
17+阅读 · 2019年2月12日
Arxiv
135+阅读 · 2018年10月8日
Deep Learning for Generic Object Detection: A Survey
Arxiv
13+阅读 · 2018年9月6日
Arxiv
22+阅读 · 2018年8月30日
Top
微信扫码咨询专知VIP会员