题目: Deep Learning in Video Multi-Object Tracking: A Survey

简介: 多对象跟踪(MOT)的问题在于遵循序列中不同对象(通常是视频)的轨迹。 近年来,随着深度学习的兴起,提供解决此问题的算法得益于深度模型的表示能力。 本文对采用深度学习模型解决单摄像机视频中的MOT任务的作品进行了全面的调查。 确定了MOT算法的四个主要步骤,并对这些阶段的每个阶段如何使用深度学习进行了深入的回顾。 还提供了对三个MOTChallenge数据集上提出的作品的完整实验比较,确定了表现最好的方法之间的许多相似之处,并提出了一些可能的未来研究方向。

成为VIP会员查看完整内容
DEEP LEARNING IN VIDEO MULTI-OBJECT TRACKING.pdf
0
32

相关内容

多目标跟踪,即Multiple Object Tracking(MOT),主要任务中是给定一个图像序列,找到图像序列中运动的物体,并将不同帧的运动物体进行识别,也就是给定一个确定准确的id,当然这些物体可以是任意的,如行人、车辆、各种动物等等,而最多的研究是行人跟踪,由于人是一个非刚体的目标,且实际应用中行人检测跟踪更具有商业价值。

对自然图像中的文本进行检测和识别是计算机视觉领域的两个主要问题,在体育视频分析、自动驾驶、工业自动化等领域都有广泛的应用。他们面临着共同的具有挑战性的问题,即文本如何表示和受几种环境条件的影响的因素。当前最先进的场景文本检测和/或识别方法利用了深度学习体系结构的进步,并取得了在处理多分辨率和多方向文本时基准数据集的卓越准确性。然而,仍然有几个挑战影响自然图像中的文本,导致现有的方法表现不佳,因为这些模型不能泛化到看不见的数据和不足的标记数据。因此,不同于以往的综述,这个综述的目标如下: 首先,提供读者不仅回顾最近场景文字检测和识别方法,但也用一个统一的评估框架来呈现广泛开展实验的结果, 评估pre-trained模型选择的方法上具有挑战性的情况下,这些技术适用于相同的评估标准。其次,识别在自然图像中检测或识别文本存在的几个挑战,即平面内旋转、多方向和多分辨率文本、透视失真、光照反射、部分遮挡、复杂字体和特殊字符。最后,本文还提出了这一领域的潜在研究方向,以解决场景文本检测和识别技术仍面临的一些挑战。

成为VIP会员查看完整内容
0
42

目标分割和目标跟踪是计算机视觉领域的基础研究领域。这两个主题很难处理一些常见的挑战,如遮挡、变形、运动模糊、缩放变化等。前者包含异构对象、交互对象、边缘模糊性和形状复杂性;后者在处理快速运动、不可见和实时处理方面存在困难。结合视频目标分割和跟踪两个问题,可以克服各自的困难,提高视频目标的性能。VOST可广泛应用于视频摘要、高清视频压缩、人机交互、无人驾驶汽车等实际应用中。本综述旨在提供最先进的VOST方法的全面回顾,将这些方法分类为不同的类别,并确定新的趋势。首先,我们将VOST方法大致分为视频对象分割(VOS)和基于分割的对象跟踪(SOT)。根据分割和跟踪机制,将每个类别进一步划分为不同的类型。在此基础上,给出了各时间节点的代表性VOS和SOT方法。其次,对不同方法的技术特点进行了详细的讨论和概述。第三,总结了相关视频数据集的特点,并给出了各种评价指标。最后,我们指出了一系列有趣的工作,并得出了自己的结论。

成为VIP会员查看完整内容
0
36

智能视频监控(IVS)是当前计算机视觉和机器学习领域的一个活跃研究领域,为监控操作员和取证视频调查者提供了有用的工具。人的再识别(PReID)是IVS中最关键的问题之一,它包括识别一个人是否已经通过网络中的摄像机被观察到。PReID的解决方案有无数的应用,包括检索显示感兴趣的个体的视频序列,甚至在多个摄像机视图上进行行人跟踪。文献中已经提出了不同的技术来提高PReID的性能,最近研究人员利用了深度神经网络(DNNs),因为它在类似的视觉问题上具有令人信服的性能,而且在测试时执行速度也很快。鉴于再识别解决方案的重要性和广泛的应用范围,我们的目标是讨论在该领域开展的工作,并提出一项最先进的DNN模型用于这项任务的调查。我们提供了每个模型的描述以及它们在一组基准数据集上的评估。最后,我们对这些模型进行了详细的比较,并讨论了它们的局限性,为今后的研究提供了指导。

成为VIP会员查看完整内容
0
48

题目: Deep Learning for Visual Tracking: A Comprehensive Survey

简介: 视觉目标跟踪是计算机视觉领域中最受关注和最具挑战性的研究课题之一。考虑到这个问题的不适定性质及其在现实世界中广泛应用的情况,已经建立了大量的大型基准数据集,在这些数据集上已经开发了相当多的方法,并在近年来取得了显著进展——主要是最近基于深度学习(DL)的方法。这项综述的目的是系统地调查当前基于深度学习的视觉跟踪方法、基准数据集和评估指标。它也广泛地评价和分析领先的视觉跟踪方法。首先,从网络体系结构、网络利用、视觉跟踪网络训练、网络目标、网络输出、相关滤波优势利用六个关键方面,总结了基于dll的方法的基本特征、主要动机和贡献。其次,比较了常用的视觉跟踪基准及其各自的性能,总结了它们的评价指标。第三,在OTB2013、OTB2015、VOT2018和LaSOT等一系列成熟的基准上,全面检查最先进的基于dll的方法。最后,通过对这些最先进的方法进行定量和定性的批判性分析,研究它们在各种常见场景下的优缺点。它可以作为一个温和的使用指南,让从业者在什么时候、在什么条件下选择哪种方法。它还促进了对正在进行的问题的讨论,并为有希望的研究方向带来光明。

成为VIP会员查看完整内容
Deep_Learning_for_Visual_Tracking.pdf
0
39

论文题目: Spatio-temporal Action Recognition: A Survey

论文摘要: 动作识别或动作检测的任务包括分析视频并确定正在执行的动作或动作。这些视频的主要主题是人类表演一些动作。然而,这一要求可以放宽,以推广到其他学科,如动物或机器人。应用范围从人机交互到自动视频编辑方案。当我们考虑时空动作识别时,我们处理的是动作定位。此任务不仅涉及确定正在执行的操作,而且还涉及在所述视频中执行操作的时间和位置。本文旨在综述解决这一问题的各种方法和算法,对它们进行全面的比较,探索可用于解决这一问题的各种数据集,并确定最有希望的方法。

成为VIP会员查看完整内容
Spatio-temporal Action Recognition A Survey.pdf
0
65

论文题目: Deep Learning in Video Multi-Object Tracking: A Survey

论文摘要: 多目标跟踪(MOT)的问题在于遵循序列中不同对象(通常是视频)的轨迹。 近年来,随着深度学习的兴起,提供解决此问题的算法得益于深度模型的表示能力。 本文对采用深度学习模型解决单摄像机视频中的MOT任务的作品进行了全面的调查。 确定了MOT算法的四个主要步骤,并对这些阶段的每个阶段如何使用深度学习进行了深入的回顾。 还提供了对三个MOT数据集上提出的作品的完整实验比较,确定了表现最好的方法之间的许多相似之处,并提出了一些可能的未来研究方向。

成为VIP会员查看完整内容
0
63

多目标跟踪(MOT)的问题在于在一个序列中跟踪不同目标的轨迹,通常是视频。近年来,随着深度学习的兴起,为这一问题提供解决方案的算法受益于深度模型的表示能力。本文对利用深度学习模型解决单摄像机视频MOT任务的作品进行了全面的综述。提出了MOT算法的四个主要步骤,并对深度学习在每个阶段的应用进行了深入的回顾。本文还对三种MOTChallenge数据集上的现有工作进行了完整的实验比较,确定了一些最优的方法之间的相似性,并提出了一些可能的未来研究方向。

成为VIP会员查看完整内容
0
58

题目: Understanding Deep Learning Techniques for Image Segmentation

简介: 机器学习已被大量基于深度学习的方法所淹没。各种类型的深度神经网络(例如卷积神经网络,递归网络,对抗网络,自动编码器等)有效地解决了许多具有挑战性的计算机视觉任务,例如在不受限制的环境中对对象进行检测,定位,识别和分割。尽管有很多关于对象检测或识别领域的分析研究,但相对于图像分割技术,出现了许多新的深度学习技术。本文从分析的角度探讨了图像分割的各种深度学习技术。这项工作的主要目的是提供对图像分割领域做出重大贡献的主要技术的直观理解。从一些传统的图像分割方法开始,本文进一步描述了深度学习对图像分割域的影响。此后,大多数主要的分割算法已按照专用于其独特贡献的段落进行了逻辑分类。

成为VIP会员查看完整内容
Understanding Deep Learning Techniques for Image Segmentation.pdf
0
69
小贴士
相关VIP内容
专知会员服务
42+阅读 · 2020年6月10日
专知会员服务
48+阅读 · 2020年5月5日
深度学习视频中多目标跟踪:论文综述
专知会员服务
58+阅读 · 2019年10月13日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
69+阅读 · 2019年6月16日
相关论文
Mamdouh Farouk
5+阅读 · 2019年10月6日
Deep Learning in Video Multi-Object Tracking: A Survey
Gioele Ciaparrone,Francisco Luque Sánchez,Siham Tabik,Luigi Troiano,Roberto Tagliaferri,Francisco Herrera
33+阅读 · 2019年7月31日
Deep Learning for Energy Markets
Michael Polson,Vadim Sokolov
4+阅读 · 2019年4月10日
Borja Ibarz,Jan Leike,Tobias Pohlen,Geoffrey Irving,Shane Legg,Dario Amodei
4+阅读 · 2018年11月15日
Deep Learning for Generic Object Detection: A Survey
Li Liu,Wanli Ouyang,Xiaogang Wang,Paul Fieguth,Jie Chen,Xinwang Liu,Matti Pietikäinen
7+阅读 · 2018年9月6日
Michael Thoreau,Navinda Kottege
7+阅读 · 2018年6月20日
Bi Li,Wenxuan Xie,Wenjun Zeng,Wenyu Liu
6+阅读 · 2018年6月19日
Erhan Gundogdu,A. Aydin Alatan
9+阅读 · 2018年3月10日
Jinsoo Choi,Tae-Hyun Oh,In So Kweon
4+阅读 · 2018年3月1日
Top