题目: Text Detection and Recognition in the Wild: A Review

简介: 自然图像中文本的检测和识别是计算机视觉领域中的两个主要问题,在体育视频分析,自动驾驶,工业自动化等方面有广泛的应用。他们面临着常见的挑战性问题,这些问题是如何在多种环境条件下表示和影响文本的因素。当前最新的文本检测和/或识别方法已经利用了深度学习体系结构发展,并报告了基准数据集在以下情况下具有更高的准确性:处理多分辨率和多方位的文本。但是,仍然存在一些影响野生图像中文本的挑战,由于现有模型无法归纳为看不见的数据和标记数据的不足,导致现有方法的执行力不行。因此,与该领域的先前调查不同,该调查的目的如下:首先,提供的不仅是对场景文本检测和识别方面的进展的看法,而且还提出了使用统一评估进行广泛实验的结果,该框架评估在挑战性案例中所选方法的预训练模型,并对这些技术应用相同的评估标准。其次,确定在检测或识别野外图像中存在的几个挑战,即平面旋转,多方向和多分辨率文本,透视变形,照明反射,部分遮挡,复杂字体和特殊字符。最后,论文提供了对该领域潜在研究方向的洞察力,以解决仍面临场景文本检测和识别技术的挑战。

成为VIP会员查看完整内容
0
28

相关内容

对自然图像中的文本进行检测和识别是计算机视觉领域的两个主要问题,在体育视频分析、自动驾驶、工业自动化等领域都有广泛的应用。他们面临着共同的具有挑战性的问题,即文本如何表示和受几种环境条件的影响的因素。当前最先进的场景文本检测和/或识别方法利用了深度学习体系结构的进步,并取得了在处理多分辨率和多方向文本时基准数据集的卓越准确性。然而,仍然有几个挑战影响自然图像中的文本,导致现有的方法表现不佳,因为这些模型不能泛化到看不见的数据和不足的标记数据。因此,不同于以往的综述,这个综述的目标如下: 首先,提供读者不仅回顾最近场景文字检测和识别方法,但也用一个统一的评估框架来呈现广泛开展实验的结果, 评估pre-trained模型选择的方法上具有挑战性的情况下,这些技术适用于相同的评估标准。其次,识别在自然图像中检测或识别文本存在的几个挑战,即平面内旋转、多方向和多分辨率文本、透视失真、光照反射、部分遮挡、复杂字体和特殊字符。最后,本文还提出了这一领域的潜在研究方向,以解决场景文本检测和识别技术仍面临的一些挑战。

成为VIP会员查看完整内容
0
44

Detection and recognition of text in natural images are two main problems in the field of computer vision that have a wide variety of applications in analysis of sports videos, autonomous driving, industrial automation, to name a few. They face common challenging problems that are factors in how text is represented and affected by several environmental conditions. The current state-of-the-art scene text detection and/or recognition methods have exploited the witnessed advancement in deep learning architectures and reported a superior accuracy on benchmark datasets when tackling multi-resolution and multi-oriented text. However, there are still several remaining challenges affecting text in the wild images that cause existing methods to underperform due to there models are not able to generalize to unseen data and the insufficient labeled data. Thus, unlike previous surveys in this field, the objectives of this survey are as follows: first, offering the reader not only a review on the recent advancement in scene text detection and recognition, but also presenting the results of conducting extensive experiments using a unified evaluation framework that assesses pre-trained models of the selected methods on challenging cases, and applies the same evaluation criteria on these techniques. Second, identifying several existing challenges for detecting or recognizing text in the wild images, namely, in-plane-rotation, multi-oriented and multi-resolution text, perspective distortion, illumination reflection, partial occlusion, complex fonts, and special characters. Finally, the paper also presents insight into the potential research directions in this field to address some of the mentioned challenges that are still encountering scene text detection and recognition techniques.

0
11
下载
预览

题目: Video Description: A Survey of Methods, Datasets, and Evaluation Metrics

简介: 视频描述是对给定视频内容自动生成描述语言。它在人机交互中具有应用程序,可帮助视障人士和视频字幕。过去几年中,由于深度学习在计算机视觉和自然语言处理方面取得了空前的成功,因此该领域的研究激增。文献中已经提出了许多方法,数据集和评估指标,这要求进行全面调查以将研究工作集中在这个蓬勃发展的新方向上。本文通过重点研究深度学习模型的最新方法来填补这一空白。比较基准数据集的域,类数和存储库大小;并确定各种评估指标(例如SPICE,CIDEr,ROUGE,BLEU,METEOR和WMD)的优缺点。经典的视频描述方法将主语,宾语和动词检测与基于模板的语言模型相结合,以生成句子。但是,大型数据集的发布表明,这些方法无法应对不受约束的开放域视频的多样性。古典方法之后是很短的统计方法时代,很快就被深度学习所取代,后者是视频描述中的最新技术。我们的调查显示,尽管发展迅速,但由于以下原因,视频描述研究仍处于起步阶段:视频描述模型的分析具有挑战性,因为难以确定对视觉特征的准确性或误差的贡献。最终描述中采用的语言模型。现有的数据集既不包含足够的视觉多样性,也不包含语言结构的复杂性。最后,当前的评价指标未能衡量机器生成的描述与人类描述之间的一致性。

成为VIP会员查看完整内容
0
47

题目: A Survey of Single-Scene Video Anomaly Detection

简介: 这篇调查文章总结了关于单个场景的视频馈送中的异常检测主题的研究趋势。 我们讨论了各种问题的表述,公开可用的数据集和评估标准。 我们将过去的研究归类并归类为一个直观的分类法。 最后,我们还提供了最佳实践,并为将来的研究提供了一些可能的方向。

成为VIP会员查看完整内容
0
16

题目: Anomalous Instance Detection in Deep Learning: A Survey

摘要:

深度学习(DL)容易受到分布不均匀和对抗性示例的影响,从而导致不正确的输出。为了使DL更具有鲁棒性,最近提出了几种方法:异常检测技术来检测(并丢弃)这些异常样本。本研究试图为基于DL的应用程序异常检测的研究提供一个结构化的、全面的概述。我们根据现有技术的基本假设和采用的方法为它们提供了一个分类。我们讨论了每个类别中的各种技术,并提供了这些方法的相对优势和劣势。我们在这次调查中的目标是提供一个更容易并且更好理解的技术,这项技术是在这方面已经做过研究的,且属于不同的类别的。最后,我们强调了在DL系统中应用异常检测技术所面临的未解决的研究挑战,并提出了一些具有重要影响的未来研究方向。

成为VIP会员查看完整内容
0
53

论文题目: Salient Object Detection in the Deep Learning Era: An In-Depth Survey

论文摘要: 作为计算机视觉中的一个重要问题,图像中的显著目标检测(SOD)近年来得到了越来越多的研究。最近在超氧化物歧化酶方面的进展主要是基于深度学习的解决方案(称为深超氧化物歧化酶)。为了便于深入理解深层SODs,本文提供了一个全面的综述,涵盖了从算法分类到未解决的开放问题的各个方面。特别是,我们首先从网络结构、监控级别、学习范式和对象/实例级别检测等不同角度对深度超氧化物歧化酶算法进行了综述。在此基础上,总结了现有的SOD评价数据集和指标体系。然后,在前人工作的基础上,认真编写了一个完整的SOD方法的基准测试结果,并对对比结果进行了详细的分析。另外,通过构造一个新的具有丰富属性标注的SOD数据集,研究了不同属性下的SOD算法的性能,这在以前的研究中是很少的。我们首次在现场进一步分析了deep-SOD模型的鲁棒性和可转移性。我们还研究了输入扰动的影响,以及现有SOD数据集的通用性和硬度。最后,讨论了超氧化物歧化酶存在的问题和挑战,并指出了未来可能的研究方向。

成为VIP会员查看完整内容
Salient Object Detection in the Deep Learning Era An In-Depth Survey.pdf
0
29

论文主题: Recent Advances in Deep Learning for Object Detection

论文摘要: 目标检测是计算机视觉中的基本视觉识别问题,并且在过去的几十年中已得到广泛研究。目标检测指的是在给定图像中找到具有精确定位的特定目标,并为每个目标分配一个对应的类标签。由于基于深度学习的图像分类取得了巨大的成功,因此近年来已经积极研究了使用深度学习的对象检测技术。在本文中,我们对深度学习中视觉对象检测的最新进展进行了全面的调查。通过复习文献中最近的大量相关工作,我们系统地分析了现有的目标检测框架并将调查分为三个主要部分:(i)检测组件,(ii)学习策略(iii)应用程序和基准。在调查中,我们详细介绍了影响检测性能的各种因素,例如检测器体系结构,功能学习,建议生成,采样策略等。最后,我们讨论了一些未来的方向,以促进和刺激未来的视觉对象检测研究。与深度学习。

成为VIP会员查看完整内容
0
63

论文题目: Object Detection in 20 Years: A Survey

论文简介:
目标检测作为计算机视觉中最基本和最具挑战性的问题之一,近年来受到了极大的关注。它在过去二十年的发展可以看作是计算机视觉历史的缩影。如果我们将当今的物体检测视为在深度学习的力量下的技术美学,那么将时光倒流到20年前,我们将见证冷武器时代的智慧。鉴于目标检测技术的技术发展,本文跨越了四分之一世纪的时间(从1990年代到2019年)广泛地审查了400多篇论文。本文涵盖了许多主题,包括历史上的里程碑检测器,检测数据集,度量,检测系统的基本构建块,加速技术以及最新的检测技术水平。本文还回顾了一些重要的检测应用程序,例如行人检测,面部检测,文本检测等,并对它们的挑战以及近年来的技术改进进行了深入分析。

成为VIP会员查看完整内容
0
42

零样本动作识别是近年来备受关注的研究领域,针对图像和视频中物体、事件和动作的识别提出了多种方法。由于收集、注释和标记视频是一项困难而费力的任务,因此需要一些方法来将实例从模型训练中不存在的类中分类,特别是在复杂的自动视频理解任务中。我们发现在文献中有许多可用的方法,然而,很难对哪些技术可以被认为是最先进的技术进行分类。尽管有一些关于静止图像零样本动作识别的调研和实验,但是没有针对视频的研究。因此,在这篇文章中,我们提出了一个调查的方法,包括技术进行视觉特征提取和语义特征提取,以及学习这些特征之间的映射,特别是零镜头动作识别的视频。我们还提供了一个完整的数据集,实验和协议的描述,提出了开放的问题和未来的工作方向,这对计算机视觉研究领域的发展至关重要。

成为VIP会员查看完整内容
0
26
小贴士
相关VIP内容
专知会员服务
44+阅读 · 2020年6月10日
相关资讯
自然场景文本检测技术综述(CTPN, SegLink, EAST)
极市平台
7+阅读 · 2019年7月30日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
17+阅读 · 2019年4月18日
人脸关键点检测综述(含论文、数据集、方法等)
腾讯数平精准推荐 | OCR技术之检测篇
机器学习研究会
12+阅读 · 2018年3月17日
CVPR 2017 | Tiny Faces 小人脸检测算法简介
极市平台
6+阅读 · 2018年2月1日
人脸检测与识别总结
计算机视觉战队
16+阅读 · 2017年11月29日
微信OCR(1)——公众号图文识别中的文本检测
微信AI
14+阅读 · 2017年11月22日
相关论文
Zobeir Raisi,Mohamed A. Naiel,Paul Fieguth,Steven Wardell,John Zelek
11+阅读 · 2020年6月8日
Anomalous Instance Detection in Deep Learning: A Survey
Saikiran Bulusu,Bhavya Kailkhura,Bo Li,Pramod K. Varshney,Dawn Song
21+阅读 · 2020年3月16日
Qipeng Guo,Xipeng Qiu,Pengfei Liu,Xiangyang Xue,Zheng Zhang
3+阅读 · 2019年12月2日
Scene Text Detection and Recognition: The Deep Learning Era
Shangbang Long,Xin He,Cong Yao
13+阅读 · 2019年9月5日
Object Detection in 20 Years: A Survey
Zhengxia Zou,Zhenwei Shi,Yuhong Guo,Jieping Ye
36+阅读 · 2019年5月13日
Kamran Kowsari,Kiana Jafari Meimandi,Mojtaba Heidarysafa,Sanjana Mendu,Laura E. Barnes,Donald E. Brown
3+阅读 · 2019年4月25日
Applying Faster R-CNN for Object Detection on Malaria Images
Jane Hung,Deepali Ravel,Stefanie C. P. Lopes,Gabriel Rangel,Odailton Amaral Nery,Benoit Malleret,Francois Nosten,Marcus V. G. Lacerda,Marcelo U. Ferreira,Laurent Rénia,Manoj T. Duraisingh,Fabio T. M. Costa,Matthias Marti,Anne E. Carpenter
3+阅读 · 2019年3月11日
Alexandre Attia,Sharone Dayan
3+阅读 · 2018年1月19日
Top