论文题目: A Review of Visual Trackers and Analysis of its Application to Mobile Robot

论文摘要: 近年来,计算机视觉受到了极大的关注,这是机器人获取外部环境信息的重要部分之一。视觉跟踪器可以为移动机器人提供必要的物理和环境参数,其性能与机器人的实际应用有关。这项研究提供了有关视觉跟踪器的全面调查。在简要介绍之后,我们首先分析了视觉跟踪器的基本框架和难点。然后介绍了生成方法和判别方法的结构,并总结了跟踪器中使用的特征描述符,建模方法和学习方法。后来,我们从三个方向审查并评估了判别式跟踪器的最新进展:相关滤波器,深度学习和卷积特征。最后,分析了移动机器人视觉跟踪器的研究方向,并概述了移动机器人视觉跟踪器的未来趋势。

成为VIP会员查看完整内容
4+
0+

相关内容

标跟踪是指:给出目标在跟踪视频第一帧中的初始状态(如位置,尺寸),自动估计目标物体在后续帧中的状态。 目标跟踪分为单目标跟踪和多目标跟踪。 人眼可以比较轻松的在一段时间内跟住某个特定目标。但是对机器而言,这一任务并不简单,尤其是跟踪过程中会出现目标发生剧烈形变、被其他目标遮挡或出现相似物体干扰等等各种复杂的情况。过去几十年以来,目标跟踪的研究取得了长足的发展,尤其是各种机器学习算法被引入以来,目标跟踪算法呈现百花齐放的态势。2013年以来,深度学习方法开始在目标跟踪领域展露头脚,并逐渐在性能上超越传统方法,取得巨大的突破。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【导读】生成式对抗网络(Generative Adversarial Networks,GANs)作为近年来的研究热点之一,受到了广泛关注,每年在机器学习、计算机视觉、自然语言处理、语音识别等上大量相关论文发表。密歇根大学Jie Gui博士等人近期发布了《A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications》,包括28页pdf,这篇综述论文对460余篇论文进行了尝试从算法,理论和应用的角度对各种GANs方法进行叙述。

【摘要】生成对抗网络(GANs)是最近的热门研究主题。自2014年以来,人们对GAN进行了广泛的研究,并且提出了许多算法。但是,很少有全面的研究来解释不同GANs变体之间的联系以及它们是如何演变的。在本文中,我们尝试从算法,理论和应用的角度对各种GANs方法进行叙述。首先,详细介绍了大多数GANs算法的动机,数学表示形式和结构。此外,GANs已与其他机器学习算法结合用于特定应用,例如半监督学习,迁移学习和强化学习。本文比较了这些GANs方法的共性和差异。其次,研究了与GANs相关的理论问题。第三,说明了GANs在图像处理和计算机视觉,自然语言处理,音乐,语音和音频,医学领域以及数据科学中的典型应用。最后,指出了GANs未来的开放性研究问题。

1. 概述

对抗生成网络已经成为了一个研究热点。深度学习领域的传奇人物Yann LeCun 在Quora上发帖称:“GANs是过去10年机器学习领域最有趣的想法。”从谷歌学术上可以发现,有大量和GANs相关的论文。例如,2018年大约有11800篇关于GANs的论文。也就是说,2018年,每天大约有32篇论文,每小时有超过一篇论文与GANs有关。GANs有两部分组成:生成器和判别器。这两个模型都由神经网络实现,该系统可以将数据从一个空间映射到另一个空间。生成器尝试捕获真实数据的分布,以生成新的数据。鉴别器通常是一个二进制分类器,要求尽可能准确地从真实的例子中鉴别出生成的例子。GANs的优化是一个最大最小优化问题。优化终止于一个鞍点,该鞍点相对于生成器是最小值,相对于鉴别器是最大值。也就是说,当优化达到Nash equilibrium的目标时,这时可以认为生成器捕获了真实数据的真实分布。本文和先前的关于GANS的综述之间的区别主要有以下几点: 1)GANs的具体应用:将GANs用于诸如图像合成和编辑,音频增强和合成等具体领域。 2)关于GANs的综合评述:最早关于GANs的相关综述是Wang et al.整理的,该论文主要介绍了2017年以前GANs 的发展进程。Z.Wang所作的“Generative adversarial networks: A survey and taxonomy”主要介绍了GANs在计算机视觉领域中的各种变体以及变体的损失函数。

到目前为止,本文是第一个从算法,理论和应用的角度为GANs提供一个全面的综述,并且介绍了GANs的最新的进展。再者,我们不仅关注GANs在图像处理和计算机视觉上的应用,而且关注了GANs在诸如自然语言处理和其他如医疗领域等相关领域中的序列数据上的应用。

2.章节内容

  • 章节1:论文摘要和介绍
  • 章节2:介绍相关工作
  • 章节3-5:分别从算法,理论和应用的角度介绍GCNs
  • 章节6:对开放性问题进行探讨
  • 章节7:总结

3. 各种相关的GANs算法

在章节3中,我们首先介绍原始的GANs。然后介绍各种具有代表性的变体和GANs的训练,评估方式以及任务驱动的GANs(如下图所示)。

GAN代表性算法

4. GANs的具体应用

GANs是一个强有力的生成式模型,该模型可以用一个随机向量生成看起来完全和真实样例一样的数据。训练过程中我们既不需要明确的知道真实数据的分布也不需要任何数学假设。基于GANs的显著优势,GANs被广泛应用于图像处理,计算机视觉和序列数据上(具体见下表)。

5. GANs的开放研究问题

  • 离散数据GAN GANs for discrete data
  • New Divergences
  • 不确定性估计 Estimation uncertainty
  • 理论 Theory
  • 其他
成为VIP会员查看完整内容
29+
0+

题目: Analysis on Application of Machine Vision in Fabric Defect Detection

摘要:

随着机器视觉在各个领域的广泛应用和大面积实施,关于机器视觉在纺织生产和质量控制上的应用也成为了研究热点。介绍了织物疵点机器视觉检测系统的硬件选择与布置,重点介绍了光源和相机的选取。根据检测原理的不同,将机器视觉检测方法分为统计法、频谱法、基于学习的方法以及结构法和模型法,并对这些方法做了综述。梳理分析了机器视觉在织物疵点检测方面所面临的问题和未来发展构想。

成为VIP会员查看完整内容
6+
0+

【导读】医学图像配准( Medical Image Registration)作为近年来的研究热点之一,受到了广泛关注,每年在各大会议上都有大量的相关文章发表。当前,基于深度学习的医学图像配准变得越来越流行,人们提出了许多方法来解决这一领域的不同问题。美国埃默里大学医学院Xiaofeng Yang老师课题组新出的这篇论文对近几年医学图像配准深度学习方法进行了全面综述,根据其方法、特征和流行程度分为七类,对每个类别进行了详细的调研,强调了其重要的点及其相应挑战,帮助读者更好地了解当前的研究现状和思路,并且使用基准数据集对基于深度学习的肺和脑配准方法进行了全面比较,最后也介绍了未来的研究方向。

题目:Deep Learning in Medical Image Registration: A Review

作者:Yabo Fu, Yang Lei, Tonghe Wang, Walter J. Curran, Tian Liu, Xiaofeng Yang

【摘要】本文综述了基于深度学习的医学图像配准方法和基于深度学习的配准方法在医学领域的最新发展和应用。这些方法根据其方法、特征和流行程度分为七类。我们对每个类别进行了详细的审查,强调了重要的贡献和确定了具体的挑战。在详细检查每一类别之后,提出了简短的评价,以总结其成就和未来的潜力。我们使用基准数据集对基于深度学习的肺和脑配准方法进行了全面比较。最后,我们从各个方面对所有被引工作进行统计分析,揭示了基于深度学习的医学图像配准的普及和未来趋势。

引言

图像配准又称图像融合或图像匹配,是基于图像外观对两幅或多幅图像进行配准的过程。医学图像配准试图找到一个最佳的空间转换,以最好地对齐底层的解剖结构。医学图像配准在很多临床应用中都有使用,如image guidance [22,123,148,170],motiontracking [13,46,172],segmentation [44,57,174,171,173,176],dose accumulation [1,153],imagereconstruction [91]等。

医学图像配准是一个广泛的课题,可以从不同的角度进行分类。从输入图像的角度来看,挂号方式可以分为单峰挂号、多峰挂号、患者间挂号、患者内挂号(如当天挂号或当日挂号)。从变形模型的角度看,配准方法可分为刚性配准方法、仿射配准方法和可变形配准方法。从感兴趣区域(ROI)的角度来看,配准方法可以根据脑、肺等解剖部位进行分组。从图像对维数的角度来看,配准方法可分为3D到3D、3D到2D、2D到2D/3D。不同的应用程序和配准方式面临着不同的挑战。对于多模态图像配准,由于不同成像方式之间固有的外观差异,很难设计出准确的图像相似度度量。由于不同患者的基础解剖结构不同,因此患者之间的配准可能很棘手。由于代谢过程、排便、患者增/减体重等引起的图像外观变化,患者不同天数的住院配准具有挑战性。为了提供实时的图像制导,配准的计算效率至关重要。

人们提出了许多方法来应对上述挑战。目前比较流行的配准方法有optical flow [169,167]、demons [154]、ANTs[3]、HAMMER[131]、ELASTIX[75]等。尽管医学图像配准已被广泛研究,但它仍然是一个热门的研究主题。医学图像配准领域发展迅速,每年都有数百篇论文发表。近年来,基于深度学习的方法已经改变了医学图像处理研究的面貌,并在许多应用中取得了最新的成果[25、27、45、58、84、85、86、88、89、97、98、156、157、158、160、161]。然而,医学图像配准中的深度学习直到最近三到四年才得到广泛的研究。虽然已有多篇关于医学图像分析中深度学习的综述文献发表[73、93、96、105、106、121、132、182],但针对医学图像配准[60]中深度学习的综述文献较少。本文的目的是总结基于深度学习的医学图像配准方法的最新发展、挑战和趋势。通过这篇综述,我们旨在:

1)综述了基于深度学习的医学图像配准的最新进展。

2)突出贡献、确定挑战并概述未来趋势。

3)从不同角度提供最新出版物的详细统计数据。

在这篇文章中,将DL-based医学图像配准方法按其方法,特征和受欢迎程度分为七类,包括1)基于RL的方法,2)基于深度相似性的方法,3) 监督变换预测, 4)无监督变换预测, 5) 医学图像配准中的GAN, 6) 使用深度学习的配准验证,和7) 其他基于学习的方法。

图1. 医学图像配准中基于深度学习的七类方法综述

在每个类别中,我们提供了一个完整的表格,列出了所有属于该类别的被综述工作并总结了它们的重要特征。我们总共收集了150多篇与基于深度学习的医学图像配准密切相关的论文。这些工作大多发表于2016年至2019年之间。在图2中,出版物的数量通过堆叠柱状图来表示。论文的数量是按类别计算的。

从图2可以看出,人们对有监督变换预测(SupCNN)和无监督变换预测(UnsupCNN)的兴趣明显增加。与此同时,GAN逐渐受到欢迎。

图2. 基于深度学习的医学图像配准中出版的文章数量。虚线表示近年来人们对基于深度学习的配准方法越来越感兴趣。“ DeepSimilarity”是在传统配准框架中使用基于DL的相似性度量的类别。“ RegValidation”代表使用DL进行配准验证的类别。

表1. 基于深度相似性的方法概述

表2. RL在医学图像配准中的应用概况

表3. 监督变换预测方法综述

表4. 无监督变换预测方法综述

表5 GAN配准方法概述

表6使用深度学习的配准验证方法概述

表7其他基于深度学习的图像配准方法综述

表8 DIRLAB数据集中不同方法的目标配准误差(TRE)值比较,TRE单位:(mm), *:传统DIR方法

表9用于脑配准的基准数据集和评价指标

图4. 基于深度学习的图像配准方法各属性的百分比饼图。

挑战与机遇

对于有监督的基于深度学习的方法,最常见的挑战之一是缺乏具有已知转换的训练数据集。这个问题可以通过各种数据扩充方法来缓解。然而,数据增强方法可能会引入额外的误差,如不切实际的人工转换的偏差和在训练和测试阶段之间的图像域转移。

配准验证方法与配准方法同样重要。我们注意到2019年越来越多的论文关注配准验证。为了可靠地评价不同配准方法在不同参数配置下的性能,需要对配准验证方法进行更多的研究。

趋势

从被引文献的统计数据来看,对于快速图像配准,存在直接变换预测的明显趋势。到目前为止,有监督的和无监督的变换预测方法的研究几乎是相等的,这两种方法的发表数量都很接近。有监督方法和无监督方法各有优缺点。我们推测,在未来,更多的研究将集中在有监督和无监督相结合的方法上。由于GAN不仅可以用于引入额外的正则化,还可以用于图像域转换,从而实现多模态到单模态的图像配准,因此基于GAN的配准方法逐渐得到了广泛的应用。基于GAN的医学图像配准技术将稳步发展。由于配准问题的病态性,新的变换正则化技术一直是研究的热点。

成为VIP会员查看完整内容
14+
0+

简介:

深度学习技术在图像降噪方面获得了极大的关注。但是,处理噪声的不同类型的学习方法有很大的差异。具体来说,基于深度学习的判别式学习可以很好地解决高斯噪声。基于深度学习的优化模型方法对真实噪声的估计有很好的效果。迄今为止,很少有相关研究来总结用于图像去噪的不同深度学习技术。在本文中,作者对图像去噪中不同深度技术进行了比较研究。我们首先对(1)用于加白噪声图像的深卷积神经网络(CNN),(2)用于真实噪声图像的深CNN,(3)用于盲目去噪的深CNN和(4)用于混合噪声图像的深CNN进行分类,这是噪声,模糊和低分辨率图像的组合。然后,又分析了不同类型的深度学习方法的动机和原理。接下来,将在定量和定性分析方面比较和验证公共去噪数据集的最新方法。最后,论文指出了一些潜在的挑战和未来研究的方向。

简要内容:

图像去噪的深度学习方法的基础框架:

  • 机器学习方法
  • 神经网络方法
  • 卷积神经网络方法

图像去噪中的深度学习技术:

  • 用于加白噪声图像的深卷积神经网络
  • 深度学习技术可实现真正的噪点图像降噪
  • 盲降噪的深度学习技术
  • 深度学习技术用于混合噪声图像去噪
成为VIP会员查看完整内容
20+
0+

摘要:视觉惯性 SLAM 指的是将视觉传感器获得的图像信息与惯性传感器测得的数据进行鲁棒融合,完成同时定位与建图的过程。视觉惯性 SLAM 作为视觉 SLAM 进行多传感器融合的一个重要突破口,成为当下的机器人视觉 研究热点和核心技术。对视觉 SLAM、惯性导航和视觉惯性 SLAM 进行了介绍,详细介绍了视觉 SLAM 的框架结构和细分部分,罗列了近年来出色的视觉 SLAM 模型。最后在视觉惯性里程计的(visual inertial odometry,VIO) 基础上,对现有的不同派别的开源视觉惯性 SLAM 进行深入分析与比较,探讨视觉惯性 SLAM 的发展趋势与动向。

作者介绍

田红丽,女,博士研究生,河北工业大学人工智能与数据科学学院计算机科学与技术系副教授。研究方向:嵌入式、FPGA、大数据处理。

成为VIP会员查看完整内容
3+
0+

报告题目:

Deep Reinforcement Learning for Computer Vision

报告简介:

近年来,深度强化学习作为机器学习的基本技术之一得到了发展,并成功地应用于各种计算机视觉任务(表现出最先进的性能)。在本教程中,我们将概述深度强化学习技术的趋势,并讨论如何使用它们来提高各种计算机视觉任务的性能(解决计算机视觉中的各种问题)。首先,我们简要介绍了深度强化学习的基本概念,并指出了在不同的计算机视觉任务中所面临的主要挑战。其次,介绍了一些用于计算机视觉任务的深度强化学习技术及其种类:策略学习、注意感知学习、不可微优化和多智能体学习。第三,介绍了深度强化学习在计算机视觉不同领域的应用。最后,我们将讨论深度强化学习中的一些开放性问题,以说明未来如何进一步发展更先进的计算机视觉算法。

嘉宾介绍:

Jiwen Lu,副教授,中国清华大学,自动化系。清华大学自动化系副教授,2015.11-至今,新加坡高级数字科学中心研究科学家,2011.3-2015.11,2003.7-2007.7西安理工大学信息科学系助理讲师。

Liangliang Ren ,清华大学博士生,研究方向是计算机视觉与机器学习、度量学习与深度强化学习

成为VIP会员查看完整内容
14+
0+

题目: Neural Machine Reading Comprehension:Methods and Trends

摘要: 近年来,随着深度学习的出现,要求机器根据给定的语境回答问题的机器阅读理解(MRC)越来越受到广泛的关注。虽然基于深度学习的MRC研究方兴未艾,但目前还缺乏一篇全面的综述文章来总结本文提出的方法和近期的发展趋势。因此,我们对这一有希望的领域的最新研究工作进行了全面的综述。具体来说,我们比较了不同维度的MRC任务,并介绍了其总体架构。我们进一步提供了流行模型中使用的最新方法的分类。最后,我们讨论了一些新的趋势,并通过描述该领域的一些开放性问题得出结论。

下载链接: https://arxiv.org/pdf/1907.01118v2.pdf

成为VIP会员查看完整内容
18+
0+

论文主题: Recent Advances in Deep Learning for Object Detection

论文摘要: 目标检测是计算机视觉中的基本视觉识别问题,并且在过去的几十年中已得到广泛研究。目标检测指的是在给定图像中找到具有精确定位的特定目标,并为每个目标分配一个对应的类标签。由于基于深度学习的图像分类取得了巨大的成功,因此近年来已经积极研究了使用深度学习的对象检测技术。在本文中,我们对深度学习中视觉对象检测的最新进展进行了全面的调查。通过复习文献中最近的大量相关工作,我们系统地分析了现有的目标检测框架并将调查分为三个主要部分:(i)检测组件,(ii)学习策略(iii)应用程序和基准。在调查中,我们详细介绍了影响检测性能的各种因素,例如检测器体系结构,功能学习,建议生成,采样策略等。最后,我们讨论了一些未来的方向,以促进和刺激未来的视觉对象检测研究。与深度学习。

成为VIP会员查看完整内容
18+
0+
Top