目标检测

  1. 综述:深度域适应目标检测 标题:Deep Domain Adaptive Object Detection: a Survey 作者:Wanyi Li, Peng Wang 链接:https://arxiv.org/abs/2002.06797

本文共梳理了40篇相关文献,由中科院自动化所学者发布。基于深度学习(DL)的目标检测已经取得了很大的进展,这些方法通常假设有大量的带标签的训练数据可用,并且训练和测试数据从相同的分布中提取。然而,这两个假设在实践中并不总是成立的。深域自适应目标检测(DDAOD)作为一种新的学习范式应运而生。本文综述了深域自适应目标检测方法的研究进展。

  1. 深度学习中的异常实例检测:综述 标题:Anomalous Instance Detection in Deep Learning: A Survey 作者:Saikiran Bulusu, Dawn Song 链接:https://arxiv.org/abs/2003.06979

本文共梳理了119篇相关文献,由雪城大学学者发布。讨论多种异常实例检测方法,并分析了各种方法的相对优势和劣势。

  1. 使用移动摄像机检测移动物体:全面综述 标题:Moving Objects Detection with a Moving Camera: A Comprehensive Review 作者:Marie-Neige Chapel, Thierry Bouwmans 链接:https://arxiv.org/abs/2001.05238

本文共梳理了347篇相关文献。随着移动传感器的兴起,研究移动相机逐渐变为热门方向。本文对不同现有方法进行了识别,并将其分为一个平面或多个两类。在这两个类别中,将各类方法分为8组:全景背景减法,双摄像头,运动补偿,子空间分割,运动分割,平面+视差,多平面和按块分割图像。本文还对公开可用的数据集和评估指标进行了研究。

图像分类

  1. 图像分类中的半监督,自我监督和无监督技术综述 标题:A survey on Semi-, Self- and Unsupervised Techniques in Image Classification 作者:Lars Schmarje, Reinhard Koch 链接:https://arxiv.org/abs/2002.08721

本文共梳理了51篇相关文献。综述了标签较少的图像分类中常用的21种技术和方法。我们比较方法,并确定了三个主要趋势。

图像去噪

  1. 图像去噪深度学习:综述 标题:Deep Learning on Image Denoising: An overview 作者:Chunwei Tian, Chia-Wen Lin 链接:https://arxiv.org/abs/1912.13171

本文梳理了238篇相关文献,由哈尔滨工业大学、广东工业大学、清华大学学者共同发布。不同类型的处理噪声深度学习方法存在巨大差异,而目前很少有相关研究来进行相关总结。本文对图像去噪中不同深度学习技术进行了比较研究,分析不同方法的动机和原理,并在公共去噪数据集进行比较。研究包括:(1). 加白噪声图像的CNN;(2)用于真实噪声图像的CNN;(3)用于盲噪声去噪的CNN;(4)用于混合噪声图像的CNN。

图像分割

  1. 使用深度学习进行图像分割:综述 标题:Image Segmentation Using Deep Learning: A Survey 作者:Shervin Minaee, Demetri Terzopoulos 链接:https://arxiv.org/abs/2001.05566

本文梳理了172篇相关文献,对语义和实例分割文献进行了全面回顾,涵盖了的各种开创性作品,包括全卷积像素标记网络,编码器-解码器体系结构,多尺度以及基于金字塔的方法,递归网络,视觉注意模型以及对抗中的生成模型。

人脸识别

  1. DeepFakes:面部操纵和伪造检测综述 标题:DeepFakes and Beyond: A Survey of Face Manipulation and Fake Detection 作者:Ruben Tolosana, Javier Ortega-Garcia 链接:https://arxiv.org/abs/2001.00179

本文梳理了105篇相关文献,本文对操纵人脸的图像技术(包括DeepFake方法)以及检测此类技术的方法进行了全面综述。论述了四种类型的面部操作:全脸合成、面部身份交换(DeepFakes)、面部属性操作以及面部表情操作。

姿态估计

  1. 目标姿态回顾:从3D边界框检测器到完整的6D姿态估计器 标题:A Review on Object Pose Recovery: from 3D Bounding Box Detectors to Full 6D Pose Estimators 作者:Caner Sahin, Tae-Kyun Kim 链接:https://arxiv.org/abs/2001.10609

本文梳理了206篇相关文献,由伦敦帝国理工学院学者发布。本文对3D边界框检测器到完整的6D姿态估计器的物体姿态恢复方法的进行了首次全面的综述。基于数学模型,将各类方法分为分类,回归,分类与回归,模板匹配和点对特征匹配任务。

行为/动作识别

  1. 基于3D骨架的动作识别学习方法的研究 标题:A Survey on 3D Skeleton-Based Action Recognition Using Learning Method 作者:Bin Ren, Hong Liu 链接:https://arxiv.org/abs/2002.05907

本文梳理了81篇相关文献,由北京大学学者发布。本文强调了动作识别的必要性和3D骨架数据的重要性,然后以数据驱动的方式对基于递归神经网络,基于卷积神经网络和基于图卷积网络的主流动作识别技术进行了全面介绍,这也是第一次对使用3D骨架数据进行基于深度学习的动作识别的全面研究。

人群计数

  1. 基于CNN的密度估算和人群计数:综述 标题:CNN-based Density Estimation and Crowd Counting: A Survey 作者:Guangshuai Gao, Yunhong Wang 链接:https://arxiv.org/abs/2003.12783

本文梳理了222篇相关文献,由北京航空航天大学学者发布,基于CNN的密度图估计方法,调研了220+工作,对人群计数进行了全面系统的研究。同时根据评估指标,在人群统计数据集上选择表现最好的三名,并分析其优缺点。

医学影像

  1. 使用经典和深层神经网络进行的乳房组织病理学图像分析的全面综述 标题:A Comprehensive Review for Breast Histopathology Image Analysis Using Classical and Deep Neural Networks 作者:Xiaomin Zhou, Tao Jiang 链接:https://arxiv.org/abs/2003.12255

本文梳理了180篇相关文献,由东北大学学者发布。对基于人工神经网络的BHIA技术进行了全面概述,将BHIA系统分为经典和深度神经网络以进行深入研究,分析现有模型以发现最合适的算法,并提供可公开访问的数据集。

  1. 使用深度神经网络的医学图像配准:全面综述 标题:Medical Image Registration Using Deep Neural Networks: A Comprehensive Review 作者:Hamid Reza Boveiri, Ali Reza MehdiZadeh 链接:https://arxiv.org/abs/2002.03401

本文梳理了117篇相关文献,对使用深度神经网络进行医学图像配准的最新文献进行了全面回顾,系统地涵盖了该领域的相关作品,包括关键概念,统计分析,关键技术,主要贡献,挑战和未来方向。

  1. 迈向自动威胁检测:X射线安全成像中深度学习进展综述 标题:Towards Automatic Threat Detection: A Survey of Advances of Deep Learning within X-ray Security Imaging 作者:Samet Akcay, Toby Breckon 链接:https://arxiv.org/abs/2001.01293

本文梳理了151篇相关文献,由英国杜伦大学学者发布。本文分常规机器学习和当代深度学习两类来回顾X射线安全成像算法。将深度学习方法分为有监督,半监督和无监督学习,着重论述分类,检测,分割和异常检测任务,同时包含有完善的X射线数据集。

  1. 用于计算组织病理学的深度神经网络模型综述 标题:Deep neural network models for computational histopathology: A survey 作者:Chetan L. Srinidhi, Anne L. Martel 链接:https://arxiv.org/abs/1912.12378

本文梳理了130篇相关文献,由多伦多大学学者发布。本文对组织病理学图像分析中使用的最新深度学习方法进行了全面回顾,包括有监督,弱监督,无监督,迁移学习等领域,并总结了几个现有的开放数据集。

三维重建

  1. 外部形状对3D内部结构预测综述 标题:A Survey On 3D Inner Structure Prediction from its Outer Shape 作者:Mohamed Mejri, Cédric Pradalier 链接:https://arxiv.org/abs/2002.04571

本文梳理了81篇相关文献,由北京大学学者发布。由于过去与骨架数据相关内容很少,本文是第一篇针对使用3D骨架数据进行基于深度学习的动作识别进行全面讨论的研究。本文突出了动作识别和3D骨架数据的重要性,以数据驱动的方式对基于递归神经网络、卷积神经网络和图卷积网络的主流动作识别技术进行了全面介绍。并介绍了最大的3D骨架数据集NTU-RGB+D及其新版本NTU-RGB+D 120,并论述了几种现有的顶级算法。

三维点云

  1. 点云的无目标配准综述 标题:Target-less registration of point clouds: A review 作者:Yue Pan

本文对48篇文献进行了梳理,总结了无目标点云配准的基本工作,回顾了三种常用的配准方法,即基于特征匹配的方法,迭代最近点算法和随机假设,并分析了这些方法的优缺点,介绍它们的常见应用场景。 链接:https://arxiv.org/abs/1912.12756

OCR:

  1. 手写光学字符识别(OCR):综合系统文献综述(SLR) 标题:Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR) 作者:Jamshed Memon, Rizwan Ahmed Khan 链接:https://arxiv.org/abs/2001.00139

本文对142篇相关文献进行了梳理,总结了有关OCR的研究,综述了2000年至2018年之间发布的研究文章,介绍OCR的最新结果和技术,并分析研究差距,以总结研究方向。

深度depth相关:

  1. 基于深度学习的单目深度估计:综述 标题:Monocular Depth Estimation Based On Deep Learning: An Overview 作者:Chaoqiang Zhao, Feng Qian 链接:https://arxiv.org/abs/2003.06620

本文对119篇相关文献进行了梳理,由华东理工大学学者发布。随着深度神经网络的迅速发展,基于深度学习的单眼深度估计已得到广泛研究。为了提高深度估计的准确性,提出了各种网络框架,损失函数和训练策略。因此,本文综述了当前基于深度学习的单眼深度估计方法,总结了几种基于深度学习的深度估计中广泛使用的数据集和评价指标,同时根据不同的训练方式回顾了一些有代表性的现有方法:有监督,无监督和半监督。

CNN

  1. 卷积神经网络的概述论文:分析、应用和展望 标题:A Survey of Convolutional Neural Networks: Analysis, Applications, and Prospects 作者:Zewen Li, Wenjie Yang, Shouheng Peng, Fan Liu 链接:https://arxiv.org/abs/2004.02806

本文对119篇相关文献进行了梳理,由华东理工大学学者发布。本文旨在在卷积神经网络这个快速增长的领域中尽可能提供新颖的想法和前景,不仅涉及二维卷积,而且涉及一维和多维卷积。首先,本文简要介绍了CNN的历史并概述了CNN发展,介绍经典CNN模型,重点论述使它们达到SOTA的关键因素,并通过实验分析提供了一些经验法则,最后对一维,二维和多维卷积的应用进行了概述。

视觉常识/其他

  1. 神经网络分类器的信息平面分析研究述评 标题:On Information Plane Analyses of Neural Network Classifiers -- A Review 作者:Bernhard C. Geiger 链接:https://arxiv.org/abs/2003.09671

  2. 低功耗深度学习和计算机视觉方法的概述 标题:A Survey of Methods for Low-Power Deep Learning and Computer Vision 作者:Abhinav Goel, George K. Thiruvathukal 链接:https://arxiv.org/abs/2003.11066

  3. 深度学习遇到数据对齐时:深度注册网络(DRN)评述 标题:When Deep Learning Meets Data Alignment: A Review on Deep Registration Networks (DRNs) 作者:Victor Villena-Martinez, Robert B. Fisher 链接:https://arxiv.org/abs/2003.03167

  4. 面向消费设备的无限制掌纹识别:文献综述 标题:Towards Unconstrained Palmprint Recognition on Consumer Devices: a Literature Review 作者:Adrian-S. Ungureanu, Peter Corcoran 链接:https://arxiv.org/abs/2003.00737

  5. 基于地面纹理的本地化功能-综述 标题:Features for Ground Texture Based Localization -- A Survey 作者:Jan Fabian Schmid, Rudolf Mester 链接:https://arxiv.org/abs/2002.11948

  6. 从观看到移动:视觉室内导航(VIN)学习综述 标题:From Seeing to Moving: A Survey on Learning for Visual Indoor Navigation (VIN) 作者:Xin Ye, Yezhou Yang 链接:https://arxiv.org/abs/2002.11310

成为VIP会员查看完整内容
0
78

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

摘要: 目标检测算法应用广泛,一直是计算机视觉领域备受关注的研究热点。近年来,随着深度学习的发展,3D图像的目标检测研究取得了巨大的突破。与2D目标检测相比,3D目标检测结合了深度信息,能够提供目标的位置、方向和大小等空间场景信息,在自动驾驶和机器人领域发展迅速。文中首先对基于深度学习的2D目标检测算法进行概述;其次根据图像、激光雷达、多传感器等不同数据采集方式,分析目前具有代表性和开创性的3D目标检测算法;结合自动驾驶的应用场景,对比分析不同 3D 目标检测算法的性能、优势和局限性;最后总结了3D目标检测的应用意义以及待解决的问题,并对 3D 目标检测的发展方向和新的挑战进行了讨论和展望。

成为VIP会员查看完整内容
0
69

论文题目: Monocular Depth Estimation: A Survey

论文摘要: 单目深度估计常被描述为一个不适定和固有的模糊问题。从二维图像中估计深度是场景重建、三维目标识别、分割和检测的关键步骤。该问题可以分为:给定单个RGB图像作为输入,预测每个像素的稠密深度图。由于大多数场景具有较大的纹理和结构变化、对象遮挡和丰富的几何细节,这一问题更加严重。所有这些因素都造成了准确估计深度的困难。在本文中,我们回顾了五篇试图用各种技术来解决深度估计问题的论文,这些技术包括有监督、弱监督和无监督学习技术。然后,我们比较这些文件,了解彼此之间的改进。最后,我们探讨可以帮助更好地解决这个问题的潜在改进。

成为VIP会员查看完整内容
0
45
小贴士
相关论文
Anomalous Instance Detection in Deep Learning: A Survey
Saikiran Bulusu,Bhavya Kailkhura,Bo Li,Pramod K. Varshney,Dawn Song
21+阅读 · 2020年3月16日
Self-Supervised Learning For Few-Shot Image Classification
Da Chen,Yuefeng Chen,Yuhong Li,Feng Mao,Yuan He,Hui Xue
11+阅读 · 2019年11月14日
Object Detection in 20 Years: A Survey
Zhengxia Zou,Zhenwei Shi,Yuhong Guo,Jieping Ye
36+阅读 · 2019年5月13日
Hamid Rezatofighi,Nathan Tsoi,JunYoung Gwak,Amir Sadeghian,Ian Reid,Silvio Savarese
3+阅读 · 2019年4月15日
Ke Sun,Bin Xiao,Dong Liu,Jingdong Wang
5+阅读 · 2019年2月25日
Joaquin Vanschoren
109+阅读 · 2018年10月8日
Deep Learning for Generic Object Detection: A Survey
Li Liu,Wanli Ouyang,Xiaogang Wang,Paul Fieguth,Jie Chen,Xinwang Liu,Matti Pietikäinen
7+阅读 · 2018年9月6日
Acquisition of Localization Confidence for Accurate Object Detection
Borui Jiang,Ruixuan Luo,Jiayuan Mao,Tete Xiao,Yuning Jiang
4+阅读 · 2018年7月30日
Viewpoint Estimation-Insights & Model
Gilad Divon,Ayellet Tal
3+阅读 · 2018年7月3日
Aljoša Ošep,Paul Voigtlaender,Jonathon Luiten,Stefan Breuers,Bastian Leibe
3+阅读 · 2017年12月23日
Top