【博士论文】基于深度学习的图像处理算法研究

2020 年 12 月 6 日 专知
【博士论文】基于深度学习的图像处理算法研究

来自山东大学樊庆楠的博士论文,入选2020年度“CCF优秀博士学位论文奖”初评名单!

https://www.ccf.org.cn/Focus/2020-12-03/717578.shtml


基于深度学习的图像处理算法研究


随着智能手机和微单相机的普及,拍照已经变成人们日常生活中不可缺少的一部分,图像也已成为人类社会的重要信息媒介。然而受到拍照环境、设备和技术的影响,图像中难免会出现退化现象,如何从图像处理的角度提升拍摄照片的质量具有重要的研究意义与应用价值。近年来,深度学习技术得到了巨大的发展,并广泛应用于图像处理领域。相对于许多传统算法,深度学习技术从海量的训练数据中学习到的先验知识具有更强的泛化能力和更复杂的参数化表达,且无需调节算法参数以适应不同的应用场景。得益于上述优势,深度学习技术已经广泛应用于图像处理领域,如何利用深度学习算法提升图像处理的效果也变成了一个重要的研究方向。


尽管深度学习技术显著促进了图像处理领域的发展,但是受限于其对训练数据的敏感性,在面对无标签、仅有弱标签或者合成伪标签的数据时,深度学习技术的优势难以充分体现。本学位论文针对以上挑战,重点研究了缺失完整数据标签的经典图像处理问题,包括图像平滑、反光去除和本征图像分解等。本文通过将上述问题抽象为对图像结构敏感的图像分解问题,将显著的目标边缘信息通过优化或者滤波的方式编码进深度学习的算法设计中。根据图像处理问题中数据标签的类型和数量不同,本文依次提出了基于无监督学习、弱监督学习和多标签联合训练的深度学习解决方案。本文的最后提出了解耦学习框架,通过对10种不同图像处理问题的联合训练,提炼出了图像处理问题的核心解空间。该算法对于理解深度学习技术在图像处理领域的应用有重要的研究价值和意义。本文的创新点和贡献包括以下几个方面:


(1) 一种基于无监督学习的空间自适应图像平滑算法

该算法通过使用卷积神经网络,以无监督的方式从无标签数据中学习图像平滑的优化过程,并实现可灵活调节的图像平滑效果。该算法提出了一个由边缘保持项和空间自适应平滑项构成的能量函数,前者用于保持重要但易破坏的图像结构,后者用于将多种形式的正则器(Lp范数)施加至图像的不同区域。由于缺乏平滑图像的真值数据,本文采用一个无监督学习的能量优化框架,用来实现多种基于图像平滑的视觉应用,譬如图像抽象化、铅笔素描、细节增强、纹理去除和基于内容的图像处理等。实验结果表明,该基于无监督学习的空间自适应图像平滑算法获得了更好的视觉结果。


(2) 一种基于弱监督学习的图像反光去除算法

该算法提出了一个多阶段卷积神经网络,用以解决图像分解领域中经典的反光去除问题。本算法框架由两个结构相似的卷积神经网络串联而成,前者预测目标图像的边缘结构,后者依据预测边缘信息的引导重建目标图像;整个过程既不需要任何人工设计,也不依赖于其他图像处理应用。通过从真实反光图像观察得到的图像亮度和结构先验,该算法设计了一种针对模糊强反光的反光图像合成算法;通过将合成数据以弱监督信号的形式融入到多阶段神经网络训练中,该算法获得了在真实反光图像上的良好泛化性能。实验结果表明,该基于弱监督学习的图像反光去除算法在不同程度的反光场景中均获得更优的视觉效果。


(3) 一种基于多标签联合训练的本征图像分解算法

本征图像分解往往存在数据集冗杂、数据标签不一致等问题。为解决该问题,本文提出了一个通用的核心神经网络,用以在不同类型的数据标签中共享本征图像形成过程的稀疏先验。该神经网络由三个不同的基础模块组成:直接本征图像估计网络、导向网络和域滤波器;其中,直接本征图像估计网络通过对本征图像的直接监督获得初始的预测结果,导向网络负责生成稀疏的反射结构先验,并引导域滤波器获得干净的反射估计。该算法设计了一个灵活的能量损失层以实现多标签数据联合训练的目的。实验结果表明,该本征图像分解算法在所有的主流基准数据集上都获得了更高的精确度。


(4) 一种基于解耦学习的实时参数化图像处理框架


传统的深度学习算法在面对不同的图像处理应用时,需要重复地训练神经网络。为了解决这个问题,该算法提出了由基础网络和权重学习网络组成的解耦学习框架,其中前者用来实现具体的图像处理应用,后者用来学习基础网络的权重。该算法通过对基础网络的结构和权重进行解耦,达到根据图像处理应用的变化实时动态调整基础网络权重的效果,并因此实现了利用单一神经网络融合多种图像处理应用的目的。实验结果表明,该解耦学习框架成功应用在10种不同的参数化图像算子中,并减少了网络参数的存储空间。



https://www.ccf.org.cn/ccf/contentcore/resource/download?ID=143740


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“深度图像” 就可以获取【博士论文】基于深度学习的图像处理算法研究》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

图像处理(image processing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组,该数组的元素称为像素,其值称为灰度值。

单幅图像超分辨率重建是计算机视觉领域上的一个重要问题, 在安防视频监控、飞机航拍以及卫星遥感等方面具有重要的研究意义和应用价值. 近年来, 深度学习在图像分类、检测、识别等诸多领域中取得了突破性进展, 也推动着图像超分辨率重建技术的发展. 本文首先介绍单幅图像超分辨率重建的常用公共图像数据集; 然后重点阐述基于深度学习的单幅图像超分辨率重建方向的创新与进展; 最后讨论了单幅图像超分辨率重建方向上存在的困难和挑战, 并对未来的发展趋势进行了思考与展望.

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190859

成为VIP会员查看完整内容
0
23

信息论的经典结果表明,信源信道分离编码是渐进最优的。但现代通信系统对时延、带宽等愈发敏 感,分离设计对解码具有无限计算能力这一假设难以成立。带宽有限时,相对于信源信道联合编码,分离编 码已被证明是次优的。传统的联合信源信道编码需要复杂的编码方案,相较之下,数据驱动的深度学习技术 则带来了新的设计思路。适时地对相关研究成果进行总结,有助于进一步明确深度学习方法解决信源信道联 合编码问题的方式,为研究新的研究方向提供依据。首先介绍了基于深度学习的信源压缩方案和端对端收发 信机模型,随后分析不同信源类型下的两种联合编码设计思路,最后探讨了基于深度学习的信源信道联合编 码的潜在问题和未来的工作方向。

成为VIP会员查看完整内容
0
23

多层图分析技术研究

近年来,越来越多的领域都使用“图”来表示和管理数据,称为“图数据”。针对 图数据的分析可以发现其中的结构特征、频繁模式、演变规律等有用的知识,具有 重要的科研意义和应用价值。随着研究的深入,人们发现现实世界的图数据往往 包含数据对象间多种类型的关系。例如,社交网络数据包括多个社交媒体组成的 网络;交通网络数据涵盖了多种交通工具组成的网络。这种图数据称为“多层图”, 其每一层包含了数据对象间某种特定类型的关系。

多层图分析可以发现准确可靠、价值更高的知识。然而,多层图分析面临两 方面的挑战:一方面,单层图上的计算语义在多层图场景下不再适用,多层图上 的计算语义更加复杂;另一方面,多层图分析涉及多个图层上的计算任务,使得 问题的固有计算复杂性大大增加。现有的多层图分析方法在计算语义和算法设计 两个方面都存在缺陷,不能很好的解决多层图分析的有关问题。

本文综合运用数据分析的相关理论、技术和方法,对于多层图分析进行了系统研究。本文同时考虑了无概率的普通多层图和带概率的多层图,从图数据的稠 密性、可靠性、传播性和相似性四方面重要性质出发,对多层图分析领域中的一 系列重要问题进行了深入研究,主要研究成果如下:

  1. 本文研究了多层图上的多样化稠密区域发现问题,该问题在生物蛋白复合 体检测和社区发现上具有重要应用。在无概率的普通多层图模型基础上,本文提 出了一种新的稠密区域概念 d-Coherent-Core(简称 d-CC),设计了两种近似比为 1/4 的高效搜索算法来求解该 NP-难问题,算法在结果质量和执行时间两个方面 均优于基于准团的传统算法。d-CC 概念同时刻画了稠密区域的稠密度和支持度两 方面重要特性,满足唯一性、包含性和层次性 3 个重要数学性质。自底向上和自 顶向下两种搜索算法采用了高效的搜索策略和剪枝方法,分别适用于支持度参数 较小和较大两种情况。真实数据上的实验结果表明:自底向上和自顶向下两种搜 索算法是高效、准确的。

  2. 本文研究了多层图上的 top-k 可靠顶点搜索问题,该问题在通信网络中具 有重要的研究意义,相比基于阈值的搜索问题自适应性更好。本文给出了一种图 层带概率的多层图模型,提出了一种新的多层图计算框架——共享计算,其可以 有效利用多层图不同图层间的重叠结构以减少搜索代价、提高算法效率。基于此,本文设计了求解 top-k 可靠顶点搜索问题的共享 BFS 精确算法和随机算法。真实 数据上的实验结果表明:共享 BFS 精确算法具有很高的效率和扩展性;共享 BFS 随机算法具有很高的准确率。

  3. 本文研究了多层图上的影响力最大化问题,该问题在病毒式营销和舆情控 制中应用广泛。为描述影响力最大化问题中的图数据,本文给出了一种带概率的 多层图模型,其可以表示由于边的不确定性而形成的多层图。针对已有算法的缺 陷,本文设计了一种能够同时达到高时间效率、高结果质量、低内存开销和高健 壮性的影响力最大化算法,具有线性的时间和空间复杂度。该算法采用高质量的 分数估计方法和增量式的分数更新方法,在实际社交网络中表现出良好的性能和 很高的扩展性。

  4. 本文研究了多层图上 SimRank 顶点相似性测度问题,该问题是推荐系统、 实体识别等众多应用的基础。在带概率的多层图模型基础上,本文严格给出了符 合其可能世界语义的 SimRank 相似性测度定义,设计了高效、准确的计算顶点间 SimRank 相似性的方法。同时,作为 SimRank 相似性测度的基础,本文提出了多 层图上随机游走的定义,严格证明了这一定义满足马尔可夫性,设计了计算随机 游走概率的高效算法。真实数据上的实验结果表明:本文提出的 SimRank 算法是 高效、准确的;本文提出的 SimRank 测度比传统测度在实际应用中效果更好。

成为VIP会员查看完整内容
0
26

摘要: 图像补全是图像处理的一个研究领域,为有物体遮挡以及图像关键部分缺失状况下的图像识别提供了解决方案,应用领域非常广泛,受到了人们的关注。经深度学习方法补全的图像具有更高的图像分辨率和可靠性,逐渐成为图像补全的主流方法之一。文中针对图像补全领域的主要问题,介绍了相关深度学习方法的基本原理和经典算法,系统而渐进地剖析了2010年以来有代表性的图像补全方法,探讨了基于深度学习的图像补全在不同领域的具体应用,并列举了该研究领域目前面临的几个问题。

http://www.jsjkx.com/CN/10.11896/jsjkx.200600009

成为VIP会员查看完整内容
0
31

虽然像CNNs这样的深度学习模型在医学图像分析方面取得了很大的成功,但是小型的医学数据集仍然是这一领域的主要瓶颈。为了解决这个问题,研究人员开始寻找现有医疗数据集之外的外部信息。传统的方法通常利用来自自然图像的信息。最近的研究利用了来自医生的领域知识,通过让网络模仿他们如何被训练,模仿他们的诊断模式,或者专注于他们特别关注的特征或领域。本文综述了将医学领域知识引入疾病诊断、病变、器官及异常检测、病变及器官分割等深度学习模型的研究进展。针对不同类型的任务,我们系统地对所使用的不同类型的医学领域知识进行了分类,并给出了相应的整合方法。最后,我们总结了挑战、未解决的问题和未来研究的方向。

成为VIP会员查看完整内容
0
85

摘要: 大数据时代,数据呈现维度高、数据量大和增长快等特点。如何有效利用其中蕴含的有价值信息,以实现数据的智能化处理,已成为当前理论和应用的研究热点。针对现实普遍存在的多义性对象,数据多标签被提出并被广泛应用于数据智能化组织。近年来,深度学习在数据特征提取方面呈现出高速、高精度等优异性,使基于深度学习的多标签生成得到广泛关注。文中分五大类别总结了最新研究成果,并进一步从数据、关系类型、应用场景、适应性及实验性能方面对其进行对比和分析,最后探讨了多标签生成面临的挑战和未来的研究方向。

成为VIP会员查看完整内容
0
100
小贴士
相关资讯
最全综述 | 图像分割算法
计算机视觉life
11+阅读 · 2019年6月20日
深度学习与医学图像分析
人工智能前沿讲习班
24+阅读 · 2019年6月8日
深度学习的图像修复
AI研习社
20+阅读 · 2019年3月28日
CVPR 2018 论文解读 | 基于GAN和CNN的图像盲去噪
PaperWeekly
11+阅读 · 2019年1月22日
【机器学习】机器学习:未来十年研究热点
产业智能官
9+阅读 · 2018年11月4日
如何设计基于深度学习的图像压缩算法
论智
26+阅读 · 2018年4月26日
计算机视觉与深度学习实战
炼数成金订阅号
6+阅读 · 2018年2月9日
独家 | 基于深度学习的行人重识别研究综述
AI科技评论
10+阅读 · 2017年12月20日
相关VIP内容
专知会员服务
62+阅读 · 1月11日
专知会员服务
23+阅读 · 1月9日
专知会员服务
26+阅读 · 2020年12月22日
专知会员服务
43+阅读 · 2020年12月18日
专知会员服务
15+阅读 · 2020年12月10日
专知会员服务
31+阅读 · 2020年12月4日
专知会员服务
100+阅读 · 2020年4月25日
相关论文
Mengwei Ren,Neel Dey,James Fishbaugh,Guido Gerig
0+阅读 · 2月11日
Antonio Sze-To,Abtin Riasatian,Hamid R. Tizhoosh
0+阅读 · 2月11日
Arthur Brack,Anett Hoppe,Pascal Buschermöhle,Ralph Ewerth
0+阅读 · 2月11日
Image Segmentation Using Deep Learning: A Survey
Shervin Minaee,Yuri Boykov,Fatih Porikli,Antonio Plaza,Nasser Kehtarnavaz,Demetri Terzopoulos
32+阅读 · 2020年1月15日
Paul Henderson,Vittorio Ferrari
3+阅读 · 2018年11月15日
ClusterGAN : Latent Space Clustering in Generative Adversarial Networks
Sudipto Mukherjee,Himanshu Asnani,Eugene Lin,Sreeram Kannan
6+阅读 · 2018年9月10日
Isabelle Augenstein,Sebastian Ruder,Anders Søgaard
3+阅读 · 2018年4月9日
Lei Sang,Min Xu,Shengsheng Qian,Xindong Wu
6+阅读 · 2018年3月24日
Mikel Artetxe,Gorka Labaka,Eneko Agirre,Kyunghyun Cho
6+阅读 · 2018年2月26日
Top