来自西安交通大学的谢琦博士论文,入选2022年度“CCF优秀博士学位论文奖”初评名单!

https://www.ccf.org.cn/Focus/2022-12-08/781244.shtml

随着信息获取与处理技术飞速发展,图像数据处理与分析技术已经与人类生活息 息相关。在这个过程中,图像结构的数学表示与建模发挥着十分重要的作用。现阶段, 对灰度图像的二维空间结构的建模已有较多研究,然而不同场景下的图像数据往往有 着较大的差异,现有的建模方法并不能满足不同场景的特异化需求。因此,在针对特定 场景构建图像数据模型时,合理应用场景独特的领域知识有着十分重要的意义。本论文主要研究几种典型图像处理与分析场景下的领域知识建模方法,既涉及无 监督学习框架,也涉及有监督学习框架。其中无监督学习的场景包括高阶数据的稀疏 性先验建模、彩色图像的非局部相似性建模以及低剂量 CT 图像的噪声建模三个应用;有监督学习的场景包括高光谱图像融合、眼底视网膜病灶检测两个应用。所取得的主 要成果包括➀:

(1) 提出了一种新型的高阶稀疏性度量。目前,张量 (高阶数组) 数据的合理稀疏性 度量构造,仍未形成统一的解决方案。本文针对这一问题,基于张量的 Kronecker 基表 示构造了一种新型张量稀疏性度量。相比传统度量,所提张量稀疏性度量不仅充分编 码了对于两种经典张量分解方式(Tucker 分解与 CP 分解)的稀疏性内涵,而且具有与 传统的向量/矩阵稀疏性度量的一致性,同时蕴含显著的物理意义,即表达张量需要的 1 秩 Kronecker 基个数。所提度量在几种高维图像数据处理问题上都取得了良好的应用 效果。

(2) 提出了一种具有旋转与颜色不变性的彩色图像非局部自相似性建模方法。非局 部自相似性是图像处理中最常用也最有效的图像先验,然而,现有方法忽略了结构相 似但颜色与纹理方向不同的图像块之间的强相似性。本文首次用图像先验分布的形式 建模了具有旋转与颜色不变性的非局部自相似性,更准确地刻画了彩色图像的非局部 自相似结构,并将其应用到彩色图像去噪问题中,取得了优于现有基于非局部自相似 性去噪方法的效果。

(3) 提出了一种噪声生成机制嵌入的 CT 弦图去噪方法。本文充分考虑了低剂量 CT 中两个本征噪声源的统计特性,即 X 射线的量子随机性和背景电噪声,将低剂量 CT 弦 图预处理问题标准化为最大后验概率(MAP)估计问题。同时,针对 CT 弦图独特的分 片线性特征,提出了一种新的 CT 弦图先验分布,能合理地建模 CT 弦图的特性。与传 统的弦图去噪方法相比,所提模型的似然(损失)项和先验(正则)项都得到了更准确 的改进,更符合 CT 弦图生成机制的统计本质,因而可获得更优的 CT 弦图去噪效果。 (4) 提出了一种物理机制嵌入的深度高光谱融合网络。本文将低分辨率图像的生成 模型和高光谱图像的低秩先验知识结合,提出一种新的高光谱融合模型,并将模型的 求解过程融入深度网络的设计,构建了一个新的高光谱融合网络——MHF-net。由于模 型和算法的精心设计,所提网络的基本模块不仅具有清晰的可解释性,而且很好地嵌入了低分辨率图像的内在生成机制。大量实验上说明,所提方法相比传统深度网络有 着本质的泛化性提升。

(5) 提出了一种领域知识嵌入的深度视网膜眼底病灶分割网络。首先,本文充分考 虑了前景(病灶)和背景(视网膜底版图像)特征,以前景背景分离的方式对视网膜眼 底图像进行建模。然后,本文为所提模型设计了有效的 EM 求解算法,并据此构建了一 种与算法的求解过程一致的新型视网膜眼底病灶分割网络,称为 EM-Net。相比于传统 视网膜眼底病灶分割网络,所提方法能够将视网膜眼底图像与病灶的结构信息合理地 嵌入网络的设计中,从而得到了超越现有方法的效果。

成为VIP会员查看完整内容
21

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【CMU博士论文】多语言视觉-语言模型研究,190页pdf
专知会员服务
33+阅读 · 2023年2月15日
【悉尼大学博士论文】深度3D信息预测与理解,184页pdf
专知会员服务
39+阅读 · 2022年12月27日
【博士论文】深度学习的对抗攻击与鲁棒性测评
专知会员服务
66+阅读 · 2022年12月9日
【CMU博士论文】多媒体内容解纠缠表示,100页pdf
专知会员服务
20+阅读 · 2022年8月8日
【博士论文】开放环境下的度量学习研究
专知会员服务
45+阅读 · 2021年12月4日
专知会员服务
76+阅读 · 2020年12月6日
【TPAMI2022】关联关系驱动的多模态分类
专知
3+阅读 · 2022年3月22日
监控视频的异常检测与建模综述
专知
0+阅读 · 2021年12月27日
【博士论文】开放环境下的度量学习研究
专知
6+阅读 · 2021年12月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
Interest-aware Message-Passing GCN for Recommendation
Arxiv
11+阅读 · 2021年2月19日
Adversarial Mutual Information for Text Generation
Arxiv
13+阅读 · 2020年6月30日
AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning
VIP会员
相关VIP内容
【CMU博士论文】多语言视觉-语言模型研究,190页pdf
专知会员服务
33+阅读 · 2023年2月15日
【悉尼大学博士论文】深度3D信息预测与理解,184页pdf
专知会员服务
39+阅读 · 2022年12月27日
【博士论文】深度学习的对抗攻击与鲁棒性测评
专知会员服务
66+阅读 · 2022年12月9日
【CMU博士论文】多媒体内容解纠缠表示,100页pdf
专知会员服务
20+阅读 · 2022年8月8日
【博士论文】开放环境下的度量学习研究
专知会员服务
45+阅读 · 2021年12月4日
专知会员服务
76+阅读 · 2020年12月6日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员