受限于硬件条件和卫星发射成本,直接获取高时空分辨率的遥感影像具有较大挑战。遥感时空融合(Spatiotemporal Fusion,STF)技术通过融合高时间分辨率但空间分辨率低的影像与高空间分辨率但时间分辨率低的影像,有效生成高时空分辨率的卫星图像,从而应对上述问题。STF为地表变化监测、农业管理和环境研究等应用提供了前所未有的观测能力。

在过去十年中,深度学习(Deep Learning,DL)方法凭借其强大的自动特征提取与非线性建模能力,彻底变革了遥感时空融合领域,在处理复杂时空数据方面显著优于传统方法。尽管基于深度学习的遥感STF技术发展迅速,当前学术界仍缺乏对该快速演进领域的系统性综述。

本文对过去十年遥感时空融合中深度学习的发展进行了全面回顾,分析了关键研究趋势、方法分类、常用数据集及评估指标,系统总结了现有研究所面临的主要挑战,并指出了具有前景的未来研究方向,为相关研究人员提供思路参考。文中提及的具体模型、数据集及其他信息可在以下链接获取: https://github.com/yc-cui/Deep-Learning-Spatiotemporal-Fusion-Survey

1 引言

时空融合(Spatiotemporal Fusion,STF)是一种基础技术,通过融合具有不同空间和时间分辨率的数据,生成具备增强时空特性的高质量影像。作为一种广泛适用的方法,STF已在多个领域展现出其通用性。 在计算机视觉(CV)中,STF在视频分析与动作识别中发挥着关键作用,通过有效融合时间与空间信息,更好地理解视觉数据中的动态变化 [1]。在城市规划与交通管理中,STF使得不同时间与空间尺度的交通流数据得以整合,从而提升拥堵预测的准确性,并优化城市交通系统 [2]。在医学领域,STF通过融合不同时间点的医学图像(如CT与MRI扫描),可视化肿瘤生长和疾病进展等动态过程,辅助医学影像分析 [3]。

在遥感(Remote Sensing, RS)领域,STF成为解决地球观测(Earth Observation, EO)中空间与时间分辨率权衡问题的重要手段。如图1所示,遥感STF的核心挑战在于如何有效融合**高时间但低空间分辨率(HTLS)数据与高空间但低时间分辨率(HSLT)**数据,以生成同时具备高时间和高空间特性的合成影像 [4]。这项能力对于地表监测、环境研究和农业管理等应用至关重要。 由于HTLS与HSLT图像在空间与时间维度上的差异性,STF面临显著挑战 [5]。例如,MODIS等传感器可提供频繁的时间快照,但空间分辨率较低;而高分辨率图像则具有更精细的空间信息,但更新频率较低。正是由于这一固有矛盾,如何生成同时具备高时间和空间分辨率的融合产品成为难题 [6, 7]。如图1所示,STF技术的目标是让HTLS与HSLT图像优势互补,生成融合产物,从而提升遥感影像的整体表现力。 传统STF方法通常依据数学建模原理分为以下五大类 [5, 8]: * 贝叶斯方法:基于概率推理的图像分析方式,如贝叶斯最大熵(BME)[10] 和统一融合模型 [11],在环境监测(如植被与气候变化)中尤为有效 [6, 9, 12, 13]。 * 混合分解方法:依据线性光谱混合理论,将低分辨率像元分解为多个端元,估算高分辨率像元值,代表方法包括MMT等 [13–17]。尽管在异质区域存在线性假设限制,但在多源遥感融合和亚像元分析中表现良好。 * 学习方法:通过历史观测学习粗分辨率与细分辨率图像间的映射关系,代表模型可自动从大规模数据中提取特征 [18, 19]。 * 加权函数方法:如STARFM、ESTARFM和STAARCH等模型 [20–22],通过加权输入图像估算高分辨率值,适用于地形简单区域,但在处理非线性变化和复杂地形时效果有限 [6, 13]。 * 混合方法:融合上述不同技术优势,如FSDAF [23] 结合了解混与加权方法,显著提升了时空数据融合精度与环境适应性,适合高分辨率遥感图像处理 [9, 12]。

近年来,随着遥感与深度学习(Deep Learning, DL)技术的快速发展,DL在遥感STF研究中获得广泛关注 [23]。与传统方法相比,DL在特征提取、非线性建模与数据适应性方面具备明显优势。传统方法依赖手工特征设计,且常基于简单的地表变化假设 [16, 24, 25],而DL能够通过大规模数据训练自动提取多层次时空特征,显著提升在复杂场景中建模非线性关系的能力。DL方法还具备较强的抗噪性与数据缺失容忍度,可生成更稳定的融合图像,更好地适应多源、多模态遥感数据融合需求,因此成为推动STF技术发展的核心动力之一 [26, 27]。 本文系统回顾了过去十年中深度学习在遥感时空融合中的应用,分析其独特优势与发展潜力,同时指出当前存在的技术瓶颈,并探讨未来的发展方向。如图2所示,本文框架结构对综述内容进行了可视化展示。


1.1 遥感时空融合中深度学习研究趋势分析

为更直观地展示研究趋势与覆盖范围,我们基于Web of Science(WOS)数据库,对相关文献进行了统计分析。我们通过两个高级检索公式收集数据,以辅助分析本领域的发展演变与未来趋势: * Q1(精准查询)TS=remote sensing AND TS=spatiotemporal fusion AND TS=deep learning,用于筛选与深度学习紧密相关的遥感STF研究; * Q2(宽泛查询)TS=remote sensing AND TS=spatiotemporal fusion,包含所有STF研究,不限于DL方法。

(说明:TS表示主题词检索,涵盖标题、摘要、作者关键词及关键词扩展) 如图3所示,从2017年仅1篇文献增长至2024年的121篇,Q1文献占比从0.06增长至0.25,显示出过去八年中深度学习方法在STF领域的快速兴起,并逐步成为该领域的重要研究方向。 为更全面了解研究热点,我们还基于全部文献生成了关键词词云(图4),可观察高频关键词及其分布特征。词云显示,LandsatMODIS是最常用的遥感数据源,体现其在STF研究中的核心地位;deepmodels 表明深度学习模型的广泛应用;ConvolutionalGAN 展示了卷积神经网络 [28] 与生成对抗网络 [29, 30] 的应用趋势;而 AttentionTransformer 则体现了近年来注意力机制与Transformer模型在STF领域的崛起 [31]。此外,关键词如 SpectralPixelsLandVegetation 反映了STF在多光谱特征、像素级处理以及土地与生态监测方向的研究重点。


1.2 现有综述与研究范围

已有综述在总结遥感STF领域基础知识、技术发展与典型应用方面发挥了重要作用 [6],但多数集中于传统方法,尚未系统覆盖近年来基于深度学习的STF最新进展 [26]。 例如,Zhu 等人 [32] 系统综述了多源遥感数据的STF方法,并提出回归、字典学习与物理模型等分类框架,但未深入探讨DL方法的潜力。Li 等人 [12] 对不同模型进行实验对比,但主要集中在传统机器学习方法上,缺乏对近年来深度学习模型结构、数据要求与应用场景的深入分析。Belgiu 与 Stein [6] 虽提及部分神经网络应用,但未对其结构与优势进行系统总结。 总体而言,现有综述在方法结构、模型创新与优势分析上仍存在不足 [6, 9],同时对STF领域常用数据集、评估指标及开源代码的系统梳理也不够完善 [26]。最关键的是,许多近年来提出的重要DL模型未被涵盖与深入讨论 [26, 32, 33]。


1.3 本文贡献

为全面系统地回顾深度学习在遥感时空融合中的应用,本文主要贡献如下: * 综述深度学习在遥感STF中的应用:系统梳理了核心DL模型及其在STF任务中的应用场景,结合实际案例分析其在遥感图像重建、预测与增强方面的潜力。 * 构建分类框架与模型发展时间轴:基于已有研究,提出按网络架构分类的STF方法框架,并通过时间线图展示模型发展轨迹。 * 总结常用数据集、评估指标与开源资源:汇总STF领域常用公开数据集、评估指标并进行对比分析,同时整理相关开源代码仓库。 * 分析技术瓶颈与未来机遇:探讨当前DL在遥感STF中的主要技术瓶颈,并展望具有前景的未来研究方向。


1.4 本文结构安排

为便于读者高效阅读与定位内容,本文结构安排如下: * 第1部分:介绍基本概念、研究重要性、发展趋势、现有综述评述与本文贡献; * 第2部分:综述最新研究成果,包括基准数据集、评估指标与方法分类; * 第3部分:讨论主要技术瓶颈与挑战; * 第4部分:探讨未来研究方向与潜在应用; * 第5部分:总结本文核心观点,并对深度学习在遥感STF中的发展前景作出展望。

表2列出了本文常用缩略词及其释义,涵盖本领域研究所涉及的关键方法、结构与应用场景。

成为VIP会员查看完整内容
1

相关内容

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译等。2023年,大语言模型及其在人工智能领域的应用已成为全球科技研究的热点,其在规模上的增长尤为引人注目,参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处,更加深入地理解人类语言的复杂性。在过去的一年里,大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟,它将不断拓展其应用范围,为人类提供更加智能化和个性化的服务,进一步改善人们的生活和生产方式。
大规模视觉-语言模型的基准、评估、应用与挑战
重新思考不确定性:大语言模型时代的关键综述与分析
专知会员服务
37+阅读 · 2024年11月20日
迈向大语言模型偏好学习的统一视角综述
专知会员服务
23+阅读 · 2024年9月7日
通用多模态人工智能:架构、挑战和机遇综述
专知会员服务
50+阅读 · 2024年6月29日
探索视觉语言模型的前沿:当前方法和未来方向的综述
专知会员服务
47+阅读 · 2024年4月12日
数据受限条件下的多模态处理技术综述
专知
19+阅读 · 2022年7月16日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
18+阅读 · 2018年9月1日
深度学习时代的目标检测算法
炼数成金订阅号
39+阅读 · 2018年3月19日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Arxiv
168+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
454+阅读 · 2023年3月31日
Arxiv
167+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
68+阅读 · 2022年9月7日
VIP会员
相关资讯
数据受限条件下的多模态处理技术综述
专知
19+阅读 · 2022年7月16日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
18+阅读 · 2018年9月1日
深度学习时代的目标检测算法
炼数成金订阅号
39+阅读 · 2018年3月19日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员