Modern deep learning models operating on multi-modal visual signals often rely on inductive biases that are poorly aligned with the physical processes governing signal formation, leading to brittle performance under cross-spectral and real-world conditions. In particular, approaches that prioritise direct thermal cues struggle to capture indirect yet persistent environmental alterations induced by sustained heat emissions. This work introduces a physics-aware representation learning framework that leverages multi-spectral information to model stable signatures of long-term physical processes. Specifically, a geological Short Wave Infrared (SWIR) ratio sensitive to soil property changes is integrated with Thermal Infrared (TIR) data through an intermediate fusion architecture, instantiated as FusionNet. The proposed backbone embeds trainable differential signal-processing priors within convolutional layers, combines mixed pooling strategies, and employs wider receptive fields to enhance robustness across spectral modalities. Systematic ablations show that each architectural component contributes to performance gains, with DGCNN achieving 88.7% accuracy on the SWIR ratio and FusionNet reaching 90.6%, outperforming state-of-the-art baselines across five spectral configurations. Transfer learning experiments further show that ImageNet pretraining degrades TIR performance, highlighting the importance of modality-aware training for cross-spectral learning. Evaluated on real-world data, the results demonstrate that combining physics-aware feature selection with principled deep learning architectures yields robust and generalisable representations, illustrating how first-principles signal modelling can improve multi-spectral learning under challenging conditions.


翻译:现代深度学习模型在处理多模态视觉信号时,常依赖于与信号形成的物理过程严重不符的归纳偏置,导致其在跨光谱和真实场景条件下性能脆弱。特别地,那些优先考虑直接热信号的方法难以捕捉由持续热排放引起的间接但持久的环境变化。本文提出了一种物理感知的表征学习框架,该框架利用多光谱信息来建模长期物理过程的稳定特征。具体而言,通过一个中间融合架构(实例化为FusionNet),将对土壤特性变化敏感的地质短波红外(SWIR)比率与热红外(TIR)数据相集成。所提出的骨干网络在卷积层中嵌入了可训练的差分信号处理先验,结合了混合池化策略,并采用更宽的感受野以增强跨光谱模态的鲁棒性。系统消融实验表明,每个架构组件都对性能提升有贡献,其中DGCNN在SWIR比率上达到88.7%的准确率,而FusionNet达到90.6%,在五种光谱配置上均优于现有最先进的基线方法。迁移学习实验进一步表明,ImageNet预训练会降低TIR性能,凸显了模态感知训练对于跨光谱学习的重要性。在真实世界数据上的评估结果表明,将物理感知的特征选择与基于原理的深度学习架构相结合,能够产生鲁棒且可泛化的表征,这说明了第一性原理信号建模如何在挑战性条件下改进多光谱学习。

0
下载
关闭预览

相关内容

【ICML2023】SEGA:结构熵引导的图对比学习锚视图
专知会员服务
23+阅读 · 2023年5月10日
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
【CVPR 2020 Oral】小样本类增量学习
专知
20+阅读 · 2020年6月26日
论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG
开放知识图谱
36+阅读 · 2018年3月30日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关VIP内容
相关资讯
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员