As augmented reality and virtual reality applications gain popularity, image processing for OmniDirectional Images (ODIs) has attracted increasing attention. OmniDirectional Image Super-Resolution (ODISR) is a promising technique for enhancing the visual quality of ODIs. Before performing super-resolution, ODIs are typically projected from a spherical surface onto a plane using EquiRectangular Projection (ERP). This projection introduces latitude-dependent geometric distortion in ERP images: distortion is minimal near the equator but becomes severe toward the poles, where image content is stretched across a wider area. However, existing ODISR methods have limited sampling ranges and feature extraction capabilities, which hinder their ability to capture distorted patterns over large areas. To address this issue, we propose a novel Multi-level Distortion-aware Deformable Network (MDDN) for ODISR, designed to expand the sampling range and receptive field. Specifically, the feature extractor in MDDN comprises three parallel branches: a deformable attention mechanism (serving as the dilation=1 path) and two dilated deformable convolutions with dilation rates of 2 and 3. This architecture expands the sampling range to include more distorted patterns across wider areas, generating dense and comprehensive features that effectively capture geometric distortions in ERP images. The representations extracted from these deformable feature extractors are adaptively fused in a multi-level feature fusion module. Furthermore, to reduce computational cost, a low-rank decomposition strategy is applied to dilated deformable convolutions. Extensive experiments on publicly available datasets demonstrate that MDDN outperforms state-of-the-art methods, underscoring its effectiveness and superiority in ODISR.


翻译:随着增强现实和虚拟现实应用的普及,面向全景图像(ODIs)的图像处理技术日益受到关注。全景图像超分辨率(ODISR)是一种提升ODIs视觉质量的有效技术。在进行超分辨率处理前,ODIs通常通过等距柱状投影(ERP)从球面映射到平面。该投影会在ERP图像中引入与纬度相关的几何失真:赤道附近失真较小,而向两极区域逐渐加剧,图像内容在更广范围内被拉伸。然而,现有ODISR方法的采样范围和特征提取能力有限,难以有效捕捉大范围失真模式。为解决这一问题,我们提出了一种新颖的多级失真感知可变形网络(MDDN)用于ODISR,旨在扩展采样范围和感受野。具体而言,MDDN的特征提取器包含三个并行分支:一个可变形注意力机制(作为膨胀率为1的路径)以及两个膨胀率分别为2和3的膨胀可变形卷积。该架构通过扩展采样范围以涵盖更广区域的失真模式,生成密集且全面的特征,从而有效捕捉ERP图像中的几何失真。从这些可变形特征提取器提取的表征在多级特征融合模块中进行自适应融合。此外,为降低计算成本,我们对膨胀可变形卷积采用了低秩分解策略。在公开数据集上的大量实验表明,MDDN性能优于现有先进方法,验证了其在ODISR任务中的有效性和优越性。

0
下载
关闭预览

相关内容

扩散模型图像超分辨率等综述
专知会员服务
24+阅读 · 2024年1月2日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员