Chest X-ray (CXR) imaging is widely used for screening and diagnosing pulmonary abnormalities, yet automated interpretation remains challenging due to weak disease signals, dataset bias, and limited spatial supervision. Foundation models for medical image segmentation (MedSAM) provide an opportunity to introduce anatomically grounded priors that may improve robustness and interpretability in CXR analysis. We propose a segmentation-guided CXR classification pipeline that integrates MedSAM as a lung region extraction module prior to multi-label abnormality classification. MedSAM is fine-tuned using a public image-mask dataset from Airlangga University Hospital. We then apply it to a curated subset of the public NIH CXR dataset to train and evaluate deep convolutional neural networks for multi-label prediction of five abnormalities (Mass, Nodule, Pneumonia, Edema, and Fibrosis), with the normal case (No Finding) evaluated via a derived score. Experiments show that MedSAM produces anatomically plausible lung masks across diverse imaging conditions. We find that masking effects are both task-dependent and architecture-dependent. ResNet50 trained on original images achieves the strongest overall abnormality discrimination, while loose lung masking yields comparable macro AUROC but significantly improves No Finding discrimination, indicating a trade-off between abnormality-specific classification and normal case screening. Tight masking consistently reduces abnormality level performance but improves training efficiency. Loose masking partially mitigates this degradation by preserving perihilar and peripheral context. These results suggest that lung masking should be treated as a controllable spatial prior selected to match the backbone and clinical objective, rather than applied uniformly.


翻译:胸部X光成像广泛用于肺部异常筛查与诊断,但由于疾病信号微弱、数据集偏差及空间监督有限,其自动化解读仍面临挑战。医学图像分割基础模型为引入解剖学先验知识提供了可能,有望提升CXR分析的鲁棒性与可解释性。本研究提出一种分割引导的CXR分类流程,在进入多标签异常分类前,将MedSAM作为肺部区域提取模块进行集成。我们使用艾尔朗加大学医院的公开图像-掩码数据集对MedSAM进行微调,随后将其应用于美国国立卫生研究院CXR数据集的精选子集,训练并评估深度卷积神经网络对五种异常(肿块、结节、肺炎、水肿、纤维化)的多标签预测能力,正常病例则通过衍生评分进行评估。实验表明,MedSAM能在多样成像条件下生成解剖学合理的肺部掩码。研究发现掩码效果同时具有任务依赖性与架构依赖性:在原始图像上训练的ResNet50实现了最强的整体异常判别能力,而宽松肺部掩码在保持可比宏观AUROC的同时,显著提升了正常病例的判别性能,这揭示了异常特异性分类与正常病例筛查之间的权衡关系。紧密掩码会持续降低异常层级性能,但能提升训练效率;宽松掩码通过保留肺门及外周上下文信息,可部分缓解此类性能衰减。这些结果表明,肺部掩码应被视为可调控的空间先验知识,需根据主干网络架构与临床目标进行针对性选择,而非统一应用。

0
下载
关闭预览

相关内容

基于UNet的医学图像分割综述
专知会员服务
38+阅读 · 2023年8月8日
【ICML2023】SEGA:结构熵引导的图对比学习锚视图
专知会员服务
23+阅读 · 2023年5月10日
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
18+阅读 · 2021年5月3日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
相关VIP内容
基于UNet的医学图像分割综述
专知会员服务
38+阅读 · 2023年8月8日
【ICML2023】SEGA:结构熵引导的图对比学习锚视图
专知会员服务
23+阅读 · 2023年5月10日
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
18+阅读 · 2021年5月3日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员