The rapid increase in the number of Computed Tomography (CT) scan examinations has created an urgent need for automated tools, such as organ segmentation, anomaly classification, and report generation, to assist radiologists with their growing workload. Multi-label classification of Three-Dimensional (3D) CT scans is a challenging task due to the volumetric nature of the data and the variety of anomalies to be detected. Existing deep learning methods based on Convolutional Neural Networks (CNNs) struggle to capture long-range dependencies effectively, while Vision Transformers require extensive pre-training, posing challenges for practical use. Additionally, these existing methods do not explicitly model the radiologist's navigational behavior while scrolling through CT scan slices, which requires both global context understanding and local detail awareness. In this study, we present CT-Scroll, a novel global-local attention model specifically designed to emulate the scrolling behavior of radiologists during the analysis of 3D CT scans. Our approach is evaluated on two public datasets, demonstrating its efficacy through comprehensive experiments and an ablation study that highlights the contribution of each model component.


翻译:计算机断层扫描(CT)检查数量的快速增长催生了对于自动化工具的迫切需求,例如器官分割、异常分类与报告生成,以协助放射科医师应对日益增长的工作负荷。三维CT扫描的多标签分类是一项具有挑战性的任务,这源于数据的体积特性以及待检测异常的多样性。现有的基于卷积神经网络(CNN)的深度学习方法难以有效捕获长程依赖关系,而视觉Transformer模型则需要大量预训练,这给实际应用带来了挑战。此外,现有方法未能明确建模放射科医师在滚动浏览CT扫描切片时的导航行为,该行为要求同时具备全局上下文理解能力和局部细节感知能力。在本研究中,我们提出了CT-Scroll,一种新颖的全局-局部注意力模型,专门设计用于模拟放射科医师在分析三维CT扫描时的滚动浏览行为。我们在两个公开数据集上评估了所提出的方法,通过全面的实验和消融研究证明了其有效性,并突出了各模型组件的贡献。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员