Timely diagnosis of Intracranial hemorrhage (ICH) on Computed Tomography (CT) scans remains a clinical priority, yet the development of robust Artificial Intelligence (AI) solutions is still hindered by fragmented public data. To close this gap, we introduce Hemorica, a publicly available collection of 372 head CT examinations acquired between 2012 and 2024. Each scan has been exhaustively annotated for five ICH subtypes-epidural (EPH), subdural (SDH), subarachnoid (SAH), intraparenchymal (IPH), and intraventricular (IVH)-yielding patient-wise and slice-wise classification labels, subtype-specific bounding boxes, two-dimensional pixel masks and three-dimensional voxel masks. A double-reading workflow, preceded by a pilot consensus phase and supported by neurosurgeon adjudication, maintained low inter-rater variability. Comprehensive statistical analysis confirms the clinical realism of the dataset. To establish reference baselines, standard convolutional and transformer architectures were fine-tuned for binary slice classification and hemorrhage segmentation. With only minimal fine-tuning, lightweight models such as MobileViT-XS achieved an F1 score of 87.8% in binary classification, whereas a U-Net with a DenseNet161 encoder reached a Dice score of 85.5% for binary lesion segmentation that validate both the quality of the annotations and the sufficiency of the sample size. Hemorica therefore offers a unified, fine-grained benchmark that supports multi-task and curriculum learning, facilitates transfer to larger but weakly labelled cohorts, and facilitates the process of designing an AI-based assistant for ICH detection and quantification systems.


翻译:颅内出血(ICH)在计算机断层扫描(CT)上的及时诊断仍是临床优先任务,但稳健人工智能(AI)解决方案的开发仍受限于零散的公开数据。为弥补这一缺口,我们推出Hemorica,这是一个公开可用的数据集,包含2012年至2024年间采集的372例头部CT检查。每例扫描均针对五种ICH亚型——硬膜外出血(EPH)、硬膜下出血(SDH)、蛛网膜下腔出血(SAH)、脑实质内出血(IPH)和脑室内出血(IVH)——进行了详尽标注,提供了患者层面和切片层面的分类标签、亚型特异性边界框、二维像素掩码和三维体素掩码。通过先导共识阶段及神经外科医师仲裁支持的双重阅片流程,保持了较低的评估者间差异。全面的统计分析证实了数据集的临床真实性。为建立参考基线,我们对标准卷积和Transformer架构进行了微调,用于二分类切片分类和出血分割。仅经最小程度微调,轻量级模型如MobileViT-XS在二分类中实现了87.8%的F1分数,而采用DenseNet161编码器的U-Net在二分类病灶分割中达到了85.5%的Dice分数,这验证了标注质量和样本量的充分性。因此,Hemorica提供了一个统一、细粒度的基准,支持多任务和课程学习,促进向规模更大但弱标注队列的迁移,并有助于设计基于AI的ICH检测与量化系统辅助工具。

0
下载
关闭预览

相关内容

OpenAI GPT 4.5 报告 (中英文版)
专知会员服务
40+阅读 · 3月1日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员