Whole-slide images (WSIs) are an important data modality in computational pathology, yet their gigapixel resolution and lack of fine-grained annotations challenge conventional deep learning models. Multiple instance learning (MIL) offers a solution by treating each WSI as a bag of patch-level instances, but effectively modeling ultra-long sequences with rich spatial context remains difficult. Recently, Mamba has emerged as a promising alternative for long sequence learning, scaling linearly to thousands of tokens. However, despite its efficiency, it still suffers from limited spatial context modeling and memory decay, constraining its effectiveness to WSI analysis. To address these limitations, we propose MambaMIL+, a new MIL framework that explicitly integrates spatial context while maintaining long-range dependency modeling without memory forgetting. Specifically, MambaMIL+ introduces 1) overlapping scanning, which restructures the patch sequence to embed spatial continuity and instance correlations; 2) a selective stripe position encoder (S2PE) that encodes positional information while mitigating the biases of fixed scanning orders; and 3) a contextual token selection (CTS) mechanism, which leverages supervisory knowledge to dynamically enlarge the contextual memory for stable long-range modeling. Extensive experiments on 20 benchmarks across diagnostic classification, molecular prediction, and survival analysis demonstrate that MambaMIL+ consistently achieves state-of-the-art performance under three feature extractors (ResNet-50, PLIP, and CONCH), highlighting its effectiveness and robustness for large-scale computational pathology


翻译:全切片图像(WSI)是计算病理学中的重要数据模态,但其千兆像素分辨率及缺乏细粒度标注对传统深度学习模型构成挑战。多示例学习(MIL)通过将每张WSI视为一组补丁级实例提供解决方案,但对具有丰富空间上下文的超长序列进行有效建模仍存在困难。近期,Mamba作为一种有前景的长序列学习替代方案出现,可线性扩展至数千个标记。然而,尽管其效率高,仍受限于空间上下文建模能力不足和记忆衰减问题,制约了其在WSI分析中的有效性。为应对这些局限,我们提出MambaMIL+,一种新型MIL框架,在保持长程依赖建模且无记忆遗忘的同时,显式整合空间上下文。具体而言,MambaMIL+引入:1)重叠扫描策略,通过重构补丁序列嵌入空间连续性与实例关联性;2)选择性条纹位置编码器(S2PE),在编码位置信息的同时缓解固定扫描顺序的偏差;3)上下文标记选择(CTS)机制,利用监督知识动态扩展上下文记忆以实现稳定的长程建模。在涵盖诊断分类、分子预测和生存分析的20个基准数据集上的大量实验表明,MambaMIL+在三种特征提取器(ResNet-50、PLIP和CONCH)下均持续取得最先进的性能,凸显了其在大规模计算病理学任务中的有效性与鲁棒性。

0
下载
关闭预览

相关内容

【KDD2022】GraphMAE:自监督掩码图自编码器
专知会员服务
23+阅读 · 2022年6月12日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员