Addressing the challenge of multimodal data fusion in high-dimensional biomedical informatics, we propose MMCTOP, a MultiModal Clinical-Trial Outcome Prediction framework that integrates heterogeneous biomedical signals spanning (i) molecular structure representations, (ii) protocol metadata and long-form eligibility narratives, and (iii) disease ontologies. MMCTOP couples schema-guided textualization and input-fidelity validation with modality-aware representation learning, in which domain-specific encoders generate aligned embeddings that are fused by a transformer backbone augmented with a drug-disease-conditioned sparse Mixture-of-Experts (SMoE). This design explicitly supports specialization across therapeutic and design subspaces while maintaining scalable computation through top-k routing. MMCTOP achieves consistent improvements in precision, F1, and AUC over unimodal and multimodal baselines on benchmark datasets, and ablations show that schema-guided textualization and selective expert routing contribute materially to performance and stability. We additionally apply temperature scaling to obtain calibrated probabilities, ensuring reliable risk estimation for downstream decision support. Overall, MMCTOP advances multimodal trial modeling by combining controlled narrative normalization, context-conditioned expert fusion, and operational safeguards aimed at auditability and reproducibility in biomedical informatics.


翻译:针对高维生物医学信息学中多模态数据融合的挑战,我们提出了MMCTOP,一种多模态临床试验结果预测框架,该框架整合了涵盖以下方面的异构生物医学信号:(i) 分子结构表征,(ii) 方案元数据和长篇资格叙述,以及(iii) 疾病本体。MMCTOP将模式引导的文本化与输入保真度验证,以及模态感知的表征学习相结合。在该框架中,领域特定的编码器生成对齐的嵌入表示,这些表示由一个通过药物-疾病条件稀疏专家混合模块增强的Transformer主干网络进行融合。该设计明确支持跨治疗和设计子空间的专门化,同时通过top-k路由保持可扩展的计算。在基准数据集上,MMCTOP在精确率、F1分数和AUC方面相较于单模态和多模态基线模型均取得了一致的提升,消融实验表明模式引导的文本化和选择性专家路由对性能和稳定性有实质性贡献。我们还应用了温度缩放来获得校准的概率,确保为下游决策支持提供可靠的风险估计。总体而言,MMCTOP通过结合受控的叙述规范化、上下文条件化的专家融合以及旨在实现生物医学信息学可审计性和可重复性的操作保障,推进了多模态试验建模。

0
下载
关闭预览

相关内容

图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关资讯
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员