Electronic Health Records (EHRs) contain extensive patient information that can inform downstream clinical decisions, such as mortality prediction, disease phenotyping, and disease onset prediction. A key challenge in EHR data analysis is the temporal gap between when a condition is first recorded and its actual onset time. Such timeline misalignment can lead to artificially distinct biomarker trends among patients with similar disease progression, undermining the reliability of downstream analyses and complicating tasks such as disease subtyping and outcome prediction. To address this challenge, we provide a subtype-aware timeline registration method that leverages data projection and discrete optimization to correct timeline misalignment. Through simulation and real-world data analyses, we demonstrate that the proposed method effectively aligns distorted observed records with the true disease progression patterns, enhancing subtyping clarity and improving performance in downstream clinical analyses.


翻译:电子健康记录(EHRs)包含大量患者信息,可为下游临床决策(如死亡率预测、疾病表型分析及疾病发作预测)提供依据。EHR数据分析的一个关键挑战在于疾病首次记录时间与实际发病时间之间存在的时间差。这种时间轴错位可能导致具有相似疾病进展的患者之间出现人为差异的生物标志物趋势,从而削弱下游分析的可靠性,并使疾病亚型分型和结局预测等任务复杂化。为解决这一问题,我们提出一种亚型感知的时间轴对齐方法,该方法利用数据投影与离散优化技术来校正时间轴错位。通过模拟数据与真实世界数据分析,我们证明所提方法能有效将失真的观测记录与真实的疾病进展模式对齐,从而提升亚型分型的清晰度并改善下游临床分析性能。

0
下载
关闭预览

相关内容

【AAAI2025】TimeDP:通过领域提示学习生成多领域时间序列
专知会员服务
41+阅读 · 2021年6月19日
【ICML 2020 】小样本学习即领域迁移
专知会员服务
78+阅读 · 2020年6月26日
专知会员服务
112+阅读 · 2020年6月26日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关VIP内容
【AAAI2025】TimeDP:通过领域提示学习生成多领域时间序列
专知会员服务
41+阅读 · 2021年6月19日
【ICML 2020 】小样本学习即领域迁移
专知会员服务
78+阅读 · 2020年6月26日
专知会员服务
112+阅读 · 2020年6月26日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员