电子健康记录(EHR)采用的扩大为临床护理和研究中数据驱动算法的应用提供了更多机会。有效进行多机构EHR研究的主要瓶颈在于各系统之间数据的异质性,存在大量的编码,这些编码要么不存在,要么在不同机构中代表不同的临床概念。数据隐私的需求进一步限制了包含多机构患者层级数据的可行性,这些数据对于研究不同患者子群体之间的相似性和差异性是必要的。为了解决这些挑战,我们开发了GAME算法。经过7个机构和2种语言的测试和验证,GAME在多个层次上集成数据: (1) 在机构层面,通过知识图谱建立编码与现有知识来源之间的关系,为标准编码及其相互关系提供医学背景; (2) 在机构之间,利用语言模型确定机构特定编码与已建立标准编码之间的关系;(3) 使用图注意力网络量化编码之间关系的强度。通过迁移学习和联邦学习共同训练嵌入,旨在保护数据隐私。在本研究中,我们展示了GAME在选择相关特征作为AI驱动算法输入方面的适用性,适用于多种疾病,如心力衰竭、类风湿性关节炎。接着,我们突出了GAME统一的多机构EHR数据在阿尔茨海默病结果研究和精神健康障碍患者自杀风险研究中的应用,且无需在个别机构外分享患者层级数据。总之,GAME算法推动了多机构EHR研究的可行性,提供了一种方法用于在临床研究和护理中实现高维数据驱动算法所需的编码转换和统一。此外,我们展示了GAME嵌入中保留了识别和研究患者子群体所需的宝贵临床信息,为跨机构合作研究提供了一种替代方案,避免了将患者层级数据共享到机构外。

成为VIP会员查看完整内容
14

相关内容

表示学习是通过利用训练数据来学习得到向量表示,这可以克服人工方法的局限性。 表示学习通常可分为两大类,无监督和有监督表示学习。大多数无监督表示学习方法利用自动编码器(如去噪自动编码器和稀疏自动编码器等)中的隐变量作为表示。 目前出现的变分自动编码器能够更好的容忍噪声和异常值。 然而,推断给定数据的潜在结构几乎是不可能的。 目前有一些近似推断的策略。 此外,一些无监督表示学习方法旨在近似某种特定的相似性度量。提出了一种无监督的相似性保持表示学习框架,该框架使用矩阵分解来保持成对的DTW相似性。 通过学习保持DTW的shaplets,即在转换后的空间中的欧式距离近似原始数据的真实DTW距离。有监督表示学习方法可以利用数据的标签信息,更好地捕获数据的语义结构。 孪生网络和三元组网络是目前两种比较流行的模型,它们的目标是最大化类别之间的距离并最小化了类别内部的距离。
【MIT博士论文】合成数据的视觉表示学习
专知会员服务
23+阅读 · 2024年8月25日
可解释人工智能中基于梯度的特征归因技术综述
专知会员服务
28+阅读 · 2024年3月20日
因果学习在可信赖推荐系统中的应用综述
专知会员服务
18+阅读 · 2024年2月15日
深度学习在时间序列异常检测中的应用综述
专知会员服务
109+阅读 · 2022年11月11日
鲁棒和隐私保护的协同学习
专知会员服务
37+阅读 · 2021年12月22日
深度学习中的单阶段小目标检测方法综述
专知会员服务
47+阅读 · 2021年11月23日
轻量化神经网络卷积设计研究进展
专知会员服务
57+阅读 · 2021年10月24日
鲁棒模式识别研究进展
专知会员服务
41+阅读 · 2020年8月9日
深度学习目标检测方法综述
专知会员服务
280+阅读 · 2020年8月1日
数据受限条件下的多模态处理技术综述
专知
19+阅读 · 2022年7月16日
时空数据挖掘:综述
专知
31+阅读 · 2022年6月30日
【AI与医学】多模态机器学习精准医疗健康
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
医疗中的自动机器学习和可解释性
专知
24+阅读 · 2019年4月1日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
168+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
453+阅读 · 2023年3月31日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【MIT博士论文】合成数据的视觉表示学习
专知会员服务
23+阅读 · 2024年8月25日
可解释人工智能中基于梯度的特征归因技术综述
专知会员服务
28+阅读 · 2024年3月20日
因果学习在可信赖推荐系统中的应用综述
专知会员服务
18+阅读 · 2024年2月15日
深度学习在时间序列异常检测中的应用综述
专知会员服务
109+阅读 · 2022年11月11日
鲁棒和隐私保护的协同学习
专知会员服务
37+阅读 · 2021年12月22日
深度学习中的单阶段小目标检测方法综述
专知会员服务
47+阅读 · 2021年11月23日
轻量化神经网络卷积设计研究进展
专知会员服务
57+阅读 · 2021年10月24日
鲁棒模式识别研究进展
专知会员服务
41+阅读 · 2020年8月9日
深度学习目标检测方法综述
专知会员服务
280+阅读 · 2020年8月1日
相关资讯
数据受限条件下的多模态处理技术综述
专知
19+阅读 · 2022年7月16日
时空数据挖掘:综述
专知
31+阅读 · 2022年6月30日
【AI与医学】多模态机器学习精准医疗健康
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
医疗中的自动机器学习和可解释性
专知
24+阅读 · 2019年4月1日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员