Nature Medicine | 探索机器学习在医疗应用转化的成功“秘诀”

科研等 2 个话题下的优秀答主

撰文 | 伊凯

责编 | 兮

近年来，机器学习技术，尤其是深度学习，凭借其强大的大数据特征提取与整合能力，在包括生物医学的多个现实领域中得到了越来越广泛的应用。在医疗健康相关的应用上，层出不穷的以卷积神经网络和循环神经网络为主导的各类自动化电子数据分析模型，在如病理状态的识别与分类和诊疗病历的自然语言处理等任务上展现了巨大的潜力。

然而，对数据分析层面的挑战的解决仅仅是一个机器学习模型从实验室走向市场，成为真正能被客户使用的完整解决方案的第一步。由于在模型搭建的初始阶段缺乏除机器学习专家之外的如医疗专家、行政管理人员和政策制定者等相关领域的人员的深度参与，多数机器学习模型最终都难以成功转化为成熟的商品。

2019年8月19日，来自美国密歇根大学和约翰·霍普金斯大学等研究机构的多位在机器学习模型的医疗应用转化方面具有丰富经验的专家在Nature Medicine上发表了题为Do no harm: a roadmap for responsible machinelearning for health care的评论性文章，系统性地描述和整理了一个在医疗健康领域具有广泛应用价值的、负责任的、合乎法理与伦理的成熟机器学习模型在开发过程中的必经之路。

作者认为，对于任何一个试图取得现实成就的机器学习模型来说，首要的特征是对所欲解决之问题的准确定义。机器学习领域中的一个常见困难是缺乏具有完整注释信息的大型数据集，因而研究者常常将注意力放在一些具有充分训练数据支持但临床价值存疑的问题上。另外，由于机器学习模型构建者本身欠缺临床应用相关的理论与经验，往往导致对所利用的数据和得出的统计学结果的真实含义的错误理解。例如在一项机器学习挑战任务中，参与者被要求利用ICU病人的监护信息预测住院死亡率，尽管大多数模型的准确率都高达90%以上，一些模型中却可能出现由临终关怀和病人死亡的直接关联而导致的无意义预测模式。因而，机器学习研究者在对临床医疗问题进行选择和理解时，应该积极征求相关方面专家的意见，从而避免从一开始就误入歧途。

其次，作者提出，在针对所选问题进行数据采集和模型建构时，研究者应该十分注意数据集的有效性和可能存在的各类技术或伦理上的风险。例如，一个特定的单一数据集往往具有很强的代表性偏差，从而导致基于其训练出的机器学习模型的泛化能力较差，轻微的应用环境改变就可能造成模型表现的巨大差异。同时，伦理方面的考量也常常受到技术人员的忽视，这包括人种、阶级和文化方面的数据权重失衡。例如，对手术风险的预测模型所依赖的训练数据往往来源于有经济条件选择进行手术的人群，而这一混杂因素显然影响了其他诸多看似随机且独立的因素，从而对模型可靠性造成负面影响。

另外，在对机器学习模型所给出的预测结果的解读上，研究者应慎重地综合相关临床问题专家的意见作出准确的判断。尽管模型本身的逻辑可解释性并不是必要的，但完全缺乏一个可靠的解释机制也是不可接受的。同时，如果一个模型仅仅对成规模的数据的整体特征具有可解释性，而对个体预测结果没有特异的解读能力，则也可能面临着较大的实际应用困难。总之，一个以走向医疗健康应用市场为最终目的的机器学习模型，应当始终保持模型复杂度、准确性、可解释性的平衡，而不可偏颇。

最后，在关于机器学习模型的布局和走向市场的过程中，作者提出了一系列具有很强现实意义的建议。例如，要评价一个结构完整的临床前机器学习模型的应用价值，必须以由医疗专家参与的随机测试为标准；相比于基于统计分析结果的硬指标，由临床专家进行主观评判的软指标亦具有相当程度的重要性，因为其包含了对相应模型的现实应用价值最直观的判断。

在模型的商业化方面，作者尤其强调了其与相应政策法规存在冲突的可能性。例如，在美国，部分医疗软件和临床诊疗支持系统被政策制定者规定为受到与医疗器材同等的监督力度。因此，研究者搭建的机器学习模型所接受、处理和反馈的信息类别及结果的可解读性都是相当重要的考量因素。若在开发过程中缺乏相关政策专家和行政人员的支持与协助，一个机器学习模型即使具有理论上的极佳表现，也可能无法最终惠及潜在的患者。

总之，作者认为，作为一个方兴未艾的热门领域，指向医疗健康应用的机器学习尽管见证着各类新型理论与模型的涌现，但其对独立于数据分析层面的现实挑战的回应仍存在诸多欠缺。要使得一个机器学习模型从实验室成功走向临床应用的广阔市场，需要包括数据科学家、临床专家、行政管理人员、政策制定者和患者等多方的共同协调参与，任何一个环节的疏漏都不仅可能造成相关模型的应用价值大打折扣，甚至还会产生严重的伦理和法理层面的负面效应。

希波克拉底誓言中对“避免一切堕落害人之败行”的强调是所有利益相关者都应该坚守的底线。

原文链接：https://doi.org/10.1038/s41591-019-0548-6

发布于 2019-12-21 11:22

机器学习

人工智能

医疗

Nature Medicine | 探索机器学习在医疗应用转化的成功“秘诀”

文章被以下专栏收录

BioArt深度