The rapid growth of medical knowledge and increasing complexity of clinical practice pose challenges. In this context, large language models (LLMs) have demonstrated value; however, inherent limitations remain. Retrieval-augmented generation (RAG) technologies show potential to enhance their clinical applicability. This study reviewed RAG applications in medicine. We found that research primarily relied on publicly available data, with limited application in private data. For retrieval, approaches commonly relied on English-centric embedding models, while LLMs were mostly generic, with limited use of medical-specific LLMs. For evaluation, automated metrics evaluated generation quality and task performance, whereas human evaluation focused on accuracy, completeness, relevance, and fluency, with insufficient attention to bias and safety. RAG applications were concentrated on question answering, report generation, text summarization, and information extraction. Overall, medical RAG remains at an early stage, requiring advances in clinical validation, cross-linguistic adaptation, and support for low-resource settings to enable trustworthy and responsible global use.


翻译:医学知识的快速增长与临床实践的日益复杂化带来了诸多挑战。在此背景下,大型语言模型(LLMs)已展现出其价值,但仍存在固有局限。检索增强生成(RAG)技术显示出提升其临床适用性的潜力。本研究综述了RAG在医学领域的应用。我们发现,相关研究主要依赖公开可用数据,在私有数据中的应用有限。在检索方面,方法普遍依赖以英语为中心的嵌入模型,而使用的LLMs多为通用模型,医学专用LLMs的应用较少。在评估方面,自动指标用于评估生成质量与任务性能,而人工评估则侧重于准确性、完整性、相关性与流畅性,对偏见与安全性的关注不足。RAG应用主要集中在问答、报告生成、文本摘要和信息抽取任务上。总体而言,医学RAG仍处于早期阶段,需要在临床验证、跨语言适应以及对低资源环境的支持方面取得进展,以实现可信且负责任的全球应用。

0
下载
关闭预览

相关内容

【CVPR2024】医学基础模型的低秩知识分解
专知会员服务
35+阅读 · 2024年4月29日
论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks
开放知识图谱
14+阅读 · 2020年4月8日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员