Generating medical reports from chest X-ray images is a critical and time-consuming task for radiologists, especially in emergencies. To alleviate the stress on radiologists and reduce the risk of misdiagnosis, numerous research efforts have been dedicated to automatic medical report generation in recent years. Most recent studies have developed methods that represent images by utilizing various medical metadata, such as the clinical document history of the current patient and the medical graphs constructed from retrieved reports of other similar patients. However, all existing methods integrate additional metadata representations with visual representations through a simple "Add and LayerNorm" operation, which suffers from the information asymmetry problem due to the distinct distributions between them. In addition, chest X-ray images are usually represented using pre-trained models based on natural domain images, which exhibit an obvious domain gap between general and medical domain images. To this end, we propose a novel approach called Enhanced Image Representations (EIR) for generating accurate chest X-ray reports. We utilize cross-modal transformers to fuse metadata representations with image representations, thereby effectively addressing the information asymmetry problem between them, and we leverage medical domain pre-trained models to encode medical images, effectively bridging the domain gap for image representation. Experimental results on the widely used MIMIC and Open-I datasets demonstrate the effectiveness of our proposed method.


翻译:从胸部X光图像生成医学报告是放射科医生一项关键且耗时的任务,尤其在紧急情况下。为减轻放射科医生的压力并降低误诊风险,近年来已有大量研究致力于自动医学报告生成。大多数近期研究开发的方法通过利用各种医学元数据来表示图像,例如当前患者的临床文档历史记录以及从检索到的其他类似患者报告中构建的医学图谱。然而,所有现有方法均通过简单的“相加与层归一化”操作将额外元数据表示与视觉表示进行整合,由于两者分布差异显著,这种方法存在信息不对称问题。此外,胸部X光图像通常使用基于自然领域图像预训练的模型进行表示,这导致通用领域图像与医学领域图像之间存在明显的领域差异。为此,我们提出了一种称为增强图像表示(EIR)的新方法,用于生成准确的胸部X光报告。我们利用跨模态Transformer融合元数据表示与图像表示,从而有效解决两者间的信息不对称问题;同时采用医学领域预训练模型对医学图像进行编码,有效弥合了图像表示中的领域差异。在广泛使用的MIMIC和Open-I数据集上的实验结果验证了我们所提方法的有效性。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员