深度学习已经彻底改变了科学研究,并被用于在越来越复杂的场景中做出决策。随着强大的能力的增长,对透明度和可解释性的需求也在增长。可解释人工智能领域旨在为AI系统的预测提供解释。然而,AI可解释性的最新进展远未令人满意。

例如,在计算机视觉中,最著名的事后解释方法生成像素级的热图,覆盖在输入域上,旨在可视化图像或视频的单个像素的重要性。我们认为,这种密集的归因图对非专家用户来说解释性较差,因为解释形成的领域——我们可能在热图中识别出形状,但它们只是像素的斑点。事实上,输入域更接近于数码相机的原始数据,而不是人类用来交流的可解释结构,例如物体或概念。

在这篇论文中,我们提出超越密集特征归因,通过采用结构化内部表示作为更可解释的解释域。从概念上讲,我们的方法将深度学习模型分为两部分:感知步骤,输入密集表示;推理步骤,学习执行手头任务。两者之间的接口是对应于明确定义的物体、实体和概念的结构化表示。这些表示作为解释模型预测的可解释域,使我们能够朝着更有意义和信息丰富的解释迈进。

提出的方法引入了几个挑战,比如如何获得结构化表示,如何将它们用于下游任务,以及如何评估结果解释。本论文包含的工作解决了这些问题,验证了方法并为该领域提供了具体贡献。在感知步骤中,我们探讨了如何从密集表示中获得结构化表示,无论是通过使用领域知识手动设计它们,还是通过无监督地从数据中学习它们。在推理步骤中,我们探讨了如何将结构化表示用于从生物学到计算机视觉的下游任务,以及如何评估学到的表示。在解释步骤中,我们探讨了如何解释在结构化域中运作的模型的预测,以及如何评估结果解释。总的来说,我们希望这项工作能激发对可解释AI的进一步研究,并帮助弥合高性能深度学习模型与现实世界应用中对透明度和可解释性需求之间的差距。

人工智能系统在商业、科学和社会的各个领域得到了广泛应用。特别是由于性能的快速提升,深度学习模型现在能够在复杂场景中支持甚至取代人类专家。然而,强大的能力伴随着巨大的责任,人工智能(AI)的日益普及引发了对透明度和可解释性的增长需求。确实,使用高精度检测癌症很有用,但AI医生必须能够向患者解释其诊断,并与其他医生合作。同样,一家公司可能开发了一个用于自动驾驶的杰出系统,但在公共道路上部署之前,需要说服监管机构其行为是安全且可预测的。 透明度、解释和可解释性是可解释人工智能(XAI)的重点。尽管在理解深度学习模型和解释其决策方面取得了重大进展,但XAI的最新状态远未令人满意。例如,计算机视觉中最著名的解释方法产生的热图被叠加到图像或视频上,以突出重要区域。我们称之为密集特征归因的这种可视化类型,对模型识别什么(纹理、部分、物体等)和如何推理(属性、关系等)提供的洞察很少。我们将这种局限性归因于解释形成的领域。实际上,对于大多数深度学习模型,解释域与输入域相对应,它更接近于感官数据(例如原始像素),而不是人类用于推理和交流的可解释结构(例如物体或概念)。 本论文的目标是超越密集特征归因,转而采用结构化表示作为更可解释的解释域。我们通过分离感知步骤(将密集输入转换为结构化表示)和推理步骤(使用结构化表示进行预测)来实现这一目标。这种分离使我们能够就结构化表示解释预测,这比密集输入更具可解释性。 在这个引言章节中,我们对我们的方法进行了背景阐述:第1.1节提供了可解释人工智能的介绍,包括其概念和需求;第1.2节描述了表示方法,无论是密集的还是结构化的,在解释深度学习模型中的作用。最后,第1.3节对提出的方法进行了正式阐述,并概述了本论文各章节中的发展情况。

成为VIP会员查看完整内容
64

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【博士论文】最优传输图表示学习,204页pdf
专知会员服务
42+阅读 · 2023年10月25日
【MIT博士论文】量子计算中的人工智能前景, 253页pdf
专知会员服务
41+阅读 · 2023年8月23日
【CMU博士论文】迈向高效自动机器学习,184页pdf
专知会员服务
30+阅读 · 2023年2月24日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
【MIT博士论文】数据高效强化学习,176页pdf
最新《图嵌入组合优化》综述论文,40页pdf
【KDD2020】图神经网络:基础与应用,322页ppt
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Arxiv
131+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
324+阅读 · 2023年3月31日
Arxiv
111+阅读 · 2023年3月24日
Arxiv
14+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【博士论文】最优传输图表示学习,204页pdf
专知会员服务
42+阅读 · 2023年10月25日
【MIT博士论文】量子计算中的人工智能前景, 253页pdf
专知会员服务
41+阅读 · 2023年8月23日
【CMU博士论文】迈向高效自动机器学习,184页pdf
专知会员服务
30+阅读 · 2023年2月24日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员