反事实解释旨在确定输入实例中所需的最小且有意义的变化,以产生与给定模型不同的预测。 反事实解释可以帮助用户理解模型的当前预测,检测模型不公正,并为收到不希望预测的用户提供可操作的建议。因此,反事实解释在教育、金融、市场营销和医疗保健等领域有着多样的应用。 反事实解释问题被构建为一个受约束的优化问题,其目标是在满足某些约束的情况下最小化输入和反事实解释之间的成本。现有研究主要集中在两个领域:纳入实际约束和引入各种解决方法。然而,反事实解释距离实际部署还很远。在本论文中,我们从信任、可操作性和安全性的角度改进了这个问题,使反事实解释更易于部署。 反事实解释的一个目标是从模型中寻求行动建议。然而,常用的模型,如集成模型和神经网络,是黑盒子,信任度较低。解释模型可以提高模型的信任度。然而,全局解释过于笼统,无法适用于所有实例,而逐一检查所有局部解释也是一种负担。因此,我们提出了一种群体级汇总方法,该方法找到 k 个群组,每个群组通过特征重要性矩阵中不同的前-l 个重要特征进行汇总。这种方法提供了一个紧凑的总结,使模型更易于理解和检查。 在现实生活应用中,使用标量成本函数比较异构特征中的变化是困难的。此外,现有方法不支持用户的交互式探索。为了解决这些问题,我们提出了一种天际线方法,将每个不可比较特征的变化视为一个最小化目标,并找到一组非支配的反事实解释。用户可以从这个非支配集中交互式地细化他们的要求。我们的实验表明,我们的方法与最先进的方法相比提供了更优越的结果。 对于希望部署反事实解释服务的模型所有者来说,模型的安全性和隐私性是关键的考虑因素。然而,这些问题在文献中尚未受到太多关注。为了弥补这一差距,我们提出了一种高效且有效的攻击方法,可以通过反事实解释(CFs)提取预训练模型。具体来说,我们的方法将 CFs 视为寻找反事实解释的反事实解释(CCFs)的常见查询,然后使用 CFs 和 CCFs 对的配对训练替代模型。实验表明,我们的方法可以获得具有更高一致性的替代模型。 总之,我们的研究有助于弥合理论理解与反事实解释实际应用之间的研究差距,并为各个领域的研究人员和从业者提供宝贵的见解。

成为VIP会员查看完整内容
27

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【ETH博士论文】基于离散优化的学习,193页pdf
专知会员服务
40+阅读 · 2023年9月17日
【MIT博士论文】保证性生成模型,155页pdf
专知会员服务
29+阅读 · 2023年8月8日
【CMU博士论文】可解释机器学习方法与应用,127页pdf
专知会员服务
72+阅读 · 2023年6月6日
【MIT博士论文】序列决策中的算法公平性,134页pdf
专知会员服务
23+阅读 · 2023年5月20日
【MIT博士论文】机器学习中的稀疏性:理论与应用,122页pdf
【MIT博士论文】数据高效强化学习,176页pdf
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
131+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
324+阅读 · 2023年3月31日
Arxiv
53+阅读 · 2023年3月26日
Arxiv
111+阅读 · 2023年3月24日
Arxiv
14+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【ETH博士论文】基于离散优化的学习,193页pdf
专知会员服务
40+阅读 · 2023年9月17日
【MIT博士论文】保证性生成模型,155页pdf
专知会员服务
29+阅读 · 2023年8月8日
【CMU博士论文】可解释机器学习方法与应用,127页pdf
专知会员服务
72+阅读 · 2023年6月6日
【MIT博士论文】序列决策中的算法公平性,134页pdf
专知会员服务
23+阅读 · 2023年5月20日
【MIT博士论文】机器学习中的稀疏性:理论与应用,122页pdf
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
相关论文
微信扫码咨询专知VIP会员