Reliable estimation of feature contributions in machine learning models is essential for trust, transparency and regulatory compliance, especially when models are proprietary or otherwise operate as black boxes. While permutation-based methods are a standard tool for this task, classical implementations rely on repeated random permutations, introducing computational overhead and stochastic instability. In this paper, we show that by replacing multiple random permutations with a single, deterministic, and optimal permutation, we achieve a method that retains the core principles of permutation-based importance while being non-random, faster, and more stable. We validate this approach across nearly 200 scenarios, including real-world household finance and credit risk applications, demonstrating improved bias-variance tradeoffs and accuracy in challenging regimes such as small sample sizes, high dimensionality, and low signal-to-noise ratios. Finally, we introduce Systemic Variable Importance, a natural extension designed for model stress-testing that explicitly accounts for feature correlations. This framework provides a transparent way to quantify how shocks or perturbations propagate through correlated inputs, revealing dependencies that standard variable importance measures miss. Two real-world case studies demonstrate how this metric can be used to audit models for hidden reliance on protected attributes (e.g., gender or race), enabling regulators and practitioners to assess fairness and systemic risk in a principled and computationally efficient manner.


翻译:机器学习模型中特征贡献的可靠估计对于信任、透明度和监管合规至关重要,尤其当模型是专有的或以黑箱形式运行时。虽然基于置换的方法是完成此任务的标准工具,但经典实现依赖于重复的随机置换,引入了计算开销和随机不稳定性。本文证明,通过用单个确定性的最优置换替代多次随机置换,我们获得了一种方法,该方法保留了基于置换的重要性评估的核心原则,同时具备非随机性、更快速和更稳定的特点。我们在近200种场景中验证了该方法,包括现实世界的家庭金融和信用风险应用,证明了在小样本量、高维度和低信噪比等挑战性情况下改进的偏差-方差权衡与准确性。最后,我们引入了系统性变量重要性,这是一种专为模型压力测试设计的自然扩展,明确考虑了特征相关性。该框架提供了一种透明的方式来量化冲击或扰动如何通过相关输入传播,揭示了标准变量重要性度量所遗漏的依赖关系。两个现实案例研究展示了如何使用该指标审计模型对受保护属性(如性别或种族)的隐藏依赖,使监管者和从业者能够以原则化且计算高效的方式评估公平性和系统性风险。

0
下载
关闭预览

相关内容

图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
论文笔记之Feature Selective Networks for Object Detection
统计学习与视觉计算组
21+阅读 · 2018年7月26日
CosFace: Large Margin Cosine Loss for Deep Face Recognition论文笔记
统计学习与视觉计算组
44+阅读 · 2018年4月25日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关资讯
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
论文笔记之Feature Selective Networks for Object Detection
统计学习与视觉计算组
21+阅读 · 2018年7月26日
CosFace: Large Margin Cosine Loss for Deep Face Recognition论文笔记
统计学习与视觉计算组
44+阅读 · 2018年4月25日
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员