Machine learning models are vulnerable to membership inference attack, which can be used to determine whether a given sample appears in the training data. Most existing methods assume the attacker has full access to the features of the target sample. This assumption, however, does not hold in many real-world scenarios where only partial features are available, thereby limiting the applicability of these methods. In this work, we introduce Partial Feature Membership Inference (PFMI), a scenario where the adversary observes only partial features of each sample and aims to infer whether this observed subset was present in the training set. To address this problem, we propose MRAD (Memory-guided Reconstruction and Anomaly Detection), a two-stage attack framework that works in both white-box and black-box settings. In the first stage, MRAD leverages the latent memory of the target model to reconstruct the unknown features of the sample. We observe that when the known features are absent from the training set, the reconstructed sample deviates significantly from the true data distribution. Consequently, in the second stage, we use anomaly detection algorithms to measure the deviation between the reconstructed sample and the training data distribution, thereby determining whether the known features belong to a member of the training set. Empirical results demonstrate that MRAD is effective across various datasets, and maintains compatibility with off-the-shelf anomaly detection techniques. For example, on STL-10, our attack exceeds an AUC of around 0.75 even with 60% of the missing features.


翻译:机器学习模型容易受到成员推理攻击,这种攻击可用于判断给定样本是否出现在训练数据中。现有方法大多假设攻击者能够完全获取目标样本的所有特征。然而,这一假设在许多现实场景中并不成立,因为攻击者往往只能获取部分特征,从而限制了这些方法的适用性。本文提出部分特征成员推理(PFMI)场景,即攻击者仅能观测到每个样本的部分特征,并试图推断该观测子集是否曾出现在训练集中。为解决此问题,我们提出MRAD(记忆引导重建与异常检测),一种适用于白盒与黑盒设置的两阶段攻击框架。在第一阶段,MRAD利用目标模型的潜在记忆重建样本的未知特征。我们发现,当已知特征未出现在训练集中时,重建样本会显著偏离真实数据分布。因此,在第二阶段,我们采用异常检测算法度量重建样本与训练数据分布之间的偏差,从而判断已知特征是否属于训练集成员。实验结果表明,MRAD在多种数据集上均表现有效,且与现有异常检测技术保持兼容。例如在STL-10数据集上,即使缺失60%的特征,本攻击的AUC仍能超过约0.75。

0
下载
关闭预览

相关内容

【ECCV2024】边缘感知Transformer的场景文本分割
专知会员服务
15+阅读 · 2024年7月25日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
22+阅读 · 2021年4月20日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 12月24日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员