对抗样本论文 - 专知

会员服务 ·

对抗样本

对抗样本由Christian Szegedy等人提出，是指在数据集中通过故意添加细微的干扰所形成的输入样本，导致模型以高置信度给出一个错误的输出。在正则化背景下，通过对抗训练减少原有独立同分布的测试集的错误率——在对抗扰动的训练集样本上训练网络。对抗样本是指通过在数据中故意添加细微的扰动生成的一种输入样本，能够导致神经网络模型给出一个错误的预测结果。实质：对抗样本是通过向输入中加入人类难以察觉的扰动生成，能够改变人工智能模型的行为。其基本目标有两个，一是改变模型的预测结果；二是加入到输入中的扰动在人类看起来不足以引起模型预测结果的改变，具有表面上的无害性。对抗样本的相关研究对自动驾驶、智能家居等应用场景具有非常重要的意义。

CLIP is Strong Enough to Fight Back: Test-time Counterattacks towards Zero-shot Adversarial Robustness of CLIP

Arxiv

0+阅读 · 3月5日

Generating Realistic, Diverse, and Fault-Revealing Inputs with Latent Space Interpolation for Testing Deep Neural Networks

Arxiv

0+阅读 · 3月22日

Exploring Transferability of Multimodal Adversarial Samples for Vision-Language Pre-training Models with Contrastive Learning

Arxiv

0+阅读 · 1月12日

AFD: Mitigating Feature Gap for Adversarial Robustness by Feature Disentanglement

Arxiv

1+阅读 · 2024年12月10日

NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples

Arxiv

0+阅读 · 2024年10月22日

NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples

Arxiv

0+阅读 · 2024年10月18日

New Paradigm of Adversarial Training: Breaking Inherent Trade-Off between Accuracy and Robustness via Dummy Classes

Arxiv

0+阅读 · 2024年10月16日

MsMemoryGAN: A Multi-scale Memory GAN for Palm-vein Adversarial Purification

Arxiv

0+阅读 · 2024年8月20日

On the Robustness of Malware Detectors to Adversarial Samples

Arxiv

0+阅读 · 2024年8月5日

Exploring Transferability of Multimodal Adversarial Samples for Vision-Language Pre-training Models with Contrastive Learning

Arxiv

0+阅读 · 2024年7月22日

Neural Codec-based Adversarial Sample Detection for Speaker Verification

Arxiv

0+阅读 · 2024年6月7日

One Perturbation is Enough: On Generating Universal Adversarial Perturbations against Vision-Language Pre-training Models

Arxiv

0+阅读 · 2024年6月8日

Improving the Adversarial Robustness for Speaker Verification by Self-Supervised Learning

Arxiv

0+阅读 · 2024年6月5日

Breaking Free: How to Hack Safety Guardrails in Black-Box Diffusion Models!

Arxiv

0+阅读 · 2024年5月23日

Exploring Frequencies via Feature Mixing and Meta-Learning for Improving Adversarial Transferability

Arxiv

0+阅读 · 2024年5月6日

参考链接

微信扫码咨询专知VIP会员