对抗样本由Christian Szegedy等人提出,是指在数据集中通过故意添加细微的干扰所形成的输入样本,导致模型以高置信度给出一个错误的输出。在正则化背景下,通过对抗训练减少原有独立同分布的测试集的错误率——在对抗扰动的训练集样本上训练网络。 对抗样本是指通过在数据中故意添加细微的扰动生成的一种输入样本,能够导致神经网络模型给出一个错误的预测结果。 实质:对抗样本是通过向输入中加入人类难以察觉的扰动生成,能够改变人工智能模型的行为。其基本目标有两个,一是改变模型的预测结果;二是加入到输入中的扰动在人类看起来不足以引起模型预测结果的改变,具有表面上的无害性。对抗样本的相关研究对自动驾驶、智能家居等应用场景具有非常重要的意义。
深度学习为何不鲁棒?万字长文综述对抗鲁棒性
极市平台
3+阅读 · 2022年11月6日
一文梳理基于梯度的黑盒迁移对抗攻击研究进展
Fisher信息量检测对抗样本代码详解
PaperWeekly
0+阅读 · 2022年7月3日
腾讯AI Lab披露可信AI研究进展,解读20余项原创工作
腾讯AI实验室
2+阅读 · 2022年4月6日
AAAI 2022 | 全身涂装式对抗纹理迷彩生成框架FCA
PaperWeekly
1+阅读 · 2022年4月2日
微信扫码咨询专知VIP会员