Variational autoencoders (VAEs) have recently been shown to be vulnerable to adversarial attacks, wherein they are fooled into reconstructing a chosen target image. However, how to defend against such attacks remains an open problem. We make significant advances in addressing this issue by introducing methods for producing adversarially robust VAEs. Namely, we first demonstrate that methods proposed to obtain disentangled latent representations produce VAEs that are more robust to these attacks. However, this robustness comes at the cost of reducing the quality of the reconstructions. We ameliorate this by applying disentangling methods to hierarchical VAEs. The resulting models produce high-fidelity autoencoders that are also adversarially robust. We confirm their capabilities on several different datasets and with current state-of-the-art VAE adversarial attacks, and also show that they increase the robustness of downstream tasks to attack.


翻译:最近发现,变化式自动电解器(VAE)很容易受到对抗性攻击,他们被骗来重建选定的目标图像。然而,如何防范这种攻击仍然是一个尚未解决的问题。我们通过采用产生对抗性强的VAEs的方法,在解决这一问题上取得了显著进展。我们首先表明,为获得分解的潜伏表示而提出的方法产生了对这些攻击更为强大的VAE。然而,这种稳健性是以降低重建质量为代价的。我们通过对等级为VAEs采用脱钩的方法改进了这一点。由此产生的模型产生了高度不洁性自动电解器,这些自动电解器也具有很强的对抗性。我们确认它们在若干不同的数据集上的能力,以及目前VAE对抗性攻击的状态。我们还表明,它们提高了下游攻击任务的强度。

0
下载
关闭预览

相关内容

专知会员服务
24+阅读 · 2021年1月21日
vae 相关论文 表示学习 1
CreateAMind
12+阅读 · 2018年9月6日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
VIP会员
Top
微信扫码咨询专知VIP会员