忽悠AI图像识别系统的新方法：随机复制并粘贴

会员服务 ·

忽悠AI图像识别系统的新方法：随机复制并粘贴

2018 年 9 月 18 日 雷锋网

▲点击上方雷锋网关注

文 | 图普科技编辑 | 杨晓凡

来自雷锋网（leiphone-sz）的报道

雷锋网 AI 科技评论按：本文由「图普科技」编译自AI image recognition systems can be tricked by copying and pasting random objects

你并不总是需要构建复杂的算法来扰乱图像识别系统——你只要在随机位置添加对象就行了。

大多数情况下，可以用对抗模型更改一些像素以扭曲图像，从而使目标识别出现错误。一些例子包括用一张小贴纸让香蕉图像秒变烤面包机，或戴傻眼镜忽悠面部识别系统。乌龟被误认为是一支步枪的经典案例证明了欺骗人工智能是一件多么容易的事情。

然而，约克大学和加拿大多伦多大学的研究人员现已证实，将物体图像复制并粘贴到原图像中，就可以误导神经网络，无需耍任何花招。

目标移植

他们利用 Tensorflow 物体识别 API 中的模型进行了一系列实验。Tensorflow 物体识别 API 是一个由 Google 工程师构建的开源框架，用于执行图像识别任务。该 API 是构建在 TensorFlow 代码之上的另一层，描述了卷积神经网络的架构。

研究人员从某张图像中获取一个对象并将其添加到另一图像的不同位置，然后将这些图片输入到 API 中。arXiv 在发表的论文中将此技术称为「目标移植（object transplanting）」。

在第一个例子中，研究人员在一名男性坐在其起居室的图像中添加了一张大象的图像。该模型在不同目标周边输出了一系列彩色边界框，并计算了不同目标识别结果的可能性。它识别出目标是一名人类和笔记本电脑的可能性为99％，椅子为81％，手提袋为67％，书籍和杯子为50％。

到目前为止该模型的表现还不错。但当将大象的图片添加到同一图像中时，模型识别开始出现混乱。当大象图片被粘贴在红色窗帘上时，模型对于图中椅子的识别突然变得不那么自信了，评级从81％下降到了76％，但它对于桌面上有一个杯子的可能性从50％增加到了54％。

更奇怪的是，当大象图片被直接复制并粘贴在人的头顶上时，它被识别为椅子。当将动物的图片粘贴在场景中的不同位置时，它只在两个地方被正确识别：当它被放置在笔记本电脑和书柜的顶部时。

当大象的图片粘贴在场景中的不同位置时，API难以正常识别。在许多情况下，它完全无法识别。

图片来源：Rosenfeld等。

尽管如此，但该API仍可能正确识别物体，因为很少出现大象与一些客厅中的常见物品混在一起的图像。“神经网络从未见过两个不同类别物体在同一图片中组合，我们不可能指望神经网络能够在测试时成功处理这类图像”该论文写道。

但该测试并不是一个不公平的测试，它凸显了神经网络的脆弱性，他们无法轻松适应不在其训练数据内的新图像。研究人员写道：“我们认为要求不同物体类别在训练集中成对出现是不合理的，无论是在实践还是理论层面。”

人工智能很难识别重复图像

当该研究团队复制图像中已有的目标对象时，API仍然难以识别。

该模型可以毫不费力地从原图片中挑选出在显示器前面的键盘上躺着的猫。然而，当在图片上再添加一张该猫的照片，并重新调整使它看起来像是直接放在第一只猫后面时，猫的脚掌被识别为狗，键盘的一角被识别为一本书。

该团队用不同的图像重复进行了实验，结果牛头成了马，棒球棍成了笔记本电脑，手提包成了杯子 - 你现在明白了吧。

添加图像中已有的相同对象也具有相同的效果。图片来源：Rosenfeld等。

该论文解释说，从不属于真正目标区域内的像素中获取的特征会使图像中的物体变得混乱。“对于目标感兴趣区域ROI内部的像素以及ROI之外的像素，都是如此。”

这是所有图像分类模型都面临的难题。它们都是通过给定区域上一系列像素的特征来识别对象，但这意味着来自其他对象的像素可以与之重叠，从而使它们混淆。

研究人员将此问题称为“局部遮挡”。“局部遮挡被普遍认为是物体检测面临的一大挑战。成功解决局部遮挡问题将是实现泛化的好兆头。”

“这里生成的图像可以看作是对抗样本的一种变体，其中一些小图像带来的干扰（人类难以察觉）会导致神经网络的输出结果出现大幅度变化，”该论文总结道。

- END -

雷锋网大招募开始了！如果你对人工智能、大数据、云计算、自动驾驶等前沿科技感兴趣，对采编、运营、品牌等职位感兴趣，请猛戳 招聘启事

◆ ◆ ◆

相关内容

图普科技

关注 0

图普科技

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

专知会员服务

113+阅读 · 2020年6月13日

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

专知会员服务

62+阅读 · 2020年5月15日

【Facebook AI】自监督学习在计算机视觉应用最新概述，108页ppt Self-supervised learning

专知会员服务

160+阅读 · 2020年4月19日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

28+阅读 · 2020年4月6日

自回归模型:PixelCNN

专知会员服务

25+阅读 · 2020年3月21日

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

专知会员服务

23+阅读 · 2020年2月22日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

182+阅读 · 2020年2月22日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

31+阅读 · 2020年1月10日

【浙江大学】对抗样本生成技术综述

专知会员服务

89+阅读 · 2020年1月6日

【NeurlPS2019论文总结】它是这样的:用于可解释图像识别的深度学习，This Looks Like That: Deep Learning for Interpretable Image Recognition

专知会员服务

21+阅读 · 2019年12月17日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

22+阅读 · 2019年6月28日

一张贴纸欺骗AI，对抗性补丁让人类隐身，监控摄像危险了！

新智元

5+阅读 · 2019年4月24日

业界 | GAN生成的假脸太逼真了！别怕，十招教你识别AI生成的假图像

大数据文摘

15+阅读 · 2018年12月18日

【学界】毫秒级图像去噪！英伟达、MIT新AI系统完美去水印

GAN生成式对抗网络

8+阅读 · 2018年7月17日

【学界】继图像识别后，图像标注系统也被对抗样本攻陷!

GAN生成式对抗网络

6+阅读 · 2017年12月11日

学界 | 继图像识别后，图像标注系统也被对抗样本攻陷!

机器之心

11+阅读 · 2017年12月10日

盘点2017年度AI领域大事件

大数据文摘

5+阅读 · 2017年12月9日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

别磨叽，学完这篇你也是图像识别专家了

AI100

6+阅读 · 2017年6月24日

图像识别 | 道路识别的自动驾驶算法基本原理

沈浩老师

6+阅读 · 2017年5月12日

Learning to See Through Obstructions

Arxiv

7+阅读 · 2020年4月2日

Directions for Explainable Knowledge-Enabled Systems

Arxiv

26+阅读 · 2020年3月17日

Summit: Scaling Deep Learning Interpretability by Visualizing Activation and Attribution Summarizations

Arxiv

4+阅读 · 2019年9月2日

Challenges in Building Intelligent Open-domain Dialog Systems

Arxiv

21+阅读 · 2019年5月13日

SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition

Arxiv

7+阅读 · 2019年4月18日

What's in a Name? Reducing Bias in Bios without Access to Protected Attributes

Arxiv

3+阅读 · 2019年4月10日

DeepFakes: a New Threat to Face Recognition? Assessment and Detection

Arxiv

5+阅读 · 2018年12月20日

Meta-Learning: A Survey

Arxiv

135+阅读 · 2018年10月8日

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Arxiv

6+阅读 · 2018年3月21日

Evorus: A Crowd-powered Conversational Assistant Built to Automate Itself Over Time

Arxiv

6+阅读 · 2018年1月10日

VIP会员