业界 | GAN生成的假脸太逼真了！别怕，十招教你识别AI生成的假图像

2018 年 12 月 18 日 大数据文摘

大数据文摘出品

编译：张秋玥、蒋宝尚

你能看出上面两张图片，哪张是真的，哪张是假的么？文摘菌是分不出来，太像了！

这种以假乱真的图片生成技术来源于一种左右互博术—生成对抗网络（GAN）。

这一概念由机器学习研究者Ian Goodfellow在2014年提出。之所以叫“生成”是因为该模型的输出为图像一类的信息，而非与输入数据相关的预测值（比如“该图像是否是根热狗”的预测）；“对抗网络”则是因为该模型使用两组猫鼠游戏一般相互竞争的神经网络，就像收银员和伪造者斗智斗勇一样：一方试图欺骗另一方认为它拿的真实钞票，而另一方则试图区分钞票的真伪。

其实，最开始的那一批生成对抗网络（GAN）图像很容易就能被发现不是真实照片。

比如2014年的这些图片：

Radford等，2014，无监督代表学习与深度卷积生成对抗网络（也被缩写为DCGAN）

但2017年10月发布的最新GAN生成图像就不那么好区分了：

Karras等，2017，改进质量、稳定性与变化程度的GAN网络（也被缩写为PGAN或ProGAN）

如何识别出GAN生成的图像？应该着重强调面部的问题，因为绝大多数研究者们都是使用人脸图像来进行试验的，并且许多人脸图像中会出现的问题经常也会在其他类型图像中出现。

以下是识别虚假图像的几个要点：

看似画笔涂上的直发

长发很容易出现这种超级直的效果——只有一小把的话看起来其实还挺好的，但一大把直发看起来就像是有人用画刀或者大笔刷涂了一把丙烯酸颜料上去一样。

难以辨认的文字

训练于生成人脸的GAN模型不太能够抓住背景中的复杂结构。此外，GAN模型同时显示训练数据的原始与镜像版本，这意味着他们不太能够抓住文字的特征因为它一般只在单一方向出现。

超现实风格背景

GAN模型生成人脸很可信的一个原因就是，所有的训练数据都被归一化了。这意味着，当涉及到例如眼睛与耳朵的位置与渲染问题时，GAN模型的可变度会很小。另一方面，背景则可以包含任何内容了。对于GAN模型来说，模拟出一个像样的背景实在有些过分了——他们最终一般就复制出一般性的纹理样背景，而非“真实”场景。

不对称性

GAN模型有时很难处理图像中的长距离依赖性。尽管在训练数据中耳环一类的配饰通常都是成对出现，生成图像中通常并非如此。还有这种情况：人眼通常看向同一方向并呈现相同颜色，但生成图像中的眼睛经常是对对眼，还可以是异瞳色呢。高度或大小非常不匹配的耳朵也是一种常见的不对称性。

奇怪的牙齿

GAN模型能够胜任生成一般性的场景，但目前为止它还不太能够搞定半规则重复细节问题，比如牙齿。有时GAN模型会产生错位牙齿，或者以很奇怪的方式拉伸或收缩单个牙齿。这个问题在其他领域也出现过，比如砖类图像的纹理合成问题。

凌乱的头发

这是识别GAN生成图像最快方法之一。通常情况下，GAN会让头发看起来盘曲打结，在肩膀周围随机形成一缕一缕的发束，并在额头上留下厚厚的杂散毛发。发型可以非常多变，还可以拥有许多细节，因此它是最难以用GAN捕捉的特征之一。非毛发类物体有时甚至可以被变成头发状纹理。

安能辨我是雄雌

这个GAN模型是在CelebA数据集的一个子集上训练的，其中包含约一万个名人的20万张人脸图像。在这个数据集中，我没有见到有谁有面部毛发，耳环或者化妆；但GAN模型还是经常分不清不同性别特征。更一般地说，我觉得这是因为GAN模型并不总是学习人类社会所强调的二元论（比如这里的“非男即女”）。

半规则噪声

有些本应当为单色的区域可能会出现具有水平或垂直条带的半规则噪声。在本例中，可能是因为模型在试图模仿布料的质地。旧一点的GAN模型一般噪声模式更明显，我们称之为“棋盘效应”（Checkerboard Artifacts）。

棋盘效应：

https://distill.pub/2016/deconv-checkerboard/

染色问题

一些颜色较浅并且为纯色的区域可能会出现多色调染色问题，比如衣领、脖子与眼白（未在本例出现）。

真实图像的例子

看看这些清晰的背景文字，对称的耳环，大小相同的牙齿以及细节丰富的发型。学习完以上这些小技巧后你可以试试玩一些小游戏，来看你是不是真的能够区分真假图片啦。

游戏：http://nikola.mit.edu/experiment

相关内容

GAN

关注 90

GAN：生成性对抗网，深度学习模型的一种，在神经网络模型中引入竞争机制，非常流行。

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

194+阅读 · 2020年5月14日

【伯克利】最新《生成式对抗网络》技术综述课程，257页ppt带你学习GAN进展

专知会员服务

182+阅读 · 2020年5月3日

【中科院自动化所】视觉对抗样本生成技术概述

专知会员服务

35+阅读 · 2020年4月15日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

28+阅读 · 2020年4月6日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

26+阅读 · 2020年4月6日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

28+阅读 · 2020年3月26日

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

专知会员服务

13+阅读 · 2020年3月8日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

31+阅读 · 2020年1月10日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

51+阅读 · 2020年1月8日

【浙江大学】对抗样本生成技术综述

专知会员服务

89+阅读 · 2020年1月6日

GAN零基础入门：从伪造视频到生成假脸

新智元

13+阅读 · 2019年6月18日

能生成逼真图像的不只有 GAN

机器学习算法与Python学习

8+阅读 · 2019年6月6日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

【GAN货】用神经网络生成音乐

专知

13+阅读 · 2018年9月15日

CMU论文解读：基于GAN和VAE的跨模态图像生成

PaperWeekly

9+阅读 · 2018年8月20日

【学界】生成式对抗网络：从生成数据到创造智能

GAN生成式对抗网络

6+阅读 · 2018年6月14日

Ian Goodfellow推荐：GAN生成模特照片媲美真人

新智元

8+阅读 · 2017年10月16日

手把手 | 生成式对抗网络（GAN）之MNIST数据生成

数说工作室

10+阅读 · 2017年7月31日

干货｜生成对抗网络（GAN）之MNIST数据生成

全球人工智能

6+阅读 · 2017年7月24日

GAN猫的脸

机械鸡

11+阅读 · 2017年7月8日

Generating Fact Checking Explanations

Arxiv

9+阅读 · 2020年4月13日

Co-Generation with GANs using AIS based HMC

Arxiv

3+阅读 · 2019年10月31日

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

Arxiv

4+阅读 · 2018年12月15日

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

Arxiv

11+阅读 · 2018年12月8日

ClusterGAN : Latent Space Clustering in Generative Adversarial Networks

Arxiv

9+阅读 · 2018年9月10日

High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

Arxiv

3+阅读 · 2018年8月20日

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

GANE: A Generative Adversarial Network Embedding

Arxiv

4+阅读 · 2018年5月21日

Mask-aware Photorealistic Face Attribute Manipulation

Arxiv

5+阅读 · 2018年4月24日

VIP会员