【深度】无需数学背景!谷歌研究员为你解密生成式对抗网络

2018 年 5 月 20 日 GAN生成式对抗网络


来源:Towards Data Science

作者:Stefan Hosein

来源:雷克世界


大家都知道,自从生成式对抗网络(GAN)出现以来,便在图像处理方面有着广泛的应用。但还是有很多人对于GAN不是很了解,担心由于没有数学知识底蕴而学不会GAN。在本文中,谷歌研究员Stefan Hosein提供了一份初学者入门GAN的教程,在这份教程中,即使你没有拥有深厚的数学知识,你也能够了解什么是生成式对抗网络(GAN)。


类比


理解GAN的一个最为简单的方法是通过一个简单的比喻:


假设有一家商店,店主要从顾客那里购买某些种类的葡萄酒,然后再将这些葡萄酒销售出去。



然而,有些可恶的顾客为了赚取金钱而出售假酒。在这种情况下,店主必须能够区分假酒和正宗的葡萄酒。



你可以想象,在最初的时候,伪造者在试图出售假酒时可能会犯很多错误,并且店主很容易就会发现该酒不是正宗的葡萄酒。经历过这些失败之后,伪造者会继续尝试使用不同的技术来模拟真正的葡萄酒,而有些方法最终会取得成功。现在,伪造者知道某些技术已经能够躲过店主的检查,那么他就可以开始进一步对基于这些技术的假酒进行改善提升。


与此同时,店主可能会从其他店主或葡萄酒专家那里得到一些反馈,说明她所拥有的一些葡萄酒并不是原装的。这意味着店主必须改进她的判别方式,从而确定葡萄酒是伪造的还是正宗的。伪造者的目标是制造出与正宗葡萄酒无法区分的葡萄酒,而店主的目标是准确地分辨葡萄酒是否是正宗的。


可以这样说,这种循环往复的竞争正是GAN背后的主要思想。


生成式对抗网络的组成部分


通过上面的例子,我们可以提出一个GAN的体系结构。



GAN中有两个主要的组成部分:生成器和鉴别器。在上面我们所描述的例子中,店主被称为鉴别器网络,通常是一个卷积神经网络(因为GAN主要用于图像任务),主要是分配图像是真实的概率。


伪造者被称为生成式网络,并且通常也是一个卷积神经网络(具有解卷积层,deconvolution layers)。该网络接收一些噪声向量并输出一个图像。当对生成式网络进行训练时,它会学习可以对图像的哪些区域进行改进/更改,以便鉴别器将难以将其生成的图像与真实图像区分开来。


生成式网络不断地生成与真实图像更为接近的图像,而与此同时,鉴别式网络则试图确定真实图像和假图像之间的差异。最终的目标就是建立一个生成式网络,它可以生成与真实图像无法区分的图像。


用Keras编写一个简单的生成式对抗网络


现在,你已经了解什么是GAN,以及它们的主要组成部分,那么现在我们可以开始试着编写一个非常简单的代码。你可以使用Keras,如果你不熟悉这个Python库的话,则应在继续进行操作之前阅读本教程。本教程基于易于理解的GAN进行开发的。


首先,你需要做的第一件事是通过pip安装以下软件包:


- keras

- matplotlib

- tensorflow

- tqdm


你将使用matplotlib绘图,tensorflow作为Keras后端库和tqdm,以显示每个轮数(迭代)的花式进度条。


下一步是创建一个Python脚本,在这个脚本中,你首先需要导入你将要使用的所有模块和函数。在使用它们时将给出每个解释。


        import os

import numpy as np

import matplotlib.pyplot as plt

from tqdm import tqdm

from keras.layers import Input

from keras.models import Model, Sequential

from keras.layers.core import Dense, Dropout

from keras.layers.advanced_activations import LeakyReLU

from keras.datasets import mnist

from keras.optimizers import Adam

from keras import initializers


你现在需要设置一些变量:


# Let Keras know that we are using tensorflow as our backend engine

os.environ["KERAS_BACKEND"] = "tensorflow"

# To make sure that we can reproduce the experiment and get the same results

np.random.seed(10)

# The dimension of our random noise vector.

random_dim = 100


在开始构建鉴别器和生成器之前,你首先应该收集数据,并对其进行预处理。你将会使用到常见的MNIST数据集,该数据集具有一组从0到9的单个数字图像。


MINST数字样本


def load_minst_data():

    # load the data

    (x_train, y_train), (x_test, y_test) = mnist.load_data()

    # normalize our inputs to be in the range[-1, 1] 

    x_train = (x_train.astype(np.float32) - 127.5)/127.5

    # convert x_train with a shape of (60000, 28, 28) to (60000, 784) so we have

    # 784 columns per row

    x_train = x_train.reshape(60000, 784)

    return (x_train, y_train, x_test, y_test)


需要注意的是,mnist.load_data()是Keras的一部分,这使得你可以轻松地将MNIST数据集导入至工作区域中。


现在,你可以开始创建你的生成器和鉴别器网络了。在这一过程中,你会使用到Adam优化器。此外,你还需要创建一个带有三个隐藏层的神经网络,其激活函数为Leaky Relu。对于鉴别器而言,你需要为其添加dropout层(dropout layers),以提高对未知图像的鲁棒性。


def get_optimizer():

    return Adam(lr=0.0002, beta_1=0.5) 


def get_generator(optimizer):

    generator = Sequential()

    generator.add(Dense(256, input_dim=random_dim, kernel_initializer=initializers.RandomNormal(stddev=0.02)))

    generator.add(LeakyReLU(0.2))


    generator.add(Dense(512))

    generator.add(LeakyReLU(0.2))


    generator.add(Dense(1024))

    generator.add(LeakyReLU(0.2))


    generator.add(Dense(784, activation='tanh'))

    generator.compile(loss='binary_crossentropy', optimizer=optimizer)

    return generator


def get_discriminator(optimizer):

    discriminator = Sequential()

    discriminator.add(Dense(1024, input_dim=784, kernel_initializer=initializers.RandomNormal(stddev=0.02)))

    discriminator.add(LeakyReLU(0.2))

    discriminator.add(Dropout(0.3))


    discriminator.add(Dense(512))

    discriminator.add(LeakyReLU(0.2))

    discriminator.add(Dropout(0.3))


    discriminator.add(Dense(256))

    discriminator.add(LeakyReLU(0.2))

    discriminator.add(Dropout(0.3))


    discriminator.add(Dense(1, activation='sigmoid'))

    discriminator.compile(loss='binary_crossentropy', optimizer=optimizer)

    return discriminator


接下来,则需要将发生器和鉴别器组合在一起!


def get_gan_network(discriminator, random_dim, generator, optimizer):

    # We initially set trainable to False since we only want to train either the 

    # generator or discriminator at a time

    discriminator.trainable = False

    # gan input (noise) will be 100-dimensional vectors

    gan_input = Input(shape=(random_dim,))

    # the output of the generator (an image)

    x = generator(gan_input)

    # get the output of the discriminator (probability if the image is real or not)

    gan_output = discriminator(x)

    gan = Model(inputs=gan_input, outputs=gan_output)

    gan.compile(loss='binary_crossentropy', optimizer=optimizer)

    return gan


为了完整起见,你还可以创建一个函数,使其每训练20个轮数就对生成的图像进行1次保存。由于这不是本次课程的核心内容,因此你不必完全理解该函数。


def plot_generated_images(epoch, generator, examples=100, dim=(10, 10), figsize=(10, 10)):

    noise = np.random.normal(0, 1, size=[examples, random_dim])

    generated_images = generator.predict(noise)

    generated_images = generated_images.reshape(examples, 28, 28)


    plt.figure(figsize=figsize)

    for i in range(generated_images.shape[0]):

        plt.subplot(dim[0], dim[1], i+1)

        plt.imshow(generated_images[i], interpolation='nearest', cmap='gray_r')

        plt.axis('off')

    plt.tight_layout()

    plt.savefig('gan_generated_image_epoch_%d.png' % epoch)


你现在已经编码了大部分网络,剩下的就是训练这个网络,并查看你创建的图像。


def train(epochs=1, batch_size=128):

    # Get the training and testing data

    x_train, y_train, x_test, y_test = load_minst_data()

    # Split the training data into batches of size 128

    batch_count = x_train.shape[0] / batch_size


    # Build our GAN netowrk

    adam = get_optimizer()

    generator = get_generator(adam)

    discriminator = get_discriminator(adam)

    gan = get_gan_network(discriminator, random_dim, generator, adam)


    for e in xrange(1, epochs+1):

        print '-'*15, 'Epoch %d' % e, '-'*15

        for _ in tqdm(xrange(batch_count)):

            # Get a random set of input noise and images

            noise = np.random.normal(0, 1, size=[batch_size, random_dim])

            image_batch = x_train[np.random.randint(0, x_train.shape[0], size=batch_size)]


            # Generate fake MNIST images

            generated_images = generator.predict(noise)

            X = np.concatenate([image_batch, generated_images])


            # Labels for generated and real data

            y_dis = np.zeros(2*batch_size)

            # One-sided label smoothing

            y_dis[:batch_size] = 0.9


            # Train discriminator

            discriminator.trainable = True

            discriminator.train_on_batch(X, y_dis)


            # Train generator

            noise = np.random.normal(0, 1, size=[batch_size, random_dim])

            y_gen = np.ones(batch_size)

            discriminator.trainable = False

            gan.train_on_batch(noise, y_gen)


        if e == 1 or e % 20 == 0:

            plot_generated_images(e, generator)


if __name__ == '__main__':

    train(400, 128)


在训练400个轮数后,你可以查看生成的图像。在查看经过1个轮数训练后而生成的图像时,你会发现它没有任何真实结构,在查看经过40个轮数训练后而生成的图像时,你会发现数字开始成形,最后,在查看经过400个轮数训练后而生成的图像时,你会发现,除了一组数字难以辨识外,其余大多数数字都清晰可见。




训练1个轮数后的结果(上)| 训练40个轮数后的结果(中) | 训练400个轮数后的结果(下)


此代码在CPU上运行一次大约需要2分钟,这也是我们选择该代码的主要原因。你可以尝试进行更多轮数的训练,并向生成器和鉴别器中添加更多数量(种类)的层。当然,在仅使用CPU的前提下,采用更复杂和更深层的体系结构时,相应的代码运行时间也会有所延长。但也不要因此放弃尝试。


至此,你已经完成了全部的学习任务,你以一种直观的方式学习了生成式对抗网络(GAN)的基础知识!并且,你还在Keras库的协助下实现了你的第一个模型。

高质量延伸阅读

【学界】OpenPV:中科院研究人员建立开源的平行视觉研究平台

【征稿通知】IEEE IV 2018“智能车辆中的平行视觉”研讨会

【学界】基于平行视觉的特定场景下行人检测

【征稿】神经计算专刊Virtual Images for Visual Artificial Intelligence

【学界】ParallelEye:面向交通视觉研究构建的大规模虚拟图像集

【CFP】Virtual Images for Visual Artificial Intelligence

【最详尽的GAN介绍】王飞跃等:生成式对抗网络 GAN 的研究进展与展望

【智能自动化学科前沿讲习班第1期】王飞跃教授:生成式对抗网络GAN的研究进展与展望

【智能自动化学科前沿讲习班第1期】王坤峰副研究员:GAN与平行视觉

【重磅】平行将成为一种常态:从SimGAN获得CVPR 2017最佳论文奖说起

【平行讲坛】平行图像:图像生成的一个新型理论框架

【深度】Mobileye RSS理论模型:把人类驾驶常识总结为数学模型,教会每一辆无人车

【学界】MIT提出使用「深度强化学习」帮助智能体在运动中做出「动作决策」

【深度】谷歌TPU 3.0到底厉害在哪里?

【学界】哈尔滨工业大学教授:左旺孟——GAN的应用与拓展

【深度】Nature再发DeepMind研究:AI复现大脑网格细胞模拟导航!

登录查看更多
1

相关内容

GAN:生成性对抗网,深度学习模型的一种,在神经网络模型中引入竞争机制,非常流行。
最新《生成式对抗网络》简介,25页ppt
专知会员服务
168+阅读 · 2020年6月28日
专知会员服务
107+阅读 · 2020年5月21日
【浙江大学】对抗样本生成技术综述
专知会员服务
89+阅读 · 2020年1月6日
深度学习算法与架构回顾
专知会员服务
77+阅读 · 2019年10月20日
GANs最新综述论文: 生成式对抗网络及其变种如何有用
专知会员服务
70+阅读 · 2019年10月19日
能生成逼真图像的不只有 GAN
机器学习算法与Python学习
8+阅读 · 2019年6月6日
入门 | 从VGG到NASNet,一文概览图像分类网络
机器之心
6+阅读 · 2018年4月2日
生成式对抗网络(GAN)如何快速理解?
炼数成金订阅号
4+阅读 · 2018年1月9日
深度图像先验:无需学习即可生成新图像
论智
45+阅读 · 2017年12月4日
深入浅出介绍:GAN的基本原理与入门应用!
全球人工智能
14+阅读 · 2017年10月23日
深入浅出:GAN原理与应用入门介绍
深度学习世界
6+阅读 · 2017年8月23日
【原理】十个生成模型(GANs)的最佳案例和原理 | 代码+论文
GAN生成式对抗网络
8+阅读 · 2017年8月14日
Arxiv
4+阅读 · 2018年5月21日
Arxiv
15+阅读 · 2018年4月5日
Arxiv
10+阅读 · 2018年3月23日
Arxiv
3+阅读 · 2017年11月21日
VIP会员
相关资讯
能生成逼真图像的不只有 GAN
机器学习算法与Python学习
8+阅读 · 2019年6月6日
入门 | 从VGG到NASNet,一文概览图像分类网络
机器之心
6+阅读 · 2018年4月2日
生成式对抗网络(GAN)如何快速理解?
炼数成金订阅号
4+阅读 · 2018年1月9日
深度图像先验:无需学习即可生成新图像
论智
45+阅读 · 2017年12月4日
深入浅出介绍:GAN的基本原理与入门应用!
全球人工智能
14+阅读 · 2017年10月23日
深入浅出:GAN原理与应用入门介绍
深度学习世界
6+阅读 · 2017年8月23日
【原理】十个生成模型(GANs)的最佳案例和原理 | 代码+论文
GAN生成式对抗网络
8+阅读 · 2017年8月14日
Top
微信扫码咨询专知VIP会员