GAN猫的脸

2017 年 7 月 8 日 机械鸡 雷特

文章作者为Alexia，统计学和机器学习研究员。目前在 Jewish General 总医院担任生化统计学家（在医院工作的统计学家或数据科学家的一个花哨的称号）。

△一只喵看到GAN生成自己时的反应

Alexia尝试使用生成对抗网络（GAN）生成猫的脸，同时以高低不等的分辨率尝试DCGAN，WGAN和WGAN-GP。利用CAT数据集作为训练数据。这个数据集有1万张猫的照片。我把图像放在小猫脸上，我去除了异常值（肉眼观察，花费了几个小时...）。最终，生成了 9304 张分辨率大于 64×64 的图像以及 6445 张分辨率大于128×128 的图像。

▍DCGAN

DCGAN生成器在约2-3小时内就能汇集到非常逼真的图像，只需209次训练，但是对于适当的汇集需要一些恰当的调整。你必须为D和G规划单独的学习率，以便G或D不会比前者更好，一旦平衡，你就很容易融合！使用64 x 64的图像，最佳选择是使用.00005作为鉴别器学习率，而.0002用于生成学习率。没有明显的mode collapse，最终得到真正可爱的猫咪照片！

▍高分辨率DCGAN和SELU

我初步尝试用DCGAN生成128 x 128的猫图像都失败了。然而，仅仅通过更换一批归一化和ReLUs与SELUs，我还是像以前一样很慢（6+小时），但有稳定的汇集与相当的学习速率。SELU是自标准化的，因此不需要批量归一化。SELU是非常新的，所以对具有GAN的SELU研究不多，但是通过我的观察，它们似乎大大增加了GAN的稳定性。

猫不像以前那样好看，并且有明显的品种偏差（大量的类似脸孔的黑猫）。这主要是由于样本大小为N = 6445而不是N = 9304（我只对大于128×128的图像进行了训练）。

▍WGAN

WGAN生成器汇集速度非常慢（花费4-5小时，600多次训练），只有使用64个隐藏节点时才会汇集。我无法使发生器与128个隐藏节点汇聚。使用DCGAN，你必须调整学习率，但如果不会汇集，则可以快速查看（如果D的损失为0，或者如果G的损失在开始时为0），但是在WGAN中需要让它运行多次训练。

在视觉上，这里有一些相当惊人的mode collapse; 许多猫有异色，一只眼闭着，一只眼睛睁着，或是鼻子很奇怪。总体而言，结果并不如DCGAN那样令人印象深刻，但是因为神经网络不那么复杂，所以这可能不是一个公平的比较。它也似乎陷入了局部最佳状态。到目前为止，WGAN令人失望。

WGAN-GP可能可以处理这些问题。在Gulrajani等人的论文中（2017），他们能够训练一个101层神经网络来制作图片！所以我怀疑，训练一个有5层和128个隐藏节点的猫生成器将会面临很大的问题。

Adam优化器具有降低mode collapse的风险，并陷入到一个糟糕的局部最优（REF）。这可能有助于解决WGAN的问题，因为它不使用Adam，而DCGAN和WGAN-GP都使用它。

▍WGAN-GP（改进的WGAN）

WGAN-GP生成器收敛速度非常慢（超过6个小时），没啥办法做任何设置。它开箱即用，无需任何调整。你可以增加或减少学习率，而不会造成许多问题。所以WGAN-GP真的让人感动到哭。

猫千变万化，没有明显的mode collapse，所以这是对WGAN的一个重大改进。另一方面，猫外表类似，就像你正在看高不等分辨率图片一样。这可能是Wasserstein loss的特点。我认为使用不同的学习率和体系结构将有所帮助。如果进一步的尝试，肯定有很大的潜力。

▍LSGAN（最小二乘GAN）

LSGAN是一种略显不同的方法，我们尝试最小化鉴别器输出与其分配标签之间的平方距离; Hejlm等人的论文建议使用：在生成器更新 1为真实图像，0为假图像，然后在生成器中更新1为假图像。建议使用：在鉴别器更新1为真实图像，0为假图像，让.50为假图像在生成器更新来寻求边界。

我没有时间做一些完整的运行，但它似乎总体相当稳定，并能够输出漂亮的猫。虽然一般情况下很稳定，但有一次，损失和梯度崩溃了。

以下是31次和32次训练：

所以这不是完全稳定的，它有时真的很糟糕。为Adam优化器选择更好的超参数将有助于防止这种情况。你不需要像DCGAN那样调整学习率，但如果不崩溃（这可能很少见），似乎会生成看起来很漂亮的猫。

另外：LSGAN的第一作者Xudong Mao给我发了一张128×128的LSGAN生成猫的例子，表明这种方法可以创造出像DCGAN一样同等质量的猫。

GitHub：http://t.cn/RKh9Cs7

Paper：https://arxiv.org/pdf/1702.08431.pdf

数据集：http://t.cn/RKUOuJO

原文：https://ajolicoeur.wordpress.com/cats/

作者：Alexia

整理：雷特

★推荐阅读★

吴恩达：机器学习模型能比医生更精确诊断心律失常（paper）

收藏 ‖ 神经网络架构图（附Paper）

详解谷歌发布的跨领域通用模型MultiModel

岛国新技术，可去掉马赛克还原照片

干货 ‖ 入门数据科学的65个免费资源

招聘志愿者

希望你有稳定输出的时间，英文能力佳，从业者优先。

加入「AI从业者社群」请备注个人信息

添加小鸡微信 liulailiuwang

登录查看更多

相关内容

DCGAN

关注 12

相较原始的GAN，DCGAN几乎完全使用了卷积层代替全链接层，判别器几乎是和生成器对称的，整个网络没有pooling层和上采样层的存在，实际上是使用了带步长（fractional-strided）的卷积代替了上采样，以增加训练的稳定性

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

196+阅读 · 2020年5月14日

【伯克利】最新《生成式对抗网络》技术综述课程，257页ppt带你学习GAN进展

专知会员服务

193+阅读 · 2020年5月3日

生成式对抗网络GAN在计算机视觉中的应用概述，GANs in computer vision: Introduction to generative learning（part1）

专知会员服务

63+阅读 · 2020年4月19日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

专知会员服务

28+阅读 · 2020年2月18日

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

专知会员服务

148+阅读 · 2019年12月28日

【书籍】深度学习框架：PyTorch入门与实践（附代码）

专知会员服务

167+阅读 · 2019年10月28日

生成式对抗网络GAN异常检测

专知会员服务

118+阅读 · 2019年10月13日

TF - GAN入门：TensorFlow 2.0 的轻量级 GAN 库

新智元

5+阅读 · 2019年10月8日

关于GAN的灵魂七问

大数据文摘

4+阅读 · 2019年4月27日

万字综述之生成对抗网络（GAN）

PaperWeekly

43+阅读 · 2019年3月19日

【干货】GAN最新进展：8大技巧提高稳定性

GAN生成式对抗网络

31+阅读 · 2019年2月12日

GAN最新进展：8大技巧提高稳定性

新智元

7+阅读 · 2019年2月12日

业界 | GAN生成的假脸太逼真了！别怕，十招教你识别AI生成的假图像

大数据文摘

15+阅读 · 2018年12月18日

SRGAN论文笔记

统计学习与视觉计算组

109+阅读 · 2018年4月12日

GAN | GAN介绍（2）

中国科学院网络数据重点实验室

44+阅读 · 2017年8月4日

干货｜生成对抗网络（GAN）之MNIST数据生成

全球人工智能

7+阅读 · 2017年7月24日

深度神经网络生成模型：从 GAN VAE 到 CVAE-GAN

AI100

11+阅读 · 2017年7月20日

Seeing What a GAN Cannot Generate

Arxiv

8+阅读 · 2019年10月24日

Social-BiGAT: Multimodal Trajectory Forecasting using Bicycle-GAN and Graph Attention Networks

Arxiv

6+阅读 · 2019年7月17日

Learning Heuristics over Large Graphs via Deep Reinforcement Learning

Arxiv

12+阅读 · 2019年3月8日

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

Arxiv

5+阅读 · 2018年12月15日

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Localization Recall Precision (LRP): A New Performance Metric for Object Detection

Arxiv

4+阅读 · 2018年7月4日

GANE: A Generative Adversarial Network Embedding

Arxiv

5+阅读 · 2018年5月21日

Fictitious GAN: Training GANs with Historical Models

Arxiv

4+阅读 · 2018年3月23日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

VIP会员