BigGAN被干了！DeepMind发布LOGAN：FID提升32%，华人一作领衔

会员服务 ·

BigGAN被干了！DeepMind发布LOGAN：FID提升32%，华人一作领衔

2019 年 12 月 5 日 量子位

鱼羊发自凹非寺
量子位报道 | 公众号 QbitAI

上看，下看，左看，右看。从各个角度看美食，真是让人越看越饿。

而有个不知道是好消息还是坏消息的事实是：这些食物从未真实存在过。

不错，这是DeepMind最新推出的LOGAN生成的“伪美食图鉴”。

这只GAN初登场就击败了“史上最强”的BigGAN，成为新的state-of-the-art，还把FID和IS分别提高了32%和17%。

什么概念？简而言之，就是LOGAN可以生成更高质量和更多样化的伪照片。

左边是BigGAN（FID/IS：5.04/126.8），右边是LOGAN（FID/IS：5.09/217）。

同样的低FID条件下，LOGAN可比BigGAN靠谱多了。

△左边是BigGAN，右边是LOGAN

而不考虑FID，在相似的高IS条件下，虽然生成的食物都一样真实，且热量爆炸，但显然LOGAN的姿势水平会更加丰富。

并且，DeepMind表示：无需引入任何架构变化或其他参数。

潜在优化

DeepMind采用的方法，是引入了一种受CSGAN启发的潜在优化（latent optimisation）。

首先，让潜在变量z，通过生成器和判别器进行前向传播。

然后，用生成器损失（红色虚线箭头）的梯度来计算改进的z’。

在第二次前向传播中，使用优化后的z’。其后，引入潜在优化计算判别器的梯度。

最后，用这些梯度来更新模型。

这一方法的核心，其实是加强判别器和生成器之间的交互来改善对抗性。

GAN中基于梯度的优化存在的一个重要问题是，判别器和生成器的损失产生的矢量场不是梯度矢量场。因此，不能保证梯度下降会找到局部最优解且可循环，这就会减慢收敛速度，或导致模式崩溃、模式跳跃现象。

辛梯度调节算法（SGA）可以在普通博弈中寻找稳定不动点，能改善对抗中基于梯度的方法的动态性。不过，因为需要计算所有参数的二阶导数，SGA的扩展成本很高。

潜在优化可以只分别针对潜在变量z和和判别器、生成器参数，使用二阶导数，来达到近似SGA的效果。

如此，就不必使用计算代价高昂的涉及判别器和生成器参数的二阶项。

简而言之，潜在优化最有效地耦合了判别器和生成器的梯度，且更具可扩展性。

并且，LOGAN受益于强大的优化器。研究人员使用自然梯度下降（NGD）进行潜在优化时发现，这种近似二阶优化方法比精确二阶方法表现更好。

虽然NGD在高维参数空间中同样代价高昂，但即使在非常大的模型中，它对于潜在优化也是有效的。

从实验结果来看，潜在优化明显改善了GAN的训练效果。

采用和BigGAN-deep基线相同的架构和参数数量，LOGAN在FID和IS上都有更好的表现。

不过，在训练期间，因为额外的前向和后向传播，LOGAN每一步的速度比BigGAN慢2到3倍。

华人一作领衔

论文一作，是DeepMind的研究科学家Yan Wu。

他于2019获剑桥大学计算神经科学博士学位，16年进入DeepMind工作。

论文的其他几位作者，分别是毕业于UC伯克利的Jeff Donahue博士。

毕业于芝加哥大学数学专业的David Balduzzi博士。

Vision Factory创始人Karen Simonyan。

以及伦敦学院大学客座教授、毕业于皇后大学的系统神经科学博士Timothy Lillicrap。

传送门

论文地址：
https://arxiv.org/abs/1912.00953

相关内容

BigGAN

关注 0

【Google】平滑对抗训练，Smooth Adversarial Training

专知会员服务

46+阅读 · 2020年7月4日

【DeepMind深度学习课程】无监督表示学习前沿进展，129页ppt，Unsupervised Representation Learning

专知会员服务

77+阅读 · 2020年6月29日

超越深度学习：梯度提升机Gradient Boosting Machines (GBM)，73页ppt

专知会员服务

48+阅读 · 2020年6月21日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

107+阅读 · 2020年5月21日

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

194+阅读 · 2020年5月14日

斯坦福2020硬课《分布式算法与优化》

专知会员服务

117+阅读 · 2020年5月6日

【伯克利】最新《生成式对抗网络》技术综述课程，257页ppt带你学习GAN进展

专知会员服务

184+阅读 · 2020年5月3日

自回归模型:PixelCNN

专知会员服务

25+阅读 · 2020年3月21日

【斯坦福大学】Dropout的隐性和显性正则化效应，Regularization Effects

专知会员服务

32+阅读 · 2020年3月4日

密歇根大学28页最新《GANs生成式对抗网络综述：算法、理论与应用》最新论文，带你全面了解GAN技术趋势

专知会员服务

102+阅读 · 2020年2月17日

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

新智元

13+阅读 · 2019年7月9日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

万字综述之生成对抗网络（GAN）

PaperWeekly

43+阅读 · 2019年3月19日

生成对抗网络的研究进展与趋势

中国计算机学会

35+阅读 · 2018年11月14日

Ian Goodfellow：你的GAN水平我来打分

机器之心

4+阅读 · 2018年8月17日

BGAN：支持离散值、提升训练稳定性的新GAN训练方法

论智

5+阅读 · 2018年5月13日

从GAN到WGAN：生成对抗网络背后的数学原理（一）

论智

27+阅读 · 2018年2月14日

【学界】用生成对抗网络解决NLP问题：谷歌大脑提出MaskGAN

GAN生成式对抗网络

9+阅读 · 2018年2月1日

【谷歌大脑团队GAN生态权威报告】6种优化GAN模型对比，最优秀的仍是原始版本

GAN生成式对抗网络

4+阅读 · 2017年11月30日

【AI作画真假难辨】Facebook 创意生成网络 CAN，比 GAN 更有创造力

新智元

3+阅读 · 2017年7月4日

f-VAEGAN-D2: A Feature Generating Framework for Any-Shot Learning

Arxiv

11+阅读 · 2019年3月25日

Phase-aware Speech Enhancement with Deep Complex U-Net

Arxiv

15+阅读 · 2019年3月7日

Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference

Arxiv

4+阅读 · 2019年2月27日

Close to Human Quality TTS with Transformer

Arxiv

3+阅读 · 2018年11月13日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Feasibility Based Large Margin Nearest Neighbor Metric Learning

Arxiv

3+阅读 · 2018年5月2日

Unsupervised Cross-dataset Person Re-identification by Transfer Learning of Spatial-Temporal Patterns

Arxiv

6+阅读 · 2018年3月20日

Wasserstein Auto-Encoders

Arxiv

6+阅读 · 2018年3月12日

Being Robust (in High Dimensions) Can Be Practical

Arxiv

3+阅读 · 2017年12月14日

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

Arxiv

5+阅读 · 2017年8月25日

VIP会员