会员服务 ·

0

StarGAN-多领域图像翻译

2017 年 12 月 26 日 CreateAMind 张雨石

http://blog.csdn.net/stdcoutzyx/article/details/78829232

标签：
StarGAN /
图像翻译 /
对抗神经网络 /
Pix2Pix /
CycleGAN

Pix2Pix模型解决了有Pair对数据的图像翻译问题；CycleGAN解决了Unpaired数据下的图像翻译问题。但无论是Pix2Pix还是CycleGAN，都是解决了一对一的问题，即一个领域到另一个领域的转换。当有很多领域要转换了，对于每一个领域转换，都需要重新训练一个模型去解决。这样的行为太低效了。本文所介绍的StarGAN就是将多领域转换用统一框架实现的算法。

下图是StarGAN的效果，在同一种模型下，可以做多个图像翻译任务，比如更换头发颜色，更换表情，更换年龄等。

引入

如果只能训练一对一的图像翻译模型，会导致两个问题：

训练低效，每次训练耗时很大。
训练效果有限，因为一个领域转换单独训练的话就不能利用其它领域的数据来增大泛化能力。

为了解决多对多的图像翻译问题，StarGAN出现了。

模型框架

StarGAN，顾名思义，就是星形网络结构，在StarGAN中，生成网络G被实现成星形。如下图所示，左侧为普通的Pix2Pix模型要训练多对多模型时的做法，而右侧则是StarGAN的做法，可以看到，StarGAN仅仅需要一个G来学习所有领域对之间的转换。

那么，是什么让G有这样的能力呢？

网络结构

要想让G拥有学习多个领域转换的能力，需要对生成网络G和判别网络D做如下改动。

在G的输入中添加目标领域信息，即把图片翻译到哪个领域这个信息告诉生成模型。
D除了具有判断图片是否真实的功能外，还要有判断图片属于哪个类别的能力。这样可以保证G中同样的输入图像，随着目标领域的不同生成不同的效果
除了上述两样以外，还需要保证图像翻译过程中图像内容要保存，只改变领域差异的那部分。图像重建可以完整这一部分，图像重建即将图像翻译从领域A翻译到领域B，再翻译回来，不会发生变化。

D的训练和G的训练如下所示。

目标函数

首先是GAN的通用函数，判断输出图像是否真实

其次是类别损失，该损失被分成两个，训练D的时候，使用真实图像在原始领域进行，训练G的时候，使用生成的图像在目标领域进行。

训练D的损失：

训练G的损失：

再次则是重建函数，重建函数与CycleGAN中的正向函数类似。

汇总后则是

多数据集训练

在多数据集下训练StarGAN存在一个问题，那就是数据集之间的类别可能是不相交的，但内容可能是相交的。比如CelebA数据集合RaFD数据集，前者拥有很多肤色，年龄之类的类别。而后者拥有的是表情的类别。但前者的图像很多也是有表情的，这就导致前一类的图像在后一类的标记是不可知的。

为了解决这个问题，在模型输入中加入了Mask，即如果来源于数据集B，那么将数据集A中的标记全部设为0.

效果图

更多请参考原始论文.

Reference

[1]. StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation
[2]. Pix2Pix图像翻译
[3]. CycleGAN-Unpaired图像翻译

招聘公众号回复招聘

登录查看更多

4

相关内容

图像翻译

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

【CVPR2020-英伟达】从图像集合中学习自监督视点，Self-Supervised Viewpoint Learning From Image Collections

【CVPR2020-英伟达】从图像集合中学习自监督视点，Self-Supervised Viewpoint Learning From Image Collections

专知会员服务

24+阅读 · 2020年4月4日

自回归模型:PixelCNN

自回归模型:PixelCNN

专知会员服务

27+阅读 · 2020年3月21日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

专知会员服务

55+阅读 · 2019年11月20日

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

专知会员服务

27+阅读 · 2019年8月10日

CVPR 2019 开源论文 | 基于翻译向量的图像翻译

CVPR 2019 开源论文 | 基于翻译向量的图像翻译

PaperWeekly

3+阅读 · 2019年10月13日

综述：基于GAN的图像翻译模型盘点

综述：基于GAN的图像翻译模型盘点

GAN生成式对抗网络

21+阅读 · 2019年9月2日

生成对抗网络在图像翻译上的应用【附PPT与视频资料】

生成对抗网络在图像翻译上的应用【附PPT与视频资料】

人工智能前沿讲习班

7+阅读 · 2018年11月28日

【CVPR Oral】TensorFlow实现StarGAN代码全部开源，1天训练完

【CVPR Oral】TensorFlow实现StarGAN代码全部开源，1天训练完

全球人工智能

8+阅读 · 2018年6月14日

【ACL2018】什么都能GAN，无监督神经网络翻译新方法

【ACL2018】什么都能GAN，无监督神经网络翻译新方法

专知

4+阅读 · 2018年5月24日

CycleGAN：图片风格，想换就换 | ICCV 2017论文解读

CycleGAN：图片风格，想换就换 | ICCV 2017论文解读

PaperWeekly

12+阅读 · 2018年3月14日

GAN做图像翻译的一点总结

GAN做图像翻译的一点总结

PaperWeekly

4+阅读 · 2017年12月26日

附资料包|GAN发展历程综述：送你最易入手的几个架构

附资料包|GAN发展历程综述：送你最易入手的几个架构

七月在线实验室

6+阅读 · 2017年9月5日

【实战】GAN网络图像翻译机：图像复原、模糊变清晰、素描变彩图

【实战】GAN网络图像翻译机：图像复原、模糊变清晰、素描变彩图

GAN生成式对抗网络

9+阅读 · 2017年9月4日

GAN猫的脸

机械鸡

11+阅读 · 2017年7月8日

Unsupervised Image Captioning

Arxiv

7+阅读 · 2018年11月27日

Unsupervised Adversarial Visual Level Domain Adaptation for Learning Video Object Detectors from Images

Arxiv

3+阅读 · 2018年10月4日

Video-to-Video Synthesis

Video-to-Video Synthesis

Arxiv

9+阅读 · 2018年8月20日

Diverse Image-to-Image Translation via Disentangled Representations

Diverse Image-to-Image Translation via Disentangled Representations

Arxiv

13+阅读 · 2018年8月2日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Conditional Image-to-Image Translation

Arxiv

8+阅读 · 2018年5月1日

XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings

Arxiv

3+阅读 · 2018年4月25日

Unpaired Image Captioning by Language Pivoting

Arxiv

4+阅读 · 2018年3月14日

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation

Arxiv

5+阅读 · 2017年11月24日

VIP会员

相关主题

相关VIP内容

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

【CVPR2020-英伟达】从图像集合中学习自监督视点，Self-Supervised Viewpoint Learning From Image Collections

【CVPR2020-英伟达】从图像集合中学习自监督视点，Self-Supervised Viewpoint Learning From Image Collections

专知会员服务

24+阅读 · 2020年4月4日

自回归模型:PixelCNN

自回归模型:PixelCNN

专知会员服务

27+阅读 · 2020年3月21日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

【ICIP2019教程-NVIDIA】图像到图像转换，附7份PPT下载

专知会员服务

55+阅读 · 2019年11月20日

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

专知会员服务

27+阅读 · 2019年8月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【ACL2025教程】大语言模型的护栏与安全性：对其应用的安全、可靠与可控引导

《实现协同自主：从人机协作到多智能体系统》最新190页

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

通信网络智能体白皮书V1.0，61页pdf

相关资讯

CVPR 2019 开源论文 | 基于翻译向量的图像翻译

CVPR 2019 开源论文 | 基于翻译向量的图像翻译

PaperWeekly

3+阅读 · 2019年10月13日

综述：基于GAN的图像翻译模型盘点

综述：基于GAN的图像翻译模型盘点

GAN生成式对抗网络

21+阅读 · 2019年9月2日

生成对抗网络在图像翻译上的应用【附PPT与视频资料】

生成对抗网络在图像翻译上的应用【附PPT与视频资料】

人工智能前沿讲习班

7+阅读 · 2018年11月28日

【CVPR Oral】TensorFlow实现StarGAN代码全部开源，1天训练完

【CVPR Oral】TensorFlow实现StarGAN代码全部开源，1天训练完

全球人工智能

8+阅读 · 2018年6月14日

【ACL2018】什么都能GAN，无监督神经网络翻译新方法

【ACL2018】什么都能GAN，无监督神经网络翻译新方法

专知

4+阅读 · 2018年5月24日

CycleGAN：图片风格，想换就换 | ICCV 2017论文解读

CycleGAN：图片风格，想换就换 | ICCV 2017论文解读

PaperWeekly

12+阅读 · 2018年3月14日

GAN做图像翻译的一点总结

GAN做图像翻译的一点总结

PaperWeekly

4+阅读 · 2017年12月26日

附资料包|GAN发展历程综述：送你最易入手的几个架构

附资料包|GAN发展历程综述：送你最易入手的几个架构

七月在线实验室

6+阅读 · 2017年9月5日

【实战】GAN网络图像翻译机：图像复原、模糊变清晰、素描变彩图

【实战】GAN网络图像翻译机：图像复原、模糊变清晰、素描变彩图

GAN生成式对抗网络

9+阅读 · 2017年9月4日

GAN猫的脸

机械鸡

11+阅读 · 2017年7月8日

相关论文

Unsupervised Image Captioning

Arxiv

7+阅读 · 2018年11月27日

Unsupervised Adversarial Visual Level Domain Adaptation for Learning Video Object Detectors from Images

Arxiv

3+阅读 · 2018年10月4日

Video-to-Video Synthesis

Video-to-Video Synthesis

Arxiv

9+阅读 · 2018年8月20日

Diverse Image-to-Image Translation via Disentangled Representations

Diverse Image-to-Image Translation via Disentangled Representations

Arxiv

13+阅读 · 2018年8月2日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Conditional Image-to-Image Translation

Arxiv

8+阅读 · 2018年5月1日

XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings

Arxiv

3+阅读 · 2018年4月25日

Unpaired Image Captioning by Language Pivoting

Arxiv

4+阅读 · 2018年3月14日

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation

Arxiv

5+阅读 · 2017年11月24日

大家都在搜

智库最新报告

生成式人工智能

久别重逢话双塔

国防科技创新

软件无线电

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员