成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
华人团队打造:AutoML + GAN = AutoGAN!AI设计GAN模型比人类更好
2019 年 8 月 25 日
新智元
新智元报道
编辑:张佳、大明
【新智元导读】
继图像分类、预训练模型之后,GAN又被用到神经架构搜索上。一个华人研究团队发现了一个新的架构突破,这种名叫AutoGAN的新架构在无条件图像生成任务方面优于当前最先进的人工制作的GAN,可见NAS在深度学习领域潜力无穷。
生成对抗网络(GAN)自其诞生以来一直盛行。它的一个最显著的成功在于是用各种各样的卷积结构生成逼真的自然图像。
近年来,人们对自动设计复杂的神经网络架构产生了浓厚的兴趣。神经架构搜索(NAS)已经成功地开发和评估了图像分类任务以及最近的图像分割。发现的架构优于人工设计的模型。然而,单纯地将现有的NAS想法从图像分类/分割移植到GAN是不够的。
首先,即使采用人工设计的架构,GAN的训练也是出了名的不稳定且容易崩溃。将NAS融入训练过程无疑会加大难度。作为另一个重要挑战,虽然验证准确性为图像分类中的NAS提供了自然的奖励选择,但选择用于评估和指导GAN搜索过程的良好度量标准并不那么简单。
论文链接:
https://arxiv.org/pdf/1908.03835v1.pdf
德克萨斯A&M大学和MIT-IBM Watson AI实验室的研究人员介绍了一种专为GAN量身定制的架构搜索方案,称为
AutoGAN
。
AutoGAN是第一次将NAS与GAN结合使用的尝试,并且是首次尝试将NAS扩展到图像分类之外。这项研究的技术创新总结如下:
定义搜索空间以捕获GAN架构变化
。最重要的是,使用RNN控制器来指导架构搜索。基于参数共享策略,在搜索过程中进一步引入了参数动态重置策略,以提高训练速度。
在基于强化学习的AutoGAN优化中,
使用Inception score(IS)作为奖励
。发现的模型在其他GAN指标下也表现出良好的性能,例如Fréchet Inception Distance(FID)。
研究人员
进一步向AutoGAN引入了多级架构搜索(MLAS)
,这是由渐进式GAN训练推动的。MLA以自下而上的顺序,分多个阶段执行搜索,并使用波束搜索(beam search)。
研究人员进行了各种实验来验证AutoGAN的有效性。发现的架构产生了非常有希望的结果,
这些结果优于当前人工设计的GAN或与之相当
。在CIFAR-10数据集上,AutoGAN获得了8.55的初始分数和12.42的FID分数。此外,研究人员还发现,在CIFAR-10上发现的体系结构甚至在STL-10图像生成任务上具有竞争力,初始分数为9.16,FID分数为31.01,显示出很强的可迁移性。在这两个数据集上,AutoGAN创造了新的最高的FID分数。
作者:Xinyu Gong 、Shiyu Chang 、Yifan Jiang、Zhangyang Wang
论文链接:https://arxiv.org/pdf/1908.03835v1
实现地址:https://github.com/TAMU-VITA/AutoGAN
研究思路与模型架构
GAN由两个互相竞争和对抗的两个网络组成:生成器和判别器。众所周知,这两种架构必须在学习能力上实现微妙的平衡。因此,要构建AutoGAN,第一个问题是:如何在GAN(生成器和鉴别器,以下表示为G和D)中一起构建两个网络?一方面,如果使用预先固定的D(或G)并仅搜索G(或D),则很容易引起D或G 之间在性能上的不平衡,导致更新缓慢,或学习过程支离破碎。另一方面,虽然可以对G和D进行联合搜索,但经验和实验表明,这样的双向NAS将使得原本就不稳定的GAN训练变得更加恶化,导致训练曲线震荡剧烈,而且经常不能收敛。
权衡之下,研究人员建议使用NAS仅搜索G的体系结构,同时通过遵循给定的例程来堆叠预定义模块来增加D的深度。因此,AutoGAN遵循以下基本思想:使用递归神经网络(RNN)控制器从其搜索空间中选择模块来构建G网络。基本方案如图1所示。整个过程中进行了多个创新,以解决训练GAN的具体任务带来的独特挑战。
图1:RNN控制器的运行方案
图2:AutoGAN中生成器单元的搜索空间
图3:AutoGAN在CIFAR-10上发现的AutoGAN(生成器)架构
AutoGAN搜索的伪代码
实验设置和结果
数据集
研究人员采用CIFAR-10 作为AutoGAN的主要测试平台。它由50,000个训练图像和10,000个测试图像组成,每个图像的分辨率为32×32。只使用训练集训练AutoGAN,无需任何数据扩充。另外,使用STL-10数据集来显示AutoGAN发现架构的可转移性。在使用STL-10进行训练时,采用5000张图像的训练集和100000张图像的未标记集。所有图像都调整为48×48,没有增补任何其他数据。
训练细节
在训练共享GAN时,研究人员遵循频谱归一化GAN 的训练设置。发生器和鉴别器的学习率设置为2e-4,使用铰链损耗和Adam优化器,鉴别器的批规模为64,发生器的批量大小为128。频谱归一化仅在鉴别器上强制执行。使用Adam 训练控制器,学习率为3.5e-4。将控制器输出概率的熵添加到奖励中,加权1e-4,以鼓励探索。搜索AutoGAN 90次迭代。对于每次迭代,共享GAN将被训练15步,控制器训练30步。动态重置方差阈值设置为1e-3。使用与共享GAN相同的训练设置训练发现的体系结构,进行50,000次生成器迭代。
表1:CIFAR-10上无条件图像生成任务的初始分数和FID分数。研究人员获得了最新的FID分数12.42
图4:生成的AutoGAN的CIFAR-10结果,结果为随机抽样而非有意挑选
表2:STL-10上无条件图像生成的初始分数和FID分数。AutoGAN在CIFAR-10上使用发现的体系结构
结论、局限和讨论
AutoGAN首次尝试将NAS引入GAN。它能够在CIFAR-10和STL-10数据集上识别出高效的架构,从而在当前最先进的人工制作的GAN模型中实现具有竞争力的图像生成结果。
由于GAN训练本身的高度不稳定性和超参数敏感性,AutoGAN在图像分类方面似乎比NAS更具挑战性。回想一下,在AutoML的初始阶段,它只能设计与人类专家设计的神经网络相当的小型神经网络,这些结果仅限于小型学术数据集,如CIFAR-10和Penn Treebank。同样,尽管取得了初步的成功,但毫无疑问,AutoGAN还有很大的发展空间。
为了使AutoGAN比最先进的人工设计的GAN更具竞争力,研究人员指出了一些需要继续努力的具体项目:
AutoGAN的当前搜索空间是有限的,并且一些强大的GAN被排除在可搜索范围之外。它需要扩大更多的构建块,这证明在GAN文献中是有效的。
到目前为止,研究人员尚未对高分辨率图像合成测试AutoGAN,例如ImageNet。虽然相同的算法原则上可直接应用,但计算成本会变得非常高。例如,对CIFAR-10的搜索已经需要43个小时,关键的挑战在于如何进一步提高搜索算法的效率。
研究人员没有释放寻找更好的鉴别者的潜力。可以在生成器和判别器之间制定交替搜索,这可以使AutoGAN变得更具挑战性。
最终,AutoGAN将需要具备合并标签的能力,例如条件GAN和半监督GAN。
登录查看更多
点赞并收藏
0
暂时没有读者
2
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
GAN
关注
91
GAN:生成性对抗网,深度学习模型的一种,在神经网络模型中引入竞争机制,非常流行。
最新《自动机器学习》综述论文,AutoML: A Survey of the State-of-the-Art
专知会员服务
92+阅读 · 2020年7月10日
最新《神经架构搜索NAS全面综述论文》挑战和解决方案,30页pdf
专知会员服务
120+阅读 · 2020年6月5日
【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘
专知会员服务
21+阅读 · 2020年5月16日
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
131+阅读 · 2020年5月14日
【伯克利】最新《生成式对抗网络》技术综述课程,257页ppt带你学习GAN进展
专知会员服务
193+阅读 · 2020年5月3日
【开放书】《自动化机器学习:方法,系统与挑战》,附223页pdf下载
专知会员服务
159+阅读 · 2019年12月18日
基于深度学习的行人重识别研究进展,自动化学报
专知会员服务
39+阅读 · 2019年12月5日
【Google】神经架构搜索(Neural Architecture Search and Beyond),Barret Zoph
专知会员服务
31+阅读 · 2019年11月25日
【纽约大学-AI研讨会】现代人工智能(Modern Artificial Intelligence)
专知会员服务
26+阅读 · 2019年11月10日
自动机器学习:最新进展综述
专知会员服务
122+阅读 · 2019年10月13日
【AutoGAN】华人团队打造:AutoML + GAN = AutoGAN!AI设计GAN模型比人类更好
产业智能官
5+阅读 · 2019年9月1日
【学界】华人团队打造:AutoML + GAN = AutoGAN!AI设计GAN模型比人类更好
GAN生成式对抗网络
3+阅读 · 2019年8月25日
深度解读:小米AI实验室AutoML团队最新成果FairNAS
PaperWeekly
32+阅读 · 2019年7月11日
AutoML研究综述:让AI学习设计AI
机器之心
14+阅读 · 2019年5月7日
要替代 TensorFlow?谷歌开源机器学习库 JAX
新智元
3+阅读 · 2018年12月14日
干货 | AutoML 和神经架构搜索初探
AI科技评论
3+阅读 · 2018年8月1日
AutoML 和神经架构搜索初探
雷锋网
5+阅读 · 2018年8月1日
谷歌放大招!数据增强实现自动化
新智元
8+阅读 · 2018年6月4日
专栏 | 自动选模型+调参:谷歌AutoML背后的技术解析
机器之心
5+阅读 · 2018年2月2日
【开发者的2018】GAN、AutoML、统一框架、语音等十大趋势
新智元
3+阅读 · 2018年1月4日
AutoML: A Survey of the State-of-the-Art
Arxiv
72+阅读 · 2019年8月14日
GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint
Arxiv
5+阅读 · 2018年12月15日
The GAN Landscape: Losses, Architectures, Regularization, and Normalization
Arxiv
3+阅读 · 2018年7月12日
Sem-GAN: Semantically-Consistent Image-to-Image Translation
Arxiv
4+阅读 · 2018年7月12日
The challenge of realistic music generation: modelling raw audio at scale
Arxiv
3+阅读 · 2018年6月26日
XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings
Arxiv
3+阅读 · 2018年4月25日
DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks
Arxiv
4+阅读 · 2018年4月3日
3D Pose Estimation and 3D Model Retrieval for Objects in the Wild
Arxiv
7+阅读 · 2018年3月30日
Mask R-CNN
Arxiv
7+阅读 · 2018年1月24日
StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation
Arxiv
5+阅读 · 2017年11月24日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
GAN
图像分类
CIFAR-10
搜索
神经架构搜索
神经架构
相关VIP内容
最新《自动机器学习》综述论文,AutoML: A Survey of the State-of-the-Art
专知会员服务
92+阅读 · 2020年7月10日
最新《神经架构搜索NAS全面综述论文》挑战和解决方案,30页pdf
专知会员服务
120+阅读 · 2020年6月5日
【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘
专知会员服务
21+阅读 · 2020年5月16日
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
131+阅读 · 2020年5月14日
【伯克利】最新《生成式对抗网络》技术综述课程,257页ppt带你学习GAN进展
专知会员服务
193+阅读 · 2020年5月3日
【开放书】《自动化机器学习:方法,系统与挑战》,附223页pdf下载
专知会员服务
159+阅读 · 2019年12月18日
基于深度学习的行人重识别研究进展,自动化学报
专知会员服务
39+阅读 · 2019年12月5日
【Google】神经架构搜索(Neural Architecture Search and Beyond),Barret Zoph
专知会员服务
31+阅读 · 2019年11月25日
【纽约大学-AI研讨会】现代人工智能(Modern Artificial Intelligence)
专知会员服务
26+阅读 · 2019年11月10日
自动机器学习:最新进展综述
专知会员服务
122+阅读 · 2019年10月13日
热门VIP内容
开通专知VIP会员 享更多权益服务
《埋藏弹药辨识技术》美陆军最新49页报告
【阿姆斯特丹博士论文】多语言性与多文化主义:迈向高效和包容的神经语言模型
中文版 | 乌军“蛛网行动”:实施周密无人机突袭重创俄轰炸机群
中文版4100字 | 战场人工智能革命尚未到来:当前俄乌双方AI无人机发展现状
相关资讯
【AutoGAN】华人团队打造:AutoML + GAN = AutoGAN!AI设计GAN模型比人类更好
产业智能官
5+阅读 · 2019年9月1日
【学界】华人团队打造:AutoML + GAN = AutoGAN!AI设计GAN模型比人类更好
GAN生成式对抗网络
3+阅读 · 2019年8月25日
深度解读:小米AI实验室AutoML团队最新成果FairNAS
PaperWeekly
32+阅读 · 2019年7月11日
AutoML研究综述:让AI学习设计AI
机器之心
14+阅读 · 2019年5月7日
要替代 TensorFlow?谷歌开源机器学习库 JAX
新智元
3+阅读 · 2018年12月14日
干货 | AutoML 和神经架构搜索初探
AI科技评论
3+阅读 · 2018年8月1日
AutoML 和神经架构搜索初探
雷锋网
5+阅读 · 2018年8月1日
谷歌放大招!数据增强实现自动化
新智元
8+阅读 · 2018年6月4日
专栏 | 自动选模型+调参:谷歌AutoML背后的技术解析
机器之心
5+阅读 · 2018年2月2日
【开发者的2018】GAN、AutoML、统一框架、语音等十大趋势
新智元
3+阅读 · 2018年1月4日
相关论文
AutoML: A Survey of the State-of-the-Art
Arxiv
72+阅读 · 2019年8月14日
GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint
Arxiv
5+阅读 · 2018年12月15日
The GAN Landscape: Losses, Architectures, Regularization, and Normalization
Arxiv
3+阅读 · 2018年7月12日
Sem-GAN: Semantically-Consistent Image-to-Image Translation
Arxiv
4+阅读 · 2018年7月12日
The challenge of realistic music generation: modelling raw audio at scale
Arxiv
3+阅读 · 2018年6月26日
XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings
Arxiv
3+阅读 · 2018年4月25日
DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks
Arxiv
4+阅读 · 2018年4月3日
3D Pose Estimation and 3D Model Retrieval for Objects in the Wild
Arxiv
7+阅读 · 2018年3月30日
Mask R-CNN
Arxiv
7+阅读 · 2018年1月24日
StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation
Arxiv
5+阅读 · 2017年11月24日
大家都在搜
用户画像
SoSITE
大型语言模型
俄乌战争
机器学习
银行
jwcc
久别重逢话双塔
t-sne
“小鹿撞怀”的鹿,可是这只萌萌的梅花鹿?
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top