【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式,92页pdf

2021 年 1 月 18 日 专知

深度学习方法是最近计算机视觉快速发展的基础。然而,这些方法往往需要昂贵的标记数据。特定于任务的模型,如分类器,并不是为了最大限度地学习一般的内部表示。此外,这些模型不能模拟数据生成过程来合成新样本,也不能修改输入样本。无监督深度生成模型有可能避免这些问题。


然而,两个主要的生成模型家族,生成对抗网络(GAN)和变分自编码器(VAE),都有各自的特点和问题。基于GAN的模型在架构上相对复杂,有一个识别器网络,但通常没有编码器来接受输入。此外,GAN训练通常是不稳定的,并且容易忽略训练分配的部分(“模式崩溃”或“模式下降”)。另一方面,VAEs往往高估分布的某些区域的方差,导致生成的图像模糊。


本论文介绍和评估模型和技术,以大大减少上述问题,并生成锐利的图像输出与一个简单的自动编码器架构。这是通过两个总体原则实现的。首先,一个合适的技术组合,从GAN模型被集成到最近引入类似于VAE的对抗生成器-编码器。第二,网络的递归性质在几个方面得到了利用。自动调制器代表了一类新的自动编码器,其特征是使用隐含表示来调制解码器层的统计信息。该网络可以获取多个图像作为输入,从中生成融合的合成样本,输出的一些尺度由一个输入驱动,另一个尺度由另一个驱动,允许瞬时“风格混合”和其他新的应用。


这项工作介绍和评估模型和技术,以大大减少上述问题,并生成锐利的图像输出与一个简单的自动编码器架构。这是通过两个总体原则实现的。首先,一个合适的技术组合,从GAN模型被集成到最近引入的类似于VAE的对抗生成器-编码器。第二,网络的递归性质在几个方面得到了利用。自动调制器代表了一类新的自动编码器,其特征是使用隐含表示来调制解码器层的统计信息。该网络可以获取多个图像作为输入,从中生成融合的合成样本,输出的一些尺度由一个输入驱动,另一个尺度由另一个驱动,允许瞬时“风格混合”和其他新的应用。


这项工作介绍和评估模型和技术,以大大减少上述问题,并生成锐利的图像输出与一个简单的自动编码器架构。这是通过两个总体原则实现的。首先,一个合适的技术组合,从GAN模型被集成到最近引入的类似于VAE的对抗生成器-编码器。第二,网络的递归性质在几个方面得到了利用。自动调制器代表了一类新的自动编码器,其特征是使用隐含表示来调制解码器层的统计信息。该网络可以获取多个图像作为输入,从中生成融合的合成样本,输出的一些尺度由一个输入驱动,其他尺度由另一个驱动,允许瞬时“风格混合”和其他新的应用。


最后,使用高斯过程框架,图像编码器-解码器设置从单个图像扩展到图像序列,包括视频和摄像机运行。为此,辅助图像元数据在生成模型的潜在空间中以非参数先验的形式被利用。这允许平滑和自由插值图像序列。在此过程中,高斯过程和计算机视觉方法之间提供了一个优雅的连接,这意味着将两者结合起来具有深远的意义。


https://aaltodoc.aalto.fi/handle/123456789/101686


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DGNM” 可以获取【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式,92页pdf专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【CMU博士论文】可控文本生成,附107页pdf与Slides
专知会员服务
55+阅读 · 2021年4月21日
专知会员服务
94+阅读 · 2021年2月6日
生成对抗网络GAN在各领域应用研究进展(中文版),37页pdf
专知会员服务
149+阅读 · 2020年12月30日
专知会员服务
28+阅读 · 2020年12月16日
【CIKM2020】神经贝叶斯信息处理,220页ppt,国立交通大学
专知会员服务
32+阅读 · 2020年10月26日
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
295+阅读 · 2020年6月16日
【GAN】生成对抗网络(GAN)的发展史
产业智能官
16+阅读 · 2020年3月20日
基于深度学习的超分辨率图像技术一览
计算机视觉life
4+阅读 · 2020年1月11日
【综述】关键词生成,附10页pdf论文下载
专知
9+阅读 · 2019年10月16日
生成对抗网络的最新研究进展
AI科技评论
5+阅读 · 2019年2月6日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
15+阅读 · 2018年7月26日
【干货】深入理解变分自编码器
专知
21+阅读 · 2018年3月22日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
A Probe into Understanding GAN and VAE models
Arxiv
9+阅读 · 2018年12月13日
Arxiv
19+阅读 · 2018年3月28日
VIP会员
相关VIP内容
相关资讯
【GAN】生成对抗网络(GAN)的发展史
产业智能官
16+阅读 · 2020年3月20日
基于深度学习的超分辨率图像技术一览
计算机视觉life
4+阅读 · 2020年1月11日
【综述】关键词生成,附10页pdf论文下载
专知
9+阅读 · 2019年10月16日
生成对抗网络的最新研究进展
AI科技评论
5+阅读 · 2019年2月6日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
15+阅读 · 2018年7月26日
【干货】深入理解变分自编码器
专知
21+阅读 · 2018年3月22日
Top
微信扫码咨询专知VIP会员