Transformer architectures show spectacular performance on NLP tasks and have recently also been used for tasks such as image completion or image classification. Here we propose to use a sequential image representation, where each prefix of the complete sequence describes the whole image at reduced resolution. Using such Fourier Domain Encodings (FDEs), an auto-regressive image completion task is equivalent to predicting a higher resolution output given a low-resolution input. Additionally, we show that an encoder-decoder setup can be used to query arbitrary Fourier coefficients given a set of Fourier domain observations. We demonstrate the practicality of this approach in the context of computed tomography (CT) image reconstruction. In summary, we show that Fourier Image Transformer (FIT) can be used to solve relevant image analysis tasks in Fourier space, a domain inherently inaccessible to convolutional architectures.


翻译:变换器结构在 NLP 任务上表现惊人, 最近也被用于图像完成或图像分类等任务 。 在此, 我们提议使用顺序图像表示, 完整序列的每个前缀都以较低的分辨率描述整个图像 。 使用这样的 Fourier 域编码, 自动递减图像完成任务相当于预测高分辨率输出, 并给出低分辨率输入 。 此外, 我们显示, 编码器- 解码器设置可以用来查询任意的 Fourier 系数, 并给出一组 Fourier 域观测 。 我们展示了在计算图像重建过程中这一方法的实用性 。 总之, 我们显示 Fourier 图像变换器( FIT) 可用于解决 Fourier 空间的相关图像分析任务, 富莱尔空间是革命结构中固有的一个无法进入的领域 。

0
下载
关闭预览

相关内容

专知会员服务
44+阅读 · 2021年6月1日
华为等发布《视觉Transformer转换器》综述论文,21页pdf
专知会员服务
85+阅读 · 2020年12月25日
最新《Transformers模型》教程,64页ppt
专知会员服务
304+阅读 · 2020年11月26日
Python图像处理,366页pdf,Image Operators Image Processing in Python
【Amazon】使用预先训练的Transformer模型进行数据增强
专知会员服务
56+阅读 · 2020年3月6日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
已删除
将门创投
7+阅读 · 2018年4月25日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Arxiv
0+阅读 · 2021年5月28日
Arxiv
9+阅读 · 2021年2月8日
Arxiv
11+阅读 · 2018年5月13日
VIP会员
相关VIP内容
专知会员服务
44+阅读 · 2021年6月1日
华为等发布《视觉Transformer转换器》综述论文,21页pdf
专知会员服务
85+阅读 · 2020年12月25日
最新《Transformers模型》教程,64页ppt
专知会员服务
304+阅读 · 2020年11月26日
Python图像处理,366页pdf,Image Operators Image Processing in Python
【Amazon】使用预先训练的Transformer模型进行数据增强
专知会员服务
56+阅读 · 2020年3月6日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
相关资讯
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
已删除
将门创投
7+阅读 · 2018年4月25日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Top
微信扫码咨询专知VIP会员