【NeurIPS2021】ResT:一个有效的视觉识别转换器 - 专知VIP

会员服务 ·

3

视觉转换器(Transformer) · NeurIPS 2021 · 论文 ·

2021 年 10 月 25 日

【NeurIPS2021】ResT:一个有效的视觉识别转换器

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文提出了一种高效的多尺度视觉转换器，称为ResT，可作为图像识别的通用骨干。现有的Transformer方法使用标准Transformer块来处理具有固定分辨率的原始图像，与之不同的是，我们的ResT有几个优点:(1)构建高效记忆的多头自注意，通过简单的深度卷积压缩记忆，在保持多头多样性的同时，在注意-多头维度上投射相互作用;(2)将位置编码构造为空间注意，更加灵活，可以处理任意尺寸的输入图像，无需插值或微调;(3)我们没有在每个阶段开始时直接进行标记化，而是将patch嵌入设计为在标记映射上进行跨步重叠卷积操作的堆栈。我们在图像分类和下游任务上全面验证了ResT。实验结果表明，提出的ResT可以在很大程度上超过最新的骨干技术，这表明ResT作为强大骨干的潜力。代码和模型将在https://github.com/wofmanaf/ResT上公开。

成为VIP会员查看完整内容

23

相关内容

视觉转换器(Transformer)

视觉转换器(Transformer)

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

【NeurIPS2021】去栅格化的矢量图识别

【NeurIPS2021】去栅格化的矢量图识别

专知会员服务

16+阅读 · 2021年11月18日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【NeurIPS2021】神经解释器的动态推理

专知会员服务

15+阅读 · 2021年10月16日

【ICML2021】基于卷积神经网络的隐私保护视频分类

专知会员服务

12+阅读 · 2021年9月10日

系列教程GNN-algorithms之六：《多核卷积拓扑图—TAGCN》

系列教程GNN-algorithms之六：《多核卷积拓扑图—TAGCN》

专知

25+阅读 · 2020年8月8日

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

机器之心

18+阅读 · 2019年4月26日

深度 | 图像语义分割的工作原理和CNN架构变迁

深度 | 图像语义分割的工作原理和CNN架构变迁

机器之心

9+阅读 · 2018年6月13日

教程 | 如何使用Keras集成多个卷积网络并实现共同预测

教程 | 如何使用Keras集成多个卷积网络并实现共同预测

机器之心

4+阅读 · 2017年12月14日

CMU与FAIR联合发布非局部神经网络，有效提升视频分类、对象分割、姿态估计结果

CMU与FAIR联合发布非局部神经网络，有效提升视频分类、对象分割、姿态估计结果

机器学习研究会

5+阅读 · 2017年11月24日

ResT: An Efficient Transformer for Visual Recognition

Arxiv

3+阅读 · 2021年10月14日

Deep Contextual Video Compression

Arxiv

5+阅读 · 2021年9月30日

Optimal Counterfactual Explanations in Tree Ensembles

Arxiv

5+阅读 · 2021年6月25日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

Residual Non-local Attention Networks for Image Restoration

Arxiv

9+阅读 · 2019年3月24日

VIP会员

相关主题

视觉转换器(Transformer)

相关VIP内容

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

【NeurIPS2021】去栅格化的矢量图识别

【NeurIPS2021】去栅格化的矢量图识别

专知会员服务

16+阅读 · 2021年11月18日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【NeurIPS2021】神经解释器的动态推理

专知会员服务

15+阅读 · 2021年10月16日

【ICML2021】基于卷积神经网络的隐私保护视频分类

专知会员服务

12+阅读 · 2021年9月10日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

系列教程GNN-algorithms之六：《多核卷积拓扑图—TAGCN》

系列教程GNN-algorithms之六：《多核卷积拓扑图—TAGCN》

专知

25+阅读 · 2020年8月8日

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

机器之心

18+阅读 · 2019年4月26日

深度 | 图像语义分割的工作原理和CNN架构变迁

深度 | 图像语义分割的工作原理和CNN架构变迁

机器之心

9+阅读 · 2018年6月13日

教程 | 如何使用Keras集成多个卷积网络并实现共同预测

教程 | 如何使用Keras集成多个卷积网络并实现共同预测

机器之心

4+阅读 · 2017年12月14日

CMU与FAIR联合发布非局部神经网络，有效提升视频分类、对象分割、姿态估计结果

CMU与FAIR联合发布非局部神经网络，有效提升视频分类、对象分割、姿态估计结果

机器学习研究会

5+阅读 · 2017年11月24日

相关论文

ResT: An Efficient Transformer for Visual Recognition

Arxiv

3+阅读 · 2021年10月14日

Deep Contextual Video Compression

Arxiv

5+阅读 · 2021年9月30日

Optimal Counterfactual Explanations in Tree Ensembles

Arxiv

5+阅读 · 2021年6月25日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

Residual Non-local Attention Networks for Image Restoration

Arxiv

9+阅读 · 2019年3月24日

微信扫码咨询专知VIP会员