【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers - 专知VIP

会员服务 ·

4

计算机视觉 · 自注意力 · 自然语言处理 · 神经网络 ·

2020 年 1 月 12 日

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

简介： Self-attention对文本处理有很大影响，并成为NLU自然语言理解的构成部分。但是，这种成功并不仅限于文本（或一维序列），基于变压器的体系结构可以在视觉任务上击败最新的ResNet。为了解释这一成就，我们的工作表明自我注意力可以表达CNN层，并且在实践中可以学习卷积滤波器。

Ashish Vaswani及其同事介绍的转换器架构已成为自然语言理解的主要力量。转换器与以前的方法（例如递归神经网络（RNN）和卷积神经网络（CNN））之间的主要区别在于，转换器可以同时关注输入序列中的每个单词。

最近，Google AI的研究人员成功地将转换器架构应用于图像。这意味着通过Self-attention替换所有CNN层，并调整参数数量以进行公平比较。本文是对“自我注意和卷积层之间关系的论文”的简介，在本文中我们研究了变形器如何处理图像。具体来说，我们表明具有足够数量的头部的多头自我注意层可以至少与任何卷积层一样具有表现力。我们的发现提出了图像上变压器成功的可能解释。

code:https://github.com/epfml/attention-cnn

成为VIP会员查看完整内容

37

相关内容

计算机视觉

计算机视觉

计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

【ICLR 2020】基于组合的多关系图卷积网络 Composition-Based Multi-Relational Graph Convolutional Networks

【ICLR 2020】基于组合的多关系图卷积网络 Composition-Based Multi-Relational Graph Convolutional Networks

专知会员服务

108+阅读 · 2020年3月29日

【ICLR2020】胶囊与反向路由点积注意力

专知会员服务

27+阅读 · 2020年2月15日

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

专知会员服务

57+阅读 · 2020年1月12日

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

专知会员服务

53+阅读 · 2019年11月20日

【论文笔记】Graph U-Nets

【论文笔记】Graph U-Nets

专知

81+阅读 · 2019年11月25日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

从三大顶会论文看百变Self-Attention

从三大顶会论文看百变Self-Attention

PaperWeekly

17+阅读 · 2019年11月11日

EMNLP 2018 | 为什么使用自注意力机制？

EMNLP 2018 | 为什么使用自注意力机制？

机器之心

8+阅读 · 2018年9月17日

论文共读 | Attention is All You Need

论文共读 | Attention is All You Need

黑龙江大学自然语言处理实验室

15+阅读 · 2017年9月7日

Self-Attention Graph Pooling

Self-Attention Graph Pooling

Arxiv

13+阅读 · 2019年6月13日

Convolutional Self-Attention Network

Arxiv

6+阅读 · 2019年4月8日

Cloze-driven Pretraining of Self-attention Networks

Arxiv

6+阅读 · 2019年3月19日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

VIP会员

相关主题

计算机视觉

自然语言处理

相关VIP内容

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

【ICLR 2020】基于组合的多关系图卷积网络 Composition-Based Multi-Relational Graph Convolutional Networks

【ICLR 2020】基于组合的多关系图卷积网络 Composition-Based Multi-Relational Graph Convolutional Networks

专知会员服务

108+阅读 · 2020年3月29日

【ICLR2020】胶囊与反向路由点积注意力

专知会员服务

27+阅读 · 2020年2月15日

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

专知会员服务

57+阅读 · 2020年1月12日

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

专知会员服务

53+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

因果强化学习的统一框架：综述、分类体系、算法与应用

《无人机系统 - 反无人机系统：测试方法》364页

【MIT博士论文】语言模型的推理时学习算法

美军低成本无人作战攻击系统（LUCAS）：扩大无人机战争规模

相关资讯

【论文笔记】Graph U-Nets

【论文笔记】Graph U-Nets

专知

81+阅读 · 2019年11月25日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

从三大顶会论文看百变Self-Attention

从三大顶会论文看百变Self-Attention

PaperWeekly

17+阅读 · 2019年11月11日

EMNLP 2018 | 为什么使用自注意力机制？

EMNLP 2018 | 为什么使用自注意力机制？

机器之心

8+阅读 · 2018年9月17日

论文共读 | Attention is All You Need

论文共读 | Attention is All You Need

黑龙江大学自然语言处理实验室

15+阅读 · 2017年9月7日

相关论文

Self-Attention Graph Pooling

Self-Attention Graph Pooling

Arxiv

13+阅读 · 2019年6月13日

Convolutional Self-Attention Network

Arxiv

6+阅读 · 2019年4月8日

Cloze-driven Pretraining of Self-attention Networks

Arxiv

6+阅读 · 2019年3月19日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

微信扫码咨询专知VIP会员