【CVPR2024】学习视觉Transformer的相关结构 - 专知VIP

会员服务 ·

10

CVPR 2024 · 视觉Transformer · Transformer ·

【CVPR2024】学习视觉Transformer的相关结构

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

我们引入了一种新的注意力机制，称为结构性自注意力（StructSA），它利用在注意力的关键查询互动中自然出现的丰富相关模式。StructSA通过卷积识别关键查询相关性的时空结构来生成注意力图，并使用它们动态地聚合值特征的局部上下文。这有效地利用了图像和视频中的丰富结构模式，如场景布局、对象运动和对象间关系。使用StructSA作为主要构建块，我们开发了结构视觉变压器（StructViT），并评估其在图像和视频分类任务上的有效性，在ImageNet-1K、Kinetics-400、Something-Something V1 & V2、Diving-48和FineGym上取得了最先进的结果。

成为VIP会员查看完整内容

24

相关内容

CVPR 2024

【CVPR2024】自然监督下的三维视觉定位与语言规范化的概念学习

【CVPR2024】自然监督下的三维视觉定位与语言规范化的概念学习

专知会员服务

4+阅读 · 5月1日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知会员服务

15+阅读 · 2023年4月6日

【NeurIPS2022】VICRegL:局部视觉特征的自监督学习

【NeurIPS2022】VICRegL:局部视觉特征的自监督学习

专知会员服务

31+阅读 · 2022年10月6日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知会员服务

19+阅读 · 2022年7月9日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

48+阅读 · 2022年6月17日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

50+阅读 · 2022年6月15日

【CVPR2022】提示分布学习

【CVPR2022】提示分布学习

专知会员服务

29+阅读 · 2022年5月17日

【NeurIPS2021】神经解释器的动态推理

专知会员服务

14+阅读 · 2021年10月16日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

14+阅读 · 2021年9月11日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知会员服务

26+阅读 · 2020年4月1日

【AAAI2023】用于图对比学习的谱特征增强

【AAAI2023】用于图对比学习的谱特征增强

专知

18+阅读 · 2022年12月11日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

18+阅读 · 2021年3月28日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

16+阅读 · 2021年3月2日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

37+阅读 · 2020年9月30日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

18+阅读 · 2020年6月28日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

专知

37+阅读 · 2020年6月11日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

244+阅读 · 2019年11月18日

语义Web知识库补全关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

29+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

4+阅读 · 2014年12月31日

图的随机p-中心和中位问题的理论和算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

4+阅读 · 2014年12月31日

网络的小世界结构及其上随机游动的混合时

国家自然科学基金

1+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

131+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

30+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

71+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

135+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

325+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

53+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

111+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

38+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

15+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

21+阅读 · 2023年1月13日

VIP会员

相关主题

视觉Transformer

相关VIP内容

【CVPR2024】自然监督下的三维视觉定位与语言规范化的概念学习

【CVPR2024】自然监督下的三维视觉定位与语言规范化的概念学习

专知会员服务

4+阅读 · 5月1日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知会员服务

15+阅读 · 2023年4月6日

【NeurIPS2022】VICRegL:局部视觉特征的自监督学习

【NeurIPS2022】VICRegL:局部视觉特征的自监督学习

专知会员服务

31+阅读 · 2022年10月6日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知会员服务

19+阅读 · 2022年7月9日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

48+阅读 · 2022年6月17日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

50+阅读 · 2022年6月15日

【CVPR2022】提示分布学习

【CVPR2022】提示分布学习

专知会员服务

29+阅读 · 2022年5月17日

【NeurIPS2021】神经解释器的动态推理

专知会员服务

14+阅读 · 2021年10月16日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

14+阅读 · 2021年9月11日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知会员服务

26+阅读 · 2020年4月1日

热门VIP内容

相关资讯

【AAAI2023】用于图对比学习的谱特征增强

【AAAI2023】用于图对比学习的谱特征增强

专知

18+阅读 · 2022年12月11日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

18+阅读 · 2021年3月28日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

16+阅读 · 2021年3月2日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

37+阅读 · 2020年9月30日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

18+阅读 · 2020年6月28日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

专知

37+阅读 · 2020年6月11日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

244+阅读 · 2019年11月18日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

29+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

4+阅读 · 2014年12月31日

图的随机p-中心和中位问题的理论和算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

4+阅读 · 2014年12月31日

网络的小世界结构及其上随机游动的混合时

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

131+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

30+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

71+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

135+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

325+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

53+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

111+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

38+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

15+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

21+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员