图神经网络作CV骨干模型，来听听华为诺亚是怎么做的 - 专知

会员服务 ·

0

图神经网络作CV骨干模型，来听听华为诺亚是怎么做的

2022 年 6 月 27 日 机器之心

在计算机视觉领域，骨干网络一直是特征提取的重要部件。从 AlexNet 到 ResNet，卷积网络 CNN 在很长一段时间内一直是视觉任务的标配。近年来，基于注意力机制的 Transformer 和以全连接层为主的 MLP 网络也开始在计算机视觉领域崭露头角。与现有主流 CNN 模型相比，基于 Transformer 或 MLP 的模型在视觉任务上也显示出了良好的性能。

直到现在，关于谁是更好的视觉骨干网络还是一个仍在探索和颇具争议的课题。传统的卷积网络将图像视作一个矩阵或网格，通过滑动窗口对邻域像素点或特征点进行聚合；视觉 Transformer 或 MLP 则是输入图片切分为若干个图像块，形成一个序列，用注意力机制或全连接层处理序列关系。网格或序列表示方法，对于图像来说显得不够灵活。比如一个人往往由头部、四肢和躯干构成，这些部位之间有一定连接关系，是一种非规则化的会变化的模式。

针对这些情况，华为诺亚方舟实验室联合中国科学院软件研究所、北大等机构的研究者在论文《Vision GNN: An Image is Worth Graph of Nodes》中，提出了一种新型视觉图神经网络（Vision GNN），它能够更灵活地对图像表征进行建模，在图像识别和目标检测等通用视觉任务取得了不错的效果。

机器之心最新一期线上分享邀请到了论文共同一作、华为诺亚方舟实验室研究员韩凯，为大家详细解读如何只用 GNN 来做视觉任务。

分享主题：Vision GNN: An Image is Worth Graph of Nodes

分享嘉宾： 韩凯，华为诺亚方舟实验室研究员，主要研究方向为深度学习和计算机视觉。他在 NeurIPS/CVPR/TPAMI 等顶会顶刊发表 20 余篇论文，多项研究成果应用于华为产品线。他的谷歌学术引用 2000+，其中 GhostNet 和 TNT 入选 PaperDigest Most Influential Papers 榜单。

分享摘要： 华为诺亚实验室的研究员联合高校发现图神经网络（GNN）也能做视觉骨干网络。将图像表示为图结构，通过简洁高效的适配，提出一种新型视觉网络架构 ViG，表现优于传统的卷积网络和 Transformer。在 ImageNet 图像识别任务，ViG 在相似计算量情况下 Top-1 正确率达 82.1%，高于 ResNet 和 Swin Transformer。

论文链接： https://arxiv.org/pdf/2206.00272.pdf

加群看直播

直播间：关注机动组视频号预约直播，北京时间6月29日19:00开播。

交流群：本次直播有QA环节，欢迎加入本次直播交流群探讨交流。

机器之心 · 机动组

机动组是机器之心发起的人工智能技术社区，聚焦于学术研究与技术实践主题内容，为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动，欢迎所有 AI 领域技术从业者加入。

点击阅读原文，访问机动组官网，观看往期回顾；
关注机动组服务号，获取每周直播预告。

登录查看更多

0

相关内容

视觉任务

TPAMI 2022｜华为诺亚最新视觉Transformer综述

TPAMI 2022｜华为诺亚最新视觉Transformer综述

专知会员服务

56+阅读 · 2022年2月24日

近期必读的5篇顶会CVPR 2021【视频理解】相关论文和代码

专知会员服务

38+阅读 · 2021年3月31日

近期必读的五篇ICLR 2021【图神经网络（GNN）】相关论文和代码

近期必读的五篇ICLR 2021【图神经网络（GNN）】相关论文和代码

专知会员服务

69+阅读 · 2021年2月25日

【NeurIPS 2020】图神经网络GNN架构设计

【NeurIPS 2020】图神经网络GNN架构设计

专知会员服务

84+阅读 · 2020年11月19日

Graph Normalization (GN)：为图神经网络学习一个有效的图归一化

Graph Normalization (GN)：为图神经网络学习一个有效的图归一化

专知会员服务

16+阅读 · 2020年9月28日

近期必读的五篇计算机视觉顶会CVPR 2020【图神经网络 (GNN) 】相关论文-Part 3

近期必读的五篇计算机视觉顶会CVPR 2020【图神经网络 (GNN) 】相关论文-Part 3

专知会员服务

90+阅读 · 2020年5月19日

近期必读的5篇顶会CVPR 2020【图神经网络（GNN）】相关论文-Part2

近期必读的5篇顶会CVPR 2020【图神经网络（GNN）】相关论文-Part2

专知会员服务

84+阅读 · 2020年3月17日

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

专知会员服务

15+阅读 · 2020年1月9日

【WSDM 2020 论文】基于自关注网络的动态图表示学习（Dynamic graph representation learning via self-attention networks），Visa Research的研究员武延宏等

【WSDM 2020 论文】基于自关注网络的动态图表示学习（Dynamic graph representation learning via self-attention networks），Visa Research的研究员武延宏等

专知会员服务

98+阅读 · 2019年11月20日

六篇 CIKM 2019 必读的【图神经网络(GNN)】长文论文

六篇 CIKM 2019 必读的【图神经网络(GNN)】长文论文

专知会员服务

38+阅读 · 2019年11月3日

极市直播丨ECCV2022-涂正中：让谷歌的骨干网络MaxViT治好你的科研内耗

极市直播丨ECCV2022-涂正中：让谷歌的骨干网络MaxViT治好你的科研内耗

极市平台

4+阅读 · 2022年7月31日

极市直播丨严彬-Unicorn：走向目标跟踪的大一统（ECCV2022 Oral）

极市直播丨严彬-Unicorn：走向目标跟踪的大一统（ECCV2022 Oral）

极市平台

1+阅读 · 2022年7月24日

图神经网络试图打入CV主流？中科大华为等联合开源ViG：首次用于视觉任务的GNN

图神经网络试图打入CV主流？中科大华为等联合开源ViG：首次用于视觉任务的GNN

极市平台

0+阅读 · 2022年6月30日

CV顶会最佳论文得主分享：好论文是怎么炼成的？

CV顶会最佳论文得主分享：好论文是怎么炼成的？

极市平台

0+阅读 · 2022年6月29日

CVPR22 ｜CMT：CNN和Transformer的高效结合（开源）

CVPR22 ｜CMT：CNN和Transformer的高效结合（开源）

极市平台

2+阅读 · 2022年6月28日

图神经网络也能用作CV骨干模型，华为诺亚ViG架构媲美CNN、Transformer

图神经网络也能用作CV骨干模型，华为诺亚ViG架构媲美CNN、Transformer

机器之心

0+阅读 · 2022年6月26日

CV的未来是图神经网络？中科院软件所发布全新CV模型ViG，性能超越ViT

CV的未来是图神经网络？中科院软件所发布全新CV模型ViG，性能超越ViT

图与推荐

0+阅读 · 2022年6月26日

中科院&华为诺亚提出ViG：一种全新的骨干网络，性能不输CNN、ViT！

中科院&华为诺亚提出ViG：一种全新的骨干网络，性能不输CNN、ViT！

CVer

1+阅读 · 2022年6月9日

用GNN做CV三大任务的新骨干，同计算成本性能不输CNN、ViT与MLP｜中科院&华为诺亚开源

用GNN做CV三大任务的新骨干，同计算成本性能不输CNN、ViT与MLP｜中科院&华为诺亚开源

量子位

0+阅读 · 2022年6月9日

卷积越大性能越强！RepLKNet一作在线分享：Transformer阴影下的超大卷积核复兴

卷积越大性能越强！RepLKNet一作在线分享：Transformer阴影下的超大卷积核复兴

机器之心

0+阅读 · 2022年3月22日

金属有机热载纳米流体的储能机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于张量稀疏L1图的半监督极化SAR影像地物分类

国家自然科学基金

0+阅读 · 2015年12月31日

应用数学暑期学校（2015）

国家自然科学基金

5+阅读 · 2015年7月12日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

多金属介导DNA基分子导线电荷输运机理与功能研究

国家自然科学基金

0+阅读 · 2013年12月31日

科技论文的语义模式研究

国家自然科学基金

0+阅读 · 2013年12月31日

多金属氧簇/嵌段共聚物杂化材料：有序自组装及协同介电性能

国家自然科学基金

0+阅读 · 2012年12月31日

人工脑基于同源同类事物连通本性的模式识别新神经网络模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

巨型图结构数据的联机分析模型及算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

地下水渗流引起无粘性土层沉降的细观机理研究

国家自然科学基金

0+阅读 · 2009年12月31日

Adaptive Graph Diffusion Networks

Arxiv

0+阅读 · 2022年9月2日

Training Graph Neural Networks with 1000 Layers

Arxiv

13+阅读 · 2021年6月14日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Interpreting and Unifying Graph Neural Networks with An Optimization Framework

Arxiv

18+阅读 · 2021年1月28日

Temporal Relational Modeling with Self-Supervision for Action Segmentation

Arxiv

13+阅读 · 2020年12月14日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds

Arxiv

11+阅读 · 2019年11月25日

Position-aware Graph Neural Networks

Position-aware Graph Neural Networks

Arxiv

15+阅读 · 2019年6月11日

Deep Graph Infomax

Deep Graph Infomax

Arxiv

17+阅读 · 2018年12月21日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

VIP会员

相关主题

图神经网络

相关VIP内容

TPAMI 2022｜华为诺亚最新视觉Transformer综述

TPAMI 2022｜华为诺亚最新视觉Transformer综述

专知会员服务

56+阅读 · 2022年2月24日

近期必读的5篇顶会CVPR 2021【视频理解】相关论文和代码

专知会员服务

38+阅读 · 2021年3月31日

近期必读的五篇ICLR 2021【图神经网络（GNN）】相关论文和代码

近期必读的五篇ICLR 2021【图神经网络（GNN）】相关论文和代码

专知会员服务

69+阅读 · 2021年2月25日

【NeurIPS 2020】图神经网络GNN架构设计

【NeurIPS 2020】图神经网络GNN架构设计

专知会员服务

84+阅读 · 2020年11月19日

Graph Normalization (GN)：为图神经网络学习一个有效的图归一化

Graph Normalization (GN)：为图神经网络学习一个有效的图归一化

专知会员服务

16+阅读 · 2020年9月28日

近期必读的五篇计算机视觉顶会CVPR 2020【图神经网络 (GNN) 】相关论文-Part 3

近期必读的五篇计算机视觉顶会CVPR 2020【图神经网络 (GNN) 】相关论文-Part 3

专知会员服务

90+阅读 · 2020年5月19日

近期必读的5篇顶会CVPR 2020【图神经网络（GNN）】相关论文-Part2

近期必读的5篇顶会CVPR 2020【图神经网络（GNN）】相关论文-Part2

专知会员服务

84+阅读 · 2020年3月17日

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

专知会员服务

15+阅读 · 2020年1月9日

【WSDM 2020 论文】基于自关注网络的动态图表示学习（Dynamic graph representation learning via self-attention networks），Visa Research的研究员武延宏等

【WSDM 2020 论文】基于自关注网络的动态图表示学习（Dynamic graph representation learning via self-attention networks），Visa Research的研究员武延宏等

专知会员服务

98+阅读 · 2019年11月20日

六篇 CIKM 2019 必读的【图神经网络(GNN)】长文论文

六篇 CIKM 2019 必读的【图神经网络(GNN)】长文论文

专知会员服务

38+阅读 · 2019年11月3日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能治理的未来

模态感知的特征匹配：单一模态与跨模态技术的全面综述

无监督行人重识别研究综述

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

相关资讯

极市直播丨ECCV2022-涂正中：让谷歌的骨干网络MaxViT治好你的科研内耗

极市直播丨ECCV2022-涂正中：让谷歌的骨干网络MaxViT治好你的科研内耗

极市平台

4+阅读 · 2022年7月31日

极市直播丨严彬-Unicorn：走向目标跟踪的大一统（ECCV2022 Oral）

极市直播丨严彬-Unicorn：走向目标跟踪的大一统（ECCV2022 Oral）

极市平台

1+阅读 · 2022年7月24日

图神经网络试图打入CV主流？中科大华为等联合开源ViG：首次用于视觉任务的GNN

图神经网络试图打入CV主流？中科大华为等联合开源ViG：首次用于视觉任务的GNN

极市平台

0+阅读 · 2022年6月30日

CV顶会最佳论文得主分享：好论文是怎么炼成的？

CV顶会最佳论文得主分享：好论文是怎么炼成的？

极市平台

0+阅读 · 2022年6月29日

CVPR22 ｜CMT：CNN和Transformer的高效结合（开源）

CVPR22 ｜CMT：CNN和Transformer的高效结合（开源）

极市平台

2+阅读 · 2022年6月28日

图神经网络也能用作CV骨干模型，华为诺亚ViG架构媲美CNN、Transformer

图神经网络也能用作CV骨干模型，华为诺亚ViG架构媲美CNN、Transformer

机器之心

0+阅读 · 2022年6月26日

CV的未来是图神经网络？中科院软件所发布全新CV模型ViG，性能超越ViT

CV的未来是图神经网络？中科院软件所发布全新CV模型ViG，性能超越ViT

图与推荐

0+阅读 · 2022年6月26日

中科院&华为诺亚提出ViG：一种全新的骨干网络，性能不输CNN、ViT！

中科院&华为诺亚提出ViG：一种全新的骨干网络，性能不输CNN、ViT！

CVer

1+阅读 · 2022年6月9日

用GNN做CV三大任务的新骨干，同计算成本性能不输CNN、ViT与MLP｜中科院&华为诺亚开源

用GNN做CV三大任务的新骨干，同计算成本性能不输CNN、ViT与MLP｜中科院&华为诺亚开源

量子位

0+阅读 · 2022年6月9日

卷积越大性能越强！RepLKNet一作在线分享：Transformer阴影下的超大卷积核复兴

卷积越大性能越强！RepLKNet一作在线分享：Transformer阴影下的超大卷积核复兴

机器之心

0+阅读 · 2022年3月22日

相关基金

金属有机热载纳米流体的储能机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于张量稀疏L1图的半监督极化SAR影像地物分类

国家自然科学基金

0+阅读 · 2015年12月31日

应用数学暑期学校（2015）

国家自然科学基金

5+阅读 · 2015年7月12日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

多金属介导DNA基分子导线电荷输运机理与功能研究

国家自然科学基金

0+阅读 · 2013年12月31日

科技论文的语义模式研究

国家自然科学基金

0+阅读 · 2013年12月31日

多金属氧簇/嵌段共聚物杂化材料：有序自组装及协同介电性能

国家自然科学基金

0+阅读 · 2012年12月31日

人工脑基于同源同类事物连通本性的模式识别新神经网络模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

巨型图结构数据的联机分析模型及算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

地下水渗流引起无粘性土层沉降的细观机理研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Adaptive Graph Diffusion Networks

Arxiv

0+阅读 · 2022年9月2日

Training Graph Neural Networks with 1000 Layers

Arxiv

13+阅读 · 2021年6月14日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Interpreting and Unifying Graph Neural Networks with An Optimization Framework

Arxiv

18+阅读 · 2021年1月28日

Temporal Relational Modeling with Self-Supervision for Action Segmentation

Arxiv

13+阅读 · 2020年12月14日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds

Arxiv

11+阅读 · 2019年11月25日

Position-aware Graph Neural Networks

Position-aware Graph Neural Networks

Arxiv

15+阅读 · 2019年6月11日

Deep Graph Infomax

Deep Graph Infomax

Arxiv

17+阅读 · 2018年12月21日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

大家都在搜

大型语言模型

久别重逢话双塔

国防科技创新

软件无线电

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员