【CVPR2022】以人为中心感知的多模态预训练 - 专知VIP

会员服务 ·

13

CVPR 2022 · 多模态预训练 · 论文 ·

2022 年 3 月 28 日

【CVPR2022】以人为中心感知的多模态预训练

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

以人为中心的感知在视觉和图形学中起着至关重要的作用。但是他们的数据注释非常昂贵。因此，希望有一个通用的预训练模型，作为数据高效的下游任务转移的基础。为此，我们提出了以人为中心的多模态对比学习框架HCMoCo，该框架利用人类数据的多模态特性(如RGB、深度、2D关键点)来进行有效的表示学习。该目标面临两个主要挑战: 多模态数据的密集预训练，稀疏人类先验的有效利用。**为了解决这一问题，我们设计了一种新型的密集样本内对比学习和稀疏结构感知对比学习目标，通过层次化学习具有连续和有序特征分布和结构感知语义一致性的模态不变潜空间。**HCMoCo通过组合异构数据集为不同的模态提供预训练，这允许有效地使用现有的特定于任务的人类数据。在四个不同模式的下游任务上的大量实验证明了HCMoCo的有效性，特别是在数据效率设置下(DensePose Estimation和Human Parsing提高了7.16%和12%)。此外，通过探索跨模态监督和缺失模态推理，我们证明了HCMoCo的多功能性，验证了它在跨模态联想和推理方面的强大能力。

https://www.zhuanzhi.ai/paper/3e8a73c1d485a5e417b1e659558792c0

成为VIP会员查看完整内容

30

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知会员服务

33+阅读 · 2022年3月3日

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知

1+阅读 · 2022年3月30日

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知

3+阅读 · 2022年3月3日

【AAAI2022】不确定性感知的多视角表示学习

【AAAI2022】不确定性感知的多视角表示学习

专知

1+阅读 · 2022年1月25日

自动驾驶权威评测世界第一，鉴智机器人推出纯视觉3D感知新范式

自动驾驶权威评测世界第一，鉴智机器人推出纯视觉3D感知新范式

机器之心

0+阅读 · 2021年12月23日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知

3+阅读 · 2021年4月9日

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能视觉监控的大规模慢特征学习研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于视感知的图像视频语义获取关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于NAM的动态视觉信息认知理解方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于环境感知的应急响应知识需求研究

国家自然科学基金

5+阅读 · 2008年12月31日

Semi-Supervised Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

Coalgebras for Bisimulation of Weighted Automata over Semirings

Arxiv

0+阅读 · 2022年4月18日

3D Compositional Zero-shot Learning with DeCompositional Consensus

3D Compositional Zero-shot Learning with DeCompositional Consensus

Arxiv

0+阅读 · 2022年4月15日

An alternative approach for distributed parameter estimation under Gaussian settings

Arxiv

0+阅读 · 2022年4月14日

Your "Labrador" is My "Dog": Fine-Grained, or Not

Arxiv

27+阅读 · 2021年2月17日

VIP会员

相关主题

多模态预训练

相关VIP内容

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知会员服务

33+阅读 · 2022年3月3日

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

【CVPR2022】基于序列对比学习的长视频帧方向动作表示

专知

1+阅读 · 2022年3月30日

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知

3+阅读 · 2022年3月3日

【AAAI2022】不确定性感知的多视角表示学习

【AAAI2022】不确定性感知的多视角表示学习

专知

1+阅读 · 2022年1月25日

自动驾驶权威评测世界第一，鉴智机器人推出纯视觉3D感知新范式

自动驾驶权威评测世界第一，鉴智机器人推出纯视觉3D感知新范式

机器之心

0+阅读 · 2021年12月23日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知

3+阅读 · 2021年4月9日

相关基金

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能视觉监控的大规模慢特征学习研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于视感知的图像视频语义获取关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于NAM的动态视觉信息认知理解方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于环境感知的应急响应知识需求研究

国家自然科学基金

5+阅读 · 2008年12月31日

相关论文

Semi-Supervised Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

Coalgebras for Bisimulation of Weighted Automata over Semirings

Arxiv

0+阅读 · 2022年4月18日

3D Compositional Zero-shot Learning with DeCompositional Consensus

3D Compositional Zero-shot Learning with DeCompositional Consensus

Arxiv

0+阅读 · 2022年4月15日

An alternative approach for distributed parameter estimation under Gaussian settings

Arxiv

0+阅读 · 2022年4月14日

Your "Labrador" is My "Dog": Fine-Grained, or Not

Arxiv

27+阅读 · 2021年2月17日

微信扫码咨询专知VIP会员