【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

一种基于知识蒸馏的弱监督图像文本匹配模型

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation

本文由腾讯 AI Lab 主导完成。弱监督的图像文本匹配旨在学习仅使用图像句子的对应来得到细颗粒度的图像区域和短语的对应. 因此，主要的挑战在于训练期间图像区域和句子短语之间缺少匹配的数据。

为了应对这一挑战，我们在训练时利用了通用的物体检测器知识蒸馏，并提出了利用对比学习来得到图像和文本细颗粒度匹配的新方法。我们的方法在弱监督的视觉区域和短语匹配任务上超越了以前的方法。

https://www.zhuanzhi.ai/paper/d59e9b614122852f5a78b38a14d43921

成为VIP会员查看完整内容

相关内容

知识蒸馏

关注 22

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【ECCV2020】通过最小化逆动力学分歧来实现从观察中模仿学习

专知会员服务

15+阅读 · 2020年9月6日

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

【CVPR2021】细粒度多标签分类

专知

44+阅读 · 2021年3月8日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

四大指标超现有模型！少样本的无监督图像翻译效果逆天| 技术头条

AI100

6+阅读 · 2019年5月13日

通过时空模型迁移学习的无监督的跨数据集行人重新识别

统计学习与视觉计算组

8+阅读 · 2018年10月23日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation

Arxiv

13+阅读 · 2020年7月3日

Self-Supervised Learning For Few-Shot Image Classification

Arxiv

19+阅读 · 2019年11月14日

S$^\mathbf{4}$L: Self-Supervised Semi-Supervised Learning

Arxiv

5+阅读 · 2019年5月9日

Multi-Stage Self-Supervised Learning for Graph Convolutional Networks

Arxiv

7+阅读 · 2019年2月28日