【CVPR2022教程】微软《视觉语言预训练进展》教程，400+页ppt - 专知VIP

会员服务 ·

35

CVPR 2022 · 视觉语言预训练 · 计算机视觉 · 自然语言处理 ·

2022 年 6 月 23 日

【CVPR2022教程】微软《视觉语言预训练进展》教程，400+页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人类通过多种渠道感知世界，如眼睛看到的图像或耳朵听到的声音。尽管任何一个单独的通道可能是不完整的或有噪声的，但人类可以自然地将从多个通道收集的信息进行排列和融合，以便掌握更好地理解世界所需的关键概念。人工智能的核心愿望之一是开发算法，使计算机具有从多模态(或多通道)数据中有效学习的能力。这些数据类似于通过视觉和语言获得的视觉和声音，帮助人类理解周围的世界。例如，计算机可以通过搜索最相似的图像来进行文本查询(反之亦然)，并通过使用自然语言描述图像的内容来模拟这种能力。

视觉与语言(VL)，一个位于计算机视觉和自然语言处理(NLP)之间的热门研究领域，旨在实现这一目标。视觉与语言预训练(vision and language pre-training, VLP)受到语言模型预训练在NLP中的巨大成功的启发，近年来迅速引起了两方面的关注。在本教程中，我们将涵盖VLP前沿的最新方法和原则，包括(1) 基于区域特征和端到端图像文本训练前;(2) 统一的视觉语言建模;(3) 延伸到视频语言预训练; (4) 从语言监督中学习视觉模型;(5) 视觉合成。

https://dvsml2022-tutorial.github.io/index.html/

成为VIP会员查看完整内容

81

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

专知会员服务

58+阅读 · 2022年7月24日

UC San Diego清华大学CVPR2022《具身人工智能》教程，260+页ppt

UC San Diego清华大学CVPR2022《具身人工智能》教程，260+页ppt

专知会员服务

67+阅读 · 2022年6月24日

【COMPTEXT2022教程】跨语言监督文本分类，41页ppt

【COMPTEXT2022教程】跨语言监督文本分类，41页ppt

专知会员服务

16+阅读 · 2022年6月14日

ACL2022开会了！DeepMind学者等《视觉语言预训练:当前趋势与未来》教程，阐述最新前沿技术，附Slides

ACL2022开会了！DeepMind学者等《视觉语言预训练:当前趋势与未来》教程，阐述最新前沿技术，附Slides

专知会员服务

49+阅读 · 2022年5月22日

【ICCV2021-Tutorial】大规模视觉定位，151页ppt

专知会员服务

30+阅读 · 2021年10月20日

【ACMMM2021】密集对比视觉语言预训练

专知会员服务

12+阅读 · 2021年10月11日

视觉语言研究进展到哪了？CVPR2021视觉语言研究全面概述：预训练、视觉问答等，附视频与430页ppt

视觉语言研究进展到哪了？CVPR2021视觉语言研究全面概述：预训练、视觉问答等，附视频与430页ppt

专知会员服务

42+阅读 · 2021年7月9日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

239+阅读 · 2020年6月20日

【CVPR2020-微软&FB】自监督学习的视觉语言建模，115页ppt讲述多模态预训练进展

【CVPR2020-微软&FB】自监督学习的视觉语言建模，115页ppt讲述多模态预训练进展

专知会员服务

57+阅读 · 2020年6月18日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

177+阅读 · 2020年5月29日

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

专知

2+阅读 · 2022年7月25日

【微软亚研ICASSP 2022 教程】神经文本语音合成，107页ppt

【微软亚研ICASSP 2022 教程】神经文本语音合成，107页ppt

专知

1+阅读 · 2022年5月25日

微软等ACL2022《知识增强自然语言处理》教程，阐述最新前沿技术，附185页ppt

微软等ACL2022《知识增强自然语言处理》教程，阐述最新前沿技术，附185页ppt

专知

0+阅读 · 2022年5月24日

AAAI2022最新「图深度学习自然语言处理」教程报告，256+页PPT阐述最新进展

AAAI2022最新「图深度学习自然语言处理」教程报告，256+页PPT阐述最新进展

专知

7+阅读 · 2022年3月15日

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

专知

0+阅读 · 2022年3月6日

中科院自动化所：最新视觉-语言预训练综述

中科院自动化所：最新视觉-语言预训练综述

PaperWeekly

3+阅读 · 2022年3月1日

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

新智元

1+阅读 · 2022年2月15日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

38+阅读 · 2020年6月20日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

专知

17+阅读 · 2019年6月3日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于跨媒体语义关联模型的图像检索技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

亚洲中部干旱区湿地遥感制图与时空变化过程研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂场景视觉注意对象分割方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

桐柏造山带及其邻区地壳上地幔三维结构与地球动力学研究

国家自然科学基金

0+阅读 · 2012年12月31日

固有免疫模式识别受体NOD1-2异常表达在母胎界面免疫紊乱中的作用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于人类视觉感知的高分辨率卫星遥感图像智能分类方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于目标的注意模型及在图像分割和目标检测中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

句子语义的视觉表示研究

国家自然科学基金

4+阅读 · 2009年12月31日

Domain Generalization: A Survey

Arxiv

2+阅读 · 2022年8月12日

Continual Machine Reading Comprehension via Uncertainty-aware Fixed Memory and Adversarial Domain Adaptation

Arxiv

0+阅读 · 2022年8月10日

EXTERN: Leveraging Endo-Temporal Regularization for Black-box Video Domain Adaptation

Arxiv

0+阅读 · 2022年8月10日

Balanced Multimodal Learning via On-the-fly Gradient Modulation

Arxiv

13+阅读 · 2022年3月29日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

Image Segmentation Using Deep Learning: A Survey

Image Segmentation Using Deep Learning: A Survey

Arxiv

43+阅读 · 2020年1月15日

Knowledge Representation Learning: A Quantitative Review

Knowledge Representation Learning: A Quantitative Review

Arxiv

27+阅读 · 2018年12月28日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Deep Representation Learning for Domain Adaptation of Semantic Image Segmentation

Arxiv

10+阅读 · 2018年5月10日

VIP会员

相关主题

视觉语言预训练

计算机视觉

自然语言处理

相关VIP内容

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

专知会员服务

58+阅读 · 2022年7月24日

UC San Diego清华大学CVPR2022《具身人工智能》教程，260+页ppt

UC San Diego清华大学CVPR2022《具身人工智能》教程，260+页ppt

专知会员服务

67+阅读 · 2022年6月24日

【COMPTEXT2022教程】跨语言监督文本分类，41页ppt

【COMPTEXT2022教程】跨语言监督文本分类，41页ppt

专知会员服务

16+阅读 · 2022年6月14日

ACL2022开会了！DeepMind学者等《视觉语言预训练:当前趋势与未来》教程，阐述最新前沿技术，附Slides

ACL2022开会了！DeepMind学者等《视觉语言预训练:当前趋势与未来》教程，阐述最新前沿技术，附Slides

专知会员服务

49+阅读 · 2022年5月22日

【ICCV2021-Tutorial】大规模视觉定位，151页ppt

专知会员服务

30+阅读 · 2021年10月20日

【ACMMM2021】密集对比视觉语言预训练

专知会员服务

12+阅读 · 2021年10月11日

视觉语言研究进展到哪了？CVPR2021视觉语言研究全面概述：预训练、视觉问答等，附视频与430页ppt

视觉语言研究进展到哪了？CVPR2021视觉语言研究全面概述：预训练、视觉问答等，附视频与430页ppt

专知会员服务

42+阅读 · 2021年7月9日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

239+阅读 · 2020年6月20日

【CVPR2020-微软&FB】自监督学习的视觉语言建模，115页ppt讲述多模态预训练进展

【CVPR2020-微软&FB】自监督学习的视觉语言建模，115页ppt讲述多模态预训练进展

专知会员服务

57+阅读 · 2020年6月18日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

177+阅读 · 2020年5月29日

热门VIP内容

相关资讯

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

IJCAI2022开会了! 微软等《领域泛化Domain Generalization》教程，阐述DG最新进展，附PPT和视频

专知

2+阅读 · 2022年7月25日

【微软亚研ICASSP 2022 教程】神经文本语音合成，107页ppt

【微软亚研ICASSP 2022 教程】神经文本语音合成，107页ppt

专知

1+阅读 · 2022年5月25日

微软等ACL2022《知识增强自然语言处理》教程，阐述最新前沿技术，附185页ppt

微软等ACL2022《知识增强自然语言处理》教程，阐述最新前沿技术，附185页ppt

专知

0+阅读 · 2022年5月24日

AAAI2022最新「图深度学习自然语言处理」教程报告，256+页PPT阐述最新进展

AAAI2022最新「图深度学习自然语言处理」教程报告，256+页PPT阐述最新进展

专知

7+阅读 · 2022年3月15日

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

专知

0+阅读 · 2022年3月6日

中科院自动化所：最新视觉-语言预训练综述

中科院自动化所：最新视觉-语言预训练综述

PaperWeekly

3+阅读 · 2022年3月1日

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

新智元

1+阅读 · 2022年2月15日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

38+阅读 · 2020年6月20日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

专知

17+阅读 · 2019年6月3日

相关基金

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于跨媒体语义关联模型的图像检索技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

亚洲中部干旱区湿地遥感制图与时空变化过程研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂场景视觉注意对象分割方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

桐柏造山带及其邻区地壳上地幔三维结构与地球动力学研究

国家自然科学基金

0+阅读 · 2012年12月31日

固有免疫模式识别受体NOD1-2异常表达在母胎界面免疫紊乱中的作用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于人类视觉感知的高分辨率卫星遥感图像智能分类方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于目标的注意模型及在图像分割和目标检测中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

句子语义的视觉表示研究

国家自然科学基金

4+阅读 · 2009年12月31日

相关论文

Domain Generalization: A Survey

Arxiv

2+阅读 · 2022年8月12日

Continual Machine Reading Comprehension via Uncertainty-aware Fixed Memory and Adversarial Domain Adaptation

Arxiv

0+阅读 · 2022年8月10日

EXTERN: Leveraging Endo-Temporal Regularization for Black-box Video Domain Adaptation

Arxiv

0+阅读 · 2022年8月10日

Balanced Multimodal Learning via On-the-fly Gradient Modulation

Arxiv

13+阅读 · 2022年3月29日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

Image Segmentation Using Deep Learning: A Survey

Image Segmentation Using Deep Learning: A Survey

Arxiv

43+阅读 · 2020年1月15日

Knowledge Representation Learning: A Quantitative Review

Knowledge Representation Learning: A Quantitative Review

Arxiv

27+阅读 · 2018年12月28日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Deep Representation Learning for Domain Adaptation of Semantic Image Segmentation

Arxiv

10+阅读 · 2018年5月10日

微信扫码咨询专知VIP会员