【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练 - 专知

会员服务 ·

0

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

2020 年 10 月 27 日 专知

我们提出了VILLA，这是已知的第一个针对视觉和语言(V+L)表征学习的大规模对抗训练。VILLA由两个训练阶段组成: (一)任务不可知的对抗性预训练; 其次(二)针对具体任务进行对抗性微调。为了避免在图像像素和文本标记上增加对抗性扰动，我们建议在每个模态的嵌入空间中进行对抗性训练。为了实现大规模训练，我们采用了“free”对抗式训练策略，并与基于KL发散的正则化相结合，提高了嵌入空间的高不变性。我们将VILLA应用到目前表现最好的V+L模型中，并在广泛的任务中达到了新的水平，包括视觉问题回答、视觉常识推理、图像-文本检索、参考表达理解、视觉隐含和NLVR2。

https://www.zhuanzhi.ai/paper/9ac766aec437a266e108f8dd71d3ab25

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“LSAT” 可以获取《【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练》论文专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

语言表示

语言表示一直是人工智能、计算语言学领域的研究热点。从早期的离散表示到最近的分散式表示，语言表示的主要研究内容包括如何针对不同的语言单位，设计表示语言的数据结构以及和语言的转换机制，即如何将语言转换成计算机内部的数据结构（理解）以及由计算机内部表示转换成语言（生成）。

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

专知会员服务

13+阅读 · 2021年1月14日

【普林斯顿陈丹琦团队】使预训练语言模型成为更好的少样本学习器

专知会员服务

31+阅读 · 2021年1月4日

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

专知会员服务

24+阅读 · 2020年11月4日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

27+阅读 · 2020年10月24日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

20+阅读 · 2020年10月24日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

48+阅读 · 2020年5月3日

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

专知会员服务

33+阅读 · 2020年4月5日

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

专知会员服务

37+阅读 · 2020年2月25日

【ICLR2020-牛津大学】自动发现和学习新的视觉类别与排名统计，13页pdf，Automatically Discovering and Learning New Visual Categories with Ranking Statistics

【ICLR2020-牛津大学】自动发现和学习新的视觉类别与排名统计，13页pdf，Automatically Discovering and Learning New Visual Categories with Ranking Statistics

专知会员服务

9+阅读 · 2020年2月15日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

44+阅读 · 2020年2月12日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

18+阅读 · 2020年6月28日

自然语言处理ACL2020论文列表

自然语言处理ACL2020论文列表

专知

12+阅读 · 2020年6月23日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

38+阅读 · 2020年6月20日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

11+阅读 · 2020年6月9日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知

7+阅读 · 2020年6月2日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【伯克利-滴滴出行】深度学习多源领域自适应综述论文

【伯克利-滴滴出行】深度学习多源领域自适应综述论文

专知

7+阅读 · 2020年2月28日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

11+阅读 · 2020年2月12日

新任务&数据集：视觉常识推理(VCR)

新任务&数据集：视觉常识推理(VCR)

专知

50+阅读 · 2018年12月1日

Disentangled Generative Causal Representation Learning

Arxiv

2+阅读 · 2021年1月21日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Large-Scale Adversarial Training for Vision-and-Language Representation Learning

Arxiv

7+阅读 · 2020年6月11日

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

Arxiv

19+阅读 · 2020年2月15日

A Comprehensive Survey on Transfer Learning

A Comprehensive Survey on Transfer Learning

Arxiv

117+阅读 · 2019年11月7日

Interpretable Adversarial Training for Text

Interpretable Adversarial Training for Text

Arxiv

5+阅读 · 2019年5月30日

Unsupervised Adversarial Visual Level Domain Adaptation for Learning Video Object Detectors from Images

Arxiv

3+阅读 · 2018年10月4日

Binary Constrained Deep Hashing Network for Image Retrieval without Manual Annotation

Binary Constrained Deep Hashing Network for Image Retrieval without Manual Annotation

Arxiv

3+阅读 · 2018年8月2日

Adversarial Meta-Learning

Arxiv

7+阅读 · 2018年6月8日

Deep Semantic Hashing with Generative Adversarial Networks

Arxiv

5+阅读 · 2018年4月23日

VIP会员

相关主题

大规模对抗训练

相关VIP内容

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

专知会员服务

13+阅读 · 2021年1月14日

【普林斯顿陈丹琦团队】使预训练语言模型成为更好的少样本学习器

专知会员服务

31+阅读 · 2021年1月4日

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

专知会员服务

24+阅读 · 2020年11月4日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

27+阅读 · 2020年10月24日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

20+阅读 · 2020年10月24日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

48+阅读 · 2020年5月3日

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

专知会员服务

33+阅读 · 2020年4月5日

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

专知会员服务

37+阅读 · 2020年2月25日

【ICLR2020-牛津大学】自动发现和学习新的视觉类别与排名统计，13页pdf，Automatically Discovering and Learning New Visual Categories with Ranking Statistics

【ICLR2020-牛津大学】自动发现和学习新的视觉类别与排名统计，13页pdf，Automatically Discovering and Learning New Visual Categories with Ranking Statistics

专知会员服务

9+阅读 · 2020年2月15日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

44+阅读 · 2020年2月12日

热门VIP内容

相关资讯

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

18+阅读 · 2020年6月28日

自然语言处理ACL2020论文列表

自然语言处理ACL2020论文列表

专知

12+阅读 · 2020年6月23日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

38+阅读 · 2020年6月20日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

11+阅读 · 2020年6月9日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知

7+阅读 · 2020年6月2日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【伯克利-滴滴出行】深度学习多源领域自适应综述论文

【伯克利-滴滴出行】深度学习多源领域自适应综述论文

专知

7+阅读 · 2020年2月28日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

11+阅读 · 2020年2月12日

新任务&数据集：视觉常识推理(VCR)

新任务&数据集：视觉常识推理(VCR)

专知

50+阅读 · 2018年12月1日

相关论文

Disentangled Generative Causal Representation Learning

Arxiv

2+阅读 · 2021年1月21日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Large-Scale Adversarial Training for Vision-and-Language Representation Learning

Arxiv

7+阅读 · 2020年6月11日

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

Arxiv

19+阅读 · 2020年2月15日

A Comprehensive Survey on Transfer Learning

A Comprehensive Survey on Transfer Learning

Arxiv

117+阅读 · 2019年11月7日

Interpretable Adversarial Training for Text

Interpretable Adversarial Training for Text

Arxiv

5+阅读 · 2019年5月30日

Unsupervised Adversarial Visual Level Domain Adaptation for Learning Video Object Detectors from Images

Arxiv

3+阅读 · 2018年10月4日

Binary Constrained Deep Hashing Network for Image Retrieval without Manual Annotation

Binary Constrained Deep Hashing Network for Image Retrieval without Manual Annotation

Arxiv

3+阅读 · 2018年8月2日

Adversarial Meta-Learning

Arxiv

7+阅读 · 2018年6月8日

Deep Semantic Hashing with Generative Adversarial Networks

Arxiv

5+阅读 · 2018年4月23日

大家都在搜

李清照词作

大型语言模型

伯克利博士论文

基于几何特征的激光雷达地面点云分割

微信扫码咨询专知VIP会员