【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embedding)最新综述论文 - 专知

会员服务 ·

0

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embedding)最新综述论文

2020 年 3 月 18 日 专知

【导读】词嵌入表示向量是自然语言处理的重要组成部分。最近来自牛津大学和DeepMind等撰写了关于上下文嵌入表示的综述论文，详述了当前预训练模型的代表性工作等。

地址：

https://www.zhuanzhi.ai/paper/74bd42517a67f1258516cb5086cf3524

上下文嵌入，如ELMo和BERT，超越了像Word2Vec这样的全局单词表示，在广泛的自然语言处理任务中取得了突破性的性能。上下文嵌入根据上下文为每个单词分配一个表示，从而捕获不同上下文中单词的用法，并对跨语言传输的知识进行编码。在这项综述中，我们回顾了现有的上下文嵌入模型、跨语言的多语言预训练、上下文嵌入在下游任务中的应用、模型压缩和模型分析。

在大型语料库无监督训练的分布式词表示(Turian et al., 2010; Mikolov et al., 2013; Pennington et al., 2014）在现代自然语言处理系统中得到了广泛的应用。但是，这些方法只获得每个单词的一个全局表示，而忽略了它们的上下文。与传统的单词表示不同，上下文嵌入超越了单词级语义，因为每个标记都与作为整个输入序列的函数的表示相关联。这些与上下文相关的表示可以在不同的上下文中捕捉到词汇的许多句法和语义特征。(Peters et al., 2018; Devlin et al., 2018; Yang et al., 2019; Raffel et al., 2019)的研究表明，在大规模未标记的语料库上预训练的上下文嵌入，在文本分类、问题回答和文本摘要等一系列自然语言处理任务上取得了最先进的表现。进一步的分析(Liu et al., 2019a; Hewitt and Liang, 2019; Hewitt and Manning, 2019; Tenney et al., 2019a)证明了上下文嵌入能够学习跨语言的有用且可迁移的表示。

综述论文的其余部分组织如下。在第2节中，我们定义了上下文嵌入的概念。在第3节中，我们将介绍获取上下文嵌入的现有方法。第四部分介绍了多语言语料库中下文嵌入的预处理方法。在第5节中，我们描述了在下游任务中应用预训练的上下文嵌入的方法。在第6节中，我们详细介绍了模型压缩方法。在第7节中，我们调查了旨在识别通过语境嵌入学到的语言知识的分析。在第8节中，我们通过强调未来研究的一些挑战来结束综述。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“CE” 就可以获取《从Word2Vec到BERT:上下文嵌入(Contextual Embedding)最新综述论文》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

2

相关内容

上下文嵌入

上下文嵌入

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

专知会员服务

101+阅读 · 2020年6月16日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知会员服务

189+阅读 · 2020年4月4日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知会员服务

105+阅读 · 2020年3月19日

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

专知会员服务

85+阅读 · 2020年3月18日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

专知会员服务

269+阅读 · 2020年1月4日

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

专知会员服务

40+阅读 · 2019年11月23日

【AAAI2020论文】概念结构化嵌入医疗文本表示（Learning Conceptual-Contextual Embeddings for Medical Text）

【AAAI2020论文】概念结构化嵌入医疗文本表示（Learning Conceptual-Contextual Embeddings for Medical Text）

专知会员服务

49+阅读 · 2019年11月15日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

【论文笔记】基于BERT的知识图谱补全

【论文笔记】基于BERT的知识图谱补全

专知

116+阅读 · 2019年9月15日

图卷积神经网络(GCN)文本分类详述

图卷积神经网络(GCN)文本分类详述

专知

280+阅读 · 2019年4月5日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

情感分析词嵌入预处理细粒度实验综述（附20页全文下载）

情感分析词嵌入预处理细粒度实验综述（附20页全文下载）

专知

18+阅读 · 2019年2月5日

Word Embedding 词嵌入最新综述论文（附全文下载）

Word Embedding 词嵌入最新综述论文（附全文下载）

专知

9+阅读 · 2019年1月30日

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

AINLP

16+阅读 · 2018年11月9日

Network Embedding 指南

Network Embedding 指南

专知

21+阅读 · 2018年8月13日

学界 | 词嵌入2017年进展全面梳理：趋势和未来方向

学界 | 词嵌入2017年进展全面梳理：趋势和未来方向

机器之心

4+阅读 · 2017年10月24日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

Deep Universal Graph Embedding Neural Network

Arxiv

6+阅读 · 2019年9月25日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

Entity-aware ELMo: Learning Contextual Entity Representation for Entity Disambiguation

Arxiv

3+阅读 · 2019年8月22日

Hypernetwork Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年10月18日

Adversarial Feature Augmentation for Unsupervised Domain Adaptation

Arxiv

6+阅读 · 2018年5月4日

Community Aware Random Walk for Network Embedding

Arxiv

4+阅读 · 2018年2月19日

An overview of embedding models of entities and relationships for knowledge base completion

Arxiv

5+阅读 · 2018年2月3日

Analyzing Language Learned by an Active Question Answering Agent

Arxiv

6+阅读 · 2018年1月23日

VIP会员

相关主题

上下文嵌入

词向量表示

相关VIP内容

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

专知会员服务

101+阅读 · 2020年6月16日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知会员服务

189+阅读 · 2020年4月4日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知会员服务

105+阅读 · 2020年3月19日

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

专知会员服务

85+阅读 · 2020年3月18日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

专知会员服务

269+阅读 · 2020年1月4日

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

专知会员服务

40+阅读 · 2019年11月23日

【AAAI2020论文】概念结构化嵌入医疗文本表示（Learning Conceptual-Contextual Embeddings for Medical Text）

【AAAI2020论文】概念结构化嵌入医疗文本表示（Learning Conceptual-Contextual Embeddings for Medical Text）

专知会员服务

49+阅读 · 2019年11月15日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

【论文笔记】基于BERT的知识图谱补全

【论文笔记】基于BERT的知识图谱补全

专知

116+阅读 · 2019年9月15日

图卷积神经网络(GCN)文本分类详述

图卷积神经网络(GCN)文本分类详述

专知

280+阅读 · 2019年4月5日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

情感分析词嵌入预处理细粒度实验综述（附20页全文下载）

情感分析词嵌入预处理细粒度实验综述（附20页全文下载）

专知

18+阅读 · 2019年2月5日

Word Embedding 词嵌入最新综述论文（附全文下载）

Word Embedding 词嵌入最新综述论文（附全文下载）

专知

9+阅读 · 2019年1月30日

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

AINLP

16+阅读 · 2018年11月9日

Network Embedding 指南

Network Embedding 指南

专知

21+阅读 · 2018年8月13日

学界 | 词嵌入2017年进展全面梳理：趋势和未来方向

学界 | 词嵌入2017年进展全面梳理：趋势和未来方向

机器之心

4+阅读 · 2017年10月24日

相关论文

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

Deep Universal Graph Embedding Neural Network

Arxiv

6+阅读 · 2019年9月25日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

Entity-aware ELMo: Learning Contextual Entity Representation for Entity Disambiguation

Arxiv

3+阅读 · 2019年8月22日

Hypernetwork Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年10月18日

Adversarial Feature Augmentation for Unsupervised Domain Adaptation

Arxiv

6+阅读 · 2018年5月4日

Community Aware Random Walk for Network Embedding

Arxiv

4+阅读 · 2018年2月19日

An overview of embedding models of entities and relationships for knowledge base completion

Arxiv

5+阅读 · 2018年2月3日

Analyzing Language Learned by an Active Question Answering Agent

Arxiv

6+阅读 · 2018年1月23日

大家都在搜

大型语言模型

IJCAI2025教程

无人机系统

久别重逢话双塔

朱克爱德华兹家族

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员