Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展 - 专知VIP

会员服务 ·

6

Transformer · 预训练模型 · 文本排序 ·

2021 年 3 月 18 日

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

文本排序的目标是生成从语料库检索到的有序文本列表，以响应特定任务的查询。虽然文本排序最常见的形式是搜索，但在许多自然语言处理应用程序中也可以找到该任务的实例。

本书提供了Transformer神经网络架构的文本排序的概述，其中BERT是最著名的例子。毫不夸张地说，Transformer和自监督预训练的结合彻底改变了自然语言处理(NLP)、信息检索(IR)等领域。在文本排名的上下文中，这些模型在许多领域、任务和设置中产生高质量的结果。

在这项综述中，我们提供了现有工作的综合，作为希望更好地理解如何将transformers应用于文本排序问题的从业者和希望在这一领域继续工作的研究人员的单一切入点。我们涵盖了广泛的现代技术，分为两个高级类别:在多阶段排名体系结构中执行重新排名的transformer模型，以及尝试直接执行排名的密集表示。有许多例子属于第一类，包括基于相关性分类的方法、来自多个文本片段的证据聚合、语料库分析和序列到序列模型。虽然第二类方法还没有得到很好的研究，但使用transformers进行表示学习是一个新兴的和令人兴奋的方向，必将引起更多的关注。在我们的调研中，有两个主题贯穿始终:处理长文档的技术(在NLP中使用的典型逐句处理方法之外)，以及处理有效性(结果质量)和效率(查询延迟)之间权衡的技术。

尽管transformer架构和预训练技术是最近的创新，但它们如何应用于文本排序的许多方面已经被比较好地理解，并代表了成熟的技术。然而，仍然存在许多开放的研究问题，因此，除了为文本排序预先设定训练transformers的基础之外，该调研还试图预测该领域的发展方向。

https://www.zhuanzhi.ai/paper/fe2037d3186f4dd1fe3c3ea1fb69f79e

成为VIP会员查看完整内容

69

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

从视觉到文本: 图像描述生成的研究进展综述

专知会员服务

67+阅读 · 2020年12月24日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

【EMNLP2020】高性能自然语言处理，274页ppt详述最新Transformer等技术进展

【EMNLP2020】高性能自然语言处理，274页ppt详述最新Transformer等技术进展

专知会员服务

61+阅读 · 2020年11月21日

【2020新书】深度学习自然语言处理简明导论，69页pdf

【2020新书】深度学习自然语言处理简明导论，69页pdf

专知会员服务

117+阅读 · 2020年11月7日

滑铁卢大学新书《基于预训练Transformer模型的文本排序》，204页pdf

滑铁卢大学新书《基于预训练Transformer模型的文本排序》，204页pdf

专知会员服务

44+阅读 · 2020年10月18日

【2020新书】预训练Transformer模型的文本排序

【2020新书】预训练Transformer模型的文本排序

专知会员服务

63+阅读 · 2020年10月18日

最新《文本深度学习模型压缩》综述论文，21页pdf

最新《文本深度学习模型压缩》综述论文，21页pdf

专知会员服务

26+阅读 · 2020年8月19日

【文本分类大综述：从浅层到深度学习，35页pdf】

【文本分类大综述：从浅层到深度学习，35页pdf】

专知会员服务

188+阅读 · 2020年8月6日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

深度学习自然语言处理综述，266篇参考文献

深度学习自然语言处理综述，266篇参考文献

专知会员服务

231+阅读 · 2019年10月12日

滑铁卢大学2020新书《预训练Transformer模型文本排序》，155页pdf

滑铁卢大学2020新书《预训练Transformer模型文本排序》，155页pdf

专知

10+阅读 · 2020年10月19日

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知

9+阅读 · 2020年6月16日

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

专知

15+阅读 · 2020年4月28日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

69+阅读 · 2019年12月4日

【必读】2019年深度学习自然语言处理最新十大发展趋势, 附报告下载

【必读】2019年深度学习自然语言处理最新十大发展趋势, 附报告下载

专知

20+阅读 · 2019年10月13日

从经典结构到改进方法，神经网络语言模型综述

从经典结构到改进方法，神经网络语言模型综述

机器之心

3+阅读 · 2019年7月23日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

2017深度学习NLP进展与趋势

2017深度学习NLP进展与趋势

全球人工智能

5+阅读 · 2017年12月19日

Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents

Arxiv

2+阅读 · 2021年5月9日

Enhancing Transformers with Gradient Boosted Decision Trees for NLI Fine-Tuning

Arxiv

0+阅读 · 2021年5月8日

Empirical Evaluation of Pre-trained Transformers for Human-Level NLP: The Role of Sample Size and Dimensionality

Arxiv

0+阅读 · 2021年5月7日

ISTR: End-to-End Instance Segmentation with Transformers

Arxiv

0+阅读 · 2021年5月6日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Visualizing Attention in Transformer-Based Language Representation Models

Visualizing Attention in Transformer-Based Language Representation Models

Arxiv

3+阅读 · 2019年4月11日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

VIP会员

相关主题

预训练模型

相关VIP内容

从视觉到文本: 图像描述生成的研究进展综述

专知会员服务

67+阅读 · 2020年12月24日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

【EMNLP2020】高性能自然语言处理，274页ppt详述最新Transformer等技术进展

【EMNLP2020】高性能自然语言处理，274页ppt详述最新Transformer等技术进展

专知会员服务

61+阅读 · 2020年11月21日

【2020新书】深度学习自然语言处理简明导论，69页pdf

【2020新书】深度学习自然语言处理简明导论，69页pdf

专知会员服务

117+阅读 · 2020年11月7日

滑铁卢大学新书《基于预训练Transformer模型的文本排序》，204页pdf

滑铁卢大学新书《基于预训练Transformer模型的文本排序》，204页pdf

专知会员服务

44+阅读 · 2020年10月18日

【2020新书】预训练Transformer模型的文本排序

【2020新书】预训练Transformer模型的文本排序

专知会员服务

63+阅读 · 2020年10月18日

最新《文本深度学习模型压缩》综述论文，21页pdf

最新《文本深度学习模型压缩》综述论文，21页pdf

专知会员服务

26+阅读 · 2020年8月19日

【文本分类大综述：从浅层到深度学习，35页pdf】

【文本分类大综述：从浅层到深度学习，35页pdf】

专知会员服务

188+阅读 · 2020年8月6日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

深度学习自然语言处理综述，266篇参考文献

深度学习自然语言处理综述，266篇参考文献

专知会员服务

231+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

【ACL2025教程】大语言模型的护栏与安全性：对其应用的安全、可靠与可控引导

《实现协同自主：从人机协作到多智能体系统》最新190页

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

通信网络智能体白皮书V1.0，61页pdf

相关资讯

滑铁卢大学2020新书《预训练Transformer模型文本排序》，155页pdf

滑铁卢大学2020新书《预训练Transformer模型文本排序》，155页pdf

专知

10+阅读 · 2020年10月19日

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知

9+阅读 · 2020年6月16日

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

【SIGIR2020-斯坦福大学】一种新的BERT类信息检索模型-又好又快的ColBERT

专知

15+阅读 · 2020年4月28日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

69+阅读 · 2019年12月4日

【必读】2019年深度学习自然语言处理最新十大发展趋势, 附报告下载

【必读】2019年深度学习自然语言处理最新十大发展趋势, 附报告下载

专知

20+阅读 · 2019年10月13日

从经典结构到改进方法，神经网络语言模型综述

从经典结构到改进方法，神经网络语言模型综述

机器之心

3+阅读 · 2019年7月23日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

2017深度学习NLP进展与趋势

2017深度学习NLP进展与趋势

全球人工智能

5+阅读 · 2017年12月19日

相关论文

Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents

Arxiv

2+阅读 · 2021年5月9日

Enhancing Transformers with Gradient Boosted Decision Trees for NLI Fine-Tuning

Arxiv

0+阅读 · 2021年5月8日

Empirical Evaluation of Pre-trained Transformers for Human-Level NLP: The Role of Sample Size and Dimensionality

Arxiv

0+阅读 · 2021年5月7日

ISTR: End-to-End Instance Segmentation with Transformers

Arxiv

0+阅读 · 2021年5月6日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Visualizing Attention in Transformer-Based Language Representation Models

Visualizing Attention in Transformer-Based Language Representation Models

Arxiv

3+阅读 · 2019年4月11日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

微信扫码咨询专知VIP会员