DeepStruct: 面向结构化预测任务的预训练语言模型 | 论文荐读 - 专知

会员服务 ·

0

DeepStruct: 面向结构化预测任务的预训练语言模型 | 论文荐读

2022 年 3 月 22 日 学术头条

作者：

Chenguang Wang, Xiao Liu, Zui Chen, Haoyun Hong, Jie Tang, Dawn Song

Chenguang Wang, Xiao Liu, Zui Chen, Haoyun Hong, Jie Tang, and Dawn Song. DeepStruct: Pre-Training of Language Models for Structure Prediction. In Proceedings of the 60th Annual Meeting of the Association of Computational Linguistics (Findings of ACL'22).

本文介绍了一种提高语言模型的结构理解能力的方法。与以往面向特定任务设计和优化模型不同，我们对语言模型进行预训练，使其在一系列与任务无关的语料库上从文本中生成结构化的预测。我们的结构预训练使模型在结构任务方面所学到的知识得到零的转移。我们在 27 个数据集上研究了这种方法的性能，这些数据集横跨 10 个结构预测任务，包括开放信息提取、联合实体和关系提取、命名实体识别、关系分类、语义角色标记、事件抽取、指代消歧、知识探测、意图检测和对话状态跟踪。我们通过特定任务的训练集进一步进行多任务学习。我们表明，一个百亿参数的语言模型可以轻松地转移到大多数任务上，并以单一模型在我们评估的 27 个数据集中的 20 个上获得了最先进的性能。

点击【在看】及时获取更多讯息

登录查看更多

2

相关内容

结构化预测

结构化预测

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知会员服务

29+阅读 · 2022年1月28日

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

【Hinton新论文】语言建模目标检测Pix2seq

【Hinton新论文】语言建模目标检测Pix2seq

专知会员服务

26+阅读 · 2021年9月23日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

专知会员服务

71+阅读 · 2021年7月31日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【AAAI2020】实体关系联合抽取的编码器-解码器结构的有效建模（ Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction）

【AAAI2020】实体关系联合抽取的编码器-解码器结构的有效建模（ Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction）

专知会员服务

53+阅读 · 2019年11月22日

P-tuning v2: 提示微调方法可在跨规模和任务上与精调方法媲美 | 论文荐读

P-tuning v2: 提示微调方法可在跨规模和任务上与精调方法媲美 | 论文荐读

学术头条

2+阅读 · 2022年4月11日

信息抽取新SOTA！首个结构化生成式信息抽取预训练模型，一统信息抽取四大任务

信息抽取新SOTA！首个结构化生成式信息抽取预训练模型，一统信息抽取四大任务

PaperWeekly

6+阅读 · 2022年4月8日

有效且稳健的数据增强小样本学习 | 论文荐读

有效且稳健的数据增强小样本学习 | 论文荐读

学术头条

6+阅读 · 2022年3月25日

小样本自然语言理解的基准测试FewNLU | 论文荐读

小样本自然语言理解的基准测试FewNLU | 论文荐读

学术头条

1+阅读 · 2022年3月23日

基于自回归填空的通用语言模型预训练 | 论文荐读

基于自回归填空的通用语言模型预训练 | 论文荐读

学术头条

5+阅读 · 2022年3月14日

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知

0+阅读 · 2022年1月28日

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

开放知识图谱

1+阅读 · 2021年11月11日

论文浅尝 | 将结构预测作为增广自然语言间的翻译任务

论文浅尝 | 将结构预测作为增广自然语言间的翻译任务

开放知识图谱

0+阅读 · 2021年9月1日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

34+阅读 · 2013年12月31日

三维模型在异构空间中的语义迁移方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向海量数据语义标注众包的任务管理方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

科技论文的语义模式研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于词义的文档表示模型及多语亚文档主题分析研究

国家自然科学基金

0+阅读 · 2012年12月31日

文本语义模型和子空间聚类研究

国家自然科学基金

1+阅读 · 2009年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

面向查询的XML文本自动文摘研究

国家自然科学基金

0+阅读 · 2008年12月31日

Subset selection for linear mixed models

Arxiv

1+阅读 · 2022年4月18日

Transductive Learning for Abstractive News Summarization

Arxiv

0+阅读 · 2022年4月16日

Revisiting joint decoding based multi-talker speech recognition with DNN acoustic model

Revisiting joint decoding based multi-talker speech recognition with DNN acoustic model

Arxiv

0+阅读 · 2022年4月15日

ML_LTU at SemEval-2022 Task 4: T5 Towards Identifying Patronizing and Condescending Language

ML_LTU at SemEval-2022 Task 4: T5 Towards Identifying Patronizing and Condescending Language

Arxiv

0+阅读 · 2022年4月15日

Consecutive Decoding for Speech-to-text Translation

Arxiv

0+阅读 · 2022年4月15日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Reinforced Self-Attention Network: a Hybrid of Hard and Soft Attention for Sequence Modeling

Arxiv

16+阅读 · 2018年1月31日

A Structured Self-attentive Sentence Embedding

Arxiv

24+阅读 · 2017年3月9日

VIP会员

相关主题

结构化预测

预训练语言模型

相关VIP内容

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知会员服务

29+阅读 · 2022年1月28日

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

【Hinton新论文】语言建模目标检测Pix2seq

【Hinton新论文】语言建模目标检测Pix2seq

专知会员服务

26+阅读 · 2021年9月23日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

专知会员服务

71+阅读 · 2021年7月31日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【AAAI2020】实体关系联合抽取的编码器-解码器结构的有效建模（ Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction）

【AAAI2020】实体关系联合抽取的编码器-解码器结构的有效建模（ Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction）

专知会员服务

53+阅读 · 2019年11月22日

热门VIP内容

开通专知VIP会员享更多权益服务

【ACL2025教程】大语言模型的护栏与安全性：对其应用的安全、可靠与可控引导

《实现协同自主：从人机协作到多智能体系统》最新190页

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

通信网络智能体白皮书V1.0，61页pdf

相关资讯

P-tuning v2: 提示微调方法可在跨规模和任务上与精调方法媲美 | 论文荐读

P-tuning v2: 提示微调方法可在跨规模和任务上与精调方法媲美 | 论文荐读

学术头条

2+阅读 · 2022年4月11日

信息抽取新SOTA！首个结构化生成式信息抽取预训练模型，一统信息抽取四大任务

信息抽取新SOTA！首个结构化生成式信息抽取预训练模型，一统信息抽取四大任务

PaperWeekly

6+阅读 · 2022年4月8日

有效且稳健的数据增强小样本学习 | 论文荐读

有效且稳健的数据增强小样本学习 | 论文荐读

学术头条

6+阅读 · 2022年3月25日

小样本自然语言理解的基准测试FewNLU | 论文荐读

小样本自然语言理解的基准测试FewNLU | 论文荐读

学术头条

1+阅读 · 2022年3月23日

基于自回归填空的通用语言模型预训练 | 论文荐读

基于自回归填空的通用语言模型预训练 | 论文荐读

学术头条

5+阅读 · 2022年3月14日

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知

0+阅读 · 2022年1月28日

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

开放知识图谱

1+阅读 · 2021年11月11日

论文浅尝 | 将结构预测作为增广自然语言间的翻译任务

论文浅尝 | 将结构预测作为增广自然语言间的翻译任务

开放知识图谱

0+阅读 · 2021年9月1日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

相关基金

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

34+阅读 · 2013年12月31日

三维模型在异构空间中的语义迁移方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向海量数据语义标注众包的任务管理方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

科技论文的语义模式研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于词义的文档表示模型及多语亚文档主题分析研究

国家自然科学基金

0+阅读 · 2012年12月31日

文本语义模型和子空间聚类研究

国家自然科学基金

1+阅读 · 2009年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

面向查询的XML文本自动文摘研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Subset selection for linear mixed models

Arxiv

1+阅读 · 2022年4月18日

Transductive Learning for Abstractive News Summarization

Arxiv

0+阅读 · 2022年4月16日

Revisiting joint decoding based multi-talker speech recognition with DNN acoustic model

Revisiting joint decoding based multi-talker speech recognition with DNN acoustic model

Arxiv

0+阅读 · 2022年4月15日

ML_LTU at SemEval-2022 Task 4: T5 Towards Identifying Patronizing and Condescending Language

ML_LTU at SemEval-2022 Task 4: T5 Towards Identifying Patronizing and Condescending Language

Arxiv

0+阅读 · 2022年4月15日

Consecutive Decoding for Speech-to-text Translation

Arxiv

0+阅读 · 2022年4月15日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Reinforced Self-Attention Network: a Hybrid of Hard and Soft Attention for Sequence Modeling

Arxiv

16+阅读 · 2018年1月31日

A Structured Self-attentive Sentence Embedding

Arxiv

24+阅读 · 2017年3月9日

大家都在搜

大型语言模型

软件无线电

久别重逢话双塔

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员