EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果 - 专知VIP

会员服务 ·

3

机器翻译 · EMNLP 2021 · 论文 ·

2021 年 12 月 25 日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

非自回归机器翻译[1]由于其解码过程不依赖于之前翻译结果从而获得很高的推理速度，但是其翻译质量相对较差。近期许多工作将迭代式[2,3]的解码策略引入非自回归机器翻译中，其通过多次优化先前的翻译结果从而提升最终翻译质量。但是，其中一个显著问题是在迭代式解码过程中这些方法并不能显示区分翻译结果中的错误。在本工作中，我们提出一个新的非自回归机器翻译架构RewriteNAT，其可以学习改写翻译结果的错误内容。该架构使用一个定位模块识别翻译中的错误，而后使用另一个改写模块将其改写成正确翻译内容。此外，为了保证训练和迭代式解码过程中输入数据分布的一致性，我们采用迭代式的训练方法进一步提升模型的改写错误能力。在多个广泛使用的翻译数据上的实验结果显示，相比多个传统的迭代式非自回归方法，我们提出方法可以获得更好的翻译性能，同时显著的减少解码时间。

成为VIP会员查看完整内容

14

相关内容

机器翻译

机器翻译，又称为自动翻译，是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支，是人工智能的终极目标之一，具有重要的科学研究价值。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【ICLR2022】序列生成的目标侧数据增强

【ICLR2022】序列生成的目标侧数据增强

专知会员服务

22+阅读 · 2022年2月14日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

18+阅读 · 2021年9月13日

【ACL2021】利用自标注的词对齐提升预训练跨语言语言模型

专知会员服务

15+阅读 · 2021年8月13日

【NAACL2021】信息解缠正则化持续学习的文本分类

【NAACL2021】信息解缠正则化持续学习的文本分类

专知会员服务

21+阅读 · 2021年4月11日

【ICLR2021】从理解到改进：序列到序列建模中的编码器特征融合

【ICLR2021】从理解到改进：序列到序列建模中的编码器特征融合

专知会员服务

36+阅读 · 2021年2月12日

【EMNLP2020-CMU&字节跳动】基于预训练语言模型的句子嵌入研究

【EMNLP2020-CMU&字节跳动】基于预训练语言模型的句子嵌入研究

专知会员服务

22+阅读 · 2020年11月14日

【EMNLP 2020 】基于反事实推理的开放域生成式对话

专知会员服务

26+阅读 · 2020年11月5日

【EMNLP 2020】融合自训练和自监督方法的无监督文本顺滑研究

【EMNLP 2020】融合自训练和自监督方法的无监督文本顺滑研究

专知会员服务

23+阅读 · 2020年10月18日

【NeurIPS2020-FB】学习具有可解码信息瓶颈的最优表示

【NeurIPS2020-FB】学习具有可解码信息瓶颈的最优表示

专知会员服务

22+阅读 · 2020年10月13日

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

专知会员服务

12+阅读 · 2020年9月19日

基于自回归填空的通用语言模型预训练 | 论文荐读

基于自回归填空的通用语言模型预训练 | 论文荐读

学术头条

5+阅读 · 2022年3月14日

赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐

赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐

哈工大SCIR

0+阅读 · 2022年3月11日

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

哈工大SCIR

0+阅读 · 2021年12月21日

推出 C4_200M 有标签数据，提升语法错误纠正效果

推出 C4_200M 有标签数据，提升语法错误纠正效果

TensorFlow

0+阅读 · 2021年9月6日

基于编辑方法的文本生成（上）

基于编辑方法的文本生成（上）

哈工大SCIR

0+阅读 · 2021年6月30日

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

哈工大SCIR

0+阅读 · 2021年6月22日

如何缓解非自回归翻译的多峰问题？试试微信AI 的RecoverSAT模型

如何缓解非自回归翻译的多峰问题？试试微信AI 的RecoverSAT模型

微信AI

0+阅读 · 2020年10月28日

赛尔原创 | EMNLP 2019 基于BERT的跨语言上下文相关词向量在零样本依存分析中的应用

赛尔原创 | EMNLP 2019 基于BERT的跨语言上下文相关词向量在零样本依存分析中的应用

哈工大SCIR

10+阅读 · 2019年11月18日

进一步改进GPT和BERT：使用Transformer的语言模型

进一步改进GPT和BERT：使用Transformer的语言模型

机器之心

16+阅读 · 2019年5月1日

现代情感分析方法

现代情感分析方法

算法与数学之美

13+阅读 · 2018年1月12日

基于单语语料的无监督统计机器翻译模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于句子语义结构的统计机器翻译研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于翻译学习和核方法的中文模糊限制信息检测研究

国家自然科学基金

2+阅读 · 2012年12月31日

面向统计机器翻译的同步短语树结构归约机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于树的句法翻译模型关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

跨语言信息检索中的机器翻译研究

国家自然科学基金

2+阅读 · 2011年12月31日

基于图的统计机器翻译方法研究

国家自然科学基金

2+阅读 · 2010年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

利用机器学习改进统计机器翻译的研究

国家自然科学基金

0+阅读 · 2009年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

L2C2: Last-Level Compressed-Cache NVM and a Procedure to Forecast Performance and Lifetime

Arxiv

0+阅读 · 2022年4月20日

A Probabilistic Time-Evolving Approach to Scanpath Prediction

Arxiv

0+阅读 · 2022年4月20日

PICT@DravidianLangTech-ACL2022: Neural Machine Translation On Dravidian Languages

Arxiv

0+阅读 · 2022年4月19日

Unsupervised Attention-based Sentence-Level Meta-Embeddings from Contextualised Language Models

Arxiv

0+阅读 · 2022年4月16日

Constructing Open Cloze Tests Using Generation and Discrimination Capabilities of Transformers

Arxiv

0+阅读 · 2022年4月14日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Machine Reading Comprehension: The Role of Contextualized Language Models and Beyond

Arxiv

15+阅读 · 2020年5月13日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Attention Is All You Need

Arxiv

25+阅读 · 2017年12月6日

A Structured Self-attentive Sentence Embedding

Arxiv

23+阅读 · 2017年3月9日

VIP会员

相关主题

相关VIP内容

【ICLR2022】序列生成的目标侧数据增强

【ICLR2022】序列生成的目标侧数据增强

专知会员服务

22+阅读 · 2022年2月14日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

18+阅读 · 2021年9月13日

【ACL2021】利用自标注的词对齐提升预训练跨语言语言模型

专知会员服务

15+阅读 · 2021年8月13日

【NAACL2021】信息解缠正则化持续学习的文本分类

【NAACL2021】信息解缠正则化持续学习的文本分类

专知会员服务

21+阅读 · 2021年4月11日

【ICLR2021】从理解到改进：序列到序列建模中的编码器特征融合

【ICLR2021】从理解到改进：序列到序列建模中的编码器特征融合

专知会员服务

36+阅读 · 2021年2月12日

【EMNLP2020-CMU&字节跳动】基于预训练语言模型的句子嵌入研究

【EMNLP2020-CMU&字节跳动】基于预训练语言模型的句子嵌入研究

专知会员服务

22+阅读 · 2020年11月14日

【EMNLP 2020 】基于反事实推理的开放域生成式对话

专知会员服务

26+阅读 · 2020年11月5日

【EMNLP 2020】融合自训练和自监督方法的无监督文本顺滑研究

【EMNLP 2020】融合自训练和自监督方法的无监督文本顺滑研究

专知会员服务

23+阅读 · 2020年10月18日

【NeurIPS2020-FB】学习具有可解码信息瓶颈的最优表示

【NeurIPS2020-FB】学习具有可解码信息瓶颈的最优表示

专知会员服务

22+阅读 · 2020年10月13日

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

专知会员服务

12+阅读 · 2020年9月19日

热门VIP内容

相关资讯

基于自回归填空的通用语言模型预训练 | 论文荐读

基于自回归填空的通用语言模型预训练 | 论文荐读

学术头条

5+阅读 · 2022年3月14日

赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐

赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐

哈工大SCIR

0+阅读 · 2022年3月11日

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

哈工大SCIR

0+阅读 · 2021年12月21日

推出 C4_200M 有标签数据，提升语法错误纠正效果

推出 C4_200M 有标签数据，提升语法错误纠正效果

TensorFlow

0+阅读 · 2021年9月6日

基于编辑方法的文本生成（上）

基于编辑方法的文本生成（上）

哈工大SCIR

0+阅读 · 2021年6月30日

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

哈工大SCIR

0+阅读 · 2021年6月22日

如何缓解非自回归翻译的多峰问题？试试微信AI 的RecoverSAT模型

如何缓解非自回归翻译的多峰问题？试试微信AI 的RecoverSAT模型

微信AI

0+阅读 · 2020年10月28日

赛尔原创 | EMNLP 2019 基于BERT的跨语言上下文相关词向量在零样本依存分析中的应用

赛尔原创 | EMNLP 2019 基于BERT的跨语言上下文相关词向量在零样本依存分析中的应用

哈工大SCIR

10+阅读 · 2019年11月18日

进一步改进GPT和BERT：使用Transformer的语言模型

进一步改进GPT和BERT：使用Transformer的语言模型

机器之心

16+阅读 · 2019年5月1日

现代情感分析方法

现代情感分析方法

算法与数学之美

13+阅读 · 2018年1月12日

相关基金

基于单语语料的无监督统计机器翻译模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于句子语义结构的统计机器翻译研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于翻译学习和核方法的中文模糊限制信息检测研究

国家自然科学基金

2+阅读 · 2012年12月31日

面向统计机器翻译的同步短语树结构归约机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于树的句法翻译模型关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

跨语言信息检索中的机器翻译研究

国家自然科学基金

2+阅读 · 2011年12月31日

基于图的统计机器翻译方法研究

国家自然科学基金

2+阅读 · 2010年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

利用机器学习改进统计机器翻译的研究

国家自然科学基金

0+阅读 · 2009年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

L2C2: Last-Level Compressed-Cache NVM and a Procedure to Forecast Performance and Lifetime

Arxiv

0+阅读 · 2022年4月20日

A Probabilistic Time-Evolving Approach to Scanpath Prediction

Arxiv

0+阅读 · 2022年4月20日

PICT@DravidianLangTech-ACL2022: Neural Machine Translation On Dravidian Languages

Arxiv

0+阅读 · 2022年4月19日

Unsupervised Attention-based Sentence-Level Meta-Embeddings from Contextualised Language Models

Arxiv

0+阅读 · 2022年4月16日

Constructing Open Cloze Tests Using Generation and Discrimination Capabilities of Transformers

Arxiv

0+阅读 · 2022年4月14日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Machine Reading Comprehension: The Role of Contextualized Language Models and Beyond

Arxiv

15+阅读 · 2020年5月13日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Attention Is All You Need

Arxiv

25+阅读 · 2017年12月6日

A Structured Self-attentive Sentence Embedding

Arxiv

23+阅读 · 2017年3月9日

微信扫码咨询专知VIP会员