Facebook AI在WMT 2019机器翻译比赛中领先 - 专知

会员服务 ·

0

Facebook AI在WMT 2019机器翻译比赛中领先

2019 年 8 月 2 日 专知

【导读】Facebook上的用户来自多个国家，使用着上百种不同的语言在平台上发布信息。因此，构建灵活的机器翻译系统一直是Facebook的研究重点之一。Facebook AI在WMT 2019机器翻译比赛的四项任务中取得了第一。

Facebook AI在WMT 2019机器翻译比赛的四项任务中取得了第一。这四项任务包含从英语翻译到德语的任务，这是比赛中最具竞争力的任务，参赛作品来自各种顶尖团队。在这项任务中，Facebook AI的模型被WMT组织者宣布为超人，这意味着相对于人类专家的翻译结果，人类评价者更喜欢Facebook AI模型的翻译结果。

Facebook的模型使用大规模采样反向翻译、噪声通道建模和数据清理技术，以实现从英语到德语，德语到英语，从英语到俄语，从俄语到英语的最高性能翻译。这些模型，和Facebook在跨语言预训练、其他模态自监督学习上的研究一起，将使得Facebook能够打破语言障碍，建立更好的内容理解系统，以保障人们的安全。

反向、前向、更加流畅

机器翻译通常通过使用单个模型来为给定的单词序列生成翻译，例如将德语句子翻译成英语。噪声通道建模通过使用3个模型获得了更为准确的翻译：

首先，正向模型翻译句子（例如从德语到英语），生成一组翻译候选或假设。然后反向模型将这些英语假设翻译回德语，允许系统评价每个英语翻译与原始德语句子的对比情况。最后，一个语言模型会判断英语翻译的流利程度。该语言模型经过在上亿词上的训练，获得了英语句子的语感（英语句子应该是什么样的）。

一旦后向和语言模型对前向模型产生的所有英语翻译进行评分，系统然后根据所有模型选择具有最高组合分数的假设作为实际翻译。我们使用fairseq（我们的开放式序列到序列建模工具包）在128个NVIDIA Volta GPU上训练所有这些模型。

清理采集数据集并微调

今年，Facebook在训练数据上也做了重大的改变，包括用来反向翻译和噪声通道建模的数据。WMT新闻翻译任务提供了大量的从互联网上抓取的数据，这些数据天然就包含很多噪声。

为了缓解这个问题，Facebook我们采用了一系列数据清理技术，例如删除翻译比其相应翻译长得多的实例。 Facebook还使用语言识别（或langid）过滤来仅保留那些两边语言都正确的句子对。

更多细节可以参考；

https://ai.facebook.com/blog/facebook-leads-wmt-translation-competition/

-END-

专 · 知

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎登录www.zhuanzhi.ai，注册登录专知，获取更多AI知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程视频资料和与专家交流咨询！

请加专知小助手微信（扫一扫如下二维码添加），加入专知人工智能主题群，咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成！560+位同学在学习，现在报名，限时优惠！网易云课堂人工智能畅销榜首位！

点击“阅读原文”，了解报名专知《深度学习:算法到实战》课程

登录查看更多

0

相关内容

机器翻译

机器翻译，又称为自动翻译，是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支，是人工智能的终极目标之一，具有重要的科学研究价值。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

专知会员服务

113+阅读 · 2020年6月13日

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

专知会员服务

25+阅读 · 2020年4月5日

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

专知会员服务

33+阅读 · 2020年4月5日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

13+阅读 · 2020年3月27日

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

专知会员服务

13+阅读 · 2020年3月8日

【Google】无监督机器翻译，Unsupervised Machine Translation

【Google】无监督机器翻译，Unsupervised Machine Translation

专知会员服务

35+阅读 · 2020年3月3日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

43+阅读 · 2020年2月12日

【ICLR2020】理解非自回归机器翻译中的知识蒸馏（Understanding Knowledge Distillation in Non-autoregressive Machine Translation）

【ICLR2020】理解非自回归机器翻译中的知识蒸馏（Understanding Knowledge Distillation in Non-autoregressive Machine Translation）

专知会员服务

10+阅读 · 2019年12月28日

【AAAI2020接受论文】Emu:使用语义专门化增强多语言句子嵌入，Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

【AAAI2020接受论文】Emu:使用语义专门化增强多语言句子嵌入，Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

专知会员服务

24+阅读 · 2019年11月11日

【AAAI2020接受论文】多任务自监督学习的不流利检测，Multi-Task Self-Supervised Learning for Disfluency Detection

【AAAI2020接受论文】多任务自监督学习的不流利检测，Multi-Task Self-Supervised Learning for Disfluency Detection

专知会员服务

12+阅读 · 2019年11月11日

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

AI科技评论

10+阅读 · 2019年9月17日

Facebook发布AI换脸检测竞赛

Facebook发布AI换脸检测竞赛

专知

9+阅读 · 2019年9月7日

想在PyTorch里训练BERT，请试试Facebook跨语言模型XLM

想在PyTorch里训练BERT，请试试Facebook跨语言模型XLM

量子位

3+阅读 · 2019年6月23日

Facebook ：AI 年度总结来啦

Facebook ：AI 年度总结来啦

人工智能学家

4+阅读 · 2019年1月21日

AI Challenger 2018 机器翻译参赛总结

AI Challenger 2018 机器翻译参赛总结

PaperWeekly

5+阅读 · 2019年1月7日

AI Challenger 2018 机器翻译冠军参赛总结

AI Challenger 2018 机器翻译冠军参赛总结

AINLP

6+阅读 · 2019年1月4日

资源 | FAIR & NYU开发XNLI语料库：15种语言（含低资源语言）

资源 | FAIR & NYU开发XNLI语料库：15种语言（含低资源语言）

机器之心

3+阅读 · 2018年11月12日

何恺明等在图像识别任务上取得重大进展，这次用的是弱监督学习

何恺明等在图像识别任务上取得重大进展，这次用的是弱监督学习

人工智能头条

6+阅读 · 2018年5月3日

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

专知

5+阅读 · 2017年12月23日

用于神经机器翻译的全并行文本生成

用于神经机器翻译的全并行文本生成

全球人工智能

7+阅读 · 2017年11月13日

Notes on Deep Learning for NLP

Arxiv

21+阅读 · 2018年8月30日

Mobile big data analysis with machine learning

Mobile big data analysis with machine learning

Arxiv

6+阅读 · 2018年8月2日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Unsupervised Neural Machine Translation with Weight Sharing

Arxiv

6+阅读 · 2018年4月24日

Phrase-Indexed Question Answering: A New Challenge for Scalable Document Comprehension

Arxiv

3+阅读 · 2018年4月20日

Zero-Shot Object Detection

Arxiv

8+阅读 · 2018年4月12日

Handling Homographs in Neural Machine Translation

Arxiv

3+阅读 · 2018年3月28日

XNMT: The eXtensible Neural Machine Translation Toolkit

Arxiv

3+阅读 · 2018年3月1日

Unsupervised Neural Machine Translation

Arxiv

6+阅读 · 2018年2月26日

Arxiv

7+阅读 · 2018年1月24日

VIP会员

相关主题

相关VIP内容

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

专知会员服务

113+阅读 · 2020年6月13日

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

专知会员服务

25+阅读 · 2020年4月5日

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

专知会员服务

33+阅读 · 2020年4月5日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

13+阅读 · 2020年3月27日

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

专知会员服务

13+阅读 · 2020年3月8日

【Google】无监督机器翻译，Unsupervised Machine Translation

【Google】无监督机器翻译，Unsupervised Machine Translation

专知会员服务

35+阅读 · 2020年3月3日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

43+阅读 · 2020年2月12日

【ICLR2020】理解非自回归机器翻译中的知识蒸馏（Understanding Knowledge Distillation in Non-autoregressive Machine Translation）

【ICLR2020】理解非自回归机器翻译中的知识蒸馏（Understanding Knowledge Distillation in Non-autoregressive Machine Translation）

专知会员服务

10+阅读 · 2019年12月28日

【AAAI2020接受论文】Emu:使用语义专门化增强多语言句子嵌入，Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

【AAAI2020接受论文】Emu:使用语义专门化增强多语言句子嵌入，Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

专知会员服务

24+阅读 · 2019年11月11日

【AAAI2020接受论文】多任务自监督学习的不流利检测，Multi-Task Self-Supervised Learning for Disfluency Detection

【AAAI2020接受论文】多任务自监督学习的不流利检测，Multi-Task Self-Supervised Learning for Disfluency Detection

专知会员服务

12+阅读 · 2019年11月11日

热门VIP内容

相关资讯

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

AI科技评论

10+阅读 · 2019年9月17日

Facebook发布AI换脸检测竞赛

Facebook发布AI换脸检测竞赛

专知

9+阅读 · 2019年9月7日

想在PyTorch里训练BERT，请试试Facebook跨语言模型XLM

想在PyTorch里训练BERT，请试试Facebook跨语言模型XLM

量子位

3+阅读 · 2019年6月23日

Facebook ：AI 年度总结来啦

Facebook ：AI 年度总结来啦

人工智能学家

4+阅读 · 2019年1月21日

AI Challenger 2018 机器翻译参赛总结

AI Challenger 2018 机器翻译参赛总结

PaperWeekly

5+阅读 · 2019年1月7日

AI Challenger 2018 机器翻译冠军参赛总结

AI Challenger 2018 机器翻译冠军参赛总结

AINLP

6+阅读 · 2019年1月4日

资源 | FAIR & NYU开发XNLI语料库：15种语言（含低资源语言）

资源 | FAIR & NYU开发XNLI语料库：15种语言（含低资源语言）

机器之心

3+阅读 · 2018年11月12日

何恺明等在图像识别任务上取得重大进展，这次用的是弱监督学习

何恺明等在图像识别任务上取得重大进展，这次用的是弱监督学习

人工智能头条

6+阅读 · 2018年5月3日

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

专知

5+阅读 · 2017年12月23日

用于神经机器翻译的全并行文本生成

用于神经机器翻译的全并行文本生成

全球人工智能

7+阅读 · 2017年11月13日

相关论文

Notes on Deep Learning for NLP

Arxiv

21+阅读 · 2018年8月30日

Mobile big data analysis with machine learning

Mobile big data analysis with machine learning

Arxiv

6+阅读 · 2018年8月2日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Unsupervised Neural Machine Translation with Weight Sharing

Arxiv

6+阅读 · 2018年4月24日

Phrase-Indexed Question Answering: A New Challenge for Scalable Document Comprehension

Arxiv

3+阅读 · 2018年4月20日

Zero-Shot Object Detection

Arxiv

8+阅读 · 2018年4月12日

Handling Homographs in Neural Machine Translation

Arxiv

3+阅读 · 2018年3月28日

XNMT: The eXtensible Neural Machine Translation Toolkit

Arxiv

3+阅读 · 2018年3月1日

Unsupervised Neural Machine Translation

Arxiv

6+阅读 · 2018年2月26日

Arxiv

7+阅读 · 2018年1月24日

大家都在搜

无人地面车辆

生成式人工智能

MIT博士论文

红外弱小目标检测算法综述

微信扫码咨询专知VIP会员