对话有道人工翻译:互联网+AI,翻译行业将成为被重构的“巴别塔”?| AI+

2017 年 8 月 7 日 黑智 杨洁

互联网和人工智能技术,也让翻译行业走到了一道全新的分水岭前。


文 | 杨洁

编辑 | 黑智


技术的发展,正在为打通人类语言的“巴别塔”,带来新的曙光。


互联网和人工智能技术,也让翻译行业走到了一道全新的分水岭前。


一直以来,翻译都是一片松散而又不引人注目的市场,但又存在着巨大的空间。根据《2016 中国语言服务行业发展报告》,2015 年中国语言服务行业创造的产值约为 2822 亿元,在 2011 年 1576 亿元产值的基础上增加了 79%。


网易有道CEO周枫曾估计,整个人工翻译市场大约是400亿的规模。但在过去,翻译行业服务的主要是从事对外业务的政府机构和企业,多数拥有较大团队的翻译公司都和特定的企业、单位挂靠或形成长期的业务关系,“最大的公司年营收基本是3亿元左右。”网易有道副总裁刘韧磊告诉黑智。其他的订单,就零零散散分布在大大小小的翻译团队,以及在不同平台上赚取外快的个人译员手中。


之前,大多数中小翻译团队只将线上作为接单的渠道,而如今,互联网翻译平台正在崛起。“长期被忽视的中小企业和C端用户需求,其实是大量而又长尾的市场。”刘韧磊说。而网易有道,就是试图撬开这片市场的主要玩家之一。它的武器,一是从语言服务工切入的人工翻译服务,二是借助人工智能技术的“入侵”,让专业翻译变得更加简捷和“大众化”。


1


从工具切入服务的“C2B”发展模式


对于在线翻译,早期的互联网用户们,更为熟悉的可能是在线即时翻译平台,以及各类在线词典和付费APP产品。在最初,网易有道的产品定位也是搜索,但是无心插柳,正是这样依托搜索引擎,而非传统的英文查词,让有道词典和在线翻译发展了起来。


对于工具类产品而言,流量是其优势所在。但对于产品变现的方式上,网易有道却做了另一番思考。“工具类产品变现的最直接的方式还是广告。”刘韧磊说,“但是,工具类产品的广告模式的天花板,也是显而易见的。”和垂直搜索的流量相比,在线翻译的用户黏度高,用户群体集中,词典上的用户也是比较高端的白领或高校学生用户,一旦发现了效果,用户忠诚度也是较高的。这些用户最直接的一个需求就是提升自我,所以有道推出了在线教育产品——有道精品课。除此之外,有道还推出了人工翻译服务。目前人工专业翻译的需求市场还远没有得到满足。免费在线翻译工具受制于技术性问题,难以做到直接应用于文档翻译的水平,但大量分散的用户却不知该如何寻找合格的英文翻译。从供需出发考虑,有道最终确定了从工具切入翻译服务的路线。


2012年,有道人工翻译上线。与传统翻译团队模式不同,有道人工翻译走的是“C2B”路线。也即是,通过C端用户做起,搭建前台和后台的服务体系,跑通市场和服务流程后,进而服务中小B端,再进一步则是服务大型企业。“我们基于有道词典的流量和用户基础,”刘韧磊说,“C端用户的在线翻译,是一个需求频率低、客单价低的业务,因此,在过去,这是很难做起来的业务。但是,C端用户的需求虽然零散,但确实属于刚需。如果有能够保证质量和速度的翻译解决方案的话,这些用户的付费意愿又是比较强的。而有道词典产品自带的免费流量,是我们能够从C端切入的前提。”



网易有道副总裁刘韧磊


互联网+人工翻译要从传统翻译模式破局,刘韧磊也提出了有道人工翻译的几点做法。


首先,有道人工翻译平台采用的是去中介化的“众包”模式,即用户自主下单、译员自主接单,并针对用户对时间和专业性等的不同要求,提供了快速翻译和文档翻译两种服务方式。据透露,有道人工翻译平台目前配备了超过3000名专业译员,其中拥有3年以上翻译经验的高级译员人数已经超过800人,为超过50万的客户提供了高质量的翻译服务。


而在核心的翻译质量把控上,对于翻译行业,保证翻译的专业性和质量才是核心。有道人工翻译采取“自营”的模式,由网易有道来把控整套服务流程和质量体系,并由网易有道的项目经理来负责对译员的能力测试、订单的质量把控。在对译员的特长和专业性进行测试后,有道人工翻译通过大数据分析系统,将订单匹配至专业性和能力合适的译员。


在对用户留存和质量把控上,有道人工翻译的自动检测系统会首先检查基本的单词和语法错误,之后由项目经理对订单完成质量进行检查和后续评分,保障翻译质量。


“目前,有道人工翻译的订单量已经突破了100万。”刘韧磊说。C端用户和中小企业翻译需求的市场,正在被逐步撬动。


2


机器翻译降低50%成本?


而更大的技术变革,出现在2016年。谷歌推出了神经网络机器翻译系统NMT(Neural Machine Translation),实现机器翻译质量的大幅度提升。人工智能技术的发展,正在超出我们的想象。机器翻译正以远超以往的速度,提高我们对信息的处理能力,弥补人工翻译在速度和成本方面的不足。而这也让翻译行业这个一向是“手工活儿”的领域,出现了被彻底改变和升级的机会。一时间,各大平台,都纷纷亮出了自己的神经网络翻译技术。翻译这块并不“显眼”的市场,却瞬间成为不同公司“炫技”的对象。


网易有道也是第一批推出神经网络翻译技术的互联网公司之一。有道首席科学家段亦涛对黑智透露,早在几年前,有道团队就已经开始关注神经网络翻译技术。但仅仅是显示前沿性还不够,对一项技术而言,能够和落地应用场景相结合、探索出商业模式,才是最具备价值的。


2017年,有道发布了人机翻译服务,将有道自研的神经网络翻译技术(YNMT),和人工翻译结合在了一起。处理翻译需求时,将由YNMT首先进行初步翻译,在其结果的基础上,再由译员对其进行处理,因此,在翻译效率上,得到了大幅度的提升。而同时,它也让翻译的价格降低了50%。


针对有固定需求的企业客户,有道人工翻译也开辟了“企业VIP”频道,为其定制专业翻译解决方案。


段亦涛表示,有道机器翻译在部分翻译场景下,实现了良好的效果。“我们为一些企业定制的部分领域的服务,翻译质量已经接近人工翻译水平。”


神经网络翻译技术的发展,大大提高了机器翻译的准确度,这才使得机器翻译能够对专业的译员进行有益的辅助。段亦涛介绍,之前的机器翻译模型,是基于短语的翻译方式,先把句子分成一个个短语和单词,独立翻译后对短语结果进行逻辑整理,变成句子。而神经网络能够将整个句子视作整体翻译单元,对之编码,进行关联翻译。2002年,IBM建立的BLEU值,是对机器翻译文本质量进行评价的重要参考标准。根据有道官方给出的数据显示,在英语学习场景中,有道神经网络翻译的英译中和中译英的BLEU值领先了同行7个百分点;而在新闻文章翻译场景中,其英译中BLEU值超同行6个百分点,而中译英超过了8个百分点。



有道神经网络翻译(YNMT)BLEU值测评结果


对于有道在机器翻译方面的优势,段亦涛总结说,得益于有道词典已经积累了将近10年的技术和丰富的语料数据。


“机器翻译给有道人工翻译带来了更大的流量 ,以及品牌的背书;其次,机器翻译也大大提高了人工翻译的业务效率。实施中效果最好的例子,能够比我们之前的翻译效率提高3倍。”刘韧磊说,“同时,依托机器翻译技术,我们也为译员开发了翻译辅助输入法等工具,让译员翻译的工作时间大大缩短了。”


然而,机器翻译对于翻译行业,现在并不是威胁。尽管众多免费机翻平台的存在为用户提供了便利,但在专业翻译领域,机器翻译仍旧只能局限于让用户“看懂”的情况,而无法应对更复杂和专业的情况。“翻译行业关于‘信达雅’的标准中,机器翻译目前还只能尽量满足‘信’,而无法达到后两者的要求。”刘韧磊说,“因此,机器翻译还是人工翻译有益的补充。”


段亦涛也表示,神经网络翻译并不完美,仍然还面临许多挑战。“NMT的特点是翻译效果更加流畅和通顺,但是由于其模型的结构,也还有需要提高的地方。例如,对翻译结果的局部修改和漏翻等问题,还有待解决。”


据段亦涛透露,在接下来,有道的技术团队还将继续聚焦机器翻译领域,提高翻译质量,并横向扩展到更多语种的翻译模型上,以及进一步提高整个翻译引擎的性能。同时,有道团队还将继续攻克另一个难题:离线翻译。


“当机器翻译的准确度越来越高,更多的应用场景将被开发,整个翻译行业的效率大幅度提高,机器翻译技术发展带来的成本降低,以及在线端用户使用习惯的延伸,将让更多的用户需求得到爆发。”刘韧磊说。“翻译行业的分工和生产方式,也许也将发生更大的改变。”


而无论如何,机器翻译和在线人工翻译的市场,仍然还有待“领头羊”诞生。而未来,随着机器翻译技术的进一步发展,挖掘出更大潜藏的翻译刚需的爆发,或许一个更大的“金矿”,还有待发掘。



黑智专访


驭势科技 吴甘沙  搜狗 王小川

云知声 黄伟  格灵深瞳 赵勇

小鱼在家 宋晨枫  奇点机智 林德康

Rokid  Misa  瑞为智能 詹东晖

极限元智能科技 雷臻  乂学教育 栗浩洋 

 暴风科技 冯鑫 销售易 史彦泽

普强信息 何国涛 真机智能 刘智勇

纳人 姜海峰   众趣科技 高翔

拍拍赚科技 汤劲武  图森未来 陈默

智齿客服 徐懿  深之蓝 魏建仓

扩博智能 严治庆 视见医疗 王峰

Roboteam Yossi Wolf  甘来 曹文斌


投资人说


云启资本 黄榆镔  松禾远望资本 程浩

英诺天使基金 李竹   线性资本 王淮

九合创投 王啸    纪源资本 肖鸿达

   


登录查看更多
1

相关内容

有道是网易旗下利用大数据技术提供移动互联网应用的子公司。网易有道公司已推出有道词典、有道云笔记、惠惠网、有道推广等一系列产品。
网易有道以搜索产品和技术为起点,在大规模数据存储计算等领域具有深厚的技术积累,并在此基础上衍生出语言翻译应用与服务、个人云应用和电子商务导购服务等三个核心业务方向。
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
234+阅读 · 2020年4月18日
面向司法案件的案情知识图谱自动构建
专知会员服务
122+阅读 · 2020年4月17日
专知会员服务
121+阅读 · 2020年3月26日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
295+阅读 · 2019年12月23日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
知识图谱的行业落地实现
竹间智能Emotibot
51+阅读 · 2019年9月16日
2019社交行业研究报告
行业研究报告
5+阅读 · 2019年5月30日
2019互联网医疗行业洞察
行业研究报告
8+阅读 · 2019年5月28日
2019中国家政服务行业发展剖析及行业投资机遇分析报告
艾瑞:自适应学习凭什么成为AI+教育的核心?
艾瑞咨询
6+阅读 · 2018年3月22日
业界 | 第四范式业界首推免费智能客服服务
机器之心
5+阅读 · 2018年3月14日
打造AI证券助理,竹间为兴业证券带来的不仅是客服
未来产业促进会
5+阅读 · 2017年12月26日
"AI+教育"是虚火还是风口?
数据玩家
3+阅读 · 2017年12月14日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
Arxiv
5+阅读 · 2018年10月4日
Arxiv
7+阅读 · 2018年4月24日
Arxiv
7+阅读 · 2018年1月31日
VIP会员
相关VIP内容
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
234+阅读 · 2020年4月18日
面向司法案件的案情知识图谱自动构建
专知会员服务
122+阅读 · 2020年4月17日
专知会员服务
121+阅读 · 2020年3月26日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
295+阅读 · 2019年12月23日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
相关资讯
知识图谱的行业落地实现
竹间智能Emotibot
51+阅读 · 2019年9月16日
2019社交行业研究报告
行业研究报告
5+阅读 · 2019年5月30日
2019互联网医疗行业洞察
行业研究报告
8+阅读 · 2019年5月28日
2019中国家政服务行业发展剖析及行业投资机遇分析报告
艾瑞:自适应学习凭什么成为AI+教育的核心?
艾瑞咨询
6+阅读 · 2018年3月22日
业界 | 第四范式业界首推免费智能客服服务
机器之心
5+阅读 · 2018年3月14日
打造AI证券助理,竹间为兴业证券带来的不仅是客服
未来产业促进会
5+阅读 · 2017年12月26日
"AI+教育"是虚火还是风口?
数据玩家
3+阅读 · 2017年12月14日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
Top
微信扫码咨询专知VIP会员