亚马逊Alexa团队语音识别技术最新成果,错误率降低15%

2018 年 12 月 14 日 乌镇智库

原文选自VentureBeat,ZDNet,CSDN

编译|三七

责编|八列

亚马逊的Alexa最近频频抢镜,采用新开发的AI训练方式,优化在新场景下对话的识别。Alexa Speech小组语音系统专家Ankur Gandhe昨天在Alexa官网发表文章,阐述他们最新的AI研究成果,可将识别错误降低15%。

他和他的同事将在本月晚些时候在希腊雅典举行的Spoken Language Technologies conference上发表论文。(“Scalable Language Model Adaptation for Spoken Dialogue Systems”)

图片|搭载了Alexa的智能音箱Echo

来自互联网

Gandhe解释说,理解对话语境的NLP模型,能很快区分“Red Sox”和“Red sauce”之间的区别,能很快识别前者是棒球队,后者则是厨房配方之一,往往比单识别效率更高。这个是诸多智能音箱的痛点之一,改进用户语音交互时的摩擦,自动从识别的错误中纠正过来。

但是每次引入新功能时都要重新训练,需要大量数据和大量时间。AI研究人员经常从模板生成的随机句子作为样本数据来训练,但Gandhe和他的团队提出了一种分析语法规则的数学表示算法,他们还列出一种技术,其功能是将新训练的NLP模型与现有系统做集成时,不会对系统性能产生负面作用。在更大的数据集可用之前,这个方法可以一天就将新引入的语音识别引入Alexa。

这个生成语言模型基于有穷状态转换器(finite-state transducers,FSTs),Gandhe解释说,如果图形给定节点表示文本字符串“I want”,它可能有两边,need/want替换,另一边是would like/want替换。

图片来自于

http://examples.mikemccandless.com/fst.py

为了将新语言模型和现有语言模型相结合,它还利用一种模型,推断两者中编码概率的最佳平衡。该团队在三种不同的情境下评估系统:查股价、查食谱以及预定机票。在航班预定测试中表现最好——降低了15%的错误率。

近日Alexa更新频繁,本月11日推出的重大更新中,帮助用户更高效完成工作,现在可以创建基于用户位置触发的例程和提醒,例如,“Alexa,当我回到家时,提醒我喂狗。”然后当用户到家时,Alexa会根据手机的位置发送提醒。另一种情况是,“Alexa提醒我到办公室的时候打印报告。”这种情况下,如果办公室没有支持Alexa的设备,手机上的Alexa应用程序将推送通知。

图片|来自互联网

Alexa Answers项目也颇具人性,让内测用户教会Alexa回答问题,目的是为了解决一些尚未有答案的问题,Alexa的相关回答将会标记为来自“Alexa用户”。

Alexa Answers是亚马逊近几个月来第二次尝试对Alexa的问答能力进行优化。今年8月,亚马逊推出了“答案更新”功能。如果用户提出的一个问题Alexa无法回答,那么当Alexa学会这个问题之后,该用户将立即收到通知。


乌镇智库 资讯推荐

英特尔推出颠覆性架构:3D堆叠芯片,10nm制程明年上市

从硬件到框架,30+巨头参与的AI基准竞争结果公布(第一回合)

帮医生看片子这样有意思的事情,怎么能少的了A.I.呢?


推荐阅读

49秒|世界1000所大学走过的1000年

尼克谈人工智能的历史、现实与未来




登录查看更多
0

相关内容

指分类错误的样本数占样本总数的比例。
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
54+阅读 · 2020年6月24日
【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN
专知会员服务
26+阅读 · 2020年4月6日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
用于语音识别的数据增强
AI研习社
24+阅读 · 2019年6月5日
对话黄学东:语音语言技术是镶在 AI 皇冠上的明珠
微软研究院AI头条
7+阅读 · 2019年5月17日
苹果首次披露Siri声纹识别技术
AI前线
6+阅读 · 2018年4月17日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
小米的语音识别系统是如何搭建的
深度学习每日摘要
5+阅读 · 2017年9月3日
语音识别之--扑朔迷“离”
微信AI
6+阅读 · 2017年8月9日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
3+阅读 · 2017年12月14日
VIP会员
相关VIP内容
相关资讯
用于语音识别的数据增强
AI研习社
24+阅读 · 2019年6月5日
对话黄学东:语音语言技术是镶在 AI 皇冠上的明珠
微软研究院AI头条
7+阅读 · 2019年5月17日
苹果首次披露Siri声纹识别技术
AI前线
6+阅读 · 2018年4月17日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
小米的语音识别系统是如何搭建的
深度学习每日摘要
5+阅读 · 2017年9月3日
语音识别之--扑朔迷“离”
微信AI
6+阅读 · 2017年8月9日
相关论文
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
3+阅读 · 2017年12月14日
Top
微信扫码咨询专知VIP会员