动态 | Siri将会说上海话,但你知道苹果是怎么教会它的吗?

2017 年 3 月 11 日 AI科技评论

上周,谷歌将Google Assistant下放到Android 6.0,而苹果的Siri、微软的Cortana、亚马逊的Alexa最近也动作频频,一场围绕下智能语音助手的大战正在全面展开。

西雅图艾伦人工智能研究所CEO Oren Etzioni表示,Siri作为最早入场的选手,其语音理解和回答问题的能力并不突出,白白浪费了先发优势。

但Siri并不是一无是处,它仍然有其他语音助手目前无法匹敌的优势:支持36个国家的21种本地语言。由于大多数的智能手机都是在非英语国家销售,对本地语言的支持将是非常重要的一个能力。

相比之下,微软的Cortana能够识别13个国家的8种语言,Google Aissitant则支持4种语言,而亚马逊的Alexa目前只支持英语和德语。

但是Siri并没有停下,据外媒报道,iOS 10.3即将支持上海话。

如果语音助手想要成为智能手机和其他智能设备标配的工具,那么语言问题将是其必须克服的障碍。但是语言本身对任何助手来说都是复杂的。比如在英国,当谈论足球比分时,“2:0”要说成“two-nil”,而不是“two-nothing”。

苹果语音团队负责人Alex Acero在接受路透社采访时解释了如何教Siri学习一门全新的语言。

Alex Acero说,在苹果公司,当研究人员开始教Siri一门新的语言时,会让真人用各种方言和口音来阅读文本段落,然后由听译人员转录成文本,这样计算机就可以拥有准确的样本用来练习。此外,苹果还会从不同的声音中捕捉各种语音。然后,苹果会建立起一个声学模型,并通过这个模型开始尝试预测字符序列。

Acero称,苹果随后会在新语言中部署“听写模式”,这是一种文本和语音之间的翻译器。当用户使用听写模式时,苹果会捕获音频录音中的一小部分,然后对其匿名处理。由于这些录音有背景噪音以及模糊不清的词语,将会由专人转录,这一过程可以将语音识别的错误率降低一半。

在收集了足够的数据,并让配音演员为新语言录制了声音之后,苹果就会向公众开放这一语言版本的Siri。不过,发布之初Siri只能回答苹果认为最常见的问题。发布之后,Siri将会从用户的实际问题中学习,并且会每两周更新一次,作出一些调整。

不过,智能助理Ozlo的创始人Chales Jolley表示,为语音助手撰写脚本无法做到规模化,“你不可能聘请足够多的作者为每一种语言撰写需要的脚本,你必须将答案综合起来。“他认为,这还需要多年的时间。

三星去年收购了“Siri之父”创建的人工智能公司Viv Labs,这家初创公司就正在着手解决这个问题。Viv的联合创始人兼CEO Dag Kittlaus说:“Viv旨在专门解决智能助理的规模化问题,要想跨过目前版本的功能局限,唯一的方法就是开放系统,让世界来教它们。“


AI科技评论招聘季全新启动!


很多读者在思考,“我和AI科技评论的距离在哪里?”,答案就是:一封求职信。


AI科技评论自创立以来,围绕学界和业界鳌头,一直为读者提供专业的AI学界,业界,开发者内容报道。我们与学术界一流专家保持密切联系,获得第一手学术进展;我们深入巨头公司AI实验室,洞悉最新产业变化;我们覆盖A类国际学术会议,发现和推动学术界和产业界的不断融合。


而你只要加入我们,就有机会和我们一起记录这个风起云涌的人工智能时代!


如果你有下面任何两项,请投简历给我们:


*英语好,看论文毫无压力

*计算机科学或者数学相关专业毕业,好钻研

*新闻媒体相关专业,好社交

*态度好,学习能力强


简历投递:lizongren@leiphone.com



登录查看更多
0

相关内容

Siri 是内嵌在苹果公司所推出的智能手机 iPhone 4S 内的人工智能助理软件。该软件使用自然语言处理技术,可通过自然的对话与手机互动,完成搜索资料、查询天气、设置手机日历、设置闹铃等服务。
对话黄学东:语音语言技术是镶在 AI 皇冠上的明珠
微软研究院AI头条
7+阅读 · 2019年5月17日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
从零开始用Python写一个聊天机器人(使用NLTK)
AI研习社
10+阅读 · 2018年12月27日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
苹果首次披露Siri声纹识别技术
AI前线
6+阅读 · 2018年4月17日
如何做个小冰那样成功的聊天机器人
七月在线实验室
5+阅读 · 2017年12月4日
想让机器人替你聊天?1小时手把手训练一个克隆版的你
Arxiv
14+阅读 · 2020年1月27日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
3+阅读 · 2018年3月22日
VIP会员
相关VIP内容
相关资讯
对话黄学东:语音语言技术是镶在 AI 皇冠上的明珠
微软研究院AI头条
7+阅读 · 2019年5月17日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
从零开始用Python写一个聊天机器人(使用NLTK)
AI研习社
10+阅读 · 2018年12月27日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
苹果首次披露Siri声纹识别技术
AI前线
6+阅读 · 2018年4月17日
如何做个小冰那样成功的聊天机器人
七月在线实验室
5+阅读 · 2017年12月4日
想让机器人替你聊天?1小时手把手训练一个克隆版的你
相关论文
Arxiv
14+阅读 · 2020年1月27日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
3+阅读 · 2018年3月22日
Top
微信扫码咨询专知VIP会员