【专访】思必驰俞凯:智能物联网时代,对话是自然语言处理中的新兴任务

2018 年 10 月 19 日 动点科技

动点科技 | ID:technode


“AI+”时代,技术提供商与开发者如何协同共舞?


人工智能是一个旁观者迷的行业。当技术开发者在谈论人工智能的时候,他们在谈论什么?在 2018 年 AIIA 人工智能开发者大会上,思必驰联合创始人兼首席科学家俞凯从技术开发者的角度跟大家谈了谈人工智能语音交互行业内的那些事。


思必驰是行业内比较成熟的智能语音技术解决方案提供商,致力于提供自然语言人机交互解决方案,应用于智能车载、智能家居和智能机器人领域,并且拥有语音识别、语音合成、语义对话及语义唤醒等技术。俞凯作为思必驰联合创始人,系剑桥大学语音博士、上海交大教授 IEEE 高级会员、国家“青年千人计划”、NSFC 优秀青年科学基金获得者及中国语音产业联盟技术工作组副组长。2012 年俞凯在上海交通大学创建智能语音技术实验室,将人机口语对话系统的全面技术引入回国,在人机口语对话交互的主要核心技术领域进行了广泛研究,多次在美国国防部、美国国家标准局组织的大规模语音识别评测,国际研究机构组织的对话系统挑战赛等国际评测和竞赛中获得冠军。


在俞凯看来,信息设备经历了 PC 端时代,移动互联网时代,现在逐步进入智能硬件物联网时代,而随之变化的还有人与机器的交流方式。“在 2017 年底的时候,全世界移动互联网和智能硬件设备的总数首次与人类总数持平,预计到 2020 年会达到百亿。我们会发现人与机器的沟通手段也发生了非常大的变化,之前做文本交互,智能硬件互联网时代大家都采用更自然的交互方式就是语音和图像,尤其是抽象的信息,语音更为重要。”俞凯说道。


随着人工智能时代的发展,尤其是 AI+ 概念的提出后,人工智能产业链开始发生变化,AI+ 专业分化进程在加速。俞凯认为,专业化分工大体上分为三层:基础的支撑层,包括芯片、传感器驱动、软硬件基础技术,以及大数据分析;系统应用层,即 AI 可落地的领域,包括车载、家居、呼叫中心、医疗、教育等垂直领域系统应用。智能交互层,智能交互层分化当中对于感知、认知、表达,有专门若干家平台型公司发力。“而我们思必驰做的就是智能交互层的事情,负责链接基础层和应用层的中间桥梁。”俞凯强调。


“智能物联网时代,不仅仅要做到语音识别,重要的是对话,对话是自然语言处理当中的新兴任务。”俞凯说道。目前市面上主要有三种对话形式终端产品。第一类是问答式的对话,知识来源在于知识图谱或者说问答库;第二类是闲聊式对话,类似微软小冰。第三类就是任务型对话,类似于信息查询,对话中表现出来有特定信息获取任务才能进行的对话。


我们知道,语音交互方式是处理工作或任务时高效的方式,但不能完全取代键盘,因为自然口语交互具有很大的不确定性,同时这也是语音交互开发者的难题。对此,俞凯介绍说,他们会在具体口语交互语境中加入环境感知模块和对话管理模块。但即便如此,不同对话语境下,固定的模块化内容并不能完全试用。“我们看到一个矛盾,技术提供商的定制效率和 B 端用户定制和产品迭代需求不能迅速被满足。“俞凯说。


基于此,思必驰提出的解决方案是——全链路智能对话开放平台 DUI 。该平台实现全链路开发、定制规模化、高度定制、以对话为核心。“在整个对话核心链路上面,我们所碰到的对话界面,不单单要有语音界面,还有图形界面,将这两者结合在一起,就形成了现在的系统,我们希望和人工智能开发者一起共同开发生态。“俞凯介绍。


据介绍,该平台目前有四个系统,分别为:玲珑系统、天机系统、青囊系统、紫薇系统。玲珑系统,即本地端在手机上或音箱上有一个本地系统,可定制相应唤醒词,包括合成音等等对话,相当于将云端内容在本地播放的人工智能播放器。天机系统,可实现洞察力画像。帮助开发者根据直接用户的统计数据,形成相应的用户画像和自动化推荐。青囊系统是一个调的系统,帮助开发者更好的进行调试。紫微系统承接第三方服务,负责对接的内容,音乐、导航等等。


“我们希望与人工智能开发者一起共同打造一个良性的开发生态系统。“俞凯说道。


会后,俞凯在接受采访时表示:“目前的 NLP(自然语言处理)绝大部分还是要借助人工。”因为数据的不完全性以及杂乱性,需要人工辅助标注有用信息。而人工智能究竟能发展到什么程度,能否超过人类。俞凯表示离得还很远,他觉得人工智能可能经过特定数据训练之后,在某一领域会超过人类,但仍会局限在某一领域中,而不会具备跨领域和跳脱思维的能力。


“大数据只是算力的体现。就好像汽车比人跑得快,只说明在机械动力上,汽车的移动速度超过了人的运动能力,但汽车不能像人一样跳一跳或者旋转胯跨越是一样的道理。“俞凯开玩笑的说。


而对于未来智能设备会有什么样的形式出现在大众面前,俞凯认为,会向便携式和穿戴式发展。他指着我们手中的话筒和摄像机说:“未来,可能采访的形式就不像现在你们拿着这么多设备。采访间里可以安装智能语音识别系统,根据我们每个人讲话不同的波束,识别出我们正在进行的对话,并匹配到每一个人。将设备应用到相应场景中去,也是我们思必驰近期在尝试的内容。”俞凯讲道。


俞凯透露,自从去年开始,思必驰开始重点关注智能芯片和自动定制服务,将于今年年底推出自主研制的 AI 芯片以及针对 B 端的智慧服务解决方案,届时会召开发布会介绍产品。


据了解,思必驰在今年 6 月份已完成 5 亿人民币的D 轮融资,由元禾控股、元禾辰坤、中民投领投。截至目前,思必驰的融资总额超过 8 亿人民币。


- - - - - - - -   END   - - - - - - - -


推荐阅读


点击图片即可阅读往期文章


关于人人都爱的卷发棒背后,戴森美女工程师告诉了我们这些




登录查看更多
1

相关内容

苏州思必驰信息科技有限公司[1] 是一家语音技术公司。2007年,思必驰创立在英国剑桥高新区。思必驰专注于将领先的系列智能语音技术应用于移动互联、智能设备、客户联络中心等行业。公司的中文名字是思必驰,思想必将驰骋,寓意着公司孤立自由的思想,以创新为本。同时这个名字还是英文单词Speech的音译,同样代表了公司立足智能语音技术行业的决心。
人机对抗智能技术
专知会员服务
187+阅读 · 2020年5月3日
电力人工智能发展报告,33页ppt
专知会员服务
119+阅读 · 2019年12月25日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
医疗知识图谱构建与应用
专知会员服务
372+阅读 · 2019年9月25日
深度解析AIoT背后的发展逻辑
中国人工智能学会
3+阅读 · 2018年12月21日
IDC发布对话式人工智能白皮书|附下载
人工智能学家
6+阅读 · 2018年3月20日
阿里智能对话交互实践与创新
人工智能头条
5+阅读 · 2017年11月30日
最全面的百度NLP自然语言处理技术解析
InfoQ
7+阅读 · 2017年11月12日
自然语言处理在人机对话中的应用
京东大数据
7+阅读 · 2017年8月11日
Arxiv
29+阅读 · 2020年3月16日
Arxiv
3+阅读 · 2019年9月5日
Learning by Abstraction: The Neural State Machine
Arxiv
6+阅读 · 2019年7月11日
QuAC : Question Answering in Context
Arxiv
4+阅读 · 2018年8月21日
Arxiv
9+阅读 · 2016年10月27日
VIP会员
相关资讯
深度解析AIoT背后的发展逻辑
中国人工智能学会
3+阅读 · 2018年12月21日
IDC发布对话式人工智能白皮书|附下载
人工智能学家
6+阅读 · 2018年3月20日
阿里智能对话交互实践与创新
人工智能头条
5+阅读 · 2017年11月30日
最全面的百度NLP自然语言处理技术解析
InfoQ
7+阅读 · 2017年11月12日
自然语言处理在人机对话中的应用
京东大数据
7+阅读 · 2017年8月11日
Top
微信扫码咨询专知VIP会员