搜狗分身技术再进化,让AI合成主播“动”起来

2019 年 2 月 21 日 AI100

   

整理 | 一一

出品 | AI科技大本营


去年 11 月的互联网大会期间,搜狗与新华社联合发布全球首个AI合成主播一经亮相,引起了人们对“AI+媒体”的广泛讨论。如今,搜狗 AI 合成主播不断更新迭代。


2 月 19 日,在新华社新媒体中心与搜狗公司战略合作签约仪式上,搜狗公司与新华社新媒体中心联合发布了站立式 AI 合成主播,这次新的 AI 合成主播从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,标志着“搜狗分身”技术再次取得突破。



据了解,初代 AI 合成主播由“搜狗分身”技术打造,这项技术让机器首次做到逼真的模拟人类说话时的声音、嘴唇动作和表情,并且将三者自然匹配,创造出人类的 AI 分身,进而帮助人类提高信息表达和传递的效率。


那此次发布的站立式 AI 合成主播又开拓了哪些“技能”?据搜狗方面介绍,新版的 AI 合成主播采用了“搜狗分身”的 WaveRNN 波形建模技术,可以实现逼真的语音合成效果,让 AI 的声音更具有真实情感和表现力。而在图像生成方面,新版的 AI 合成主播实现了更加逼真的表情生成、自然的肢体动作以及嘴唇动作预测等能力,而且还让 AI 合成主播“动”了起来,这提升了合成主播的表现力。


什么是“搜狗分身”技术?它诞生于搜狗“自然交互+知识计算”的人工智能理念之下,能够利用搜狗的 AI 能力,从图像表情,声音语言习惯,逻辑思维等层面对 AI 进行拟人化训练,然后克隆制造人类的 AI 分身,进而帮助人类提高信息表达和传递的效率。


搜狗方面表示,随着“搜狗分身”技术能力的不断提高,AI 合成主播的定制周期也大为降低,合成效果和稳定性也有着显著提升。值得一提的是,此次发布会同时发布了首个 AI 合成女主播,这是“搜狗分身”技术持续复制不同类型、不同特点 AI 合成主播能力的一个体现。目前,仅靠少量用户真实音视频数据,搜狗即可快速定制出高逼真度的分身模型,帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。


搜狗 CEO 王小川介绍,作为 AI 合成主播的技术核心,“搜狗分身”技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域,通过提供个性化的行业解决方案,为不同职业赋能,提升整个社会的信息生产力。


据悉,目前首批入职新华社的一中一英两位 AI 合成主播,已生产 3400 余条新闻报道,累计时长达 10000 多分钟,参与了包括第五届世界互联网大会、首届进博会、2019 春运、春节等报道,成为中国人工智能与传媒业大胆融合并付诸规模化应用的典型案例。


而最新推出的站立式 AI 合成主播将参与 2019 年全国两会的报道,并将在搜狗搜索、输入法等资讯平台上与用户见面。


(本文为 AI科技大本营整理文章,转载请微信联系 1092722531)

精彩推荐

推荐阅读:

                         

点击“阅读原文”,查看历史精彩文章。

登录查看更多
0

相关内容

搜狗凭借对前瞻性技术趋势的把握和敏锐的市场嗅觉,已经成为中国互联网的创新典范,也是最具发展潜力的公司之一。搜狗的产品围绕互联网的最基础应用,其中输入法、浏览器、搜索三大产品均名列前茅。2010年8月9日,在引入阿里巴巴集团和云峰基金等战略投资者之后,搜狗从搜狐分拆,成为独立运营的公司,王小川出任搜狗首席执行官。
人机对抗智能技术
专知会员服务
183+阅读 · 2020年5月3日
【CVPR2020-Facebook AI】前置不变表示的自监督学习
专知会员服务
46+阅读 · 2020年4月19日
【中科院自动化所】视觉对抗样本生成技术概述
专知会员服务
35+阅读 · 2020年4月15日
多模态深度学习综述,18页pdf
专知会员服务
209+阅读 · 2020年3月29日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
标贝科技:TensorFlow 框架提升语音合成效果
谷歌开发者
6+阅读 · 2019年4月29日
方兴未艾的语音合成技术与应用
AI100
8+阅读 · 2018年10月16日
大伽「趣」说AI:腾讯云在多个场景中的AI落地实践
人工智能头条
4+阅读 · 2018年8月1日
Arxiv
7+阅读 · 2018年4月24日
Arxiv
8+阅读 · 2018年1月25日
VIP会员
Top
微信扫码咨询专知VIP会员