摘要: 语音信息处理技术在深度学习的推动下发展迅速,其中语音合成和转换技术相结合能实现实时高保真的指定对象、内容的语音输出,在人机交互、泛娱乐等领域具有广泛的应用前景。文中旨在对基于深度学习的语音合成与转换技术进行综述。首先,简要回顾了语音合成和转换技术的发展历程;接着,列举了在语音合成、转换领域的常见公开数据集以便研究者开展相关探索;然后,讨论了从文本到语音模型,包括在风格、韵律、速度等方面进行改进的经典和前沿的模型、算法,并分别对比评述了其效果与发展潜力;进一步针对语音转换进行综述,归纳总结了转换方法与优化思路;最后,总结了语音合成与转换的应用与挑战,并根据其在模型、应用和规范方面所面临的问题,展望了未来在模型压缩、少样本学习和伪造检测方面的发展方向。

成为VIP会员查看完整内容
31

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
125+阅读 · 2021年4月29日
基于深度学习的行人检测方法综述
专知会员服务
71+阅读 · 2021年4月14日
专知会员服务
47+阅读 · 2021年3月24日
专知会员服务
63+阅读 · 2021年3月6日
专知会员服务
22+阅读 · 2021年1月5日
【综述】基于知识图谱的推荐系统综述
AINLP
15+阅读 · 2020年7月7日
基于深度学习的视频目标检测综述
CVer
7+阅读 · 2019年6月9日
基于深度学习的图像超分辨率最新进展与趋势【附PDF】
人工智能前沿讲习班
15+阅读 · 2019年2月27日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
18+阅读 · 2018年9月1日
干货 | 基于深度学习的目标检测算法综述(二)
AI科技评论
21+阅读 · 2018年8月20日
Arxiv
0+阅读 · 2021年10月11日
Real-Time High-Resolution Background Matting
Arxiv
4+阅读 · 2020年12月14日
Arxiv
136+阅读 · 2018年10月8日
VIP会员
相关VIP内容
专知会员服务
125+阅读 · 2021年4月29日
基于深度学习的行人检测方法综述
专知会员服务
71+阅读 · 2021年4月14日
专知会员服务
47+阅读 · 2021年3月24日
专知会员服务
63+阅读 · 2021年3月6日
专知会员服务
22+阅读 · 2021年1月5日
相关资讯
【综述】基于知识图谱的推荐系统综述
AINLP
15+阅读 · 2020年7月7日
基于深度学习的视频目标检测综述
CVer
7+阅读 · 2019年6月9日
基于深度学习的图像超分辨率最新进展与趋势【附PDF】
人工智能前沿讲习班
15+阅读 · 2019年2月27日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
18+阅读 · 2018年9月1日
干货 | 基于深度学习的目标检测算法综述(二)
AI科技评论
21+阅读 · 2018年8月20日
相关论文
Arxiv
0+阅读 · 2021年10月11日
Real-Time High-Resolution Background Matting
Arxiv
4+阅读 · 2020年12月14日
Arxiv
136+阅读 · 2018年10月8日
微信扫码咨询专知VIP会员