项目名称: 基于稀疏编码的语音特征增强方法研究

项目编号: No.61305001

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 何勇军

作者单位: 哈尔滨理工大学

项目金额: 25万元

中文摘要: 目前的语音识别系统在理想环境下具有较高的识别率,但当存在环境噪声时,其性能将急剧下降,这严重限制了语音识别技术的广泛应用。为了解决这一问题,本项目拟基于稀疏编码的基本理论和方法,研究语音特征增强的有效方法,以提高语音识别系统的噪声鲁棒性。稀疏编码在稀疏性准则下表示信号,不对噪声作平稳性假设,符合人类听觉系统处理信息的特点,为语音特征增强提供了新途径。本课题围绕稀疏编码中的字典构建、稀疏分解和信号重构这三个基本问题展开研究。在字典构建方面,研究合理的字典评价、优化和更新策略;在稀疏分解方面,研究考虑时间相关性的分解算法以及适应时变噪声的参数设置方法;在重构方面研究利用先验知识的动态重构算法和错误原子的动态屏蔽策略;最后研究基于增强频谱的语音特征提取方法。本项目的研究对提高语音识别系统的噪声鲁棒性,进而推动其走向现实应用具有重要的理论意义和实用价值。

中文关键词: 特征提取;稀疏编码;噪声鲁棒性;语音识别;

英文摘要: Although current speech recognition systems can achieve high accuracy rates, their performances are degraded severely under noisy environments, which prevents speech recognition from real applications. To solve this problem, we study speech feature enhancement methods based on the elemental theory and technique of sparse coding to improve the noise robustness of speech recognition systems. Sparse coding represents signals under the rule of sparsity without stationarity assumption on noise, which is in according with the signal processing way of human beings and provids a new way to speech feature enhancement. This research focuses on the three basical aspects of sparse coding, namely dictioanry chosing, sparse decomposition and reconstrction. In dictionary chosing, we propose reasonable evaluation strategies and noise dictionary updating methods; in sparse decompostion, we make use of time relativity of speech and noise, and set the parameters of decompostion methods in a dynamical manner; in reconstruction, we focus on exploiting the prior knowledge of speech and noise and proposing dynamical reconstruction methods to remove wrong atoms. Finnaly, we study feature extraction based on the enhanced speech spectrum. This research has important theoretical significance and practical value in improving the noise robu

英文关键词: feature extraction;sparse coding;noise robustness;speech recognition;

成为VIP会员查看完整内容
0

相关内容

特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。 特征被检测后它可以从图像中被抽取出来。这个过程可能需要许多图像处理的计算机。其结果被称为特征描述或者特征向量。
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
深度学习模型鲁棒性研究综述
专知会员服务
88+阅读 · 2022年1月23日
专知会员服务
41+阅读 · 2021年8月30日
专知会员服务
27+阅读 · 2021年8月16日
专知会员服务
32+阅读 · 2021年4月18日
基于生理信号的情感计算研究综述
专知会员服务
60+阅读 · 2021年2月9日
专知会员服务
57+阅读 · 2020年12月6日
 图像内容自动描述技术综述
专知会员服务
84+阅读 · 2019年11月17日
计算机视觉中的传统特征提取方法总结
极市平台
1+阅读 · 2021年12月9日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
12+阅读 · 2021年10月22日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
Arxiv
25+阅读 · 2018年1月24日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
深度学习模型鲁棒性研究综述
专知会员服务
88+阅读 · 2022年1月23日
专知会员服务
41+阅读 · 2021年8月30日
专知会员服务
27+阅读 · 2021年8月16日
专知会员服务
32+阅读 · 2021年4月18日
基于生理信号的情感计算研究综述
专知会员服务
60+阅读 · 2021年2月9日
专知会员服务
57+阅读 · 2020年12月6日
 图像内容自动描述技术综述
专知会员服务
84+阅读 · 2019年11月17日
相关资讯
计算机视觉中的传统特征提取方法总结
极市平台
1+阅读 · 2021年12月9日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员