项目名称: 复杂声学环境下的说话人语音信息的抽取、分离和识别
项目编号: No.90920002
项目类型: 专项基金项目
立项/批准年度: 2010
项目学科: 金属学与金属工艺
项目作者: 王岚
作者单位: 中国科学院深圳先进技术研究院
项目金额: 50万元
中文摘要: 本项目是针对复杂声学环境下的说话人语音信息处理展开研究。我们将分析典型的复杂声学环境- - 驾驶环境下非恒定噪声源的特性,从人类听觉系统对非恒定噪声源的压制机理出发,探索面向识别的语音信息与非恒定噪声的提取和分离方法。我们首先进行驾驶环境下的中文连续语音数据的采集和数据分析,建立一个可推广的基于多项式回归与插值 HMM 的声学模型,用于非恒定噪声下的鲁棒性自动语音识别。我们将探索不同的数学方法以对变化噪声环境下的相匹配的声学模型参数进行动态,实时的运算。我们将探索基于特征与模型空间的参数多项式回归于插值方法,使得计算复杂度和识别性能有合理的平衡。同时,该方法将与自适应训练和区别性训练整合,使之可以应用于大规模连续语音识别的系统框架中。因此,本项目的研究内容不仅具有认知理论研究基础,还可以应用在实际系统中。
中文关键词: 多项式回归与差值;结构化建模;变换矩阵;鲁棒语音识别;车载噪声
英文摘要:
英文关键词: polynomial regression;structure modeling;linear transforms;robust ASR;in-car noise