论文网
首页 理科毕业科技创新正文

几种单通道的语音增强算法研究

  • 投稿LeeJ
  • 更新时间2015-09-23
  • 阅读量1127次
  • 评分4
  • 38
  • 0

杨 龙

(中国人民解放军装甲兵工程学院信息工程系,中国 北京 100072)

【摘 要】对目前常用的几种单通道语音增强算法,即谱减法、最小均方误差估计以及子空间算法进行研究,通过仿真实验对三种单通道语音增强算法的去噪效果和去噪后语音失真程度以及信噪比进行比较分析,由此论证三种方法的使用条件和在该条件下的增强效果。

教育期刊网 http://www.jyqkw.com
关键词 语音增强;去噪;信噪比

The Search of Single Channel Speech Enhancement Algorithms

YANG Long

(Department of Information Engineer, Academy of Armored Forces Engineering, Beijing 100072,China)

【Abstract】The paper compares the commonly used several kinds of single channel speech enhancement algorithms, such as spectral subtraction, minimum mean square error estimation and subspace algorithm. Through the experiments, the paper aims at arguing the performance of the three kinds of single channel speech enhancement algorithms and gains the condition and environment of using the algorithms..

【Key words】Speech enhancement;De-noise;SNR

语音通信是最直接有效的传递信息的手段,随时代的发展,语音通信质量不断被提出更高的要求,因而语音增强技术一直是研究的热点,语音增强算法层出不穷。

语音增强算法可根据麦克风的通道数分为单通道和多通道。由于模型简单和成本较低,单通道语音增强算法一直被广泛的应用并不断研究推广。常见的单通道语音增强算法有谱减法,基于统计的方法,子空间,维纳滤波等。

1 三种单通道语音增强算法

1.1 谱减法

谱减法基本思想是假设加性噪声的情况下,从带噪语音的频谱估值中减去噪声频谱估值,从而得到纯净语音的频谱估值。谱相减法的一般形式如图1所示,Y(ω)是带噪语音频域形式,(ω)为噪声频谱估计。

1.2 最小均方误差估计(MMSE)

基于短时频谱幅度(STSA)对于语音可懂度和质量的重要性,研究者提出了从已知带噪信号中提取信号幅度谱的最优方法——最小均方误差估计法(MMSE),其估计式如下,

公式(3)中,(k)是纯净语音幅度估计值,R(k)是带噪语音幅度估计值,ξk为先验信噪比。此法关键在优化算法结构,减少计算量。并且,先验信噪比估计的准确度也对整体增强效果有较大的影响。

1.3 子空间算法

基于信号子空间的语音增强算法以线性代数为基础,通过正交分解的思想将带噪信号向量空间分解为分别由纯净信号主导和噪声信号主导的两个子空间,通过去除落在“噪声空间”里的带噪向量分量来估计出纯净语音信号。利用值分解(SVD),可将带噪信号分解到两个信号子空间,这两个空间相互正交,其中一个为目标信号子空间,另一个为其正交子空间或“噪声子空间”。

子空间算法通用结构如图2示。为了达到精准实现语音和噪声的空间分割,除了需构建相关变换的U矩阵,还需估计出变换过程中的增益矩阵。由于以线性代数为基础,在每个语音帧都需进行SVD因此计算量庞大,常以递归法或限定估计数量的方式优化算法结构。

2 实验与分析

通过利用matlab构建仿真环境,本文使用来自NOISEUS语料库的带噪语音对三种经典的单通道语音增强算法进行仿真比较,分析和总结三种算法的优缺点。所有测试含噪语音来自NOISEUS语料库,选取sp01作纯净语音,选取train,babble和airport作为噪声。设置0dB和5dB两种信噪比为仿真环境。带噪语音信号的采样频率设置为8000Hz。以SNR=5的条件进行仿真的波形图如图3所示。

以SNR和LLR作为测试实验性能的评价标准。根据文献[]可知,SNR用来评价去噪能力,LLR用来评价语音失真度,SNR越大越好,LLR越小越好。其仿真结果所获数据见表1。

从表1可以看出,子空间的SNR和LLR最大,说明子空间去噪效果最好,但语音失真度最大。MMSE的LLR最小,即语音失真度最低。在处理低信噪比的含噪语音时,MMSE的去噪能力比谱减法强,而在处理高信噪比的含噪语音时,谱减法的去噪能力比MMSE强。

3 结束语

本文介绍了谱减法、最小均方误差(MMSE)以及子空间法三种单通道的语音增强算法。通过对三种算法仿真,从数据对三种算法进行了分析,从而论证了三种算法的优缺点及其使用环境与条件。仿真实验表明,子空间法去噪效果好,但失真大,即可懂度低;MMSE去噪能力稍弱,但是可懂度高;谱减法做为最基本的语音增强算法,在实时性上占据优势,但是去噪效果不如前两种算法。

教育期刊网 http://www.jyqkw.com
参考文献

[1]P. C. Loizou,高毅,等.语音增强:理论与实践[M].成都:电子科技大学出版社,2012,12.

[2]王路露,刘光灿,夏旭.一种改进型谱减算法的语音增强研究[J].计算机工程与应用,2014,19:210-213.

[3]陈俊,孙洪,董航.基于MMSE先验信噪比估计的语音增强[J].武汉大学学报:理学版,2005,05:638-642.

[4]杨琳,张建平,颜永红.单通道语音增强算法对汉语语音可懂度影响的研究[J]. 声学学报,2010,02:248-253.

[5]杨海滨,张军.基于模型的单通道语音分离综述[J].计算机应用研究,2010,11:4025-4031.

[6]欧世峰,赵晓晖,顾海军.改进的基于信号子空间的多通道语音增强算法[J].电子学报,2005,10:60-63.

[责任编辑:刘展]