非高斯零均值噪声环境下的语音增强算法

2015-11-24 01:52蔡萍

湖南理工学院学报（自然科学版） 2015年1期

关键词：背景噪声高斯信噪比

蔡萍

(闽江学院物理学与电子信息工程系,福州 350108)

非高斯零均值噪声环境下的语音增强算法

蔡萍

(闽江学院物理学与电子信息工程系,福州 350108)

语音增强的目的就是尽量从带噪语音信号中提取纯净语音.谱减法由于其实现简单,实时性好等优点被广泛应用于语音增强中.然而,传统谱减法只能对高斯零均值的噪声信号进行增强.针对这一问题,提出一种能适应非高斯零均值噪声环境的改进算法.该算法处理后的语音具有较好的可懂度和信噪比,并大大削弱了音乐噪声.

语音增强; 谱减法; 信噪比

引言

人们在移动通信和语音识别等过程中,不可避免地受到语音中噪声的干扰.背景噪声是导致语音信号可懂度、清晰度下降的最主要因素.特别当噪声是宽带噪声时,噪声的功率谱与语音信号完全重叠,对提取纯净语音造成了难度.谱减法是出现较早且发展较成熟的一类算法,具有简单易实现、运算量小的优点,是处理宽带噪声的主流方法之一[1].然而,用经典方法处理的语音信号会产生有节奏起伏,听上去像音乐一样的“音乐噪声”,让人听起来不舒服.针对谱减法的这一缺陷,出现了很多改进算法.这些改进算法在消除音乐噪声,背景噪声和减小语音失真等方面都有很大的提高[2].

针对实际环境下噪声并非都是零均值高斯分布的问题,本文提出了一种有别于传统谱减法的改进算法,在对这两种算法理论分析的基础上,通过实验仿真,得出了分析结果.

1　基本谱减法

语音信号具有“短时平稳”性,也就是说,在10～30ms的时间内,语音信号的短时幅度谱具有平稳特性[3].基本谱减法是一种基于短时谱的算法,因此在对语音信号处理前应进行分帧.其基本思想是假设在噪声与语音信号相互独立的前提条件下,从带噪信号的功率谱中减去噪声的功率谱,从而实现语音增强的目的.

假设纯净语音为()sk,噪声为()nk,带噪语音为()yk,则在一帧信号内:

由于人耳对语音信号的相位不敏感,所以用傅里叶反变换恢复时间信号时,可用原带噪信号傅里叶变换的相位[4].

2　改进的谱减法

传统算法从(5)式到(6)式转换的前提条件是2Re[S(w)N*(w)]等于零.而在一般情况下,噪声未必都是高斯零均值的.这时2Re[S(w)N*(w)]的值就不能忽略不计.特别是在强背景噪声环境下,此项的值还是相当可观的.

这里提出一种新的算法.

3　仿真结果与分析

在MATLAB环境下进行仿真.纯净语音信号为男声.采样频率为8KHz,量化位数为16.

噪声选取空调发出的宽带噪声,并将均值设置为0.3.图1所示为对5dB的带噪信号用经典谱减法和改进谱减法进行处理的结果.系数η取1.1.

图1　语音信号增强前后波形图

从波形图中看出,采用传统谱减法增强后的语音残留有大量噪声,而用改进的谱减法则更接近于纯净语音信号.人耳主观判决的结果也表明,在语音的保真度、舒适度、音乐噪声的残留度等方面,改进的谱减法能达到更高的指标.

表1给出了不同信噪比条件下传统谱减法和改进谱减法的增强效果.

表1　不同信噪比下两种算法的比较

由表1可见,在噪声不是高斯零均值白噪声的条件下,传统的谱减法完全失去了优势.在高信噪比时,只能对信噪比进行少许的改善; 而在低信噪比条件下甚至出现了信噪比减小的现象.而改进的谱减法由于照顾到噪声非零均值非高斯分布的实际情况,体现出较好的鲁棒性,特别是在低信噪比时达到信噪比大幅提升的良好效果.

[1] Berouti M,Schwartz R,Makhoul J.Enhancement of Speech Corrupted by Acoustic Noise[C].Acoustics,Speech,and Signal Processing,IEEE International Conference on ICASSP,1979,4:208～211.

[2] 胡科开,吴凭天,杨磊,等.一种基于改进型谱减法的语音增强新算法[J].大众科技,2008,109(9):25～26

[3] 王水平,唐振民,陈北京,等.复杂环境下语音增强的复平面谱减法[J].南京理工大学学报,2013,37(6):857～862.

[4] 陈欢,邱晓晖.改进谱减法语音增强算法的研究[J].计算机技术与发展,2004,18(4):69～71

[5] 林琴,张道信,吴小培.一种基于改进谱减法的语音去噪新方法[J].计算机技术与发展,2007,17(7):63～66

OFDM Techniques of European Digital Television Transmission Standard DVB-T

CAI Ping
(Department of Physics & Electronic Information Engineering,Minjiang University,Fuzhou 350108,China)

The purpose of speech enhancement is to extract pure speech signal from polluted speech signal as much as possible.Spectral subtraction algorithm is widely used in speech enhancement for its simple realization and good real-time character.However,traditional spectral subtraction algorithm can only be applied on Gaussian and zeromean noise.To solve this problem,put forward an improved algorithm which is adapted to non-Gaussian and non-zeromean noise environment.Being processed by this algorithm,speech signal has relatively high understandability and signal-to-noise ratio,and has less influence of musical noise.

speech enhancement; spectral subtraction algorithm; signal-to-noise ratio

TN912.3

1672-5298(2015)01-0026-03

2014-12-29

蔡萍(1981- ),女,福建宁德人,硕士,闽江学院物理学与电子信息工程系讲师.主要研究方向:语音信号处理

非高斯零均值噪声环境下的语音增强算法

引言

1 基本谱减法

2 改进的谱减法

3 仿真结果与分析

1　基本谱减法

2　改进的谱减法

3　仿真结果与分析