任永梅 張雪英 賈海蓉 賈雅瓊
1(湖南工學院電氣與信息工程學院 湖南 衡陽 421002)2(湖南工學院信號與信息處理重點實驗室 湖南 衡陽 421002)3(太原理工大學信息工程學院 山西 太原 030024)
?
聯合改進子空間的自適應小波包閾值語音增強算法
任永梅1,2張雪英3賈海蓉3賈雅瓊1,2
1(湖南工學院電氣與信息工程學院湖南 衡陽 421002)2(湖南工學院信號與信息處理重點實驗室湖南 衡陽 421002)3(太原理工大學信息工程學院山西 太原 030024)
摘要針對傳統自適應小波包閾值算法增強的語音存在失真的問題,提出聯合改進子空間的自適應小波包閾值語音增強算法。提出的新算法對帶噪語音首先做KL變換(Karhunen Loeve Transform)得到其特征值,并用自適應小波包閾值算法對該特征值進行處理,以去除部分噪聲子空間;接著用遞歸最小二乘算法(RLS)對噪聲的特征值進行估計,修正傳統子空間算法容易導致的特征值估計偏差問題;最后用經過自適應小波包閾值算法處理得到的新的特征值減去噪聲特征值,以去除所有噪聲子空間并由KL逆變換最終還原出純凈語音。仿真結果表明新算法相比傳統自適應小波包閾值算法有更優的增強效果,減少了語音失真。并且在信噪比較低的情況下,新算法對增強的語音的信噪比和分段信噪比提高得更多。
關鍵詞語音增強小波包子空間遞歸最小二乘算法信噪比分段信噪比
0引言
由于子空間技術能夠在殘留噪聲和語音失真之間統籌兼顧增強語音的質量,也可以很好地消除音樂噪聲,所以此方法已經在語音增強領域得到了廣泛應用。其基本思想為通過進行空間分解,把整個空間劃分為噪聲子空間和疊加了噪聲的信號子空間,且二者相互獨立,再將噪聲子空間濾除,將原始信號從疊加了噪聲的信號子空間中估計出來[1,2]。傳統的子空間算法不能去除整個噪聲子空間,所以在估計語音特征值時易引起偏差,進而導致產生語音失真等問題,因此本文首先對傳統子空間方法進行改進,即利用RLS方法估計出噪聲特征值,以修正傳統方法中僅用無聲段的方差平均值來估計噪聲特征值,減少了語音失真。
小波分析作為時-頻域分析方法,具有多分辨率特性和時變性,能從局部到任意細節觀察信號,克服了傅立葉變換不能描述信號局部特性的不足[3]。小波包分解和小波分解的不同之處就是它對語音信號的高頻部分也會做分解,具有更強的分析信號的能力。
近些年提出了基于清濁音分離[4]和基于聽覺小波包[5]等自適應小波包閾值語音增強算法,文獻[4]中的方法能否準確檢測清音和濁音具有一定的復雜度,增強語音中仍有殘留噪聲;文獻[5]中的方法采用小波包模擬人耳的頻率分析機制,在每一頻率群里采用新的閾值動態除噪,不僅算法復雜度比較高,而且人的聽覺系統要比文獻中的系統復雜很多,所以會引起過閾值處理現象。鑒于此,本文提出了聯合改進子空間的自適應小波包閾值語音增強算法。新算法用自適應小波包閾值算法對經過霍特林變換(KL)得到的帶噪語音的特征值做初步處理,去除部分噪聲子空間并獲得新的特征值;接著用此特征值減去RLS方法估計的噪聲的特征值,以去除全部噪聲子空間;最后通過KL逆變換獲得增強語音;利用子空間方法能統籌兼顧語音失真和殘留噪聲的優勢,進一步改善了傳統自適應小波包閾值語音增強算法的增強效果。實驗結果表明,和傳統算法對比,新算法可以取得更好地去噪效果,并且減少了語音失真。
1改進的子空間語音增強算法
1.1遞歸最小二乘算法的原理
自適應濾波器的原理方框圖[6]如圖1所示,此圖中的自適應方法通常采用遞歸最小二乘算法(RLS),本質上該算法是一種有限長單位脈沖響應維納濾波器的時間遞推算法,并嚴格以最小二乘法準則為依據[7]。

圖1 自適應濾波器的原理方框圖
RLS算法的遞推公式如下:
w(n)=w(n-1)+k(n)e*(n)
(1)
e(n)=d(n)-wH(n-1)u(n)
(2)
這里,k(n)為增益向量,e(n)為預測誤差,通過調整參數,力圖找到噪聲的最佳估計,噪聲就可以得到一定程度的抵消。
遞歸最小二乘算法(RLS)的優點是對于非平穩信號的適應性較好,收斂速度比較快,估計精度也較高。遞歸最小二乘算法(RLS)自適應濾波器在噪聲消除中也得到了很好的應用,所以這里采用RLS算法對噪聲的特征值做估計。
1.2改進的子空間算法
在對語音信號進行處理時,通常都會假定噪聲方差是已知且嚴格正定的,噪聲矢量將存在于整個噪聲語音信號張成的空間當中,因此可以認為含噪語音信號的空間由兩部分組成:信號加噪聲的子空間和噪聲子空間[8]。子空間方法就是要去除掉噪聲子空間,從而估計出語音信號,最終實現語音增強。
傳統子空間算法對于噪聲特征值的估計僅僅用前3000點(無聲段)的方差平均值,易引起語音特征值估計偏差,導致語音失真。為此,提出改進的子空間方法,即通過自適應RLS遞推更新方法估計出噪聲的特征值,實現對傳統子空間方法中的噪聲的特征值的修正,達到減少語音失真的目的。改進的子空間算法原理方框圖如圖2所示。

圖2 改進的子空間語音增強算法原理方框圖
改進的子空間語音增強算法可按照如下四個詳細步驟進行:
1) 輸入的噪聲語音作霍特林(KL)變換,得出其在子空間中的特征值ΛY和特征向量;
2) 估計噪聲的特征值ΛN,這里采用RLS算法進行估計;


為了驗證算法的有效性,在白噪聲情況下,對兩種算法計算出的噪聲特征值進行了對比,結果如表1所示。從表1可以看出,改進子空間方法估計的噪聲特征值比傳統方法估計的噪聲特征值更加接近于真實噪聲的特征值。

表1 兩種算法計算出的噪聲的特征值
2聯合改進子空間的自適應小波包閾值語音增強算法
2.1自適應小波包閾值去噪原理
經過小波包分解之后,語音信號的小波包系數和噪聲信號的小波包系數將呈現出相反的性質。通常認為,幅值較大的小波包系數是語音信號的,而幅值較小的小波包系數是噪聲信號的,所以,可以假定不同的閾值門限來閾值處理小波包系數,以去除小于閾值門限的系數,并用剩余的大于閾值門限的系數來重構信號。自適應小波包閾值去噪原理方框圖如圖3所示。

圖3 自適應小波包閾值去噪原理方框圖

2.2新的閾值函數
由于傳統的硬閾值函數具有不連續性,因此在重構語音信號時不可避免地將會產生震蕩現象;而軟閾值函數處理后的信號幅度和純凈語音信號幅度之間有恒定的偏差存在[10]。鑒于此,本文提出了一種新的閾值函數,其表達式如式(3)所示:
(3)

2.3新算法描述
由于傳統自適應小波包閾值算法增強的語音存在著語音失真和殘留噪聲,而子空間算法在平衡語音失真和殘留噪聲方面又有優勢,所以提出了聯合改進子空間的自適應小波包閾值語音增強算法。新算法的原理方框圖如圖4所示。

圖4 新算法的原理方框圖
對于新算法的描述如下:先對經過霍特林變換(KL)的噪聲語音利用自適應小波包閾值算法來去除掉部分噪聲子空間,并得出新的特征值,再從該特征值中減去RLS算法估計出的噪聲的特征值,以得出增強語音的特征值,最后再進行KL逆變換得出增強語音。
3仿真實驗與分析
本文對新算法與文獻[4]中的自適應小波包閾值方法分別作了仿真實驗并進行了對比分析,用的軟件版本是MATLABR2008a。實驗時選的原始語音來自NOIZEUS語音庫。噪聲來自Noisex-92噪聲庫中的白噪聲和火車噪聲,其中白噪聲信號的信噪比取-5到15 dB(間隔5 dB),火車噪聲信號的信噪比取0到10 dB(間隔5 dB)。
為了取得最優的實驗結果,取幀長度為40個采樣點,幀移為幀長的二分之一;小波函數選取的是sym8小波;小波包分解結構為文獻[11]中的3層小波包分解結構。圖5中的時域波形圖是信噪比為5 dB的白噪聲背景下兩種算法處理得到的,圖6是圖5中各個時域波形圖的頻譜圖。

圖5 白噪聲背景下增強語音的時域波形圖

圖6 白噪聲背景下增強語音的頻譜圖
從圖5可以看出,傳統方法增強的語音還存在較多的殘留噪聲,也有語音失真;新算法處理得到的增強語音的波形圖和原始(純凈)語音的波形圖最接近,能夠更好地保留住原始語音成分,減少了語音失真。
從圖6可以看出新算法增強的語音的頻譜圖與原始語音的頻譜圖最接近,而且其對深色部分(語音)保留得更多;另一方面在語音間歇處的顏色要比5 dB帶噪語音的頻譜圖深一些,說明了新算法在一定程度上能夠較好地抑制音樂噪聲。
本文在測評增強后的語音的性能時采用的評價方法有信噪比、分段信噪比和PESQ(感知語音質量評價),仿真結果如下面表2、表3和圖7、圖8所示。

表2 兩種算法增強后的語音的信噪比/dB

表3 兩種算法增強后的語音的分段信噪比 單位:dB

圖7 白噪聲背景下的PESQ值對比 圖8 火車噪聲背景下的PESQ值對比
從表2和表3可看出,當輸入的信噪比(SNR)和分段信噪比(SSNR)相同時,新算法增強的語音的信噪比值和分段信噪比值比傳統算法增強的語音的對應值都有所提高,并且信噪比越低,提高的越多;在15 dB時,SNR和SSNR大約分別降低了0.2和0.15 dB,但這并不影響該算法的整體優越性。
從圖7和圖8中的PESQ值中可看到,由新算法增強的語音的PESQ值要比由自適應小波包閾值方法增強的語音的PESQ值高,并且在0和5 dB時,PESQ值的增幅要比信噪比較高時更多一些;主觀測聽的結果也是新算法增強得到的語音的質量更好。主客觀評價方法都證明了新算法不僅能夠去噪,而且可以減少語音失真。
4結語
本文提出的新算法將自適應小波包閾值方法和利用遞歸最小二乘算法(RLS)修正了的傳統子空間語音增強方法進行了結合,進一步改善了自適應小波包閾值算法的增強效果。實驗表明,新算法在抑制噪聲的同時減少了語音失真,并且其在低信噪比時的去噪效果更好。但本文方法也有不足之處,比如自適應閾值是引用文獻中的,在以后的研究中可以考慮改進自適應閾值來進一步改善去噪效果。
參考文獻
[1] 劉鵬,馬建芬.具有較高可懂度的子空間語音增強算法[J].計算機工程與設計,2013,34(7):2619-2622.
[2] 張雪英,賈海蓉,靳晨升.子空間與維納濾波相結合的語音增強方法[J].計算機工程與應用,2011,47(14):146-148.
[3] 任永梅,張雪英,賈海蓉.一種新閾值函數的小波包語音增強算法[J].計算機應用研究,2013,30(1):114-116,137.
[4] Zhang Junchang,Zhang Yi,Ye Zhen.Adaptive Speech Enhancement Based on Classification of Voiced/Unvoiced Signal[C]//IEEE International Conference on Multimedia and Signal Processing.Guilin:IEEE,2011:310-314.
[5] 陳春輝,馮剛.基于聽覺小波包自適應語音增強方法[J].華南師范大學學報(自然科學版),2013,45(2):55-59.
[6] 張然,湯全武,史崇升.基于遞推最小二乘自適應濾波算法的圖像去噪[J].計算機應用與軟件,2014,31(4):193-196.
[7] 羅文超,張友純.在MATLAB中采用RLS算法實現FIR自適應濾波器[J].軟件導刊,2008,7(1):107-108.
[8] 賈海蓉,張雪英,牛曉薇.用小波包改進子空間的語音增強方法[J].太原理工大學學報,2011,42(2):117-120.
[9] 董胡,錢盛友.基于小波變換的語音增強方法研究[J].計算機工程與應用,2007,43(31):58-60.
[10] Ghanbari Y,Karami-mollaei M R.A new approach for speech enhancement based on the adaptive thresholding of the wavelet packets[J].Speech Communication:2006,48(8):927-940.
[11] 田秀榮.基于正交小波包分解的語音去噪增強[J].計算機仿真,2011,28(5):388-390.
ADAPTIVE WAVELET PACKET THRESHOLD SPEECH ENHANCEMENT ALGORITHM COMBINED WITH IMPROVED SUBSPACE
Ren Yongmei1,2Zhang Xueying3Jia Hairong3Jia Yaqiong1,2
1(SchoolofElectricalandInformationEngineering,HunanInstituteofTechnology,Hengyang421002,Hunan,China)2(KeyLaboratoryofSignalandInformationProcessing,HunanInstituteofTechnology,Hengyang421002,Hunan,China)3(CollegeofInformationEngineering,TaiyuanUniversityofTechnology,Taiyuan030024,Shanxi,China)
AbstractFor distortion problem existed in speech enhanced by traditional adaptive wavelet packet threshold algorithm, we propose the adaptive wavelet packet threshold speech enhancement algorithm combined with improved subspace. The new algorithm proposed first makes Karhunen Loeve transform on noisy speech to get its eigenvalues, which are then dealt with by adaptive wavelet packet threshold algorithm to remove part of the noise subspace. Then it adopts recursive least squares algorithm (RLS) to estimate the noise eigenvalues, and revises the eigenvalue estimation deviation caused by traditional subspace algorithm. Finally the algorithm uses the derived new eigenvalues processed by adaptive wavelet packet threshold algorithm to subtract the noise eigenvalues so as to eliminate all the noise subspace and eventually restores the pure speech by KL reverse transform. Simulation results show that this new algorithm has better enhancement effect compared with traditional adaptive wavelet packet threshold algorithm, and reduces the speech distortion as well. And what’s more, in the circumstance of low SNR, the new algorithm gains much higher improvement in signal-to-noise ratio (SNR) and segment SNR (SSNR) of the enhanced speech.
KeywordsSpeech enhancementWavelet packetSubspaceRLSSNRSSNR
收稿日期:2014-12-15。2013年度湖南工學院校級科學研究項目(HY13002);山西省科技廳2013年青年科技研究基金項目(2013021016-1);湖南省自然科學青年人才培養聯合基金項目(14JJ6046);湖南工學院信號與信息處理重點學科項目。任永梅,助教,主研領域:語音信號處理。張雪英,教授。賈海蓉,副教授。賈雅瓊,副教授。
中圖分類號TP391.9
文獻標識碼A
DOI:10.3969/j.issn.1000-386x.2016.05.035