張 青 吳 進
(西安郵電大學 陜西 西安 710121)
基于多窗譜估計的改進維納濾波語音增強
張 青 吳 進
(西安郵電大學 陜西 西安 710121)
為減少維納濾波在語音增強中殘留的“音樂噪聲”,將多窗譜估計和改進的維納濾波方法結合,并進行語音合成。設計了基于多窗譜估計的改進維納濾波語音增強方法,該方法采用多窗譜估計噪聲功率譜,改進維納濾波降噪得到增強語音,以及重疊相加語音合成,并給出仿真對比驗證。結果表明,基于多窗譜估計的改進維納濾波方法在抑制噪聲,減少音樂噪聲方面優于基于維納濾波的增強算法和基于多窗譜估計的改進譜減法的增強算法。
語音增強 多窗譜 改進維納濾波 語音合成 重疊相加
語音增強就是減少噪聲干擾,提高語音質量的一個過程[1-2]。在實際中,語音在傳輸過程中很容易受到來自外界和內部噪聲的污染,使得接收端語音質量下降[3]。抑制噪聲干擾[4],提高語音質量是語音增強的重要問題。
到目前為止,一些語音增強的方法,如譜減法[5],帶噪語音功率譜與噪聲做減法得到估計語音的一種方法,該方法會使增強后的語音存在殘留“音樂噪聲”;維納濾波[6],只適用于平穩噪聲環境,不適應復雜多變的噪聲背景;最小均方誤差法[7],該算法是基于統計模型的,計算量大復雜度高。
針對上述問題,本文提出了一種基于多窗譜估計的改進維納濾波語音增強方法。該方法采用多窗譜估計帶噪語音功率譜得到估計值,改進維納濾波增強法進行噪聲抑制,最后采用重疊相加合成語音。
1.1 多窗譜估計
Thomson在1982年提出了多窗譜估計[8],該方法對同意數據序列用多個正交的數據窗分別求直接譜,然后求平均得到譜估計,多窗譜是一種更為準確的譜估計方法,多窗譜估計定義如下:
(1)
式中,L為數據窗個數,Smt為第k個數據窗的譜:
(2)
式中,x(n)為數據序列,N為序列長度,ak(n)為第k個數據窗,它滿足多個數據之間相互正交:
(3)
數據窗是一組相互正交的離散橢球序列DPSS(DiscreteProlateSpheroidalSequences)。
1.2 維納濾波算法及其改進
維納濾波器是一種線性濾波器。當輸入帶噪語音y(n)=s(n)+d(n)(n=0,1,2,…),其中s(n)為純語音,d(n)為噪聲。經過系統函數為h(n)的維納濾波系統,輸出估計語音為[9]:

(4)

根據正交性原理,系統函數h(n)對每個m滿足[11]。

(5)

(6)
將式(6)的H(k)稍作變形可得改進維納濾波器的估計器[13],即:
(7)

(8)
(9)
其中,ξ(k)是先驗信噪比,γ(k)是后驗信噪比,定義如下:
(10)
(11)
ξi(k)=aξi-1(k)+(1-a)(γi(k)-1)
(12)
(13)
這便是第i幀語音信號頻譜的估算值。
本文提出基于多窗譜估計的改進維納濾波語音增強算法,區別于傳統的維納濾波算法。具體實現步驟如下:
Step1 帶噪語音信號為y(n),加窗分幀后為yi(m),相鄰幀之間有重疊;
以i幀為中心前后各取M幀,共有2M+1幀進行平均實際中常取M為1,即在3幀中進行平均;
Step3 把分幀后的信號yi(m)進行多窗譜估計,得到多窗譜功率譜密度P(k,i)(i表示第i幀,表示k第k條譜線);
Step4 對多窗譜功率譜密度估計值也進行相鄰幀之間的平滑處理,計算平滑功率譜密度Py(k,i):
以i幀為中心前后各取M幀,共有2M+1幀進行平均。實際中常取M為1,即在3幀中進行平滑;


實驗中的語音材料為安靜環境下錄制的純凈語音,噪聲選自Noisex-92數據庫。在不同背景噪聲環境下,輸入信噪比分別為-5、5dB的情況下,對比分析基于維納濾波和基于多窗譜估計的改進維納濾波語音增強以及基于多窗譜估計的改進譜減法語音增強的增強效果。結果如圖1、圖2、表1所示,其中圖1為高斯白噪聲環境下,輸入信噪比分別為-5、5dB時,基于維納濾波的語音增強與基于多窗譜估計的改進維納濾波語音增強的增強效果對比;圖2為babble噪聲環境下,輸入信噪比為-5、5dB時,基于維納濾波的語音增強與基于多窗譜估計的改進維納濾波語音增強的增強效果對比;表1為分別在babble、Gaussian、pink以及factory噪聲環境下,當輸入信噪比為-5、0、5dB時,對比基于維納濾波的語音增強和基于多窗譜估計的改進維納濾波語音增強以及基于多窗譜的改進譜減法的語音增強的輸入輸出信噪比及其差值。


圖1 增強效果對比

圖2 增強效果對比
圖1中(a)、(c)分別為在高斯白噪聲環境下,輸入信噪比依次為-5、5dB時,基于維納濾波算法的語音增強。圖1中(b)、(d)分別為在高斯白噪聲環境下,輸入信噪比依次為-5、5dB時,基于多窗譜估計的改進維納濾波算法的語音增強。對比圖1中(a)和(b)、(c)和(d)可以看出,在高斯白噪聲環境下,輸入信噪比為-5、5dB時,基于多窗譜估計的改進維納濾波語音增強相對于基于維納濾波的語音增強,在增強效果方面有一定的提高。圖2中(e)、(g)分別為在babble噪聲環境下,輸入信噪比依次為-5、5dB時,基于維納濾波算法的語音增強;圖2中(f)、(h)分別為在babble噪聲環境下,輸入信噪比分別為-5、5dB時,基于多窗譜估計的改進維納濾波算法的語音增強。對比圖2中(e)和(f)、(g)和(h)可以看出,在babble噪聲環境下,輸入信噪比為-5、5dB時,基于多窗譜估計的改進維納濾波語音增強相對于基于維納濾波的語音增強,在增強效果方面也有一定的提高。

表1 不同噪聲環境下語音增強的輸出SNR比較
從表1可以看出,當輸入信噪比分別為-5、0、5 dB時,就輸入輸出信噪比而言,在babble、Gaussian、pink以及factory背景噪聲下,基于多窗譜估計的改進維納濾波算法與基于多窗譜估計的改進譜減法的語音增強,其增強效果優于基于維納濾波的語音增強算法。當輸入信噪比為-5 dB時,在Gaussian噪聲環境下,基于多窗譜估計的改進譜減法語音增強得到的信噪比差值大于基于多窗譜估計的改進維納濾波語音增強算法得到的信噪比差值,說明在Gaussian噪聲環境下,基于多窗譜估計的改進維納濾波語音增強算法的增強效果相對基于多窗譜估計的改進譜減法語音增強的增強效果略差。當輸入信噪比為5 dB時,在babble、Gaussian以及factory噪聲環境下,基于多窗譜估計的改進維納濾波語音增強得到的信噪比差值略低于基于多窗譜估計的改進譜減法語音增強得到的信噪比差值。而在其他情況下,基于多窗譜估計的改進維納濾波語音增強的增強效果相對優于基于多窗譜估計的改進譜減法。
為減少在維納濾波增強后,語音中殘留的“音樂噪聲”,提出了基于多窗譜估計的改進維納濾波語音增強算法,該算法將多窗譜帶噪語音功率譜估計和改進維納濾波算法相結合,得到增強語音的頻譜,并采用重疊相加法將其合成語音信號。通過仿真實驗,結果表明,基于多窗譜估計的改進維納濾波算法相比基于維納濾波的語音增強以及基于多窗譜估計的改進譜減法語音增強,在增強效果方面有一定的提高。
[1] 徐巖,王春麗.語音信號增強技術及其應用[M].北京:科學出版社,2014.
[2] 王水平,唐振民,陳北京,等.復雜環境下語音增強的復平面譜減法[J].南京理工大學大學學報,2013,37(6):857-862.
[3] 張衛強,郭璁,張喬,等.一種基于計算聽覺場景分析的語音增強算法[J].天津大學學報:自然科學與工程技術版,2015,48(8):663-669.
[4] 李秩男,張雄偉,曾理,等.改進的稀疏字典學習單通道語音增強算法[J].信號處理,2014,30(1):44-50.
[5] 王路露,劉光燦,夏旭.一種改進型譜減算法的語音增強研究[J].計算機工程與應用,2014,50(19):210-213.
[6] 容強,肖漢.基于MMSE維納濾波語音增強方法研究與Matlab實現[J].計算機應用與軟件,2015,32(1):153-156.
[7]YouC,KohS,RahardjaS.Adaptiveb-orderMMSEestimationforspeechenhancement[J].Proc.IEEEInt.Conf.Acoust.,SpeechSignalProcessing,2003(1):900-903.
[8] 武鵬鵬,趙剛,鄒明.基于多窗譜估計的改進譜減法[J].現代電子技術,2008,31(12):150-152.
[9] 張正文,周航麒.基于多窗譜估計的維納濾波語音增強算法[J].河南理工大學學報,2015,34(5):686-690.
[10]FardkhaleghiP,SavojiMH.NewapproachestospeechenhancementusingphasecorrectioninWienerfiltering[C]//InternationalSymposiumonTelecommunications-IST,2010:895-899.
[11]IbrahimA,MilnerB.VisuallyDerivedWienerFiltersforSpeechEnhancement[J].IEEETransactionsonAudio,Speech&LanguageProcessing-TASLP,2011,19(6):1642-1651.
[12]ScalartP,FilhoJ.Speechenhancementbasedonapriorisignaltonoiseestimation[J].Proc.IEEEInt.Conf.Acoust. ,Speech,SignalProcessing,1996:629-632.
[13]PhiliposCLoizou.語音增強理論與實踐[M].成都:電子科技出版社,2012.
[14] 宋知用.MATLAB在語音信號分析與合成中的應用[M].北京:北京航空航天大學出版社,2013.
IMPROVED WIENER FILTER SPEECH ENHANCEMENT BASED ONMULTI-TAPER SPECTRUM ESTIMATION
Zhang Qing Wu Jin
(Xi’anUniversityofPostandTelecommunications,Xi’an710121,Shaanxi,China)
In order to reduce the musical residual noise left by the speech enhancement of wiener filter, multi-taper spectrum estimation is combined with the improved wiener filter method while processing speech synthesis. A wiener filter speech enhancement method based on multi-taper spectrum estimation is designed. The method adopts the noise power spectrum of multi-taper spectrum estimation, improves wiener filter to reduce noise and enhance speech, and overlap-adds it to achieve speech synthesis. Then the simulation contrast verification is given. The result shows that the wiener filter speech enhancement method based on multi-taper spectrum estimation performs better in noise suppression and musical noise reduction than speech enhancement algorithm based on wiener filter as well as improved spectral subtraction method based on multi-taper spectrum estimation.
Speech enhancement Multi-taper spectrum Improved wiener filter Speech synthesis Overlap-adding
2016-02-25。國家自然科學
61272120)。張青,碩士,主研領域:語音增強。吳進,教授。
TP912.35
A
10.3969/j.issn.1000-386x.2017.03.011