陳建明 楊 龍
(裝甲兵工程學(xué)院信息工程系 北京 100072)
基于總體平均經(jīng)驗(yàn)?zāi)B(tài)分解的語音增強(qiáng)算法研究
陳建明 楊 龍
(裝甲兵工程學(xué)院信息工程系 北京 100072)
總體平均經(jīng)驗(yàn)?zāi)B(tài)分解EEMD(Ensemble Empirical Mode Decomposition)雖然能夠在一定程度上抑制模態(tài)混淆,但添加的白噪聲不能被完全中和,對所有本征模態(tài)函數(shù)IMF(Intrinsic Mode Function)分量進(jìn)行集成平均等增加了計(jì)算工作量。基于EEMD和結(jié)合小波閾值去噪思想,提出改進(jìn)的EEMD方法。首先對原始信號進(jìn)行EEMD分解,得到一系列IMF分量;其次對篩選后的每個IMF計(jì)算噪聲強(qiáng)度;然后采用小波啟發(fā)式閾值估計(jì)噪聲并計(jì)算閾值;最后以軟閾值的方式濾除每個IMF中噪聲并重構(gòu)信號還原出增強(qiáng)的語音。通過分析仿真信號和實(shí)測信號,結(jié)果表明:該算法對帶噪語音有很好的濾波效果,與其他同類算法相比提高信噪比2~4 dB。
總體平均經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD) 小波閾值去噪 語音增強(qiáng)算法
20世紀(jì)60年代,人們對語音通信質(zhì)量有了更高的要求,語音增強(qiáng)技術(shù)成為了研究的熱點(diǎn),多種語音增強(qiáng)算法不斷涌現(xiàn)。從70年代開始,研究者以語音生成模型為基礎(chǔ),根據(jù)短時平穩(wěn)性相繼提出了一些常用的傳統(tǒng)語音增強(qiáng)算法,如譜相減法、自適應(yīng)濾波法等。之后,研究者采用統(tǒng)計(jì)模型來估計(jì)語音信號譜,此類算法增強(qiáng)效果相對較好,但是需要先驗(yàn)性經(jīng)驗(yàn)和訓(xùn)練數(shù)據(jù)且計(jì)算量偏大,處理時間長,因此,常用于信號識別處理。80年代,小波變換理論日趨成熟,研究者將研究重心轉(zhuǎn)移到更適合非平穩(wěn)信號分析的小波變換上。1998年,美籍華人Huang等創(chuàng)造性地提出一種新的信號處理方法——經(jīng)驗(yàn)?zāi)B(tài)分解EMD(Empirical Mode Decomposition)[1]。該方法實(shí)現(xiàn)了對非平穩(wěn)信號的平穩(wěn)化處理,不但具有小波變換的多頻率分辨率,且具有良好的自適應(yīng)特性。雖然EMD對非平穩(wěn)信號的分解有諸多優(yōu)勢,但是為了能夠?qū)崿F(xiàn)最優(yōu)的分解效果且最大限度地保留原信號的信息,在利用EMD進(jìn)行語音信號處理的時候必須要克服EMD最容易發(fā)生端點(diǎn)效應(yīng)和混疊效應(yīng)問題。針對EMD產(chǎn)生的混疊效應(yīng)問題,Wu和Huang在2009年提出了總體平均經(jīng)驗(yàn)?zāi)B(tài)分解EEMD方法[2-3],EEMD是針對在EMD基礎(chǔ)上通過噪聲輔助產(chǎn)生的改進(jìn)算法來克服模態(tài)混疊問題。EEMD在信號分解與檢測、故障診斷、信號預(yù)測,以及語音去噪等許多領(lǐng)域都有較大的應(yīng)用[4-8],在使用中學(xué)者為了解決本領(lǐng)域的信號處理問題,提出了許多改進(jìn)的EEMD算法。文獻(xiàn)[9]成對地添加符號相反的白噪聲到目標(biāo)信號,大大減小了重構(gòu)誤差;文獻(xiàn)[10] 通過提取信號中的高頻成分來確定加入白噪聲的幅值,再根據(jù)減小白噪聲影響的統(tǒng)計(jì)規(guī)律得到總體平均次數(shù),然后引入有限帶寬高斯白噪聲,實(shí)現(xiàn)對信號的快速準(zhǔn)確分解;文獻(xiàn)[11] 以極值點(diǎn)分布特性為評價參數(shù),自適應(yīng)確定EEMD方法中高斯白噪聲優(yōu)化幅值;文獻(xiàn)[12]結(jié)合時域航空電磁信號的衰減特性,采用 Savitzky-Golay平滑濾波完成對時域航空電磁信號降噪;文獻(xiàn)[13] 采用“3σ法則”,對含噪信號先“粗篩”后進(jìn)行“細(xì)篩”等實(shí)現(xiàn)對低信噪比下的諧波檢測。這些算法針對各領(lǐng)域的信號特性,采用多種組合方法,克服EEMD混疊效應(yīng)問題達(dá)到去噪的目的。本文在EEMD的基礎(chǔ)上,結(jié)合小波分解軟閾值的思想,采用啟發(fā)式閾值計(jì)算的方法,提出了基于EEMD的改進(jìn)算法。該算法的啟發(fā)式閾值去噪對帶噪語音信號具有自適應(yīng)性,有較好的濾波效果,與其他同類算法相比提高信噪比2~4 dB,能滿足實(shí)際應(yīng)用需要。
根據(jù)Huang對于EMD引入白噪聲改進(jìn)的思想,可將改進(jìn)后的EEMD的原理[14]歸納如下:
1) 對待分解的信號x(t)加入一組白噪聲wi(t)(i=1-N,N為次數(shù)),構(gòu)成一個總體X(t)。
Xi(t)=x(t)+wi(t)
(1)
2) 對式(1)中生成的總體Xi(t)進(jìn)行EMD分解,得到每個IMFj(j=1-K)分量。
(2)
式中cij(t) 為第i次加入白噪聲后,分解得到的第j個IMF。
3) 重復(fù)步驟1)~2),每次加入不同的白噪聲。
4) 取相應(yīng)的IMF的均值作為最終的IMF組。
(3)
對于EEMD來說,在噪聲幅度一定的條件下,總體個數(shù)越多,則平均后所得的IMFs越接近真實(shí)信號分量。但是需要注意如果加入的噪聲幅度過小,信噪比較高,則噪聲將無法影響極值點(diǎn)的選取,從而加入的白噪聲失去了彌補(bǔ)尺度的作用,因此無法克服模態(tài)混疊的作用而適得其反。
帶噪語音通過EEMD分解到不同的時間尺度上,因而整個信號的振動模態(tài)可根據(jù)頻率的高低依次呈現(xiàn)在不同的IMF上,這樣可以直觀地看到語音和噪聲在不同尺度上的具體表現(xiàn)。通常,語音信號的主要信息大多分布在較大的時間尺度且有限個IMF中,因此,對所需的IMFs重構(gòu)來還原信號可為后續(xù)的信號處理提供有效支撐。
2.1 小波閾值去噪原理
語音根據(jù)其信號特征可知能量集中,從而通過小波分解后所得的小波系數(shù)較大;而噪聲能量通常比較分散,分解所得的小波系數(shù)較小且隨著分解尺度的增大,噪聲分解后的小波系數(shù)越小,即噪聲分量主要分布在小尺度的小波系數(shù)中。基于此,利用閾值的思想將噪聲系數(shù)進(jìn)行限制,只保留信號的小波系數(shù)以達(dá)到去噪的目的。閾值去噪的實(shí)現(xiàn)思想即對大于和小于閾值的小波系數(shù)作不同的處理。通常,閾值函數(shù)分為硬閾值和軟閾值[15]。
硬閾值定義為:
(4)
軟閾值定義為:
(5)

1) 固定閾值

(6)
式中,σ表示噪聲強(qiáng)度的估計(jì),由噪聲的方差求得,N表示分解系數(shù)的長度。在EMD分解的前提下,σ的求得公式如下:
(7)
式中,j表示EMD分解尺度的序數(shù),N為IMF的長度。
2) 無偏似然估計(jì)閾值
其步驟為:先對信號中所有數(shù)據(jù)的絕對值按照由小到大的順序排列,然后對排列好的數(shù)據(jù)依次求平方得到新的數(shù)據(jù)序列,表示為:
sx2(k)=(sort(x(n)))2k=1,2,…,N
(8)
若選取閾值為式(8)產(chǎn)生的序列中的第k個值,則可表示為:

(9)
而這第k個值作為閾值所產(chǎn)生的風(fēng)險可表示為:

(10)
根據(jù)式(10)可獲得風(fēng)險曲線,其中風(fēng)險最小的點(diǎn)所對應(yīng)的值則為無偏估計(jì)的閾值,可表示為:

(11)
3) 啟發(fā)式閾值
該閾值綜合了前兩種閾值計(jì)算的思想,啟發(fā)式的選取最優(yōu)預(yù)測的閾值,具體公式如下:

(12)

(13)
根據(jù)式(12)和式(13),當(dāng)μ<ν時,信噪比較低,采用固定閾值,反之,采用無偏似然估計(jì)閾值。
根據(jù)語音信號的非線性非平穩(wěn)特性,啟發(fā)式閾值具有固定閾值和無偏似然閾值兩種估計(jì)的優(yōu)勢,可根據(jù)信號的特性自發(fā)進(jìn)行估計(jì)。因此,本文采用的類小波閾值的閾值選取方法為啟發(fā)式閾值。
2.2 基于EEMD的類小波軟閾值語音增強(qiáng)
由以上描述可知,帶噪語音中的語音信號和噪聲信號根據(jù)其特性在EEMD分解后,語音信號隨著分解尺度的增加,有效的語音分量體現(xiàn)的越多,而噪聲的分量隨著分解尺度的增加所占的信息不斷減少,尤其對于含有大量高頻分量的噪聲特別有效。通過選取適當(dāng)?shù)腎MF,即提取出可用的分解尺度上的信號分量進(jìn)行重構(gòu),可有效去除無用的噪聲分量。
在去除無用的IMF基礎(chǔ)上,本文提出了小波閾值思想設(shè)定閾值來消除噪聲。改進(jìn)的算法的具體步驟可表示為:
步驟1首先對原始信號進(jìn)行EEMD分解,得到一系列IMF分量;
步驟2對篩選后的每個IMF用式(7)計(jì)算噪聲強(qiáng)度;
步驟3采用小波啟發(fā)式閾值估計(jì)噪聲并計(jì)算閾值;
步驟4以軟閾值用式(5)的方式濾除每個IMF中噪聲;
步驟5重構(gòu)信號并還原出增強(qiáng)的語音。
3.1 實(shí)驗(yàn)素材
實(shí)驗(yàn)采用的純凈語音為男聲“裝甲兵工程學(xué)院”。其采樣頻率為8 kHz,參考噪聲來自NoiseX92噪聲庫,以坦克內(nèi)部噪聲m109進(jìn)行仿真實(shí)驗(yàn)。
1) 純凈語音的時頻信息
純凈男聲“裝甲兵工程學(xué)院”的時域波形、FFT譜和語譜圖如圖1所示,從FFT譜中可以看出語音信號的頻率范圍在20 Hz~8 kHz,從頻譜中可知該語音的頻率主要集中在1 k~4 kHz,以中低頻為主。

圖1 純凈語音男聲的時域波形、FFT譜和頻譜
2) 噪聲m109的時頻信息
噪聲m109的時域波形和頻譜如圖2所示,噪聲m109是時速30 km/h行駛的M109坦克的內(nèi)部背景噪聲。從圖2中可看出噪聲幅值和頻率均呈現(xiàn)一定的機(jī)動性,m109噪聲的頻率幾乎全部集中在1 kHz以下,但是還有部分高頻分量,在5 kHz、8 kHz、9 kHz附近有所體現(xiàn)。

圖2 噪聲m109的時域波形和頻譜
3.2 仿真結(jié)果與分析
為了測試本文提出的基于EEMD的類小波軟閾值語音增強(qiáng)算法的性能,現(xiàn)將上節(jié)的純凈語音和參考噪聲合成0 dB和5 dB的帶噪語音進(jìn)行仿真實(shí)驗(yàn),并以目前常用的LMS和MMSE語音增強(qiáng)算法作為參考進(jìn)行對比。
1) SNR=0時的仿真結(jié)果
圖3和圖4為在m109噪聲條件下通過本文算法得到的增強(qiáng)后語音的時域波形和頻譜,從帶噪語音的頻譜來看,中高頻都受到噪聲的干擾,原語音信號的低頻部分受到更大的影響。從增強(qiáng)后的頻譜來看,中高頻的噪聲影響被有效的抑制,而低頻的影響也由閾值限定有效去除。


圖3 m109(SNR=0)生成帶噪語音波形及EEMD分解結(jié)果

圖4 m109(SNR=0)噪聲下本文算法增強(qiáng)后語音時域波形和語音頻譜
圖5為LMS的增強(qiáng)仿真結(jié)果,從時域波形上可以顯示出對噪聲有一定的抑制,但是頻譜上呈現(xiàn)的增強(qiáng)效果不太明顯。圖6為MMSE的增強(qiáng)結(jié)果,從時域和頻譜的仿真結(jié)果來看,增強(qiáng)效果不錯,頻譜上高頻有少許噪點(diǎn),但對于原始語音的還原度很好。


圖5 m109(SNR=0)噪聲下LMS語音增強(qiáng)時域波形和頻譜

圖6 m109(SNR=0)噪聲下MMSE語音增強(qiáng)時域波形和頻譜
2) SNR=5 dB的仿真結(jié)果
圖7(a)為m109噪聲在SNR=5條件下通過本文算法得到的增強(qiáng)后語音頻譜,通過頻譜可發(fā)現(xiàn)本文算法去噪效果有效。圖7(b)和(c)為LMS和MMSE的增強(qiáng)結(jié)果,相比較于SNR=0的情況下,增強(qiáng)效果有所改善。


圖7 m109(SNR=5)噪聲下本文算法、LMS、MMSE后語音增強(qiáng)頻譜
通過上述SNR=5條件下的頻譜圖可以看出,本文算法對高頻噪聲的濾除非常有效,但是可能導(dǎo)致高頻的分量過少影響可懂度。從增強(qiáng)效果來講,本文算法優(yōu)于MMSE和LMS,表1為SNR=5時的三種算法實(shí)驗(yàn)的信噪比結(jié)果。

表1 三種算法增強(qiáng)后輸出信噪比結(jié)果
從仿真實(shí)驗(yàn)看,由于采用EEMD的濾波特性,對于噪聲而言,對高頻的去噪效果非常顯著,從圖中的三種方法的頻譜對比可知,噪聲頻率相對在低頻范圍。如圖7所示,本文算法信噪比改善的效果要好于LMS和MMSE,但是從頻譜上來看,過多的高頻分量被濾除,導(dǎo)致可懂度有所下降。
從EEMD分解圖中,噪聲根據(jù)參考尺度明顯分解至中頻或低頻部分,從而需通過小波軟閾值進(jìn)一步濾除,在增強(qiáng)后的語音中還會殘存一部分噪聲分量。
利用本文算法還對NoiseX92噪聲庫中的餐廳噪聲babble、F16艙內(nèi)噪聲f16、軍用車輛噪聲leopard等進(jìn)行了仿真實(shí)驗(yàn),結(jié)果表明該算法與其他同類算法相比提高信噪比2~4 dB,對帶噪語音有很好的濾波效果。
[1] Huang N E,Shen Z,Long S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society A Mathematical Physical & Engineering Sciences,1998,454(1971):903-995.
[2] Huang N E,Wu Z.A review on Hilbert-Huang transform: Method and its applications to geophysical studies[J].Reviews of Geophysics,2008,46(2):RG2006.
[3] Wu Zhaohua,Huang N E.Ensemble empirical mode decomposition:a noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009,1(1):1-41.
[4] Franzke C.Long-range dependence and climate noise characteristics of Antarctic temperature data[J].Journal of Climate,2010,23(22):6074-6081.
[5] Lei Y,He Z,Zi Y.Application of the EEMD method to rotor fault diagnosis of rotating machinery[J].Mechanical Systems & Signal Processing,2009,23(4):1327-1338.
[6] 李海濤,王成國,許躍生,等.基于EEMD的軌道—車輛系統(tǒng)垂向動力學(xué)的時頻分析[J].中國鐵道科學(xué),2007,28(5):24-30.
[7] Lotfi S,Jaouher Ben A,Farhat F.Bi-spectrum based-EMD applied to the non-stationary vibration signals for bearing faults diagnosis[J].Isa Transactions,2014,53(5):1650-1660.
[8] 張彥霞,肖清泰,徐建新,等.基于經(jīng)驗(yàn)?zāi)B(tài)分解的小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(10):284-287.
[9] 鄭近德,程軍圣,楊宇.改進(jìn)的EEMD算法及其應(yīng)用研究[J].振動與沖擊,2013,32(21):21-26.
[10] 何星,王宏力,姜偉.改進(jìn)的自適應(yīng)EEMD方法及其應(yīng)用[J].系統(tǒng)仿真學(xué)報(bào),2014,26(4):869-873.
[11] 孔德同,劉慶超,雷亞國,等.一種改進(jìn)的EEMD方法及其應(yīng)用研究[J].振動工程學(xué)報(bào),2015,28(6):1015-1021.
[12] 張婷,李雙田.改進(jìn)的EEMD算法在時域航空電磁信號降噪中的研究[J].信號處理,2016,32(7):771-778.
[13] 孫曙光,龐毅,王景芹.改進(jìn)的EEMD去噪方法及其在諧波檢測中的應(yīng)用研究[J].電工電能新技術(shù),2016,35(4):67-74.
[14] 張梅軍,唐建,何曉暉.EEMD方法及其在機(jī)械故障診斷中的應(yīng)用[M].北京:國防工業(yè)出版社,2015.
[15] 王蓓,張根耀,李智.新小波閾值函數(shù)在醫(yī)學(xué)圖像去噪中的應(yīng)用[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014,23(7):175-179.
RESEARCHOFSPEECHENHANCEMENTALGORITHMBASEDONENSEMBLEEMPIRICALMODEDECOMPOSITION
Chen Jianming Yang Long
(DepartmentofInformationEngineering,AcademyofArmoredForceEngineering,Beijing100072,China)
Ensemble Empirical Mode Decomposition (EEMD) can restrain mode mixing of EMD at a certain level, however, the calculation amount of all ensemble IMF (Intrinsic Mode Function) grows due to the white noise unneutralized completely. Therefore, based on EEMD and wavelet soft threshold, we presented a modified EEMD algorithm for speech enhancement. First, the original signal was decomposed using EEMD, and a series of IMFs were acquired; second, noise intensity of the each screened IMF was calculated; third, using wavelet heuristic threshold method, the noise was estimated and the threshold was calculated; finally, noise of every IMF was filtered with wavelet soft threshold method, and speech signal was restructured. By analyzing the simulation signal and the measured signal, we show that the algorithm has a good filtering effect on the speech enhancement, and improves the SNR 2 ~ 4dB compared with other similar algorithm.
Ensemble empirical mode decomposition(EEMD) Wavelet soft threshold Speech enhancement algorithm
TP319 TN911.7
A
10.3969/j.issn.1000-386x.2017.09.064
2016-11-24。陳建明,教授,主研領(lǐng)域:信號與信息處理。楊龍,助教。