李 恝,吳海彬,葉錦華
(福州大學機械工程及自動化學院,福建 福州 350108)
語音是人與人、人與機器之間信息傳遞的主要載體之一,語音信號質量是影響語音交互準確率的一個關鍵,而語音信號在通訊過程中不可避免地受到外界噪聲的污染,影響后續對語音信息的處理.語音增強可以有效地對帶噪聲語音信號進行去噪,提高語音信號質量,國內外學者已對語音增強開展了大量的研究工作[1-7].經驗模態分解(empirical mode decomposition,EMD)是一種自適應信號時頻處理方法,很適合語音信號這種非線性非平穩信號序列的去噪處理,且具有較高的信噪比[1].文獻[2]用EMD進行語音去噪后與動態時間規劃結合起來,提高了語音的識別率;文獻[3]對EMD引入短時傅里葉變換,實現強噪聲污染語音信號的去噪.麥克風陣列在空間上具備選擇特性,從而可以抑制無關方向聲源或噪聲干擾,并有效提高所需聲源方向語音信號的質量[4].文獻[5]將最小方差無畸變響應波束形成與改進的維納濾波相結合來去除殘余噪聲;文獻[6]提出波束形成和生成對抗深層神經網絡相結合的多通道語音增強算法;文獻[7]給出空域與頻域聯合處理算法,即利用延時-求和波束形成對語音信號和干擾信號分別進行波束形成,然后轉換到頻域進行處理,有效抑制了干擾信號.本研究提出一種改進EMD與麥克風陣列最小方差無失真響應(minimum variance distortionless response ,MVDR)波束形成算法相結合的語音增強方法.首先,改進常規EMD算法,在自相關系數閾值法去除虛假固有模態函數 (intrinsic mode function,IMF)分量的基礎上,根據語音信號與噪聲的自相關函數特性的差異,準確地找到噪聲主導IMF分量和語音信號主導IMF分量的分界點,接著對噪聲主導的IMF分量增加小波閾值去噪,減少了噪聲污染,并解決信噪比較高情況下常規EMD語音信號易失真問題.使用IMF的中心頻率作為MVDR波束形成算法的頻率進行波束形成,以滿足算法的窄帶特性要求,綜合利用了麥克風陣列的抗干擾優勢,增強了麥克風陣列的抗干擾能力和環境適應能力.
EMD方法是將帶噪聲信號按照局部時間特征尺度分解成若干個從高頻到低頻IMF,EMD過程具有自適應性,通過將信號的噪聲分解到每層IMF中來提高微弱信號所在層的信噪比.
噪聲一般包含在階數小的IMF分量中,階數大的IMF分量以信號為主導,受到噪聲的影響較小,因此找到其分界點k,然后用信號主導的IMF分量重構信號,就能達到去除信號噪聲的目的.現有EMD方法一般采用均方誤差或連續最小均方誤差來確定k值,其中,連續最小均方誤差可以避免均方誤差需要已知不含噪聲原始信號的弊端[8].
考慮包含加性高斯白噪聲z(t)的信號:

(1)

定義從k開始的IMF合成信號為:

(2)
則連續最小均方誤差的計算式為

(3)


(4)
式中:arg min表示最小值.
基于常規的EMD方法容易產生包含虛假頻率成分的IMF,且在信噪比較低的情況下,基于連續均方誤差這種能量準則確定的分界點適用性有限.此外,把噪聲為主導的IMF分量直接去除,會損失部分語言信號,造成較嚴重的語音信號失真.鑒于此,對傳統EMD方法進行兩點改進.1)為了更精確找到分界點,首先根據各IMF分量和原始信號的互相關系數去除虛假分量,免除虛假IMF分量的影響;然后,根據語音信號跟高斯白噪聲的自相關函數的不同特性來確定分界點.由于語音信號存在相關性,其自相關函數在零點取得最大值,在其他點,則會隨著時間差而變化,不會很快衰減到零.盡管高斯白噪聲的自相關函數也是在零點取最大值,但在其他點則會迅速衰減到接近零值,和能量準則相比根據這個特性所找分界點,其受輸入信號的信噪比影響更小,因此確定的分界點更加精確.2)不直接去除噪聲主導的IMF分量,對其進行運算量相對少且適應性較廣的小波閾值去噪,并用所有的IMF分量重構信號,保留噪聲主導IMF中的有用信號,減小信號的失真.
改進EMD方法的步驟如下:
1)對帶噪聲的信號y(t)進行EMD分解,獲得N個IMF分量;
2)計算各IMF分量與y(t)的互相關系數,少于規定閾值則當作虛假IMF分量去除,以互相關系數最大值的十分之一為閾值;
3)計算剩余的各個IMF分量的自相關函數;
4)確定分界點k:對比各階IMF分量的自相關函數圖譜,根據信號跟噪聲的不同自相關特性,當圖譜幅值出現明顯波峰,且沒有很快降低到較小值,則該圖譜對應IMF分量的階數即為分界點;
5)對噪聲為主的IMF分量進行小波閾值去噪;
6)使用剩余的所有IMF分量來重構信號.
時域小波閾值去噪用途廣泛,其原理是根據信號與噪聲在各尺度上的小波系數的特性不同,選擇合適的閾值處理小波系數,然后再重構信號.為了克服傳統固定閾值函數在閾值點有跳躍的問題以及動態閾值函數具有固定偏差的問題,本研究采用一類改進的閾值函數[9]:

(5)
式中:λ為給定閾值;a0、a1、b0、w和β都是系數.
自適應波速形成能夠對多變的環境實現自適應干擾抑制,可以極大提高麥克風陣列的抗干擾能力.MVDR波束形成算法是一種典型的自適應波束形成算法,該算法將接收的信號首先進行相位補償,使得所有通道的信號的相位一致,然后在保證目標信號不失真的情況下,以輸出信號的功率最小為條件計算權值,最后加權求和實現噪聲的抑制.

圖1 均勻線性麥克風陣列拓撲圖Fig.1 Topology of uniform linear microphone array
不失一般性,以均勻線性麥克風陣列拓撲結構為例.如圖1所示,假設有N+1個麥克風陣元,間距為d,有一個期望信號和M個干擾信號,且都為從遠場以平面波入射到麥克風陣列上,期望信號的方向為θ0,干擾信號方向為θj,(j=1,2,…,M),則麥克風陣列接收的信號矢量可以表示為:


(6)

MVDR波束形成就是求出保證期望方向信號不失真且陣列的輸出功率最小的最優加權矢量,可以等效于以下問題的解:
WMVDR=argminE[|WHX(k)|]=argminWHRXW
(7)
且滿足WHa(θ0)=1 ,用拉格朗日乘子法解得:

(8)
式中:RX=E[X(k)XH(k)] 為陣列協方差矩陣.
MVDR波束形成算法更適用于窄帶信號,而語音信號是寬帶信號,EMD將語音信號分解成多個中心頻率從高到低的IMF分量,該分量滿足窄帶準單分量信號的特性[10].因此,將改進EMD與MVDR波束形成相結合,以IMF分量的中心頻率進行MVDR波束形成,使得MVDR波束形成算法能夠適應語音信號的帶寬要求,并發揮二者的優勢,進一步提高語音增強效果.

圖2 本研究語音增強方法算法流程圖Fig.2 The flow chart of speech enhancement algorithm in this paper


(9)
算法流程見圖2.先將每個通道的信號進行改進EMD分解,然后利用互相關系數閾值法去除虛假IMF分量,接著用自相關函數法判斷出剩余IMF分量中的噪聲主導IMF分量,再對噪聲主導IMF進行小波去噪,最后把小波去噪后所有通道的同階IMF分量進行MVDR波束形成,得到增強后的語音信號.
圖2中,x1(t),x2(t),…,xP(t)代表P個麥克風接收到的信號,算法的具體處理步驟如下:
1)對麥克風陣列接收到的信號進行改進EMD算法分解,得到各個通道的IMF分量;
2)每個通道的IMF分量使用互相關系數閾值法去除虛假IMF分量;
3)計算各通道IMF分量的自相關函數;
4)根據信號跟噪聲的自相關函數特性確定分界點k;
5)對所有噪聲為主的IMF分量進行小波閾值去噪;
6)將每個通道的同階IMF分量進行MVDR波束形成,并將形成的信號求和,得到增強后語音信號.
使用MATLAB錄制一段語音信號進行改進EMD算法效果實驗,采樣頻率為8 kHz,噪聲為高斯白噪聲,采樣時間為1 s,結合文獻[9]并實驗得到小波參數設置為:λ=4.5,β=2,a0=2.266,a1=-0.125,b1=2.234,w=1.8,效果最好,結果如圖3所示.圖3(b)為加入噪聲后的語音信號,其信噪比SNR=10 dB,圖3(c)中采用傳統EMD算法去噪后信號波形相對變得稀疏,并且在紅色框區域產生了明顯的失真,信噪比下降為5.720 9,而圖3(d)中采用本研究改進EMD算法,較好地保留了原始語音信號的特性,信噪比提高到了11.781 8.由此可知,由于語音信號頻率成分復雜,直接去除噪聲主導的IMF分量會把語音信號成分去除,造成信號失真,而本研究改進EMD方法具有較好的語音信號保真度,獲得較高的信噪比.

圖3 傳統EMD方法和改進EMD方法的對比實驗Fig.3 Contrastive experiment of traditional EMD method and improved EMD method


圖4 語音增強方法對比實驗Fig.4 Contrast experiment of speech

圖5 語音增強方法語譜圖Fig.5 Speech enhancement methods spectrogram

表1 白噪聲下不同語音增強方法的輸出信噪比Tab.1 Output SNR of different speech enhancement methods under white noise (dB)

表2 白噪聲下不同語音增強方法的PESQ評分Tab.2 PESQ score of different speech enhancement methods under white noise (dB)
改進EMD方法實驗結果表明,將帶噪聲的語音信號進行改進EMD去噪,提高了語音信號的信噪比,因此也提高了IMF分量的純凈度,這樣求得IMF中心頻率更加準確.MVDR波束形成算法實驗結果表明,該波束形成算法也具有很強的抗干擾能力,因此以更精確的IMF中心頻率進行MVDR波束形成,噪聲殘余也就得到更有效的抑制.
本研究將改進EMD算法與MVDR波束形成算法相結合實現語音信號增強,改進EMD算法先利用互相關系數閾值法去除虛假IMF分量;然后,采用自相關函數分析信號與噪聲的相關特性,準確確定信號與噪聲主導IMF的分界點;最后,對合成信號保留小波閾值且去噪后的噪聲主導IMF分量,提高了EMD算法的信噪比,減小了信號失真.在此基礎上,將EMD算法所有輸出IMF進行MVDR波束形成,擴展了MVDR對寬帶寬語音信號的適用性,有效補償了MVDR波束形成算法的噪聲濾波殘余,進一步提高了信噪比,增強了麥克風陣列的抗干擾能力.實驗結果表明,該語音增強方法相比于單獨的EMD算法和MVDR波束形成算法,其降噪能力和適應性都更強,具備良好的實際工程應用價值.