張春曉,陳又圣,黃鴻展
深圳信息職業技術學院,廣東深圳518000
目前電子耳蝸在干擾噪聲環境下的識別率仍然不高,提高前端信號采集的信噪比是提高言語識別率的重要途徑之一。在電子耳蝸實際使用中,目標信號與干擾噪聲往往方位不一致,例如面對面交流和打電話交流過程中的干擾噪聲主要來自其他方位,來自正向方位的語音信號是常見使用場景中的目標信號[1]。麥克風陣列波束形成的方法由于增加了空間方位的信息,在近年來被應用于電子耳蝸前端語音增強中[2-5]。在基于麥克風陣列的語音增強方法中,延遲波束形成技術由于實現簡單和計算量少等特點被目前電子耳蝸領域的前端信號采集和語音增強算法研究所采用[6-9]。
延遲波束形成方法中的延遲系數是決定波束指向類型的重要參數[10-11],但在電子耳蝸小尺寸間距及語音采樣率條件下,延遲具體數值往往不是整數,由此產生了分數延遲參數的實現及信號插值的問題[12]。就本質而言,分數延遲是在已有的信號采集點之間插值形成新的信號序列作為估計的延遲信號,并進一步用于語音增強算法中。
插值可以大體分為有限長單位沖激響應濾波器(Finite Impulse Response,FIR)和無限脈沖響應數字濾波器(Infinite Impulse Response,IIR)方法兩大類,其中,拉格朗日插值方法由于其算法簡單,易于率先實現等特點在很多領域應用較廣[13-16]。由于尺寸限制及功耗要求,電子耳蝸對信號處理的實時性有較高要求,本文使用拉格朗日插值方法來實現電子耳蝸波束形成中的分數延遲,并探討該插值方法的參數特征和失配特性。
對電子耳蝸實際應用來說,雙麥克風的模式由于算法簡單,計算復雜度低而被應用于前端信號采集及語音增強中。延遲參數是決定波束指向的重要參數,而延遲參數一般以d/c 的倍數形式來表示,其中,d表示雙麥克風的間距,c表示聲速。雙麥克風等權重情形下,不同延遲參數條件下不同方位的信號幅頻響應如圖1所示。

圖1 不同延遲條件下系統各個方位的幅頻響應Fig.1 System amplitude response for different delay conditions at different orientations
圖1 表示不同延遲參數條件下系統各個方位的系統幅頻響應曲線,其中,0°方位表示正向,-90°和90°方位表示側向,-180°和180°方位表示后向(-180°和180°位置重合)。從圖1 可以看到,不同的延遲參數會產生不同的系統幅頻響應曲線,由此產生了不同的波束指向。例如,延遲參數為0 時,正向和后向方位的幅頻響應相同,而側向幅頻響應為0,對應雙極型波束指向;延遲參數為d/c時,正向的幅頻響應最大,而后向的幅頻響應為0,對應心型波束指向。因此,延遲參數決定著極性圖的類型,在波束指向設計中,延遲參數對精度有很高的要求。
在電子耳蝸實際應用中,由于體積的限制,電子耳蝸本身所使用的雙麥克風間距較小。例如,延遲一個d/c在采樣率為22.05和44.10 kHz條件下分別對應延遲0.649 和1.297 個采樣點,由此產生了分數延遲的問題。延遲0.649 和1.297 個采樣點實質上是在原來采集信號的基礎上實現插值,對于第i個采樣點x(i),延遲0.649是在采樣點x(i)和采樣點x(i+1)之間插值,而延遲1.297 是在采樣點x(i+1)和采樣點x(i+2)之間插值。
拉格朗日插值是一種多項式的插值方法,其特點是實現簡單。對于原始采集的信號序列x(1)、x(2)、x(3)、…、x(n),拉格朗日插值多項式L(x)如式(1)所示:

其中,Gj(x)為加權系數函數,其表達式如式(2)所示:

對于分數延遲D個采樣點,則采樣序列由x(1)、x(2)、…、x(n)變成延遲信號序列L(1+D)、L(2+D)、L(3+D)、…、L(n+D)。對于前面所探討的電子耳蝸實際尺寸參數來說,延遲一個d/c在22.05 kHz的采樣率條件下形成新的序列:L(1.649)、L(2.649)、L(3.649)、…、L(n+0.649);同樣地,在44.1 kHz 采樣率條件下形成新的序列:L(2.297)、L(3.297)、L(4.297)、…、L(n+1.297)。
對于不同的階數,拉格朗日插值可形成特定的插值模式。一階的拉格朗日插值形成最簡單的線性插值方法,如果用原始采集的信號序列x(1)、x(2)、x(3)、…、x(n)來表示延遲序列,則對于延遲0.649和1.297個采樣點所形成的信號序列如式(3)和(4)所示:

從式(3)和(4)可以看到,一階的拉格朗日插值是對相鄰兩點的插值,并通過給予相鄰兩點的加權形成新的信號延遲的插值點。同樣地,N階的拉格朗日插值是通過相鄰的N個點的加權形成的。
從式(3)和(4)可以看到,一階的拉格朗日插值是對相鄰兩點的插值,并通過給予相鄰兩點的加權形成新的信號延遲的插值點。同樣地,N階的拉格朗日插值是通過相鄰的N個點加權和形成的。而從系統輸入輸出角度看,通過拉格朗日插值方法實現的插值可以看成是一個延遲濾波器。
如果延遲D個采樣點,則理想的分數延遲濾波器的系統函數Hideal表達式如(5)所示:

由式(5)可以看到,理想的分數延遲濾波器是具有線性相位的全通系統,即系統幅頻響應恒為1,相位具有線性變化的特征。由于線性相位的全通系統是非因果系統,不能實時實現,因此不適合直接應用在電子耳蝸實時信號處理的過程中。對于實時處理的拉格朗日插值方式,其對應的濾波器系統響應存在失配,在采樣率22.05 和44.1 kHz 條件下延遲一個d/c的拉格朗日插值濾波器在不同階數情形下的系統幅頻響應分布如圖2所示。
圖2 表示階數為1~10 時拉格朗日插值濾波器系統幅頻響應分布情況。對比不同階數和歸一化頻率條件下的幅頻響應變化,可以看到,當頻率較小時,系統的幅頻響應變化不大。歸一化頻率范圍在0~0.1fs(采樣率22.05 kHz 時對應的頻帶范圍是0~2 205 Hz,采樣率44.1 kHz 時對應的頻帶范圍是0~4 410 Hz)時的幅頻響應幾乎為1,與理論的分數延遲濾波器的幅頻響應一致性較好。而當頻率增大時,幅頻響應的變化增大,有正的偏差和負的偏差,并且階數越大,高頻位置的幅頻響應偏差越大。因此,拉格朗日插值濾波器在低頻位置的誤差較小,高頻位置誤差較大,高階會增大高頻誤差。

圖2 不同階數的拉格朗日插值濾波器系統幅頻響應分布Fig.2 System amplitude response distribution of Lagrange interpolation filter for different filter orders
在采樣率是22.05 kHz和44.1 kHz條件下延遲一個d/c的拉格朗日插值濾波器在不同階數情形下的系統相頻響應曲線如圖3所示。
圖3對比了不同階數的拉格朗日插值濾波器系統相頻響應曲線,其中圖3a和圖3c分別是直接通過反正切計算拉格朗日插值濾波器在采樣率是22.05 kHz和44.1 kHz條件下延遲一個d/c的相位曲線結果。從圖3a和圖3c可以看到,部分階數條件下高頻位置會出現曲線的跳變,這是由于計算時反正切的相位范圍是-π~π,因此超過該范圍會出現跳變。進一步通過解卷繞得到對應的實際相位曲線圖3b 和圖3d。在圖3中,理想分數延遲濾波器的相位是線性變化的(黑色虛線),而拉格朗日插值濾波器的相位則是非線性的曲線。當歸一化頻率較小時(0~0.2fs頻段),相位線性度好,與理想分數延遲濾波器的相位非常接近,當歸一化頻率大于0.2fs時,相位失配增大。從高頻的相位曲線分布看,拉格朗日插值濾波器相位與理想分數延遲濾波器的相位的失配包括正的偏差和負的偏差,階數增大時失配更大。
本文采用拉格朗日插值的方式實現電子耳蝸延遲參數的實現,分析了拉格朗日插值的特征和分數延遲的參數,并從多參數情形下研究了拉格朗日插值對分數延遲失配的影響。拉格朗日插值多項式從表達式看是多項式的插值方法,其功能是通過相鄰的若干個點的值加權求和形成的預測值。拉格朗日插值具有低頻位置幅頻響應和相頻響應誤差最小化的特征,有助于應用于電子耳蝸的分數延遲實現。

圖3 不同階數的拉格朗日插值濾波器系統相頻響應曲線Fig.3 System phase response curves of Lagrange interpolation filter for different filter orders