夏云飛,程子敬,李稚
(北京衛星信息工程研究所,北京 100194)
車輛行駛時產生的聲音是一種包含多種聲音成分的混合聲音,在車型分類中首先需要做的就是特征提取,特征提取過程中如何對聲信號進行有效去噪以及如何提取有效特征是兩大難點。文獻[1-15]大多針對如何利用特征提高識別率,并未過多考慮從源頭上進行噪聲處理以獲得有效特征,而且文獻中提出的方法所獲取的特征相對比較復雜,計算量也比較大。
文中利用小波軟閾值去噪方法和經驗模態分解組合實現了燃油車和電動車的頻譜分析技術,從頻譜的角度直觀地區分燃油車和電動車,為車型分類識別提供了一種簡單實用的方法。
Donoho 在小波變換的基礎上提出了小波閾值去噪方法,一般包括3 個步驟:小波分解、閾值處理和小波重構。首先,通過小波分解信號。然后,通過閾值量化處理每一層的高頻系數。最后,對處理后的小波系數進行小波重構,以獲得降噪信號。在這3個步驟中,閾值處理對去噪結果有很大影響,并且閾值函數起關鍵作用。閾值函數主要包括硬閾值函數和軟閾值函數[16]。這兩種方法的閾值函數表達式如下:
硬閾值函數:

軟閾值函數:

其中,wi,k為小波系數;λ為閾值;w′j,k為處理后的小波系數。
1998 年,Norden E.Huang 等人提出了一種信號處理方法,即經驗模態分解(Empirical Mode Decomposition,EMD)方法,楊建華等[17]人采用過該方法,該方法可以使信號平穩化并且自適應地將信號分解為不同尺度的波動或變化趨勢,形成一系列具有不同尺度特征的數據序列,每個序列稱為本征模式函數(Intrinsic Mode Function,IMF),這些反映原始信號的分量可以直接從中提取。IMF 需要滿足兩個條件:1)極值點和零點的數量必須相等或最多相差一個;2)對于任意一點,由局部最大值定義的包絡平均值和由局部最小值定義的包絡平均值為零。
IMF 函數的計算過程如下[18]:
對于一個信號m(t),首先確定出m(t)上的極大極小值點,用三次樣條曲線分別連接極大值點和極小值點形成上下包絡線,m(t)與上下包絡線的均值e(t)的差值記為r(t)=m(t)-e(t),根據IMF的兩個條件判斷r(t),如果m(t)滿足IMF的形成條件,則記為IMF1;否則,繼續重復上述判定步驟,將剩余項q(t)=m(t)-IMF1 用作新的輸入信號,重復上述步驟,直到得到全部的本征模態函數。經過多次分解之后得到的原信號的EMD 分解結果為:

其中,IMFi為第i個IMF 函數,rN為經過N次分解后的剩余項。
該實驗采用的數據是SoundCloud 網站上下載的14 個電動車音頻和18 個燃油車音頻,每段音頻長度為5 s,采樣頻率為48 kHz。
車輛聲信號只通過小波軟閾值算法去噪得到的結果如圖1、圖2 所示,從中可以看出,經過小波軟閾值去噪前、后幅度譜變化不明顯,不能達到理想的去噪效果,還需要進一步細化研究。

圖1 燃油車去噪前后的幅度譜

圖2 電動車去噪前后的幅度譜
車輛聲信號先通過小波軟閾值再通過EMD 分解之后得到的固有模態分量及其對應頻譜如圖3~6所示,從中可以看出,在高階分量即IMF1、IMF2、IMF3的去噪前頻譜成分中含有的噪聲成分比較復雜,難以分離出來,IMF1、IMF2、IMF3 去噪后其含有的頻譜成分基本上可以清楚地分離出來,由此看出,去噪后的效果非常明顯。另外,燃油車聲信號去噪后的高階分量IMF1、IMF2、IMF3的頻譜雖然還有一些噪聲分量,但是基本上可以得出其頻譜成分;相比燃油車聲信號去噪后的結果,純電動車聲信號去噪后的高階分量IMF1、IMF2、IMF3的頻譜非常清楚,可以直接得出其頻譜成分。

圖3 燃油車去噪前固有模態分量及其對應頻譜

圖4 燃油車去噪后固有模態分量及其對應頻譜

圖5 電動車去噪前固有模態分量及其對應頻譜

圖6 電動車去噪后固有模態分量及其對應頻譜
采用小波軟閾值和經驗模態分解對燃油車和電動車聲信號去噪之后獲得的固有模態分量進行頻譜成分分析。表1、表2 分別為電動車和燃油車的各階頻率成分統計結果。

表1 電動車聲信號頻譜成分

表2 燃油車聲信號頻譜成分
對統計結果進行分類如下:
1)100 Hz 以內的頻率成分
電動車聲頻譜的成分(單位:Hz):4.8,9.6,14.4,19.2,24,28.8,33.6,38.4,43.2,48,52.8,57.6,67.2,76.8,91.2;72,86.4,96。
燃油車聲頻譜的成分(單位:Hz):4.8,9.6,14.4,19.2,24,28.8,33.6,43.2,48,52.8,57.6,67.2,76.8,91.2,62.4,81.6。
2)100~300 Hz 以內的頻率成分
電動車聲頻譜的成分(單位:Hz):105.6,115.2,124.8,153.6,158.4,177.6,187.2,206.4,216,220.8,225.6,268.8;148.8,249.6。
燃油車聲頻譜的成分(單位:Hz):105.6,115.2,124.8,153.6,158.4,177.6,187.2,206.4,216,220.8,225.6,268.8;110.4,120,129.6,134.4,144,182.4,192,196.8,211.2,235.2,254.4,283.2,292.8。
3)300~1 000 Hz的頻率成分
電動車聲頻譜的成分(單位:Hz):451.2,528.1,561.7,580.9,614.5,624.1;312,384,494.4,537.7,542.5,566.5,600.1,643.3,657.7,662.5,691.3,772.9。
燃油車聲頻譜的成分(單位:Hz):451.2,528.1,561.7,580.9,614.5,624.1;307.2,316.8,336,340.8,345.6,388.8,398.4,441.6,489.6,499.2,513.7,571.3,576.1,585.7,595.3,633.7,652.9,667.3,681.7,696.1,753.7,758.5,768.1,835.3,859.3,969.7,984.1。
4)大于1 000 Hz的頻率成分
電動車聲頻譜的成分(單位:Hz):1 277,1 306;1 219,1 339,1 354,1 498,1 776,2 184,2 285。
燃油車聲頻譜的成分(單位:Hz):1 277,1 306;1 104,1 114,1 123,1 143,1 176,1 215,1 373,1 378,1 392,1 411,1 455,1 488,1 493,1 555,1 589,1 699,1 992,2 251,2 362。
分析上述統計結果可以得出:
1)燃油車和電動車聲信號在0~100 Hz 之內的頻率基本相同,除了極個別的頻率,如燃油車聲頻譜的62.4 Hz、81.6 Hz,電動車聲頻譜的72 Hz、86.4 Hz、96 Hz;
2)燃油車和電動車聲信號在100~300 Hz 之間的頻率成分關系屬于燃油車包含電動車的關系,此外,在這個頻率段,燃油車包含的頻率成分明顯比電動車要多,如110.4 Hz,120 Hz,129.6 Hz,134.4 Hz,144 Hz,182.4 Hz,192 Hz,196.8 Hz,211.2 Hz,235.2 Hz,254.4 Hz,283.2 Hz,292.8 Hz;
3)燃油車和電動車聲信號在300~1 000 Hz 和大于1 000 Hz的頻率成分都是燃油車更多,電動車的頻率成分相對比較分散,而燃油車在某一個頻率附近會出現較多附加頻率;
4)燃油車的頻率成分不僅數量多于電動車,而且最大頻率也高于電動車,這也就解釋了為什么電動車的噪聲比燃油車小很多。
通過小波軟閾值去噪和經驗模態分解相組合,可以比較明顯地濾除掉車輛聲信號頻譜中多余的噪聲頻譜成分,得到清晰的頻譜成分,從頻譜成分分析的角度,為燃油車和電動車的特征提取提供了一種簡單實用的方法。