柏會寧,馬建倉,李軍杰,王彤,秦濤
(西北工業大學 電子信息學院,西安 710129)
人耳聽覺系統是一套高效智能的語音信號識別系統,其信號處理能力是現有人工信號處理系統無法比擬的,通過對人耳的生理結構以及信息處理機制的分析,在語音識別領域建立了多種數學模型,可以明顯提高語音識別精度。機械振動信號與語音信號從波形特性上來說具有較大的相似性,可以將人耳的聽覺特性及識別方法用于機械設備振動故障識別,實現振動信號的高速處理和準確識別。語音識別方法可以避免將傳感器直接安裝在振動部件上,而是通過采集機械振動產生的聲音信號進行故障診斷,取得了較好效果[1]。由于振動信號本身可能比其產生的聲音信號包含更多的故障信息,因此,結合機械部件的自身特性,對振動信號應用人耳語音識別方法進行故障診斷具有重要意義。
倒頻譜能夠分離邊帶和高次諧波,可以有效解決軸承故障中出現的調制現象[2~3]。目前,語音識別中應用較多的是將倒頻譜特性提取為Mel頻率倒譜系數(Mel Frequency Cepstrum Coefficient,MFCC)[4],從而利于運用模式識別方法識別不同狀態。在此,根據MFCC特征提取方法,結合軸承故障信號特征,利用Fisher比率法設計出一組彼此有重疊的三角濾波器模擬人耳的基底膜頻率分解特性,以求得軸承振動信號的倒譜系數,并將提取的特征利用支持向量機進行故障識別。
生理學證實,人耳聽覺系統主要由外耳、中耳和內耳構成。在整個聽覺系統的信息獲取中,耳蝸起到了核心作用。當中耳接收到外耳傳入的聲音時,帶動鼓膜、聽小骨的運動,引起耳蝸內流體壓強的變化,從而引起行波沿基底膜的傳播。不同頻率的聲音產生不同的行波,其峰值出現在基底膜的不同位置上。頻率較低時,基底膜振動的幅度峰值出現在基底膜的頂部附近;頻率較高時,基底膜振動的幅度峰值出現在基底膜的基部附近(靠近鐙骨)。
如果信號是一個多頻率信號,則產生的行波將沿著基底膜在不同的位置產生最大幅度。在每一聲音頻率上,隨著強度的增加,基底膜的運動幅度增大,并且帶動更寬的部分振動。進一步的研究還表明,基底膜位置對于頻率的反應并不是均勻分布的,而是低頻部分較為緊密,高頻部分比較稀疏,從這個意義上講,耳蝸就像頻譜分析儀,而基底膜可以看成是一組頻帶重疊的非均勻分布的帶通濾波器,這組帶通濾波器將整個頻帶劃分為若干個不等寬頻帶,稱為臨界頻帶。在此,采用一組非均勻分布的三角帶通濾波器模擬耳蝸的這種分頻能力,實現振動信號的頻率分解。
毛細胞是聽覺的另一感官細胞,是將基底膜振動信號轉變為神經信號的重要環節(一般稱為力-電轉換)[5],聲音信號使得基底膜上下波動時,由于毛細胞上的覆膜與基底膜具有不同的轉動軸,便會引起兩者間的剪切運動,從而引起毛細胞頂部纖毛的搖擺運動。對于不同的刺激強度,纖毛的敏感度是不一樣的,在強度較弱時,其離子通道打開的數目隨信號強度的增加而增加,但是當刺激強度達到一定程度時,離子通道打開的數目趨向恒定。也就是說,當信號超過一定閾值后,人耳對其反應趨于穩定,這種特性稱為非線性壓縮特性。有研究已證實這種特性增強了人耳的抗噪性能[6],并且有多種數學模型可以進行模擬,可利用該項特性增加計算貢獻率時的魯棒性。
MFCC提取是語音識別中應用較為普遍的特征參數獲取方法,其中濾波器中心頻率的設計依照Mel頻率尺度,這種尺度比較好地模擬了人對聲音的感知程度,在低頻端分辨率較高,高頻端分辨率較低,體現了人耳頻帶的非均勻分布特性,在聲音信號的識別方面有較好的效果,但直接用于機械振動信號識別時并非完全適合,因此需要尋找能在機械振動信號中應用的頻率尺度。
通過對故障信號進行頻域分析可知,不同故障的各頻帶能量有較大不同,故對故障振動信號在不同頻帶內的信息進行統計和分析,在此基礎上按一定規則調整濾波器組的中心頻率,設計符合振動故障識別的非均勻分布頻域濾波器組,以建立具有較高識別效果的系統。
由于不同故障信號在頻域上的分布有較大不同,可以統計對于故障信號識別有較大作用的頻帶并進行強化。首先將頻域劃分為m個均等的頻帶區間,每個頻帶由1個三角濾波器所覆蓋,這些三角濾波器的中心頻率線性等間隔的分布在頻率軸上,第m個三角形濾波器的上限、中心和下限頻率分別設為h(m),c(m)和l(m),相鄰三角形濾波器之間的下限、中心和上限頻率有如下關系成立:c(m)=h(m-n)=l(m+n),其中n為帶寬重合系數,用來調整各頻帶重疊程度,n越小則帶寬越小,在此取為1。
將各個濾波器頻率帶寬內所有信號能量譜平方的加權和作為該頻帶濾波器的輸出,即
(1)
式中:f為頻率;s(f)為信號的頻譜能量;wm(f)為加權系數。
Fisher比率法是一種特征選取方法,常用來表征一維特征在故障識別中的有效性[6],可用于衡量每個子帶對故障信息的貢獻程度,在第m個子帶中,得分定義為不同故障信號均值的方差與同一故障信號方差的均值之比,即
(3)
i=1,2,3,…,N;j=1,2,3,…,T。
(4)
(5)


(6)
式中:d為常數,根據經驗取為0.5。
通過(6)式獲取每個子帶的得分后,根據各個子帶對故障信息的貢獻不同,進行頻帶自適應調整。
(7)
(8)
式中:fs為采樣頻率。
重新設置之后,攜帶分類信息多的頻帶所分配的三角濾波器中心頻率分布較為緊密,而攜帶分類信息少的頻帶分配的濾波器中心頻率分布稀疏,接近于人耳聽覺特性。
通過以上步驟得到符合機械振動信號頻率尺度的三角濾波器中心頻率,并據此設計三角濾波器組,這組非均勻分布的三角濾波器稱為自適應頻率尺度濾波器。
仿MFCC的倒譜系數提取及識別步驟如圖1所示。

圖1 倒譜系數提取過程
(1)采集數據,將故障信號分成數據長度為N的數據段,每段為1幀。
(2)將每幀振動信號乘上hamming窗,以增加信號左端和右端的連續性。
(3)將加窗之后的振動信號進行Fourier變換,計算其頻域上的能量分布。
(4)將頻譜能量平方后乘以一組(20個)在頻帶上均勻分布的三角帶通濾波器,計算各個頻帶信息貢獻率。
(5)計算各頻帶信息貢獻得分,重新設計各個濾波器的中心頻率,構造仿人耳基底膜的自適應非均勻分布濾波器組。其中第m個頻帶的三角帶通濾波器頻率響應Bm(f)為
Bm(f)=
(9)
(6)將需識別的振動測試數據重新進行加窗和FFT運算,計算出頻譜能量,并使其通過由步驟(5)得到的三角帶通濾波器組。
(7)求取每個濾波器輸出的對數能量

(10)
(8)將濾波器輸出的能量進行離散余弦變換,計算倒頻譜系數,計算公式為
l=1,…,L。
(11)
式中:l為倒頻譜系數的維數。
(9)將步驟(8)求出的參數帶入支持向量機模型中,進行故障數據的訓練和識別。
為驗證上述特征提取方法,采用美國凱斯西儲大學軸承數據中心的軸承故障數據[9]進行試驗。試驗軸承型號為6205-2RS,內圈直徑為25 mm,外圈直徑為52 mm,鋼球直徑為7.94 mm,通過電火花技術在軸承的不同部位制造損傷點模擬各種故障模式。軸承數據由加速度傳感器采集,采樣頻率fs=12 000 Hz,采樣數據長度N=4 096,故障模式包括內圈故障、外圈故障和鋼球故障。各故障模式下的振動波形如圖2所示,僅通過波形很難識別出不同的故障信號。

圖2 不同故障模式下軸承振動信號的波形
不同模式下的20維倒譜系數如圖3所示。由圖可知,不同模式對應的倒譜系數均不同,可以根據此系數進行分類識別。

圖3 不同模式下的倒譜系數
濾波器個數的選擇直接影響整個系統的識別準確率和計算效率,不同濾波器個數下的識別率如圖4所示。當濾波器個數大于20時,識別率不再顯著提高,但隨著濾波器個數的增加,數據計算量增加,因此選取濾波器的個數為20。

圖4 不同濾波器個數下的識別率
濾波器個數確定后,各頻帶信息貢獻率如圖5所示。由圖可知,中低頻的信息對目標識別的貢獻較大,而高頻部分較小。

圖5 各頻帶貢獻率
Mel尺度分布及自適應頻率尺度的中心頻率分布如圖6所示,兩者大體趨勢基本相同。其中,Mel尺度在1 000 Hz以下時大致呈線性分布,帶寬約100 Hz,在1 000 Hz以上時則呈對數增長;而自適應頻率尺度濾波器的中心頻率隨不同頻帶對故障信息的貢獻率而自適應調整,呈現非單調性和不均勻分布狀態。自適應頻率尺度的優勢在于能夠根據頻帶對故障信息的貢獻指導濾波器的設計,起到增強貢獻大的頻帶,弱化貢獻小的頻帶的作用,從而保證故障信息的提取,提高故障識別率。

圖6 自適應中心頻率與Mel尺度對比
根據各三角濾波器的中心頻率,設計仿人耳分頻特性的三角濾波器組如圖7所示,其中不同的濾波器組對應不同的頻帶,并且帶寬也不同,有效模仿了人耳基底膜特性。

圖7 仿人耳基底膜非均勻頻帶濾波組
自適應非均勻濾波器組設計完成后,將試驗數據按照不同的故障提取倒譜系數特征進行訓練和識別,其中每4 096個點為1組數據,其中訓練集共2 680組數據,測試集共1 220組數據。為驗證濾波器組的抗噪性能,通過添加高斯白噪聲模擬各信噪比下的軸承故障信號,仿真其在不同信噪比環境下的識別率,并與Mel倒譜方法和未加非線性壓縮的自適應頻率分布方法進行了比較,結果見表1。由表可知,通過非線性壓縮自適應調整之后,識別效果優于其他2種方法,并且在信噪比較低的情況下也能較好識別故障。

表1 不同中心頻率分布的濾波器組在不同信噪比下的識別率 %
在8 dB環境下,非線性壓縮的自適應頻率分布方法對于測試集中不同故障類型的識別結果見表2。由表可知,對于不同故障類型,非線性壓縮的自適應頻率分布方法均表現出了較高的識別率和較好的識別效果,也證實了人耳基底膜頻帶非線性分布和信息非線性壓縮對于提高系統穩定性的作用。

表2 對不同故障類型的識別率
通過Fisher比率法設計了自適應非均勻三角濾波器組,通過模擬人耳聽覺模型提取軸承振動信號倒譜系數,并使用支持向量機分類器完成軸承故障分類識別,對于不同故障類型均表現出了較好的識別效果,達到了預期目的,為機械振動的故障特征提取提供了新借鑒。
另外,人耳聽覺還有側抑制、半波檢波、自適應、自學習等特性,這些特性在機械振動診斷識別等領域中的應用將是以后高效檢測與識別方法發展的重要研究方向。