王嘉浩,羅 倩,胡園園
(北京信息科技大學信息與通信工程學院,北京 100192)
隨著工業的進步,旋轉機械日益向集成化、大型化、高速化和智能化的方向發展[1]。在各種旋轉機械中,滾動軸承是常見也是易于損壞的零部件之一,具有易啟動、摩擦小、潤滑簡單和更換方便的優點,廣泛用于精密儀器、航空航天、汽車、機床、機器人等領域。據有關資料統計,旋轉機械的故障中振動故障占70%,而30%的振動故障是由滾動軸承故障引起的[2]。因此,滾動軸承的故障診斷理論和應用研究一直是旋轉機械故障診斷領域的一個重點。
由于機車滾動軸承發生故障時信號是非平穩的,其振動信號各頻帶的能量發生相應變化,利用各頻帶能量分布作為該狀態下軸承故障特征[3]。傳統的距離度量方法,多數針對空間中不同的樣本點,對不同分布間的相似度難以實現有效度量。傳統的分布相似度度量方法,在度量不同分布間的相似度時,受重疊程度的影響嚴重,難以實現有效的相似性度量。EMD在度量不同分布間的相似度時,具有不受分布位置影響的優勢[4]。針對EMD的這種特性,本文將EMD引入KNN算法中,提出了基于KNN-EMD算法的機車軸承故障診斷方法,提高診斷準確率。
小波包分解以小波變換為基礎,但比小波分解更加精細。小波包分解不僅針對信號的低頻部分進行分解,對信號的高頻部分也同樣進行分解[5]。這種分解方式解決了小波分解再高頻段內頻率分辨率差,在低頻段內時間分辨率差的缺陷。
在多分辨率過程中,將小波包分解視為對一個函數空間逐級進行正交分解的過程[6]。小波包分解公式為

(1)

小波包變換對信號的分解相對于小波變換來說更加的細致,基于小波包分析方法,通過對原始信號分解,可以得到原始信號在不同的頻帶內的能量分布?;谶@種方法,可以針對在原始信號中需要分析的頻率范圍,將原始信號在指定的尺度上進行分解,并得到其能量分布,進而達到提取特征的目的。將這種分析方法成為能量分析[7]。
基于小波包變換對信號進行能量分析主要依賴于小波包的分解原理及小波包分解頻帶能量檢測技術。信號經小波包分解后得到的信號在各頻帶上的能量折射出原始信號能量分布的整體特征,因此可以利用原始信號的能量特征對信號進行分類[8]。
信號經過j層小波包分解后,信號的總能量也被分解到了2j個互不重疊的頻率區間內,因此通過考察信號整體能量在各個頻段內分布比例的變化,便可以作為原始信號的特征信息[9]。
信號小波包分解后第j層上第k個頻帶Xjk(n)上的能量

(2)
歸一化后得到能量特征如下
p=[E1,E2,…E(2j-1)]/E總
(3)
其中

(4)
K近鄰法(K-nearest neighbor,KNN)是一種基本分類與回歸方法,其基本做法是:給定測試實例,基于某種距離度量找出訓練集中與其最靠近的K個實例點,然后基于這K個最近鄰的信息來進行預測。通常,在分類任務中使用“投票法”,即選擇這K個樣本中出現最多的類別標記作為預測結果。
KNN 算法是一種簡單高效的分類算法,該算法規則分為以下3個步驟:
1)計算數據集中的點與當前測試樣本中點之間的距離,并且按照距離遞增的順序進行排序;
2)選取與當前測試樣本點距離最小的K個點;
3)統計前K個點所在類別中所出現的頻率,并返回前K個點出現頻率最高的類別作為當前的預測分類結果,即多數表決的分類決策。
K=3與K=5時的KNN決策流程如圖1。

圖1 KNN決策流程
EMD是一種衡量2個分布相似性的度量。它的正式定義是一個線性規劃問題[10],給定兩個分布
P={(p1,ωp1),…(pm,ωpm)}
(5)
Q={(q1,ωq1),…(qn,ωqn)}
(6)

分布P和分布Q之間的EMD的規范化定義為

(7)
其中對fij有以下四個約束條件
fij≥0,i=1,2,…,M;j=1,2,…,N
(8)

(9)

(10)

(1)
EMD在直方圖中的體現如圖2。

圖2 EMD圖示
傳統KNN算法中,度量數據集中兩點之間的距離采用歐式距離。歐式距離在度量不同分布的差異時,難以做到準確有效。EMD在度量不同分布間的相似度時,具有不受分布位置影響的優勢[4]。同時,原始信號在經過小波包分解后產生的能量分布與直方圖具有相同的特征,因此本文將EMD引入到KNN算法中,代替歐式距離對能量分布進行度量。
在不同的K值下,計算測試數據與周圍K個最近鄰點的EMD,最后根據多數表決的分類決策規則將測試數據分類。
KNN-EMD算法步驟可總結如下:
1)設X=(x1,x2,…xm)為小波包能量法提取的滾動軸承振動信號能量特征的集合;
2)將X劃分為訓練集Xtrain與測試Xtest;
3)對不同參數K值進行訓練,K的取值一般位于區間[1,10];
4)計算訓練集與測試集之間的EMD;
5)為測試集樣本選取K個與之距離最小的樣本;
6)使用多數表決分類決策規則得到測試集樣本分類結果。
在本次仿真中,利用美國凱斯西儲大學所給出的軸承故障數據進行實驗。待檢測的軸承支撐著電動機的轉軸,驅動端軸承型號為SKF6205,風扇端軸承型號為SKF6203.
在數據測量中,機器風扇端和驅動端的軸承座上方各放置一個加速度傳感器。振動加速度信號由16通道數據記錄儀采集得到,采樣頻率為12kHz,所測試損傷直徑為0.1778mm。
仿真數據包含滾動軸承的4種運行狀態,分別是正常狀態、內圈故障狀態、滾動體故障狀態、外圈故障狀態。仿真采集的滾動軸承各狀態下時域振動信號波形如圖3。

圖3 軸承各個狀態下時域振動信號圖
通過觀察圖3,滾動軸承的時域振動波形區分度較低,很難將軸承各狀態區分開,為了更為直觀的區分度,對滾動軸承實現有效的故障診斷,對4種運行狀態下的滾動軸承振動信號進行小波包能量分布提取,結果如圖4-圖7。

圖4 內圈故障信號能量譜

圖5 滾動體故障信號能量譜

圖6 外圈故障信號能量譜

圖7 正常信號能量譜
通過圖4,圖5,圖6,圖7可以比較直觀的觀察到滾動軸承處于不同狀態時,其振動信號各子頻帶的能量分布具備較大的區分度。正常狀態下,軸承能量主要集中分布在前4個子頻帶,與故障狀態下能量分布有明顯差異。三種故障狀態下能量分布均集中分布在第3子頻帶與第7子頻帶,但三者仍具備分布上的差異。滾動體故障信號能量譜與外圈故障信號能量譜相比,前者能量譜子頻帶3能量所占比重小于子頻帶7,而后者與之相反。相比這兩種故障能量譜能量分布,內圈故障信號能量譜分布相對分散。
對上述軸承4種狀態下共4*81(324)組數據進行劃分,對其數據集隨機提取20%的數據作為測試集,其余數據作為訓練集。
在小波基的選取上,daubechies和haar小波常用于對數字信號進行處理。在實際工程應用中,所選的的小波基支集長度多為5-10。haar小波支集長度較小,僅為1,對于現在大部分的工程應用都不合適,而在db系列小波中,僅db3小波滿足工程應用對支集長度的要求,故本文選用‘db3’小波作為小波基。
本文中,將所提取到第三層各結點能量值組成一維能量分布,因此,在計算不同分布間EMD時,可將其權重設置為1。
在不同K值下進行訓練測試,并將測試結果與傳統KNN比較。
利用傳統KNN算法對測試集進行分類時,得到分類見表1。

表1 KNN準確率
對不同K值時,分類準確率曲線如圖8。

圖8 不同K值KNN準確率曲線
從表1可以看出,對測試集使用KNN分類時,對不同的K值可以獲得不同的分類效果。從圖8中看出,傳統KNN算法的分類精度在K=1時可以達到最佳分類效果,其分類準確率為98.46%。
利用KNN-EMD算法對測試集進行分類時,得到不同K值下分類準確率見表2。

表2 KNN-EMD準確率
對不同K值時,分類準確率曲線如圖9。

圖9 不同K值KNN-EMD準確率曲線
圖9反映出KNN-EMD算法與KNN算法相同,在K=1時達到最佳分類效果。由表2可以看出,本文提出的KNN-EMD算法分類準確率相較于K=1時的KNN算法提高了接近百分之一,診斷準確率達到99.23%,能夠有效軸承故障部位對軸承故障部位進行分類定位,達到工業生產要求,可以在工業生產中實際應用。
理論上EMD度量特征分布之間的距離,因而在處理經過小波包分解提取的軸承振動信號的能量分布時具有它本身優異的特性。EMD在對多個分布間距離進行度量時,具有不受分布位置影響的優勢,因此可以對提取到的能量特征進行有效度量,并結合KNN算法分類決策規則實現有效分類。
本文通多對小波包分解,能量分布提取以及KNN-EMD的綜合使用,提出了一種機車軸承故障診斷方法。針對故障信號時域特征不明顯這一問題,
利用小波包對故障信號能量特征進行提取進而得到差異較大的特征量。針對傳統KNN算法中,歐式距離在度量不同分布相似度的局限性以及EMD在度量不同分布間的相似度的優勢,將EMD引入到KNN算法中,代替歐式距離對能量分布進行度量。相較于傳統KNN算法,在診斷準確率上得到有效提高。但由于EMD的計算需要涉及到線性規劃問題,因此造成了計算量的增加,這一缺陷會增加故障診斷的時間,本文下一步的研究重點將是通過對線性規劃的分析解決EMD計算復雜度的問題。