朱興統
(廣東工業大學自動化學院,廣州510006)
滾動軸承作為旋轉機械設備中的一個重要組成部件之一,如果滾動軸承出現了故障,就會可能直接影響機械設備的性能,影響生產產品的質量,也可能會導致整臺機械設備停止運行。據有關統計,旋轉機械故障有大約30%是由于滾動軸承故障引起。有必要對滾動軸承振動信號進行監測,以便及時診斷出故障。因此對滾動軸承故障診斷的研究具有重要的現實意義。在故障診斷過程中,從滾動軸承振動信號中提取各種特征信息是故障診斷的關鍵環節,能否提取出有效特征信息直接影響故障診斷準確率。機械故障特征提取與故障識別已經成為研究熱點領域,有很多研究者提出了許多種故障特征提取與診斷的方法。何斌等人為了提高滾動軸承故障準確率,通過構造相應的小波基函數,采用最小二乘擬合法構造預測器和更新器,應用于對滾動軸承的振動信號進行分析,取得了較好的結果[1]。吳強等人提出結合連續小波變換和獨立分量分析的方法對單通道信號的滾動軸承故障進行早期故障[2]。Rajeswari等人提出了一種基于小波包變換和多分類支持向量機的滾動軸承狀態診斷方法[3]。針對滾動軸承的故障振動信號具有非平穩性的特點,Yang等人提出了一種基于經驗模態分解(EMD)能量熵的滾動軸承故障診斷方法。利用EMD提取不同頻段能量作為特征的神經網絡診斷方法能夠準確、有效地識別滾動軸承故障模式,具有較好的診斷效果[4]。杜振寧和向春枝提出了小波包分解和高階累積量對軸承振動信號進行特征提取,并通過主成分分析法對特征數據進行降維,利用神經網絡算法進行故障分類[5]。Li Meng采用主成分分析(PCA)和支持向量機(SVM)方法對滾動軸承故障模式進行識別。根據振動信號的特點,利用主成分分析(PCA)得到特征向量,利用SVM故障分類器對滾動軸承進行故障診斷。理論和實驗表明,該方法在故障模式識別中是可行的[6]。為了提高滾動軸承故障診斷的準確率,本文提出結合經驗模態分解、樣本熵、核主成分分析和樸素貝葉斯算法的故障診斷方法。
經驗模式分解是一種信號處理的時頻分析方法,在非線性、非穩態的信號處理方面具有顯著的優勢。該方法對信號進行自適應分解是依據該信號數據序列的時間尺度特征來進行的。EMD實際上就是將一個復雜的信號分解為若干個本征模態函數IMF(Intrinsic Mode Function)分量和一個殘余分量。IMF需滿足兩個條件:①函數在時域范圍內,局部極值點和過零點的數量必須相等,或者最多相差一個;②在任意時刻點上,局部最大值的包絡和最小值的包絡的平均值必須等于零。經驗模式分解步驟如下:
(1)找出原始信號x(t)中所有的局部極大值和極小值,采用三次樣條插值函數分別對局部極大點和局部極小點進行擬合得到上包絡線和下包絡線。
(2)計算上包絡線 bmax(t)和下包絡線 bmin(t)的平均值 m(t),將原始信號 x(t)減去 m(t)得到新的信號h(t),即:h(t)=x(t)-m(t)。
(3)判斷新的信號h(t)是否滿足IMF條件。如果滿足條件,則h(t)為第一個IMF分量;如果不滿足條件,將 h(t)作為原始信號,重復步驟(1-3),直到得出第一個IMF分量,記為c1(t)。
(4)將原始信號 x(t)減去第一個 IMF 分量 c1(t),得到新信號r1(t),即:

(5)將 r1(t)作為原始信號,重復步驟(1)到(4),如果rn(t)為單調函數,則終止上述步驟。最終將原始信號x(t)分解得到n個IMF分量和一個殘余量rn(t),即:

樣本熵是RICHMAN等提出的一種時間序列復雜性的度量方法[7]。樣本熵是近似熵的改進算法,但其精度比近似熵更高。設時間序列X有N個數據點,樣本熵的計算步驟如下:
(1)依據原始時間序列構造出m維向量,得到N-m+1個m維向量:

(2)Xm(i)與Xm(j)分別是上一步驟構造的m維向量,Xm(i)與Xm(j)之間的距離d[Xm(i),Xm(j)]定義為兩者對應元素差值的絕對值的最大值,即:

(3)假設相似容限為r,對于給定Xm(i),計算Xm(i)與其余向量 Xm(j)(j=1,2,…,N-m;j≠ i)的距離d[Xm(i),Xm(j)],統計滿足條件d[Xm(i),Xm(j)]≤r數量,設為Ai,并求出Ai與N-m的比值,記作,即:


(6)理論上,原始序列的樣本熵定義為:

當N為有限數時,上式表示成:

主成分分析(Principal Component Analysis,PCA)是一種統計分析方法,可以用于減少數據集的維數的一種方法,被廣泛應用于信號處理、模式識別、故障診斷等領域。主成分分析不能處理非線性數據,而故障診斷應用中所收集到的振動信號數據大部分都是非線性的。Scholkopf等人在主成分分析方法引入核函數,提出了核主成分分析方法[8]。核主成分分析實際上就是先通過非線性映射函數將輸入數據空間映射到高維特征空間,然后進行主成分分析。
對于輸入空間中的m個n維數據樣本xi∈Rn,對其進行非線性映射Φ:Rn→F得到高維的特征空間。假設高維的特征空間的樣本滿足中心化條件:,則高維的特征空間的樣本協方差矩陣為:

為了求解協方差矩陣的特征值與特征向量,假設特征值λ≥0,特征向量V∈F{0},滿足:

由式(10)中兩邊分別左乘Φ(xk),有:

特征向量V可以由Φ(xi)線性組合表示為:

式中,Φ(x)=(Φ(x1),…,Φ(xm)),ai為相關系數,α=[α1,…,αm]T。
把式(12)代入式(11),可得:

定義一個m*m的矩陣K:

式(13)可寫成:

式中K為對角矩陣。
式(15)兩邊同時去除K,有:

求解核矩陣K,將特征值從大到小排列,取排列在前面的 p個特征值為:λ1,λ2,…,λp,對應的特征向量為:a1,a2,…,ap,并歸一化特征向量,有:

對于給定一個測試點x∈Rn在V上的映射為:

假設數據集有n個特征屬性,類別標簽集合為{c1,…ck}。某個待分類樣本X={X1,X2,…,Xn}。根據貝葉斯定理:

P(ci)是先驗概率,可以根據訓練集計算出來。
由于樸素貝葉斯假定樣本的各個特征屬性對樣本分類結果的影響是相互獨立的,所以條件概率為:

將式(20)代入式(19)得:

由于對所有的類別P(X)都相同,所以公式(21)只需考慮分子部分。
樸素貝葉斯分類器可表示為:

對P(Xj|ci)的求解,有三種常見的模型:多項式模型、高斯模型、伯努利模型。本文采用高斯模型求解,高斯模型公式為:

基于經驗模態分解樣本熵和樸素貝葉斯的故障診斷流程如圖1所示,具體流程步驟描述如下:
(1)采集軸承振動信號數據。
(2)采用經驗模態分解對振動信號進行分解,并計算各模態分量。
(3)計算各模態分量的樣本熵,構建特征向量,分為訓練樣本集和測試樣本集。
(4)樸素貝葉斯分類。用訓練樣本集對樸素貝葉斯分類器進行訓練,測試樣本集輸入素貝葉斯分類器進行診斷。
(5)輸出診斷結果。

圖1 故障診斷流程
本實驗采用美國凱斯西儲大學軸承數據中心的軸承故障數據集。該軸承故障試驗臺如圖2所示,該試驗臺主要的組成部件有:一個1.5KW的電動機、一個扭矩傳感器/譯碼器、一個功率測試計、電子控制器等。驅動端的軸承為SKF6205,驅動端的軸承座上方安裝有一個加速度傳感器,通過這個加速度傳感器來采集軸承的振動加速度信號,采樣頻率為12kHz。以2048個數據點為一組樣本,分別選取內圈故障、外圈故障、滾動體故障、正常狀態的軸承振動信號各50組,總共200組。

圖2 美國凱斯西儲大學軸承數據中心的軸承故障試驗臺
本實驗從每類樣本中隨機選取40組的樣本作為訓練集,10組樣本為測試樣本集。圖3為內圈故障、外圈故障、滾動體故障、正常狀態各一組軸承振動信號樣本的時域波形。
滾動軸承振動信號通過EMD進行分解,取前7個IMF分量計算樣本熵,構成7維的特征向量,部分樣本熵數據如表1所示。然后,利用KPCA對7維的特征向量進行降維,得到2維的特征向量,作為樸素貝葉斯分類器的輸入向量。最后將2維的特征訓練集對樸素貝葉斯模型進行訓練,將2維的特征測試集輸入到訓練后樸素貝葉斯模型得到故障診斷結果。為了驗證本文方法的有效性,將本文方法與小波包+能量+樸素貝葉斯、EMD+樣本熵+樸素貝葉斯方法對比,三種方法的故障準確率如表2所示,本文方法的故障準確率為95%,分別高于另外兩種方法7.5%和2.5%。
本文提出的基于經驗模態分解、核主成分分析和樸素貝葉斯算法的故障診斷方法。利用經驗模態分解對滾動軸承存在復雜、非線性、非平穩的振動信號有明顯的優勢。利用核主成分分析將非線性的樣本信息映射到高維的空間,再利用高維空間進行線性降維,消除一些不重要的屬性,可以提高故障診斷效率。樸素貝葉斯模型具有算法較簡單,且有穩定的分類效率。融合經驗模態分解、核主成分分析和樸素貝葉斯算法的優點,能夠有效解決滾動軸承故障診斷問題。

圖3 原始軸承振動信號的時域波形

表1 滾動軸承各狀態下的EMD樣本熵

表2 三種方法的準確率對比