張超,何闖進,何玉靈
(華北電力大學 機械工程系,河北 保定 071003)
滾動軸承是旋轉機械中容易損壞的部件之一,在機械運轉過程中,過載、疲勞、磨損、腐蝕等現象都有可能導致軸承損傷。軸承損傷部位經過載荷區時會產生一定的沖擊,激勵固有頻率振動并表現出高頻、調幅的特性,而調幅信號中的低頻特征與軸承故障類型有關。因此,提取故障信號的低頻特征是滾動軸承故障診斷的關鍵。
由于軸承運行工況復雜,實際采集到的軸承振動信號往往具有明顯的非線性、非平穩性特征,且包含較強的背景噪聲,傳統的傅里葉方法無法實現理想的分析效果。經驗模態分解(EMD)可將非平穩多模態信號自適應分解為不同頻段的本征模態函數(IMF),然后結合希爾伯特變換得到各階IMF的幅值與頻率信息[1]。在EMD基礎上結合高斯白噪聲頻率均勻分布的特性,提出的集合經驗模態分解(EEMD)方法可以解決EMD的模態混疊問題,從而更好地實現信號的分類識別[2-4]。EMD及其改進算法帶來了超越傅里葉分解的新思路,對信號的自適應分解準確度高[5-6],但仍存在端點效應、分解誤差較大等問題。
文獻[7]采用固定低通濾波函數替代EMD方法中的包絡均值曲線,從而提出了迭代濾波(Iterative Filtering,IF)算法,但該方法的濾波函數需提前設定且在逐次迭代運算過程中保持不變,無法像EMD一樣有針對性地實現信號的自適應分解,因而限制了其實際應用。在此基礎上,文獻[8]選用Fokker-Planck方程的基礎解系作為濾波函數,進一步提出了自適應局部迭代濾波(Adaptive Local Interative Filtering,ALIF)方法。該方法能夠根據待分解信號計算得到相應濾波函數,從而在有限的迭代過程中篩選出各階IMF,實現信號的自適應分解,并能夠有效克服模態混疊和端點效應,實現信號更加精準的分解。
為實現滾動軸承不同類型故障的識別,需進一步對提取的故障特征信息進行分類。傳統的模糊C均值(Fuzzy C-Means,FCM)算法是一種應用比較成熟的聚類方法,基于核方法改進的模糊均值(Kernelized Fuzzy C-Means,KFCM)方法通過非線性映射將待分類樣本映射至高維空間,突出了樣本點間的特征差異[9],然后再用FCM算法對高維特征空間進行聚類,從而達到更好的數據分類效果。基于以上論述,提出了一種基于ALIF和KFCM聚類的滾動軸承故障診斷方法,并通過對比分析定性、定量地驗證該方法識別滾動軸承不同類型故障的準確性和有效性。
ALIF方法采用Fokker-Planck方程的基礎解系作為濾波函數,該濾波函數能夠隨著濾波區間的變化計算得到相應表達式,從而在迭代運算過程中精確提取單一的IMF分量,實現非平穩信號的自適應分解。ALIF算法的迭代篩選過程包含內循環、外循環2個過程。
內循環過程的目的是迭代篩選出各階IMF分量。滑動算子Г(z(t))可表示為
(1)
(2)
式中:ω(t)為濾波函數;l(z)為濾波區間;m為極值點個數,N為信號長度。
假設h(x)和g(x)均為光滑可導函數,且在區間[a,b]上滿足:
1)g(a)=g(b)=0,且對于任意x∈(a,b),g(x)>0;
2)h(a)<0 則Fokker-Planck微分方程的一般形式為 (3) 式中:δ,μ的取值范圍為(0,1)。 (4) 此時,方程存在的解p(x)即為所求的濾波函數ω(t),且滿足: 1)對于任意x∈(a,b),p(x)≥0; 2)對于任意x?(a,b),p(x)=0。 原信號z(t)與滑動算子Г(z(t))相減可得到波動算子κ(z(t)),即 κ(z(t))=z(t)-Γ(z(t))。 (5) 在實際情況下,迭代過程不能一直進行下去,通常需設置迭代停止條件,令 (6) 式中:κi為第i個波動算子。當Ei小于指定閾值時,內循環迭代篩選停止,κ(z(t))即為提取到的IMF分量。 外循環的目的是終止內循環的IMF分量的提取過程。當從原信號z(t)中去除所有IMF分量后得到的余量r(t)呈現明顯平均趨勢特征時,外循環停止。 ALIF分解流程如圖1所示。 圖1 ALIF分解流程圖 近似熵是一種用非負數衡量時間序列復雜度的方法[10]。文獻[11]通過對比單一正弦信號加入白噪聲前后的不同發現,單一正弦信號波形規律性好,近似熵值小;而加入白噪聲后的信號波形畸變大,近似熵值也大大增加:說明時間序列越復雜,近似熵就越大,時間序列越不具有規則性。 設原始時間序列有x(1),x(2),…,x(n)共N個數據點。預先給定維數m和相似容限r,計算過程如下: 1)按順序將時間序列{x(i)}分成一系列m維矢量,即 X(i)=[x(i),x(i+1),…,x(i+m-1)]。 (7) 2)定義矢量X(i)與X(j)之間的距離為矢量中任意2個元素的最大差值,即 d[X(i),X(j)]=max{|x(i+k)-x(j+k)|};k=0,…,m-1。 (8) 3)給定相似容限r的閾值,統計d[X(i),X(j)] (9) (10) 5)取維數m+1,重復上述步驟1~4,得 (11) (12) 6)近似熵的估計值為 EApEn(m,r,N)=Φm(r)-Φm+1(r)。 (13) 當m=2,r=(0.1~0.25)σ(σ為數據序列{x(i)}的標準差)時,近似熵值對數據長度N的依賴性較小,具有較為合理的統計特性[10],即 EApEn(2,r,N)≈EApEn(2,r)。 (14) 實際計算中,通常取r=(0.1~0.25)σ,m=2,本文取r=0.25σ,m=2。 基于核的模糊C均值聚類是通過核空間非線性映射將待分類樣本映射至高維空間,突出樣本的特征差異后再進行聚類的方法[12]。 非線性映射Ф定義為 Φ:xk→Φ(xk)∈F, (15) 式中:xk為原始特征空間樣本,xk∈X。 KFCM算法的聚類目標函數為 (16) (17) 式中:c為類別數;n為樣本數量;μik為隸屬度;m為模糊加權指數;vi為聚類中心。 定義核函數K(x,y)=ФT(x)Ф(y),即 (18) 則核空間的歐式距離為 ‖Φ(xk)-Φ(vi)‖2=K(xk,xk)+K(vi,vi)-2K(xk,vi), (19) 式中:σk為高斯核參數。 根據(17)式所示約束條件,結合(18)和(19)式可求得隸屬度和聚類中心,分別為 (20) (21) 隸屬度在逐次迭代過程中更新,當目標函數的變化小于閾值或無變化時,迭代運算停止。 通常采用分類系數S和平均模糊熵E進行聚類效果評價,分別定義為 (22) (23) 具體的分類效果可以用分類系數和平均模糊熵表征。分類系數S是表示聚類結果模糊程度的標準。若S=1,聚類結果屬于硬劃分;若S<1,則屬于模糊劃分;因此S越接近1,說明樣本聚類效果越好。平均模糊熵E表示分類的不確定性,對于硬劃分有E=0,對于模糊劃分有E>0。因此E越接近0,樣本聚類效果就越好[13]。 為驗證ALIF和KFCM聚類對軸承故障的有效性與優越性,采用美國凱斯西儲大學電氣工程實驗室采集的滾動軸承數據進行分析,并與EMD,EEMD聚類分析結果進行對比。試驗軸承型號為6205-2RS,在轉速1 750 r/min、采樣頻率12 kHz條件下,分別對軸承處于正常、內圈故障、外圈故障以及鋼球故障狀態時的振動數據進行分析。 以軸承內圈故障信號為例進行說明,分別采用EMD,EEMD和ALIF方法進行分解并選取前6階IMF分量進行對比,結果如圖2所示,由圖可知:EMD與EEMD比較相似,IMF分量的頻率區間都比較接近,其中EMD中的第4,5階和EEMD中的第4階IMF分量存在比較明顯的模態混疊問題。而ALIF分解出的前6階IMF分量所占據頻率區間的細化程度較高,也沒有出現模態混疊問題。 圖2 內圈故障信號的分解結果 相關系數較大的IMF分量可以很好地保留信號的故障特征信息[14],前6階IMF分量與原信號的相關系數見表1,由表可知:前3階IMF分量與原信號的相關系數遠大于其他分量的相關系數值,可以認為原始信號的大部分故障特征信息包含在前3階IMF分量中,故選用前3階IMF分量表征原始信號。 表1 IMF分量與原信號的相關系數 采用近似熵提取IMF分量中的故障特征進行聚類。為證明近似熵能夠作為聚類分析的依據,分別求取軸承4種狀態樣本數據的ALIF近似熵值,結果見表2,由表可知:對于同種故障類型信號,ALIF分解所得各階IMF分量的近似熵值有明顯不同,說明各階IMF分量的復雜程度不同;總體而言,4種信號各階IMF分量的近似熵值組成的特征向量也存在較大差異,表明各個狀態類型信號的復雜度不同,存在硬分類的可能。 表2 前3階IMF分量的ALIF近似熵 在同一試驗條件下,對軸承4種運行狀態時的振動數據分別連續取20組(訓練和測試各10組)樣本數據,每個樣本的數據點數為3 072。分別采用EMD,EEMD和ALIF方法自適應分解20組樣本數據得到多階IMF分量,計算前3階IMF分量的近似熵值作為特征向量矩陣,從而得到3×40的故障樣本近似熵矩陣和待測樣本近似熵矩陣。先將故障樣本近似熵矩陣作為特征向量,對其作聚類運算得到4個聚類中心,然后將得到的聚類中心和待測樣本近似熵矩陣作為特征向量輸入到KFCM中,數據迭代運算直至誤差收斂小于容差時完成聚類,結果如圖3—圖5所示。對比分析圖3—圖5可知,不同方法所得結果的聚類中心位置和樣本點分布在聚類中心周圍的緊密程度均不相同: 圖3 不同狀態軸承振動數據EMD近似熵的KFCM聚類結果 圖4 不同狀態軸承振動數據EEMD近似熵的KFCM聚類結果 圖5 不同狀態軸承振動數據ALIF近似熵的KFCM聚類結果 1)基于EMD近似熵的聚類方法的分類效果較差,數據點散落分布在聚類中心周圍,且內圈故障與外圈故障數據混雜在一起,在二維平面和三維空間上都無法區分。 2)基于EEMD近似熵的聚類方法提取故障特征信息的效果要優于EMD聚類方法,能夠實現較好的軸承故障分類效果。圖中4類數據均散布在各自的聚類中心周圍,且數據點緊湊,類別區分清晰,但二維投影平面顯示出內圈故障與鋼球故障的類間間距較小。 3)對于基于ALIF近似熵的聚類方法,各類信號的聚類中心相隔較遠,類別區分非常清晰。4種不同類型的待識別樣本信號經ALIF分解聚類后,各類數據點均聚集在各自的聚類中心周圍,且分布緊湊。與EMD和EEMD相比,基于ALIF聚類方法的類中心間距更大,不同信號區分更明顯,說明該方法的分類效果更優,對滾動軸承各類故障信號具有很高的識別度和良好的分類效果。 對以上3種算法的聚類效果進行定量對比,分別計算各聚類結果的分類系數S和平均模糊熵E,結果見表3。由表3可知:基于EMD和KFCM聚類方法的分類系數為0.788,平均模糊熵為0.400,聚類效果最差;基于EEMD和KFCM聚類方法的分類系數為0.970,平均模糊熵為0.086,聚類效果相對EMD得到極大改善;基于ALIF和KFCM聚類方法的分類系數最接近1,平均模糊熵最接近0,說明該方法的聚類效果在3種方法中最優。 表3 不同信號分解算法的KFCM聚類指標 同樣,在同一試驗條件下,對軸承4種運行狀態時的振動數據分別連續取20組(訓練和測試各10組)樣本數據,每個樣本的數據點數為3 072。采用ALIF方法自適應分解20組樣本數據得到多階IMF分量并選取前3階IMF分量作為包含主要故障特征信息的特征向量計算近似熵值,得到3×40的故障樣本近似熵矩陣和待測樣本近似熵矩陣,分別進行FCM,KFCM聚類的結果如圖6所示。2種算法的分類系數S和平均模糊熵E見表4。 表4 ALIF處理后FCM及KFCM的聚類指標 圖6 不同狀態軸承振動信號經ALIF處理后的聚類效果 根據三維空間聚類結果及聚類指標可知:經FCM聚類后,軸承各信號聚類中心相隔較遠,各類別信號區分也較為明顯,可以實現軸承不同類型故障的劃分;但基于KFCM聚類的數據點距各自中心更近,分布更加緊湊,各類數據的中心間距更大,不同信號的區分更明顯,且分類系數更接近于1,平均模糊熵更接近于0,比FCM的聚類效果更好。 采用基于ALIF和近似熵的方法進行滾動軸承振動信號特征提取,通過KFCM實現對軸承內圈、外圈及鋼球故障的聚類識別劃分。對比分析表明,相對于EMD和EEMD,ALIF方法能夠更加準確地將多模態信號分解為單一IMF分量,便于后續提取信號故障特征;相對于FCM,KFCM的數據點聚類更加緊湊,不同類別信號區分更大;基于ALIF近似熵特征的KFCM聚類的分類系數最接近1,平均模糊熵最接近于0,能夠有效識別滾動軸承的故障特征并進行高精度分類。 本文算法為滾動軸承各類故障的診斷識別劃分提供了一種有效的分析工具,如何進一步提高算法效率,將其應用于工程實踐是以后需要進一步開展的工作。1.2 外循環過程

2 近似熵

3 KFCM聚類
3.1 KFCM原理

3.2 聚類效果分析
4 試驗驗證
4.1 不同類型故障分類







4.2 不同聚類方法分類


5 結束語