周建民, 王發令, 張臣臣, 張 龍, 尹文豪, 李 鵬
(華東交通大學 載運工具與裝備教育部重點實驗室,南昌 330013)
軸承是機械結構中的關鍵部件,狀態監測和故障診斷是保證機械設備正常運行的關鍵。軸承故障診斷過程主要包括故障特征提取和故障分類[1]。當軸承發生故障時,振動信號的頻帶能量會發生變化。如果能夠提取出軸承的頻帶信號特征,就可以進行軸承故障分類。因此,有效地提取故障特征是故障診斷的關鍵。
滾動軸承故障研究主要以振動信號的研究為主,振動信息具有非線性和非平穩特點[2],尤其是運行中萌生的早期故障,特征信息微弱,同時受到機械設備產生的強噪聲干擾,給故障診斷帶來困難[3]。
Gai等[4]利用經驗模態分解(empirical mode decomposition,EMD)對已知狀態下的軸承振動進行分解,再通過奇異值分解(singular value decomposition,SVD)獲得固有模態函數(intrinsic mode function,IMF)分量的奇異值作為特征向量,提出了基于EMD-SVD和模糊神經網絡的軸承退化評估方法,有效地分析軸承的性能退化情況。Malik等[5]結合EMD和人工神經網絡(artificial neural network,ANN)建立軸承故障診斷模型,比較EMD特征輸入到不同ANN分類器的效果,最后得出了不同ANN模型在軸承故障診斷中的性能特點。但EMD分解過程中存在過包絡、欠包絡、模態混淆、端點效應等問題[6]。
為了解決EMD的問題,Wu等[7]引入噪聲輔助分析,提出集成經驗模態分解(ensemble empirical mode decomposition,EEMD),有效地抑制了模態混疊等問題。EEMD作為一種新型自適應、近似正交的分解方法,同時適用于非線性、非平穩信號的分析。Chen等[8]利用EEMD將信號分解為固有模態函數(intrinsic mode functions,IMFs),然后利用希爾伯特平方解調(hilbert square demodulation,HSD)對選定的IMFs進行解調,用于風力機齒輪箱故障診斷。陳法法等[9]將EEMD和信息熵結合,用EEMD能量熵來提取軸承故障特征,有效獲得軸承振動信號的特征分布類型。鑒于EEMD在信號分析中優越性和早期弱信號的檢測能力,本文將其與信息熵結合,通過EEMD分解軸承振動信號獲得IMF,計算IMF的能量熵比作為特征,充分刻畫軸承振動信號的細節信息。
基于人工智能(artificial intelligent,AI)的早期故障診斷作為一種新興的工業應用和故障識別的有效解決方案,越來越受到學術界和工業界的重視。其通過機器學習技術,可以有效地克服對研究人員專業知識要求較高的局限性。在基于AI的早期故障診斷方案中,最常用的模型有隱馬爾可夫(hidden markov model,HMM)、支持向量數據描述(support vector data description,SVDD)、支持向量機(support vector machine,SVM)、高斯混合模型(gauss mixture model,GMM)和ANN。
Wang等[10]利用SVM做分類器,通過EMD-SVD求解軸承振動信號特征,輸入到SVM模型中獲得故障分類結果。Zhang等[11]利用特征空間中簇間距離優化SVM,對電機軸承進行故障類型分類,得到良好的分類效果。陳龍等[12]提出基于單層稀疏自編碼器學習和SVM的軸承性能退化評估方法,成功得到性能退化趨勢。上述對軸承進行故障診斷或性能退化評估的研究都取得了良好的結果,但是其研究內容僅局限于仿真故障數據而忽略了實際軸承損壞的各種工況。因此本文提出基于SVM的智能評估方法,使用軸承真實數據進行測試,既能診斷不同的軸承故障類型,也能對軸承進行性能退化評估,判斷早期故障點。
本文使用EEMD提取軸承全壽命周期數據的特征,利用信息熵處理IMF分量,獲得IMF分量能量熵比。為了充分提取軸承的有效特征,使用常用的時域計算方法提取數據的時域特征。利用相關性、單調性和魯棒性有效的選擇退化特征,得到最終的特征向量。采用遺傳算法(genetic algorithm,GA)優化SVM參數,將三種不同類型故障軸承分為正常、退化和失效樣本,輸入模型中訓練并獲得最優參數。通過定義新的退化指標,評估軸承性能退化狀態,確定軸承早期故障點。通過未使用的失效數據驗證方法在實時監測中的應用。最后通過對比驗證確定方法的有效性和優越性。
準確評價軸承性能退化特征提取的概念是實現軸承狀態在線監測平臺的關鍵。研究了從滾子軸承振動信號中提取的各種原始特征。傳統的統計特征是表征軸承振動信號發生故障時變化的有力工具。當軸承發生故障時,振動信號的時域特征會隨著故障的位置、大小而發生變化,因此時域特征可用于表征軸承的工況。本文選取的時域特征如表1所示。

表1 時域特征計算公式Tab.1 Calculation formula of time-domain features
EMD是Huang等[13]提出的一種新的自適應方法,適用于非線性分析和非平穩信號處理。在EMD中,一個信號可以分解為多個IMF和一個殘差。但在實際應用中,由于其固有的模態混疊等問題,大大的限制了其實用性能。因此,Wu等和Huang等提出的集成經驗模態分解,有效抑制消除EMD中的模態混疊,得到的IMF分量更加真實客觀的反映信號的物理信息。具體算法過程見參考文獻[14]。
分解所得最終原始振動信號表示為
(1)
式中:cj(t)為EEMD分解后所得的第j個IMF分量;si(t)為分解所得殘差和的均值。
信息熵作為系統不確定性程度的描述已經在特征提取和信號處理方面得到廣泛的應用。當系統中的不確定性信息越多,則對應的熵值越大。用信息熵描述定量信號不確定性與復雜程度的統計特性具有穩定性好、抗噪能力強的特點。故障軸承的振動信號的頻率成分和各頻率段內信號的幅值能量會發生變化,因此結合EEMD和信息熵理論可以更為詳細的解剖軸承信號的退化信息。構造EEMD 能量比的具體步驟見參考文獻[15]。
EEMD能量熵的計算公式為
(2)
式中:Hen為第i個 IMF分量的能量熵;pi=Ei/E為第i個IMF分量占總能量的百分比。
由其他軸承診斷研究可知,EEMD特征提取考慮的IMF分量個數越多,后面的IMF分量對軸承診斷的作用越小。因此,本文只考慮前10個IMF分量。
上述所提取的一些退化特征可能與軸承的退化現象無關,因此,他們可能無法在軸承發生故障之前指示變化。為了提高性能退化評估的準確性和有效性,需從提取的退化特征中進行選擇,并通過融合所選擇的退化特征來構建軸承性能的健康指數。
合理的退化特征與軸承退化處理具有良好的相關性,單調遞增或遞減,對異常值的魯棒性都是軸承特征選擇考慮的條件[16]。對提取的退化特征的單調性、魯棒性和相關性進行估計,得到退化特征子集。退化特征的選擇過程如下。
(1)采用平滑法將提取的退化特征分解為均值趨勢和隨機部分
fea(t)=feaT(t)+feaR(t)
(3)
式中:fea(t)為t時刻的退化特征值;feaT(t)為趨勢部分的數值;feaR(t)為隨機部分的數值。
(2)特征選擇指標的計算公式為
(4)
(5)
(6)

(3)相關性是特征與時間線性關系的度量;單調性評價特征變化趨勢的一致性;魯棒性反映特征對異常值的容忍度。由式(4)~式(6)可知,三個指標均在[0,1]內,與特征的性能呈正相關。為了綜合考慮三個指標,提出加權線性組合作為退化指標選擇準則,計算公式為
Cri=ω1Corr+ω2Mon+ω3Rob
(7)
式中:ω1=0.2,ω2=0.5,ω3=0.3為指標的權重,這是由指標對軸承退化的貢獻程度決定的[17]。
由于退化指標的尺度不一致,數據直接融合造成很大的失真,容易導致特征的錯誤選擇。因此,需要對得到的各個指標的數據進行標準化。標準化計算為
(8)
遺傳算法是一種全局優化概率搜索算法[18],因其具有魯棒性強、適用性廣,操作簡單等優點而得到廣泛的應用。其主要思想是選擇合適的適應度函數,先產生初始種群,通過編碼產生染色體,仿照自然界的淘汰機制對個體進行選擇、交叉和變異等操作。最后得到滿足條件的個體進行反編碼得到最優解。
SVM是一種小樣本分類方法,這種方法通過構建最優超平面,使得超平面兩側的不同類樣本的距離最大化。因其在解決非線性高維空間問題上的優越性而被廣泛應用于模式識別、函數逼近、概率密度估計、故障診斷等領域。支持向量機的分類模型為
(9)

使用SVM處理離散變量和引入核函數中需要確定懲罰因子c和核函數參數g,兩者的選擇直接影響了SVM的分類精度和泛化能力。懲罰因子c與數據的擬合程度成正比關系,c取值越大則數據擬合程度越高。核函數參數g決定分類效果,g的取值過大則會降低分類效果。
SVM參數確定往往是通過交叉驗證思想下使用網格法尋找最優懲罰因子和核函數參數。為了克服網格法在大范圍內尋找最優參數的局限性,采用遺傳算法來搜索最優參數。優化具體步驟見參考文獻[19],其中,c∈[0,100],g∈[0,100]。
實驗數據采用美國辛辛那提大學智能維護系統中心軸承疲勞壽命試驗臺數據[20]。試驗臺如圖1所示。

圖1 滾動軸承加速疲勞壽命試驗臺Fig.1 Rolling bearing accelerated fatigue life test bench
試驗臺的主軸上裝有4個型號為Rexnord ZA-2115的雙列滾子軸承,如圖2所示,軸承每排包含16個滾子,節圓直徑71.5 mm,滾筒直徑為8.4 mm,接觸角15.17°。通過對軸和軸承施加徑向載荷約為2 721.6 kg。轉速保持在2 000 r/min。采用NI DAQ-6062E數據采集卡,采樣頻率為20 kHz,間隔10 min采集一次數據,每次采集時間為1 s,采樣長度為20 480個點。加速度傳感器型號為PCB353B33,分別安裝在主軸的水平方向和垂直方向。

圖2 Rexnord ZA-2000軸承系列Fig.2 Rexnord ZA-2000 bearing series
每次試驗有4個軸承進行測試,當某一個軸承損壞時,停止實驗,保留實驗數據。整個數據集描述的數據內容為軸承從健康運行到失效的整個實驗振動信號變化過程。測試結束后在軸承的磁性插頭上發現大量的金屬碎片,證明軸承已損壞。失效的軸承部件如圖3所示。

圖3 失效軸承部件圖片Fig.3 Pictures of failedbearings parts
選擇三種不同部件失效的軸承作為樣本:第一種為外圈失效樣本,樣本總數為984個,其中最后兩個樣本波形已失真,因此樣本總數為982個;第二種為內圈失效樣本,樣本總數為2 156個;第三種為滾子失效樣本,樣本總數為2 156個。
將樣本分為正常樣本(H)、外圈退化樣本(DOR)、外圈失效樣本(FOR)、內圈退化樣本(DIR)、內圈失效樣本(FIR)、滾子退化樣本(DR)、滾子失效樣本(FR)。樣本總數為5 294,其中正常樣本臨近退化樣本之間會有重疊部分,軸承出現故障是緩慢形成的,而不是一次性出現大的缺陷,因此存在這一重疊帶。同理,退化樣本臨近失效時也會存在重疊部分,為了避免模型在這一重復地帶之間判斷失誤,去掉重疊帶數據,將樣本總數減少到3 334個。各類樣本設置的SVM標簽和樣本數如表2所示。

表2 樣本個數及SVM標簽Tab.2 Number of samples and SVM tags
按表1所列的順序提取時域特征,編號為1~11,同時提取EEMD能量熵總和作為編號12,提取IMF分量能量熵比作為編號13~22。
分別提取三種不同故障的軸承特征,計算各特征的相關性、單調性和魯棒性分別如圖4所示,圖4中曲線代表三種不同故障的軸承在同一個特征下的均值。

圖4 三種不同故障的軸承的特征分析圖Fig.4 Feature analysis of three bearings with different faults
在相關性對比當中,外圈失效軸承會有相對較高的相關性,所提取的時域特征和EEMD能量熵都有個別較高的相關性系數存在。在單調性中時域特征占大的優勢,但單調性值的波動區間遠小于相關性和魯棒性值的波動區間。除了第4個特征和第22個特征之外,其余特征都具有較高的魯棒性。綜合考慮三個指標,計算綜合指標Cri,并進行標準化,結果如表3所示。

表3 不同特征的綜合指標Cri值Tab.3 Comprehensive Cri values of different features
為了選擇最優特征子集,設置選擇特征的閾值為0.6,對綜合指標進行排序,如圖5所示。選擇特征綜合指標Cri>0.6的特征,特征編號分別為01,15,07,12,06,11,13,16,03,14,02。保留所選的特征作為最優特征子集。

圖5 特征綜合指標選擇Fig.5 Selection of comprehensive index of features
GA優化結果得出最優參數為c=23.85,g=1.787 5,保留最優參數,輸入SVM中作為測試模型的參數。檢測軸承的性能退化情況,使用退化指標(degradation index, DI)來評估軸承的退化狀態。退化指標的具體計算方法如下:
步驟1獲取軸承全壽命數據。
步驟2提取數據的特征并進行特征選擇。
步驟3將特征分為訓練樣本和測試樣本,訓練樣本訓練SVM模型并通過遺傳算法找到最優的參數。
步驟4定義退化指標Di(1)=0。從第二個樣本開始,當SVM輸出標簽為1時,判斷軸承屬于健康狀態Di(i)=Di(i-1)+0;否則Di(i)=D(i-1)+1;Di為0表示健康狀態,Di越大則故障越嚴重。其中,i為全壽命周期樣本數據的第i個時刻數據。
通過計算模型分類精度評估模型分類的準確性,其中,模型分類精度計算公式為
使用三種不同故障類型的軸承全壽命周期數據進行測試,故障智能評估模型可通過標簽智能識別出故障的類型。再根據退化指標定義,繪制出軸承性能退化評估曲線,測試結果如圖6~圖9所示。
由圖6可知,外圈故障檢測早期故障點為第533個樣本,即第5 330 min,而第533個樣本到第911個樣本為軸承退化階段,第911個樣本之后,樣本標簽發生變化,軸承為嚴重退化至失效階段。在該階段軸承已經無法使用。通過評估圖形可對比,早期曲線為直線,模型輸出標簽為1,第533開始出現標簽2,后期在接近800時出現直線情況,輸出為標簽1,即診斷失誤情況,但并不影響曲線整體上升的趨勢,通過模型輸出標簽與實際故障情況對模型分類精度進行計算,可得外圈故障分類精度為98.07%。

圖6 軸承外圈故障數據評估結果Fig.6 Failure data evaluation results of bearing outer ring
從圖7可得,內圈故障的早期故障點為第1 635個樣本,即第16 350 min,軸承退化階段為樣本1 635~2 084。第2 048個樣本之后,軸承嚴重退化。同理,通過對模型分類精度進行計算,內圈故障分類精度為96.29%。

圖7 軸承內圈故障數據評估結果Fig.7 Failure data evaluation results of bearing inner ring
由圖8分析可得,軸承滾子故障數據的早期故障點為第1 438個樣本,軸承退化階段為1 438~2 105,軸承嚴重退化至失效階段為2 105~2 155。滾子故障數據分類精度為98.7%。

圖8 軸承滾子故障數據評估結果Fig.8 Failure data evaluation results of bearing rollers
在實際工程應用中,方法的使用需要基于數據驅動,因此需要獲得同類軸承的歷史全壽命周期失效數據。通過歷史失效數據訓練模型后,可直接在工程中實時監測軸承的性能退化狀態。為了進一步評估,以辛辛那提大學提供的第三套數據作為測試樣本,軸承與訓練的軸承為同類軸承,數據樣本共6 324個,軸承振動信號采集原始圖如圖9(a)所示,最終失效結果為軸承內圈故障。本文方法所得的評估結果如圖9(b)所示,早期退化點為第6 163個樣本,這與振動信號振幅增大所在位置相近。嚴重退化點為第6 244個樣本。所得樣本標簽為內圈退化和失效,與實際失效結果一致,這一結果證明了該方法在實際工程監測中的有效性和方法的魯棒性。

圖9 測試數據評估結果Fig.9 Evaluation results of test data
為了驗證本文提出的智能評估方法的優越性,對比其他方法如表4所示。

表4 方法對比Tab.4 Method comparison
通過對比可得,本文所用方法在同類型文章中具有更高的平均分類準確率,且能判斷軸承的退化狀態。而其他文章在有高故障診斷率的同時,無法評估軸承退化狀態,其主要缺點是采用仿真數據進行試驗,通過加工不同直徑和深度的軸承故障來進行測試,但在實際工業中軸承的故障是反復磨損,逐漸擴大的。本文使用反映軸承動態響應的真實數據進行測試,測試結果更符合工程應用。
對比方法的性能退化評估的優越性與早期故障檢測的準確性,以軸承外圈故障數據為例。峭度是工程中常用的監測參數,其曲線突變能及時反映軸承的狀態,因此能判斷早期故障點。基于峭度的軸承性能退化評估曲線如圖10所示。
由圖10可得,軸承的峭度曲線在第566個樣本有小的突變,后緩慢上升,直到第647個樣本之后才有一個大的突變。而不論是第566個樣本還是第647個樣本的判斷,都比基于GA-SVM的智能評估模型判斷的早期故障點要晚,這在工業的決策中是不允許的。而在第970個樣本后峭度曲線直線上升,表示軸承失效,比實際判斷晚了59個時刻,即590 min。

圖10 外圈故障軸承全壽命周期內峭度曲線Fig.10 Kurtosis curve of the outer ring fault bearing life cycle
由前期研究成果可得該外圈故障數據的包絡譜分析結果如圖11所示。

圖11 早期故障樣本與無故障樣本包絡解調圖Fig.11 Envelope demodulation diagrams of early fault and faultless samples
分析圖11可知,在第533個樣本中,譜峰出現在230 Hz,461 Hz和691 Hz,與ZA-2115軸承外圈故障特征頻率236 Hz相近,譜峰所在頻率與軸承外圈特征頻率存在差異的根本原因為存在滑移效應[22]。而在第532個樣本中則沒有相應的峰值,對第532個樣本之前的樣本進行包絡譜分析得出同樣的結果,因此可確定第533個樣本為早期故障點出現的樣本。因此基于GA-SVM的滾動軸承智能評估方法得出初始故障結果與驗證結果一致。
提出了一種基于特征優選和GA-SVM的智能評估模型,能準確識別故障類型,輸出軸承性能退化指標,判斷早期故障點,為設備的維護提供理論依據。
(1)相對于EMD特征提取方法,EEMD解決了EMD所面臨的模態混疊、端點效應等問題,結合EEMD和信息熵能更加精確地提取軸承的退化特征。
(2)結合考慮相關性、單調性和魯棒性的特征選擇指標,可以有效剔除與軸承退化現象無關的特征,通過加權線性組合融合指標,最終確定綜合指標大于0.6的特征為選擇的特征。
(3)使用GA參數優化SVM參數,獲得懲罰因子c和核函數參數g最優值。實驗結果表明,基于GA-SVM的軸承故障智能評估方法的平均分類準確率達到97.69%。
(4)定義新指標,在智能識別故障的同時,能確定軸承早期故障點,繪制分析軸承性能退化評估曲線。通過三套不同故障類型的軸承全壽命數據和一套未使用的失效數據驗證方法的可行性。