慎明俊, 高宏玉, 張守京*, 王 典
(1.西安工程大學機電工程學院, 西安 710048; 2.北奔重型汽車集團有限公司, 包頭 014000)
在現代工業生產系統中,不同的組件協同工作以實現既定目標。滾動軸承作為工業復雜裝備中的基礎零部件,對整個機械系統的性能有著很大的影響[1]。然而,滾動軸承通常在惡劣多變的工作環境下工作,在工程應用中易受損傷。雖然滾動軸承在相同的工作條件下與產品部件一起使用,但是它們的使用壽命可能會有很大的變化。對滾動軸承性能的評價不僅可以保證機械設備的平穩高效運行,而且可以及時發現和消除意外故障事件。因此,基于傳感器信號的實時監測并對其進行性能退化評估就顯得極其重要。
近年來學者們提出了大量基于振動信號特征提取和時間序列預測的方法并成功應用于軸承剩余壽命(remaining useful life, RUL)預測中,其無需考慮機械結構、工況以及失效機理的優勢極大程度上提高剩余壽命預測的精確度。李華新等[2]為解決傳統機器學習模型需要大量訓練和標簽的缺點,提出了分層稀疏碼(hierarchical sparse coding, HSC)的方法對軸承進行剩余壽命預測。劉波等[3]將軸承從正常到失效的全壽命周期劃分成若干個退化階段,并將隱馬爾可夫模型(hidden Markov model, HMM)與粒子群算法優化(particle swarm optimization,PSO)改進的支持向量機(support vector machine, SVM)結合對劃分的退化階段分別進行預測。上述方法一方面采用的是人工特征提取,其建模方式復雜并且部分特征人工提取很容易被忽略掉。而近年來,深度學習憑借自身多層次的內部結構和再學習訓練方法的優勢,能較好地解決傳統人工特征提取的不足;另一方面由于RUL預測很明顯的一個特點就是時間相關性,傳統方法無法提取到時序數據的時間相關性特征,針對這一問題,循環神經網絡[4](recurrent neural network,RNN)的變體長短期記憶神經網絡(long-short term memory, LSTM)應運而生,并且其在各個領域效果顯著[5]。
因此,結合深度置信神經網絡(deep belief neural, DBN)與LSTM建立軸承壽命預測模型,一方面發揮DBN模型在深度特征提取的優勢,提高傳統的人工特征提取的準確性和工作效率;另一方面利用LSTM處理時間序列的優勢提高滾動軸承剩余壽命預測的準確性。
長短時記憶網絡是Hochreiter為解決循環神經網絡在處理比較長的時間序列數據時出現的梯度爆炸和梯度消失現象而提出的一種記憶單元網絡結構的模型[6],是在RNN的基礎上在細胞中引入了判斷信息是否符合要求的門限結構來控制信息的累積速度——輸入門、遺忘門、輸出門,從而借助這種結構對新信息進行記憶和更新,解決長期依賴的問題。如圖1所示每一個LSTM的神經元是由細胞狀態即長期狀態ct和短期狀態ht、輸入門it、遺忘門ft、輸出門ot所組成。

σ和tanh分別表示sigmoid函數和雙曲正切函數
所謂的細胞狀態,就是一個存儲信息的容器,通過輸入門、遺忘門、輸出門的過程控制,逐步對容器中的信息進行增減變化和輸出。在每一個神經單元中,細胞狀態經歷了遺忘門的遺忘過程,輸入門的輸入過程以及向輸出門進行輸出信息的過程。
輸入門就是復制處理當前神經單元的輸入信息。它由兩部分組成: sigmoid函數自主選擇更新哪些信息;tanh函數將構造的全新的向量添加到當前的細胞狀態中以構造新的狀態[7]。實現公式為
(1)
遺忘門的主要作用是決定當前的狀態需要丟棄之前的哪些信息。若ft=1則表示信息被完全保留;ft=0表示信息被完全丟棄[8]。ft的實現公式為
ft=σ(wxfxt+whfht-1+bf)
(2)
輸出門主要控制的是當前隱藏狀態的輸出信息。實現公式為
(3)
式中:ht-1為t-1時刻的輸出;wxi、wxc、wxf、wxo分別為在t時刻輸入向量xt的權重矩陣參數;whi、whc、whf、who分別表示t-1時刻隱層向量ht-1的權重矩陣參數;bi、bc、bf、bo表示偏置向量參數。
最后利用反向傳播(back propagation through time, BPTT)算法對LSTM模型進行參數優化。
多層受限玻爾茲曼機(restricted boltzmann machine, RBM)和一層BP網絡構成了典型的深度置信神經網絡,運用逐層貪婪學習算法優化RBM層間的權重和偏置[9],DBN基本結構如圖2所示。

w為權重,v為可視層輸入向量,h為隱含層輸出向量
圖2中的可視層和隱含層兩部分構成了DBN網絡的RBM單元;為保留數據更多的特征DBN網絡中上一層RBM的輸出即為下一層RBM的輸入;最后,再建立一層BP神經網絡,利用反向傳播網絡將誤差信息自上而下傳播到RBM的每一層,并對DBN網絡模型的參數進行微調,以保證整個DBN的特征向量為最優。
搭建基于DBN-LSTM的壽命預測模型,充分利用DBN多層次感知機結構的優勢,較好地保留了原始數據的屬性,較好地解決滾動軸承振動數據特征提取問題,克服了以往軸承信號特征提取依靠人為經驗提取的不足,提高了滾動軸承壽命預測精度。流程圖如圖3所示。具體操作如下。

圖3 DBN-LSTM流程圖
(1)數據預處理。依據原始信號頻譜設置帶通濾波的濾波區間,并對信號進行降噪處理。
(2)確定預測起始點(start prediction point,SPT)。根據均方根特征和峭度特征的全壽命趨勢圖確定剩余壽命預測起始點,并依據SPT劃分訓練集和測試集。
(3)深層特征提取。利用PSO算法對深度置信神經網絡的4層RBM結構的層節點數進行優化,提取軸承振動數據的深層特征,完成無監督學習訓練過程。
(4)訓練階段。將經優化后的DBN提取到的深層特征輸入到LSTM網絡中,并依據式(1)~式(3)及LSTM網絡記憶單元結構獨有的特性,經LSTM進行訓練,建立起預測模型。
(5)測試階段。將劃分的測試集輸入到訓練好的預測模型中,得到軸承的RUL。

(4)
(5)
MA=1-MAPE
(6)
式中:RMSE值越小,表明預測值與真實值越接近,預測準確性越高。MAPE和MA評價模型的預測能力。MAPE越小,MA越大,模型的預測效果越好。
采用辛辛那提大學公開的滾動軸承全壽命周期數據中的第二組數據(共984組,采樣間隔為10 min,采樣頻率為2 000 Hz)進行模型驗證,該數據在滾動軸承RUL預測領域應用的極為廣泛。其中包含了軸承在不同狀態和模式下的監測數據,試驗結束后每個軸承都有不同程度的磨損。有關軸承的具體信息請參閱文獻[11],此處不作說明。
為了清晰地反映出軸承的剩余壽命和退化趨勢,設置DBN-LSTM模型的輸出為1~984的數列以此來表征軸承的退化狀態,1表示軸承處于正常運行狀態,984則表示軸承出現故障實驗結束。 滾動軸承剩余壽命的預測值則通過模型輸出的退化值映射到對應的數據集組數。圖4為軸承從正常到外圈故障的全壽命過程時頻圖,由圖4(b)可知信號的能量集中在4 000~5 000 Hz,并且噪聲較多。設置帶通濾波的濾波區間對信號進行降噪處理,圖5為經帶通濾波降噪后的時頻圖。

圖4 軸承全壽命周期時頻圖

圖5 降噪后軸承全壽命周期時頻圖
對比圖5(a)和圖4(a)可知,信號經帶通濾波降噪后濾除了軸承在運轉過程中產生的噪聲,使得時域圖中信號更加光滑;在頻譜圖中,圖5(b)與圖4(b)相比,故障脈沖更加凸顯。這樣DBN提取的特征就更加有效,模型預測就更加準確。
壽命預測起始點的選擇將影響預測的準確性,并且滾動軸承的壽命相對其他零部件較長,所以選擇合適的滾動軸承剩余壽命預測起始點對于提高預測精度和減少預測時間是極其重要的。
在訓練樣本時,由于信號中包含噪聲和軸承故障時產生的共振諧波,因此不能直接選擇振動信號的幅值特征來表征軸承的退化狀態和預測模型的輸入。實際上,主要的統計特征有均方根、峭度、裕度因子、峰值、峰峰值、偏度和功率譜密度等[12]。選取均方根(root mean square, RMS)和峭度兩個特征值來表征軸承退化狀態,并以此來確定軸承退化模型的SPT。圖6(a)和圖6(b)分別為RMS和峭度在軸承運行全壽命周期的趨勢圖。對比兩圖可發現RMS和峭度在全壽命周期前期較為平穩,后期有明顯的波動,可以確定軸承在此時段內發生了故障。為進一步驗證SPT對預測結果的影響,選擇不同的預測起始點進行模型訓練。從表1中可知開始預測點越早模型訓練時間越長,預測精度也不佳。因此,SPT點的選擇要能保證預測的精度,不宜過早也不易過晚,經對比本文選擇第684組數據處作為LSTM模型的SPT點。

圖6 均方根與峭度趨勢圖

表1 不同起始點的預測結果對比
為保證預測精度并及時對軸承進行壽命預測,選擇從第384組數據開始進行訓練,將384~684組數據作為訓練集,684~984組數據作為測試集。
DBN網絡模型對數據特征提取的效果深受RBM層數及節點數等參數的影響。首先確定RBM層數對DBN特征提取的影響,對RBM層數進行對比選擇。選擇平均精度(MA)、權重個數以及訓練時間作為評判標準,不同RBM層數對預測結果的影響對比結果如表2所示。
由表2可以看出當DBN模型為4層時,測試樣本的MA達到最優;在RBM層數確定的情況下,各RBM層節點數目對預測精度及訓練和測試時間都會有極大的影響。由于RBM層節點數較大,若采用縱向對比方案對其節點數進行優選運算量極大,因此采用PSO對各RBM層節點數目進行尋優,以充分發揮DBN模型對軸承故障信號提取的優越性。如圖7所示當PSO優化算法迭代次數為60次時最優,輸出的4層RBM節點數最優解為24、41、24、5。

表2 DBN層數對預測結果影響

圖7 PSO適應度進化曲線
為了確定被測軸承何時到達預期壽命,根據3.2節起始預測點的選擇,現將第384~684組樣本數據作為訓練集對模型進行訓練。由圖8可知,隨著迭代次數的增加,訓練誤差趨于0,表明模型訓練效果極佳。表3為訓練后的LSTM 網絡結構參數。

表3 LSTM參數

圖8 訓練誤差
將684~984組數據作為測試集輸入到訓練后的LSTM網絡中,得到圖9所示LTSM預測輸出結果。

圖9 LSTM預測結果
從圖9可以看出本文模型預測的軸承RUL與真實數據有相同的變化趨勢,預測數據和實際數據的曲線擬合程度高且兩者之間的誤差較小,在滾動軸承運行后期預測值波動較小,表明本文選擇的特征值能有效表征滾動軸承的退化狀態,也表明本文提出的軸承剩余壽命預測方法是有效的。
為了驗證深度特征提取相對于人工特征提取的有效性,LSTM網絡可以充分利用具有時間相關性的退化歷史數據的優越性,將BP神經網絡、DBN-BP和傳統的LSTM與本文模型進一步對比,各方法預測結果如圖10所示。表4為4種方法的預測誤差。

圖10 4種方法對比結果

表4 4種方法的預測誤差
由圖10可知,DBN-BP、BP神經網絡及傳統的LSTM模型在軸承運行后期與真實值出現較大的離散性,表明這兩種方法不能充分挖掘時間序列數據的內在聯系;傳統的LSTM網絡模型相比前三種模型表現出較好的擬合性,但在軸承運行的最后期表現出一定的離散性,這是由于人工特征提取不能提取深層特征的原因;本文提出的DBN-LSTM模型在精度和擬合程度上都要優于其他四種模型,且本文方法的預測值與真實值基本保持一致。證明了本文方法的可行性。從表4中可以看出基于DBN-LSTM的壽命預測RMSE=0.031 6,MAPE=0.008 9,均小于其他幾種方法,證明該方法預測精度最高,可以準確預測滾動軸承剩余壽命。
提出一種基于DBN-LSTM模型的滾動軸承剩余壽命預測模型,融合了DBN在深度特征提取的優勢和LSTM處理時間序列的特性,提高了滾動軸承剩余壽命預測的準確性。通過實驗分析得到以下結論。
(1)通過軸承全壽命周期內均方根和峭度特征的趨勢圖,確定軸承壽命預測的SPT點,提高預測的準確性。
(2)PSO優化后的DBN網絡能充分從高維復雜數據中能有效提取表征軸承退化狀態的深層特征,結合LSTM網絡對時間序列數據具有的自主學習能力的優勢來提高預測的準確性,利用隨時間變化的退化歷史數據來獲取退化狀態并有效地實現非線性函數映射。
(3)經過與其他預測方法對比發現,基于DBN-LSTM的軸承退化預測方法在預測精度方面優于其他3種方法,能進一步提高滾動軸承RUL預測的精度。