舒 濤, 張一弛, 丁日顯
(1.空軍工程大學防空反導學院, 陜西 西安 710051; 2.空軍工程大學研究生院, 陜西 西安 710051)
旋轉機械設備中包含了軸承、齒輪、發動機等關鍵部件。現實生活中,因上述關鍵部件出現故障導致事故發生的情況屢見不鮮:1972年日本關西電力公司海南電廠在試運行過程中機組齒輪失效,致使毀機并造成50億日元的損失;1993年黑龍江某電廠工作人員因故障處理能力不足,全部軸承損壞且發動機燒毀,造成巨額財力損失;2005年山西某客車由于軸承嚴重磨損,無法控制方向,使得11人死亡,12人受傷[1]。目前仍有許多類似事故時常發生。通過上述事故可以看出旋轉機械設備一旦出現故障,輕則造成設備損毀,重則造成人員傷亡。因此,亟需對其進行壽命預測以提高旋轉機械的穩定性和可靠性。
一直以來,不斷有國內外學者對旋轉機械關鍵部件的壽命預測方法提出自己的見解。郭銳[2]等從流量退化趨勢的角度入手,并結合模糊推理的方法對外嚙合齒輪泵壽命展開預測,結果表明該方法的預測平均誤差約為8%;黎慧[3]等提出利用灰色預測模型短期預測軸承壽命,在數據量較少的情況下,該模型預測準確性較高;Ali[4]等提出了一種改進的循環神經網絡(recurrent neural network, RNN),即長短期記憶(long-short term memory, LSTM)網絡,解決了RNN 不能很好地處理長期依賴問題,能夠有效地提高滾動軸承長期預測的準確性;石慧[5]利用狀態空間建模的方法建立齒輪退化模型進行壽命預測,在齒輪工作73 h后預測準確率即可達到95%;Mohsen[6]運用改善距離評估(improved distance evaluation, IDE)的方法降低特征向量的維度,提高了軸承壽命預測的準確性,可達93%~94%; Khazaee[7]等通過多層感知器神經網絡算法對發動機預測壽命,誤差可以低于10%;張繼冬等[8]為了減小訓練樣本數量,將傳統的卷積神經網絡的全連接層更新為卷積層與池化層,從而可以利用卷積層局部共享的特性減少模型訓練過程所需優化參數的數量,提高了結果的可靠性;文娟等[9]為解決粒子濾波(particle filter, PF)算法中的粒子退化問題,提出了一種無跡PF(unscented PF, UPF)算法,該算法結合了PF算法和無跡卡爾曼濾波(unscented Kalman filter, UKF)算法的優點,得到了適合數據的重要性采樣概率分布使得粒子退化速度減緩,從而提高了壽命預測準確率。上述學者提出的對于軸承、齒輪和發動機的壽命預測方法雖然在原來只依靠專家經驗的診斷預測方法基礎上有大幅度提高,但是方法比較復雜,難于理解和實現,且大多僅將誤差控制在8%左右,仍存在提升空間。
本文以旋轉機械設備中的軸承為例開展壽命預測研究,綜合灰色模型(grey model, GM)的小型樣本和LSTM網絡非線性預測準確率高的特點提出了一種改進GM(improved GM, IGM)預測模型IGM(1,1)-LSTM。首先利用極大似然估計法求取軸承可靠性數值(confidential value, CV)量化軸承工作狀態,并在GM(1,1)模型的基礎上提高了原始數據序列平滑比且優化了背景值,將其與LSTM模型結合進行CV預測的工作。進一步在平均絕對百分比誤差、均方根誤差和預測精度3項指標上,與原始GM(1,1)、IGM(1,1)模型、LSTM模型3種單一模型進行了對比分析;在預測失效時刻上,與全卷積層神經網絡算法[8]、UPF算法[9]進行比較。
設備的退化程度與其出現故障的概率之間需要明確的關系表示,即設備的健康狀態評價指標。目前,對于軸承的健康狀態評價指標已經有了較為深入的研究。有學者將簡單的統計參數例如平均值、均方根值等作為預測剩余壽命的判據,但由于振動信號摻雜了大量噪聲,該方法在降低噪聲和抗干擾方面效果并不盡如人意[10]。Ali[11]利用Hilbert-Huang變換以及希爾伯特邊際譜對軸承內、外圈以及滾動體的失效特征進行了提取和分析;申中杰[12]以軸承振動信號的均方根值作為軸承失效的特征指標,并進行剩余壽命預測,取得較好的效果;張亢[13]等人則根據數學形態學分形維數的方法提出了一種軸承狀態指標。
上述方法提取的健康狀態評價指標的確取得了不錯的效果,但是在進行傅里葉變換時仍然會出現信號能量泄露的情況,為避免這種現象,周建民[14]等提出了一種全壽命周期的評估指數CV。先是對軸承振動信號的本征模函數(intrinsic mode function, IMF)能量進行提取,將其作為特征向量;接著建立邏輯回歸模型,獲取回歸參數;最后計算出每一個時刻的CV作為軸承的健康狀態評價指標。CV=1表示數據樣本對應的設備處于正常狀態,反之,CV=0表示數據樣本對應的設備處于性能最差狀態。在不同的退化程度下軸承的CV有所不同,如果定義某一種狀態為“可接受”的狀態,那么可以把這種狀態所對應的CV作為一個“安全警告閾值”,如果CV高于此閾值,就說明軸承運行狀態在可以接受的范圍之內;如果CV低于此閾值,則說明軸承接近失效,此時應停機檢修,防止出現重大事故。
CV表達式如下[15]:
(1)
式中:x為k維列向量中第i個數值;β0為回歸截距;βk為回歸系數。當CV小于或等于0.05時,βk的值很大,Matlab軟件已經無法計算得出具體數值,所以記為此時的滾動軸承已經沒有工作能力。
本文選用美國辛辛那提大學軸承數據[16]來試驗新預測模型的準確性,首先要對該滾動軸承的整個工作周期計算其CV,該數據針對此型號軸承共有984個時刻采樣數據每一個采樣時刻間隔為10 min,按照極大似然估計的方法來計算該滾動軸承的CV。
X=[X1,X2,…,X984]
X1=[x1,1,x2,1,…,x20 480]T?cv1
X2=[x1,2,x2,2,…,x20 480,2]T?cv2
?
X984=[x1,984,x2,984,…,x20 480,984]T?cv984
(2)
(3)
令lnL=0,則
(4)
根據式(4)可以求解出β0至β984,得出該滾動軸承整個工作周期的984個CV,如圖1所示。

圖1 軸承整個壽命周期真實CV
目前,預測數據序列的最廣泛也最直接的方法就是利用GM(1,1)模型實現,常用的GM(1,1)改進模型有新陳代謝GM(1,1)模型、智能函數組合優化的GM(1,1)模型、耦合三角函數變換的GM(1,1)模型等,這些灰色預測模型的優點是不需要大量原始數據且短期內預測效果良好,但是當原始數據不穩定并且數量較少時,預測的平均相對誤差都不理想,所以本文將用改進平滑度和優化背景值后的IGM(1,1)模型與LSTM預測模型進行結合,成為新預測模型并與原始GM(1,1)模型、IGM(1,1)模型和LSTM模型進行多指標分析對比。
預測CV時采用GM(1,1)的灰色預測模型[3],流程圖如圖2所示。

圖2 GM(1,1)預測流程圖
先將原始數據x(0)(i)累加得到x(1)(n),對Y(1)(n)建立模型:

(5)
(6)
(7)
(8)

(9)

因為該型號軸承的真實CV在時刻為700與900時發生突變,所以在進行算法預測時應該將984個時刻分成3個階段,且可以用Matlab編程計算得出a和u的值。
LSTM網絡是經過RNN優化的一種時間RNN,后來由Aldenhoff等人在Ali等人的基礎上改進添加了額外的遺忘門,解決了之前遺留下來的“梯度消失”問題,可以說是目前最成功的RNN結構。
記狀態記憶單元的值為St,輸入門為it,遺忘門為ft,中間輸出為ht,輸出門為ot,St與ht二者共同決定記憶單元當中的遺忘模塊。Xt為遺忘門中的輸入部分,分別經σ與tanh激活函數變換后決定狀態記憶單元中的保留向量,σ函數輸出值為0到1之間,0代表不通過,1代表完全通過[17]。輸出的ht是St與ot一起決定的,h(t)的計算公式為
(10)
i(t)=σ(Wxixt+Whih(t-1)+WsiS(t-1)+bi)
(11)
f(t)=σ(Wxfxt+Whfh(t-1)+WsfS(t-1)+bf)
(12)
(13)
o(t)=σ(Wxoxt+Whoh(t-1)+WsoS(t-1)+bo)
(14)
h(t)=o(t)?tanh(S(t))
(15)

3.1.1 數據平滑比定義
可以假設有數據序列
X=[x(1),x(2),…,x(n)]
那么整個序列中的第k個數據x(k)與前k-1個數據之和的比稱作數據平滑比[18],可以體現出整個數據序列變化的平穩度,即
(16)
式中:k=2,3,…,n。ρ(k)值越小,則該數據序列越平穩。

本文提出一種xi/(lni)c改進的數據處理方法使得ρ(k)值變小。其中i=2,3,…,k-1,c為大于0的常數,下面對xi/(lni)c改進方法的可行性進行證明。
令i 若對不等式兩邊進行求和運算,有 則 (17) 所以式(17)證明xi/(lni)c變換可以優化整個數據序列的平穩度。 (18) 預測流程圖如圖3所示。 圖3 改進模型預測流程圖 假設原始數據序列X(0)={x(0)(2),x(0)(3),…,x(0)(n)}對X(0)進行xi/(lni)c變換處理,則可以得到 (19) 則Y(0)={y(0)(2),y(0)(3),…,y(0)(n)} 通過一次累加可得 (20) 處理后,得到 Y(1)={y(1)(2),y(1)(3),…,y(1)(n)} 對Y(1)建立微分方程: (21) (22) 式中: 更換背景值公式,如式(18)可求出Z(1)(k),k=3,4,…,n的值。 所以,可得 (23) 則經xi/(lni)c變換后的預測值: (24) 美國辛辛那提大學軸承實驗數據包含3個數據集,每個數據集描述了一個失效測試實驗。每個數據集由多個1秒鐘的文件組成,每個文件由20 480個點組成,采樣率設定為20 kHz,每隔10分鐘采集一次數據,通過NI DAQ6062E采集卡采集數據。根據美國辛辛那提大學第二次軸承實驗數據可以得到該型號軸承的984個CV狀態值,由于樣本量并不是很大,所以預測工作需要使用短期預測穩定性較高的灰色模型。但是又因為這984個CV非線性趨勢十分明顯,所以預測工作還需采用LSTM網絡模型。整個周期的CV中,又存在許多劇烈變化的數項,所以應將二者結合并在處理波動幅度較大的項時需要重復、循環訓練,直至訓練結果滿足輸出條件。 結合后的模型結構如圖4所示,計算給型號軸承全周期的真實CV后,將984個數據按照7∶3確定訓練集與數據測試集,即選取前700個CV進行訓練。 圖4 IGM(1,1)-LSTM預測流程圖 在確定IGM(1,1)-LSTM模型參數中的隱含層神經元數量時,需要進行檢驗性實驗。實驗數據采用已計算出的真實CV的前420個數據,來預測第421到第600個數據并進行檢驗,如表1所示。取學習率的值為0.05,時間步長為1,網絡輸入、輸出層數均為1,訓練輪次為700次,則通過表1可知:當隱含層神經元數量增加時,平均絕對誤差百分比xMAPE值逐漸減小,但是當神經元數量增加到5時,xMAPE值出現波動而升高,即出現了學習程度過高的情況,所以隱含層中的神經元數量應取4。 表1 IGM(1,1)-LSTM模型實驗結果 選取單一預測模型:LSTM網絡預測第701至984時刻的均方根誤差xRMSE平均值作為該模型的閾值,如表2所示。若初次預測的結果小于該閾值,則直接輸出,反之則須繼續訓練直至滿足條件。 表2 4種模型多性能指標對比 根據數學模型預測性能的評價指標,選取其中的平均絕對誤差、平均絕對百分比誤差、均方根誤差和模型預測精度四項數值作為本文的模型評價指標。 (25) 那么殘差ε(i)為 (26) 所以可以得出平均絕對百分比誤差 (27) 均方根誤差為 (28) 模型預測精度P為 P=(1-ε(i))×100% (29) 傳統的GM(1,1)模型i值均是從1開始,但是由于xi/(lni)c改進后的GM(1,1)模型分母不能為0,所以其i值應從2開始。 組合后模型預測的第701至984個的xRMSE、xMAPE、P與其他3種模型對比如表2所示,4種模型用Matlab仿真得出的預測對比曲線圖如圖5所示。將第701至984個預測數據分為14組,隨著預測數量的遞增可以更好地分析出各模型的預測性能。 圖5 4種模型預測曲線圖 由表2可知,GM(1,1)模型的xMAPE十分不穩定而且較高,預測精度也逐漸降低,在改進平穩度與背景值后的IGM(1,1)模型在此數據背景下各種指標明顯優于傳統模型,證明該方法改進的效果較為明顯。IGM-LSTM模型的xMAPE隨著訓練數據的增加而呈現減小的趨勢,模型預測精度也隨著訓練數據的增加而逐漸升高。若僅使用IGM(1,1)和LSTM單一模型預測,預測精度雖然相對于傳統GM(1,1)升高許多,但是與組合后的模型相比仍存在差距。根據圖5可以看出本文所提方法預測得到的曲線精度最高,與實際曲線變化趨勢基本一致。 由下式可以計算出該型號軸承的剩余工作時間: s=10(x|CV=0.05-n0) (30) 式中:x|CV=0.05表示當CV=0.05時對應的橫坐標值,即失效時刻;n0為已知檢測時刻。 用辛辛那提大學第2組軸承實驗數據對張繼冬等人提出的全卷積層神經網絡算法和文娟等人提出的UPF算法復現得到圖6、表3和表4。 圖6 3種算法第961~984時刻預測曲線圖 表3 3種算法在第20組時刻的性能指標對比 表4 3種算法預測失效時刻對比 圖6為3種算法在最后一組時刻的軸承退化趨勢預測曲線圖,表3為3種算法在第20組時刻(961~984)中各階段的xMAPE和P值,結合二者可以很直觀地看出全卷積層神經網絡算法預測的第2、3階段CV準確率較低,xMAPE達到4.435%,無跡粒子濾波算法預測的第2階段CV準確率較高,第3階段CV準確率較低,xMAPE為2.078%;表4反映出IGM(1,1)-LSTM的失效時刻預測結果與實際測得的結果最為接近。 本文對于旋轉機械設備中軸承易老化和故障率高的問題,提出一種結合灰色預測與LSTM網絡的組合模型預測軸承的退化趨勢。首先在處理數據方面使用了xi/(lni)c變換提高平滑比,再使用先累加后積分的方法優化背景值,提升了GM(1,1)模型的預測精度。接著針對灰色模型預測數據量較大時不穩定的問題,將其與非線性預測性能好但短期預測不穩定的LSTM網絡模型結合成為新預測模型。先是與傳統GM(1,1)模型、IGM(1,1)模型和LSTM網絡模型的性能指標進行對比,而后與向量誤差修正算法和無跡粒子濾波算法就該數據集的同組數據進行比較分析。結果證明組合模型具有較高的預測精度,能夠很好地彌補單一模型預測時的不足,且在該類數據范圍內預測效果優于全卷積層神經網絡算法和UPF算法。 齒輪也可以運用該方法進行壽命預測工作,在旋轉機械設備的維護上,這種新的組合模型預測方法能夠為工作人員提供更大的便捷。
3.2 背景值優化

3.3 改進平滑比與背景值的IGM(1,1)模型




4 IGM(1,1)-LSTM模型設計
4.1 模型基本結構



4.2 模型評價指標
5 預測模型仿真結果對比
5.1 與3種單一模型的退化趨勢預測對比

5.2 與兩種算法的失效時刻預測對比



6 結 語