李卓漫 王海瑞
(昆明理工大學信息工程與自動化學院)
滾動軸承作為旋轉機械設備的重要部件之一,在進行剩余壽命預測時,如果預測不準確,會導致無法在機械設備出現問題前及時采取預防措施,進而產生相當程度的經濟損失,因此對它進行準確的壽命預測對于設備維護、提高生產效率都有相當重要的意義[1,2]。 近年來,基于狀態監測的軸承剩余壽命預測方法成為國內外研究的熱點,同時由于循環神經網絡(RNN)在時間序列處理方面具有優越性而在滾動軸承剩余壽命預測方面得到廣泛應用。 文獻[3]中提出了一種基于循環神經網絡的健康指標,用于軸承剩余壽命的預測。 文獻[4]中使用具有時序功能的長短期記憶網絡構建網絡模型,并進行剩余壽命預測。由于RNN在訓練中會出現長期依賴、 梯度爆炸和消失的問題, 為此提出了長短期記憶網絡(Long Short-Term Memory,LSTM)。 LSTM通過設計遺忘門、輸入門和輸出門結構,有效地利用了長距離的時序信息[5],提高了預測效果。 與此同時,LSTM神經網絡的預測效果很大程度上依賴于參數的設置。模型使用不同參數會使其性能有所不同。且通過人為設置參數,可能導致預測效果不穩定。因此筆者采用粒子群算法(PSO)對LSTM網絡的部分需人為設定的參數進行優化, 實驗中選擇批處理大小和隱藏層單元數目,從而構建PSO-LSTM模型對滾動軸承的剩余壽命進行預測。
LSTM以RNN為基礎加入了遺忘門、輸出門和輸入門和3種特殊結構[6],本質是使用sigmoid激活函數,使全連接層的輸出值取值范圍在[0,1],該值表示信息量通過的比例。 遺忘門表示上一時刻輸出信息量的遺忘比例, 輸入門表示當前時刻輸入信息量的保留比例,兩者共同更新狀態值,輸出門則表示新狀態輸出比例。 文獻中最常見的LSTM網絡結構最初是由Graves A和Schmidhuber J[7]提出的,結構如圖1所示,其中x(t)為當前輸入,h(t-1)為上一時刻輸出值,h(t)為當前輸出值,c(t)為新狀態值,c(t-1)為上一時刻的狀態值。

圖1 LSTM網絡結構
遺忘門是通過讀取h(t-1)和x(t)輸出介于0~1之間的一個數f(t),通過這個數來決定c(t-1)的保留程度,計算公式為:

輸入門是決定h(t-1)和x(t)中將會有哪些新的信息被傳輸給細胞狀態,具體的數據處理由兩部分組成, 一是通過使用tanh激活函數輸出a(t)增加到細胞狀態中,二是通過使用sigmoid激活函數確定更新哪些值,計算公式為:

更新當前狀態為:

輸出門的數據處理同樣由兩部分組成,一部分包括O(t)和激活函數tanh,另一部分包括h(t-1)、x(t)和激活函數sigmoid,計算公式為:

式中 b——偏置值;
U——循環權重;
W——輸入的權值矩陣;
σ——sigmoid激活函數。
由此可見,LSTM的關鍵是狀態值c(t),它在t時刻保持單元狀態的記憶,通過遺忘門f(t)和輸入門i(t)進行調節。
粒子群算法是模擬鳥類迷失的一種進化計算方法[8],其數學模型為:設粒子群的搜索空間是D維,粒子個數為n,文中取n=30。 第i個粒子在搜索過程中最優解對應的表達式為P(i)=[P(i1),P(i2),…,P(iD)],其中設第g個粒子搜索過程中的最優位置P(g)為所有局部最優解P(i)(i=1,2,…,n)中的最優解[9];第i個粒子的速度V(i)=[V(i1),V(i2),…,V(iD)]。 每個粒子的速度和位置變化可以用下式表達:

其中,t為迭代次數, 文中取t=500;c1、c2為影響因子, 分別表示粒子和全局對它的影響程度,取值范圍通常為[0,2],文中取c1+c2=2;r1、r2用于避免陷入局部最優,是取值為[0,1]之間的隨機常數;w定義為慣性常數,作用是保持個體原有的屬性,其取值范圍為[0,1][2],文中取w=0.7。PSO算法中需對粒子的位置和速度設置合理范圍,當粒子迭代次數達到t或適應度值達到設定的要求時,停止迭代。
為了更準確地預測滾動軸承的剩余壽命,筆者以擅長處理時間序列的LSTM模型為基礎,構建滾動軸承剩余壽命預測模型。 與此同時,為了使預測模型與不同工況下的滾動軸承剩余壽命退化數據特征更加匹配, 筆者采用了PSO算法對LSTM模型進行優化,構建了PSO-LSTM模型,以獲得較優的參數組合。
模型首先將批處理大小和隱藏層單元數目在給定范圍內隨機初始化,以此作為LSTM模型的初始參數,通過劃分好的訓練數據和驗證數據分別對初始模型和訓練后的模型進行訓練和預測,并將預測結果的平均絕對百分比誤差作為適應度函數f。 適應度函數f的定義為:
所謂評估準則,是對評估基本準則和評估執業準則、職業道德準則的統稱。其中,評估基本準則由國務院有關評估行政管理部門組織制定,評估執業準則、職業道德準則由評估行業協會依據評估基本準則制定。本項規定還提出了評估專業人員 “勤勉謹慎從事業務”的要求,這也是中介服務行業立法通常會有的要求,其重要表現在于評估專業人員應當認真履行必要情況下的現場調查等調查職責,在獨立分析估算基礎上編制評估報告。

其中,y^m是第m個標簽值,ym是第m個預測值,N是樣本數量。
此時PSO算法中的粒子就對應于所優化的超參數,通過式(7)、(8)更新粒子的速度和位置,迭代尋優直至找到最優值。以最優超參數作為LSTM模型的批處理大小和隱藏層單元數目,從而完成LSTM模型的優化。再通過原數據集完成剩余壽命預測。 PSO算法優化LSTM的流程如圖2所示。

圖2 PSO算法優化LSTM的流程
實驗數據集采用PHM2012挑戰賽的滾動軸承數據集[4],該數據集包括3種不同工況下17個軸承的運行數據,每個軸承都包含水平和垂直兩個方向的振動加速度數據, 數據采樣間隔為10s,單次采樣時長為0.1s,采樣頻率為25.6kHz。 筆者分別采用訓練集和測試集的水平方向振動加速度數據展開實驗。
首先,根據原始數據提取時域特征,筆者綜合提取10個常用時域特征,分別為均值、峰值、偏斜度、均方根值、峰度、最大值、最小值、峰峰值、方差和標準差。 同時對時域特征進行最值歸一化。 將剩余壽命的模型設置為一元一次函數,把數據集中各全壽命數據的數據組數作為每個軸承的初始狀態剩余壽命值,隨著工作周期數的增加,剩余壽命值逐漸遞減,直至工作到最后一個周期時,軸承剩余壽命值減至零。 分別以此作為軸承各個周期的剩余使用壽命值。
將提取的時域特征作為LSTM的輸入, 根據PSO優化流程, 首先將數據劃分為訓練數據和測試數據, 訓練數據訓練需要優化的LSTM模型,訓練過程中,通過計算粒子適應度函數,同時更新粒子位置,以得到優化后的LSTM模型。 筆者采用Adam算法進行優化, 并使用多層LSTM堆疊的結構,首層LSTM在每個時間步輸出結果,將返回的時間序列輸入第2層LSTM, 該層只返回最后時間步結果,在LSTM層后添加全連接,使輸出的特征維度為一維。 為防止模型過擬合,在模型中加入了隨機丟棄層,丟棄概率設置為0.2。 筆者根據軸承壽命數據實際情況,設定批處理大小的取值范圍為[10,50],隱藏層單元數目的取值范圍為[50,100]。 在不同工況條件下分別選取了軸承1-1、2-1和3-1作為訓練數據, 訓練數據真實值與預測值對比如圖3a、c、e所示;選取軸承1-5、2-6和3-3作為測試數據進行測試,測試數據真實值與預測值對比如圖3b、d、f所示。 PSO優化后參數批處理大小為37,兩層隱藏層單元數目分別為72、83。
從圖3中可以看出,對于不同的軸承,該模型也可以對預設的軸承壽命曲線有較好的擬合效果,預測壽命在軸承退化后期,基本吻合軸承壽命曲線,也說明了模型對于復雜工況的適應性較好,訓練好的模型也有較好的普適性。

圖3 不同工況下的訓練和預測效果
與此同時,為了驗證模型的有效性,使用均方根誤差RMSE和相關指數R2作為評價預測性能的指標,以此對實驗進行結果分析,并將實驗結果與其他模型的最優效果進行對比。
均方根誤差公式如下:

從式(10)可以看出,RMSE可以反映預測值和真實值之間的偏差,但對于差值的正負不做區分,僅憑RMSE對預測效果進行評價不夠全面。 因此,對于各個模型預測結果與軸承剩余壽命曲線的擬合程度用相關指數R2來評估,R2的值在0~1之間,其值越大,表明模型擬合效果越好。 R2定義如下:


表1 PSO-LSTM與其他4種模型的預測性能對比
通過以上分析可以看出, 筆者采用的PSOLSTM模型在RMSE和R2評價指標上都取得了較好成績,對軸承壽命預測效果較好,尤其是軸承退化后期,預測值基本與實際值吻合,因此可以通過提取時域特征, 再將數據輸入到PSO-LSTM模型中進行預測以得到剩余壽命的預估值。
筆者針對滾動軸承剩余壽命預測,首先對數據集提取時域特征, 并將它作為LSTM網絡的輸入,為了使網絡模型與數據更契合,更加符合數據特點,同時采用PSO算法對LSTM網絡的批處理大小和隱藏層單元數目進行優化,再使用優化后的LSTM網絡模型進行訓練,最后實現軸承剩余壽命的預測工作。 通過實驗證明了該模型的可用性。