胡啟國,白熊,杜春超
(重慶交通大學機電與車輛工程學院,重慶 400074)
航空發動機在正常運行中發生事故,會造成巨大的經濟與社會損失,為了保證航空發動機可靠、安全地運行,利用設備監測數據對其進行剩余壽命預測顯得尤為重要,可以為設備提前檢修提供參考依據。
眾多研究者對剩余壽命預測進行了深入研究。裴洪等總結和分析了基于機器學習的設備剩余壽命(Remaining Useful Life,簡稱RUL)預測方法,通過分析基于機器學習的剩余壽命模型理論和模型內部結構的層數,將其分為淺層機器學習和深度學習的方法;武博等提出利用主成分分析建立不同程度判斷標尺構建導彈筒壽命預測模型,實現對導彈筒的全周期壽命評估;杜方舟等基于航空發動機排氣溫度裕度數據,利用遺傳算法優化基于支持向量機的剩余壽命預測模型,最終擬合出的壽命曲線與原廠數據高度切合,得到較好的預測效果;高峰等通過多域特征量對數據集進行擴充,并搭建了長短時記憶(Long Shortterm Memory,簡稱LSTM)神經網絡壽命預測模型,最終利用C-MAPSS數據集驗證了該方法的可靠性;馬忠等通過改進卷積神經網絡(Convolutional Neural Networks,簡稱CNN)解決了航空發動機多狀態變量下的非線性特征導致剩余壽命預測困難的問題,結果表明改進CNN進行壽命預測的準確性得到顯著提高;牟含笑等提出基于深度置信網絡與BLSTM神經網絡的航空推進系統剩余壽命預測方法,該方法適用于時間序列的處理;李杰等等提出一種融合神經網絡的剩余壽命預測方法,該方法精度高且具有良好的魯棒性;車暢暢等將一維卷積神經網絡與BLSTM神經網絡混合模型運用到航空發動機的剩余壽命預測中,準確地預測壽命變化的結果,相較于單一使用BLSTM或CNN網絡模型的預測精度有所提高;曾慧潔等通過模型對樣本集正反序列的訓練學習,建立了BLSTM網絡模型來預測航空發動機故障,并將結果與其他神經網絡模型對比,表明雙向長短時記憶神經網絡預測精度更高;宋亞等提出了一種基于自動編碼器和雙向LSTM的混合模型來預測渦輪發動機的RUL,并獲得了比LSTM模型更好的預測結果。針對航空發動機壽命預測問題,國外E.L.Ntantis等總結了航空發動機故障與提前維修預測方法,對比了物理建模、人工神經網絡、貝葉斯神經網絡、CNN等多種方法,得出基于神經網絡的預測方法更加快速、準確;I.Remadna等考慮航空發動機退化數據特征提取困難的問題,利用CNN對復雜退化信息進行提取,再利用BLSTM神經網絡對航空發動機剩余壽命進行了預測,通過C-MAPSS數據集驗證了該方法;C.Ordó?ez等提出一種由差分自回歸移動模型與支持向量機組成的混合模型對航空發動機RUL進行預測,通過航空發動機數據集驗證了該模型,并取得不錯的預測效果。
雖然眾多研究者所提出的RUL模型都取得了不錯的預測效果,但大多研究者在預測時并未考慮數據間的非線性關系及多信息冗余問題導致模型訓練時學習過多產生不必要的信息而使得預測精度大打折扣的問題。
本文提出利用核主成分分析處理非線性數據的優越性,對多維退化性息進行融合降維;針對BLSTM神經網絡處理時間序列的能力提出一種基于KPCA-BLSTM神經網絡的航空發動機多信息融合剩余壽命預測模型,并利用C-MAPSS航空發動機數據集進行對比驗證,并與SVR、CNN、BLSTM神經網絡模型的預測結果進行對比。
航空發動機的退化過程是一個累積的過程,狀態變化不僅與當前時刻的監測信息有關,而且某個歷史時刻的信息也會影響設備的狀態變化。國內外研究者提出的LSTM神經網絡,相對于普通循環神經網絡(Recurrent Neural Networks,簡稱RNN),既可以更好地處理長時間序列的數據信息,又可以解決訓練過程中的梯度消失和梯度爆炸問題。


圖1 LSTM神經單元示意圖Fig.1 Schematic diagram of LSTM neural unit
LSTM模型通過使用由上一層輸出的h和當前時間輸入的x組成的輸入向量計算遺忘門f來控制存儲單元的狀態:

式中:W為輸入層的權重矩陣;b為偏置向量;(·)為激活函數,即sigmoid函數。


式中:W,b分別為狀態更新層的權重和偏差。
信息傳遞到輸出層后,網絡通過輸出門o控制更新狀態的輸出。

式中:W,b分別為輸出層的權重和偏差。
雙向LSTM神經網絡由LSTM層的兩個方向組成。在長時間序列的訓練過程中,可以從正反兩個方向捕獲整個序列的信息,具有比LSTM更高的性能。雙向LSTM結構如圖2所示。

圖2 雙向LSTM結構示意圖Fig.2 Schematic diagram of BLSTM structure
第一層LSTM結構計算當前輸入的正向序列信息,第二層LSTM結構反向計算相同的序列,兩層結構均存在相互獨立的隱含層。LSTM結構層間的隱含層輸出,不僅要傳遞給下一層的輸入層,而且通過雙向LSTM結構還需要傳遞給上一層的輸入結構中。在訓練過程中,通過對輸出單元的正反向傳播,完成對神經網絡的權重更新。
航空發動機在投入到生產使用過程中受到內部因素和外界環境的影響,其性能會發生退化,各項性能指標也會相應降低,直至失效完全失去工作能力。在實際試驗或運用中,會通過各種傳感器獲得這些設備的現場運行監測數據,這些數據可視為以設備運作為基礎的時間序列。
設一組設備的監測數據可表示為

式中:X為第臺設備的所有運行狀態監測數據集合。

式中:x為第臺設備的第個狀態監測變量的時間序列。


因此,與第臺監測設備的狀態數據相對應的剩余壽命集合表示為


基于以上思想,本文提出一種針對多狀態多維度退化特征的監測數據RUL預測模型,整體流程如圖3所示。

圖3 RUL預測模型流程圖Fig.3 RUL prediction model flowchart
由于整個模型的輸入為多狀態監測數據,首先進行數據預處理,并采用KPCA對預處理后的多維狀態數據進行融合降維;其次添加RUL標簽,按照時間窗大小對低維監測數據的時間序列進行劃分,并建立雙向LSTM深度學習網絡模型;然后分別設置批量(batch)從20開始,以10個批量為間隔數增加,根據每個迭代次數的平均損失函數與更改模型權重參數選取最佳批量,直至損失減小并趨于穩定;最后將測試數據導入模型進行驗證,通過評價模型判斷模型訓練的效果。
在進行預測之前,需要對多狀態監測數據進行預處理,為了使設備的真實值和預測值在訓練時表現出差異性,需要對數據集添加RUL標簽。退化過程是退化量累積的過程,在航空發動機運行初期,退化特征并不明顯,一段時間后設備能夠平穩運作,直到運行到某一階段,設備開始進入加速退化階段,并出現故障,因此采用分段線性模型進行預測,如圖4所示。

圖4 分段線性模型Fig.4 Piecewise linear model
為了消除傳感器參數范圍的差異,對每組傳感器監測的數據進行線性歸一化處理,使得處理后的參數值在[0,1]的范圍內。其表達式為

經過數據預處理后,采用KPCA進行降維,然后根據方差貢獻量選擇適當的維數。在模型訓練過程中,為了防止模型出現過擬合現象,在雙向LSTM層與全連接層中添加一個Dropout層,并且設置一定的丟棄率去掉隱含層部分輸出值,確保神經元在正向傳播中不被影響。根據時間步長對訓練集和測試集進行分割,并將分割后的訓練集輸入到雙向LSTM模型中。選擇均方誤差作為損失函數,其表達式為


利用同樣處理訓練集的方法對測試集進行數據處理,并輸入到訓練后的神經網絡模型中,輸出RUL預測值。為了定量評價模型預測能力,采用均方根誤差和非對稱評分函數作為評價依據。
均方根誤差可以反映預測誤差的大小,其表達式為

非對稱評分函數能夠通過判斷預測值是否大于或小于真實值而給出截然不同的計算結果,其中評分正比于誤差,其函數表達式為


本文采用C-MAPSS數據集進行仿真驗證,數據集由四個子集組成,包含6種不同的工作條件和4種故障形式,每個子集記錄了在不同工作條件和故障類型下航空發動機的健康狀況退化數據。CMAPSS數據集中包含的全部信息如表1所示。

表1 航空發動機監測數據Table 1 Aero engine monitoring data
選用FD003子集作為實驗數據集,FD003數據集包括3個工作條件參數:飛行高度,馬赫數和油門旋轉變壓器角度,它們可以組合成六個對發動機性能有重大影響的工作條件。數據還包括21個發動機傳感器,例如風扇入口處的壓力,燃燒器的燃料空氣比和旁路比。FD003的故障模式為HPC退化和風扇退化失效。
為了減小訓練模型的復雜度,增強其穩定性,選用KPCA對發動機高維數據進行降維,KPCA是一種常用的數據融合和維數約簡方法,即構造高維特征空間,把原始變量轉化為空間內積矩陣,并利用原始變量空間的核函數代替內積函數。為了確定目標降維量,將累計方差貢獻量作為目標降維量選取的標準,經計算得出各特征的方差貢獻量如圖5所示,前10維累計方差貢獻量達到0.95,由此選定10維作為目標降維量。

圖5 KPCA方差貢獻量Fig.5 KPCA variance contribution
經KPCA降維后,根據時間步長對訓練集和測試集的時間序列進行劃分。輸入模型的3D張量為(24 720,50,10)。在將數據輸入模型之前,需要設置模型的各種參數。模型參數直接影響模型的性能,選擇合適的神經網絡參數對模型的訓練成功與否起著至關重要的作用,經反復調試參數后,確定模型的主要參數,如表2所示。

表2 BLSTM神經網絡參數設置Table 2 BLSTM neural network parameter settings
將輸入模型的數據集以9∶1的比例劃分為訓練集和驗證集。設置“提前停止”的參數,如果在10個周期內驗證集的誤差無下降趨勢,則將停止訓練。利用驗證集(即100組發動機)驗證模型準確度,驗證結果如圖6所示,可以看出:預測值與真實值的擬合度較高,說明模型的預測效果較好。

圖6 模型預測結果Fig.6 Model prediction results
為了進一步驗證所建立模型的預測效果,對C-MAPSS數據集的FD003中1、9、24、35號發動機剩余壽命進行預測擬合,其中部分發動機數據擬合結果如圖7所示。


圖7 不同型號發動機預測對比Fig.7 Comparison of predictions for different types of engines
從圖7可以看出:無論發動機處于循環周期的前、中、后期,該模型得到的預測值和真實值的擬合程度都較為準確,預測值分布在真實值附近。由此可以得出本模型針對發動機這類復雜設備具有較高的預測精度,為提升發動機的可靠性和安全性提供了依據。
為了證明模型的準確度,選用FD003中1號發動機數據,分別搭建支持向量機回歸(SVR),CNN,LSTM以及BLSTM預測模型,并與KPCABLSTM預測結果相對比,對比結果如表3所示。

表3 多模型預測結果對比Table 3 Comparison of multi-model prediction results
從表3可以看出:KPCA-BLSTM模型在誤差和得分上均優于單個模型,三種深度學習模型預測結果優于傳統機器學習方法SVR;BLSTM比LSTM具有更好的性能,這表明BLSTM在處理較長時間序列時可以結合歷史和將來的信息來充分表征狀態監視數據的內部關系。
(1)利用KPCA對航空發動機多監測信息進行降維與融合,通過方差貢獻量判斷10維為最佳目標降維量,最終得到一個低維信息融合數據集。
(2)搭建了BLSTM神經網絡預測模型,利用經信息融合后的數據集對其進行訓練,最終模型預測值對真實值擬合程度較高,表明模型的預測效果較好。
(3)選取所提出的剩余壽命預測模型,將預測結果與SVR、CNN以及雙向LSTM預測模型進行對比,KPCA-BLSTM模型的均方根誤差與得分皆優于其他三種模型。