李路云, 王海瑞, 朱貴富
(1.昆明理工大學信息工程與自動化學院,昆明,650500;2.昆明理工大學信息化建設管理中心,昆明,650500)
航空發動機是飛機的核心部件,它的健康狀況關系到飛機的安全性與經濟性,對它進行準確合理的預測性維護就相當重要。利用傳感器采集技術和先進智能技術對發動機的剩余壽命進行預測,就成了預測性維護工作中的關鍵一環。
隨著“大數據”時代的到來,數據驅動的方法逐漸成為剩余壽命預測的主流方法[1]。任子強等將多源傳感器數據融合成一維復合健康指標,再利用線性Wiener過程對一維復合健康指標進行退化建模[2]。雖然隨機退化模型有較強的可解釋性,但預測精度還有待提高。Li等采用SFS算法優化了SVR中的超參數,實現了滾動軸承的剩余壽命預測[3]。淺層機器學習難以充分提取設備的退化特征,在預測準確性和魯棒性方面,深度學習更具優勢[4]。為獲得更高的預測精度,馬忠等利用改進的CNN對航空發動機的剩余壽命進行預測[5]。Kong等提出了一種DCNN與LSTM相結合的方法,同時使用貝葉斯優化算法對兩個網絡的超參數進行優化,有效提高了鋰離子電池的剩余壽命預測精度[6]。以上方法雖然獲得了較好的預測效果,但并未對預測中的不確定性進行量化。航空發動機工作環境復雜,采集到的退化數據不可避免地會受到噪聲的污染,為使預測結果更接近現實,應對預測中的不確定性進行量化[7]。Sun等將MC Dropout技術應用于多尺度卷積神經網絡中,實現了滾動軸承剩余壽命的區間預測[8]。該方法有效量化了滾動軸承剩余壽命預測中的不確定性,但這種不確定性依賴于網絡結構,無法保證預測結果的可靠性。李浩等利用SAE構造健康指標,將提取后的健康指標放入基于BiLSTM構建的DeepAR模型中進行剩余壽命預測[9]。該方法實現了發動機剩余壽命的區間預測,但是通過SAE構造的健康指標依然存在可解釋性差的弊端。
利用深度學習進行壽命預測可獲得較高的預測精度,但通過模型構造的健康指標和模型的可解釋性成了一個巨大的挑戰[10]。數理統計的方法可解釋性強,但處理大數據的能力還有待提高。于是,專家們開始提出一種將深度學習與數理統計相結合的剩余壽命預測方法。Liu等利用PCA提取隱藏在原始傳感器數據中的關鍵特征,再構建一個由Wiener 過程、LSTM、XGBoost等構成的動態多階段組合預測模型實現對航空發動機的剩余壽命預測[11]。彭開香等采用DBN構造健康指標,再利用HMM模型實現對航空發動機的剩余壽命預測[12]。以上兩種方法結合了深度學習和數理統計兩者的優點,互相彌補彼此的不足,但這樣的結合仍然存在兩大缺陷:一是利用深度學習模型構造的健康指標可解釋性差;二是提取的健康指標和隨機模型是否匹配也是一個需要解決的問題[13]。
基于以上分析,本文提出一種融合數理統計與深度學習的新型航空發動機剩余壽命預測方法。一方面,利用Wiener過程建立退化模型,將模型預測壽命和真實壽命之間的偏差作為優化目標函數,形成復合健康指標提取與隨機退化建模的反饋閉環,經過多次優化調整得到融合系數的最優解,再利用融合系數的最優解將多源傳感器數據進行加權融合,構造一個解釋性強的一維復合健康指標[13]。另一方面,利用一維復合健康指標和Bootstrap方法構建n個基于GRU的集成回歸模型和1個基于GRU的預測誤差模型,最終得到航空發動機剩余壽命的區間預測,有效解決了深度學習模型中預測結果不確定性難以量化的問題,為實際工程問題提供了一種新的解決思路。
航空發動機是一種復雜的大型機械設備,僅依靠單一傳感器監測數據并不能全面有效地表征發動機的健康狀態,需要將多源傳感器監測數據進行融合,充分提取所有監測數據中的退化特征,從而準確預測發動機的剩余壽命[14]。本實驗選用的訓練集包含100個發動機從開始運行至失效的完整狀態數據,測試集包含100個發動機失效前某一段時間內的非完整監測數據。每個發動機的退化數據都是由21維傳感器監測得到的,這些退化數據具有大規模、高維度、非完整的特點。為充分提取所有監測數據中的退化特征,本文參考和借鑒文獻[13]的方法,將能夠體現發動機退化趨勢的14維傳感器數據進行加權融合,構造一個可解釋性強的健康指標。
1.1.1 多源傳感器數據加權融合
利用式(1)構造一維復合健康指標:
(1)
式中:S為傳感器的個數;ωb為第b個傳感器數據的融合系數;xm,b(t)表示第m個發動機的第b個傳感器在t時刻采集到的退化數據。
第m個發動機對應的監測時間記作tm,則復合健康指標對應的觀測數據記作fm,如式(2)、式(3)所示。
tm={tm,0,tm,1,tm,2,…,tm,Km}
(2)
fm={fm,0,fm,1,fm,2,…,fm,km}
(3)
式中:fm,k=Fm(tm,k),k=0,1,2,…,Km;Km為第m個發動機的監測數據個數,Δt=tm,k-tm,k-1。
1.1.2 利用Wiener過程退化建模
利用線性Wiener過程對復合健康指標進行建模。模型描述如下:
Fm(t)=fm,0+λmt+σmB(t)
(4)
式中:fm,0為第m個發動機在tm,0=0時刻的初始退化量;λm為漂移系數,反應了第m個發動機的退化率;σm為第m個發動機的擴散系數,刻畫退化過程的隨機不確定性;B(t)為反映退化過程時變隨機性的標準Brownian運動。
1.1.3 求解融合系數
構建如下式所示表征預測效果的優化目標函數:
(5)

{W*,ν*}=minJ(W,ν)
(6)
通過最小化J(W,ν)可得到最優解{W*,ν*},本文利用擬牛頓法對式(6)進行多維搜索求解,具體求解過程如圖1所示。

圖1 多源傳感器數據融合過程
1.1.4 健康指標的評估
為證明加權融合方法構造的健康指標優于其他方法構造的健康指標,本文采用Spearman相關系數評估發動機剩余壽命與健康指標之間的關聯程度。Spearman相關系數的絕對值越大,兩變量之間的關聯程度越強[15],Spearman相關系數的計算公式如下:
(7)

GRU網絡運行速度快、處理時序特征有較好的優勢,但無法量化壽命預測的不確定性,于是將它與Bootstrap方法進行結合,通過Bootstrap方法對最優復合健康指標進行重復抽樣來量化壽命預測的不確定性。與其他預測模型相比,這種組合方法不僅能獲得較高的預測精度,還能實現對航空發動機剩余壽命的單點預測和區間預測。
1.2.1 Bootstrap方法
Bootstrap是一種通過對傳感器監測數據進行重復抽樣來量化預測不確定性的方法,其基本思想是通過對原始樣本進行n次有放回抽樣,得到n個與原始樣本大小相等的Bootstrap樣本[16]。Bootstrap方法從理論上減少了預測值與真實值之間的偏差,適用于難于獲取區間估計的樣本預測[17]。
1.2.2 GRU
GRU[18]和LSTM[19]一樣,是為了解決RNN梯度消失問題而提出來的。GRU與LSTM的區別主要在于GRU的結構和參數比LSTM更簡單,運算效率更高效,GRU的結構如圖2所示,主要由重置門和更新門構成。

圖2 GRU的結構圖
計算公式如下:
(8)

1.2.3 構建GRU和Bootstrap方法的壽命預測模型
文獻[20]利用Bootstrap方法和二維DCNN實現了對滾動軸承的剩余壽命區間預測,本文參考此文獻方法,利用GRU和Bootstrap方法實現對航空發動機的剩余壽命區間預測(圖3)。

圖3 Bootstrap-GRU預測模型



步驟4利用Gn中的3個Bootstrap樣本分別訓練3個基于GRU的集成回歸模型。


(9)
(10)

步驟8采用式(11)近似求出模型預測誤差項的方差。
(11)

步驟10構建一個新的基于GRU的預測誤差模型完成對新數據集Gr2的訓練。


(12)
為解決深度學習方法在航空發動機剩余壽命預測中存在的弊端,提出一種多源傳感器數據加權融合與GRU相結合的剩余壽命預測方法。其核心步驟是:①通過直接觀察法挑選出能夠表征發動機退化趨勢的14維傳感器監測數據作為特征參數,對特征參數進行標準化和貼標簽處理;②利用Wiener過程構建一個反饋閉環回路,通過對優化目標函數進行搜索尋優,得到多源傳感器數據的融合系數,根據融合系數構造一維復合健康指標;③利用一維復合健康指標和Bootstrap方法構建3個基于GRU網絡的集成回歸模型和一個基于GRU網絡的預測誤差模型,根據模型預測結果計算得到發動機剩余壽命的預測區間;④采用均方根誤差和評分函數對預測結果進行評價。具體實施流程如圖4所示。

圖4 方法流程圖
為驗證本文所提方法的效果,選取C-MAPSS渦扇發動機退化數據集中的FD0001數據集進行實驗,該數據集包含訓練集、測試集,具體數據信息如表1所示[21]。

表1 FD0001數據集
本文選用均方根誤差和評分函數作為模型的性能度量指標[22]。
均方根誤差(RMSE,式中簡記RRMSE)的數學表達為:
(13)
評分函數(Score,式中簡記Sscore)表達式如式(14)、式(15)所示:
(14)
(15)


圖5 評價函數圖像
訓練集中1號發動機的21維傳感器監測到的數據如圖6所示,從圖6中可以看出,2、3、4、7、8、9、11、12、13、14、15、17、20、21號傳感器監測到的數據能夠反映渦扇發動機的退化趨勢,因此選擇以上14維傳感器監測到的數據作為模型的特征參數。





















圖6 1號發動機傳感器監測數據變化趨勢
利用Z-Score方法對特征參數進行標準化處理,計算式為:
(16)

再利用分段線性函數給標準化后的特征參數貼上標簽,分段點設置為130[23]。當發動機的剩余壽命大于等于130時,標簽值為130,當剩余壽命小于130時,標簽值依次遞減1。
根據1.1節中所提方法,求解得到訓練集的融合系數為{W*}={0.300 4,0.205 5,0.792 3,-0.401 2,0.200 5,-0.148 5,0.794 3,-0.608 6,-0.024 5,0.223 1,0.519 1,0.485 0,-0.239 2,-0.414 5},利用求解得到的融合系數,將處理好的訓練集和測試集數據進行加權融合構造一維復合健康指標。訓練集中1號發動機構造的一維復合健康指標如圖7所示。

圖7 1號發動機一維復合健康指標
本文選用Spearman相關系數來評估一維復合健康指標的優劣,對比了LSTM、t-SNE、1D-CNN和加權融合的方法(見表2),結果證明利用加強融合方法構造的健康指標能更好地提取發動機的深層退化特征。

表2 健康指標對比
參數見表3。

表3 GRU網絡主要參數
圖8給出的是模型預測誤差(預測壽命-真實壽命)的分布情況,從圖8中可以看出,預測誤差在(-10,0]的發動機數量是最多的,超前預測的發動機數量和滯后預測的發動機數量近似相等。

圖8 誤差分布直方圖
圖9中,隨機展示了8號、49號、12號和100號測試集發動機剩余壽命的點估計和區間估計。從圖9中可以看出,在發動機的整個退化過程中,不論是真實的退化過程還是模型預測的退化過程都在90%的置信區間。




圖9 測試集中的單個發動機剩余壽命預測結果
圖10為100個測試集發動機的剩余壽命預測結果,為便于觀察,按照圖10中發動機真實剩余壽命的大小進行升序排序,可得如圖11所示的預測結果。

圖10 測試集發動機剩余壽命預測結果
從圖11中,可以更加直觀地看到,本文所提方法獲得的預測結果與發動機的真實剩余使用壽命比較貼近,且測試集中100個發動機的真實剩余壽命和預測剩余壽命都在90%的置信區間。

圖11 測試集發動機剩余壽命預測結果排序
為了證明本文所提方法的性能,進行如下對比,結果見表4。

表4 對比結果
從表4中可以看出,與傳統機器學習方法、單一深度學習網絡、混合深度學習網絡和其他深度學習與數理統計的組合方法對比,本文所提方法預測效果較好;與LSTM網絡對比,兩者預測效果近似,但GRU網絡的運行時長縮短了124 s,有較高的運行效率。此外,若不使用加權融合的方法構造一維復合健康指標,而是選擇直接將預處理好的14維傳感器特征參數放入GRU模型中進行剩余壽命預測,這樣做預測效果非但沒有本文所提方法好,而且會因為數據維度多導致訓練時長增加。
針對深度學習模型在剩余壽命預測領域中存在的一些問題,本文提出了一種基于數據融合與GRU的航空發動機剩余壽命預測方法,選擇C-MAPSS渦扇發動機退化數據集進行實驗驗證,得出如下結論。
1)通過加權融合方法構造的一維復合健康指標不僅能夠很好地映射發動機的退化過程,還能實現數據的降維,減少時間復雜度和空間復雜度。與其他方式相比,該方法構造的一維復合健康指標不僅具有可解釋性強的優點,還能更加充分地提取發動機的退化特征。
2)利用GRU網絡建立剩余壽命預測模型,不僅能獲得較好的預測效果,還能大大提高網絡的訓練效率;將GRU與Bootstrap方法結合起來成功量化了剩余壽命預測中存在的不確定性。
3)深度學習與數理統計的組合方法不僅能獲得較高的預測精度,還能有效解決深度學習在渦扇發動機剩余壽命預測中的弊端,為渦扇發動機制定維修策略提供有力幫助。