苗青林,張曉豐,高楊軍,劉顯光,秦丕勝
(空軍工程大學裝備管理與無人機工程學院,西安,710051)
隨著傳感技術和監測技術的發展,航空發動機剩余使用壽命(remaining useful life, RUL)預測[1-2]也采用了大量傳感器。但各傳感器數據間具有強耦合、非線性關聯的關系,致使傳統預測方法難以準確預測航空發動機RUL。
近年來,隨著機器學習的發展,基于數據驅動的航空發動機RUL預測方法受到廣泛關注,依靠機器學習算法的航空發動機RUL預測方法成為主流發展趨勢。人工神經網絡(artificial neural network, ANN)[3]、循環神經網絡(recurrent neural network, RNN)[4-5]、長短期記憶神經網絡(long short-term memory, LSTM)[6-9]、多目標深層信念網絡集成方法(multi objective deep belief network integration ensemble, MODBNE)[10]、相關向量機(relevance vector machine,RVM)融合的時間序列預測方法[11]、支持向量機(support vector machines, SVM)算法[12]等在航空發動機RUL預測中得到了一定的應用,這些方法克服了傳統預測的局限性,預測精度有所提高。
卷積神經網絡(convolutional neural networks, CNN)是具有卷積計算且有深度結構的前饋神經網絡,被廣泛應用于圖像處理領域。近年來,許多學者將航空發動機傳感器數據看成RGB通道為1的圖像,使用CNN預測RUL[13-14],在C-MAPSS數據集上實驗,結果表明CNN較現有算法在預測準確度上有所提升,但其仍將航空發動機壽命衰減過程看作一個線性過程,沒有將航空發動機壽命狀態進行分類,即健康狀態(未發生壽命衰減)和壽命衰減狀態,導致預測仍存在較大的誤差。
為進一步提高算法精度,降低預測誤差,本文提出了一種基于雙通道的深度卷積神經網絡(two-channel deep convolutional neural network, TCDCNN)方法,用來預測航空發動機剩余使用壽命。方法整體框架如圖1所示。

圖1 整體框架
本文采用由NASA提供的C-MAPSS數據集[1],包括FD001~FD004四個子集,每個子集分為訓練集和測試集。每個子集的訓練集軌跡數量、測試集軌跡數量、工作條件數量和故障模式數量如表1所示。

表1 數據集詳情
表1中FD001和FD002中故障模式為高壓壓氣機(high pressure compressor,HPC)衰退,FD003和FD004中故障模式為HPC衰退和風扇衰退。
每個訓練集和測試集中的數據包括航空發動機id、時間步c、3個航空發動機設置和21個航空發動機傳感器數據。
訓練集中每個航空發動機的總壽命s1id為該發動機c的最大值,如式(1)所示:
(1)
測試集中每個航空發動機的總壽命s2id是該航空發動機c的最大值加上測試停止時的true_RULid(式中簡寫為RT),如式(2)所示:
(2)
以FD001為例,得到了每個航空發動機總壽命后,用總壽命減c得到剩余使用壽命RUL(式中簡寫為R),如式(3)所示:
(3)
由于傳感器種類眾多、數據集中、數據維度大,為提高算法效率,需要對數據進行降維,各傳感器(sensor)描述如表2所示[14]。
最大信息系數(maximal information coefficient,MIC)是用于檢測變量之間的關聯程度的度量標準,范圍為0~1,計算各個傳感器數據與RUL的MIC值[15],得到傳感器s1、s5、s6、s10、s14、s16、s18和s19的MIC值為0,說明上述傳感器數據并不影響RUL預測,可以刪除該傳感器數據。

表2 傳感器描述
使用存在噪聲的數據對網絡進行訓練,得到網絡模型的預測結果誤差較大。進行數據降噪時應保證降噪前后的數據量不變,本文采用卡爾曼濾波方法對數據進行降噪。
卡爾曼濾波是采用卡爾曼增益修正狀態觀測值,以逼近真實值,通常用來去除噪聲來還原真實數據,在軌跡預測、制導和導航等領域有較好的應用。
對降噪后的數據進行歸一化處理,將數據映射到0~1范圍內。
卷積神經網絡輸入的數據通常為矩形數據,本文采用的數據集由多個多元時間序列組成,所以需要數據重構,使其形成矩陣數據。
假設原數據大小為x×y,采用數據切片大小為l×y,滑動步長為1,掃描操作之后得到(x-l+1)個l×y的數據片,數據片可以看成1張大小為l×y的灰色圖像,RGB通道為1。
以FD001中id為1的數據為例,數據的大小為192×18,采用30×18的切片進行數據提取,滑動步長為1,過程如圖2所示。
圖2中灰色矩形為掃描窗口,從數據的最上方開始掃描,然后矩陣向下移一行,依次類推。數據重構之后共獲得163個30×18大小的數據片。

圖2 數據切片過程
對每個數據片設置標簽,標簽為該數據片的最后一次循環的RUL,一共有163個數據片,對應數據標簽為0~162。FD001~FD004的數據切片大小分別30×18,20×18,30×18,20×18。
現有CNN算法[13-14]中的壽命衰減過程考慮不夠全面,沒有判斷壽命衰減起始點位置方法,導致預測誤差較高。Shi首次將壽命衰減起始點判斷方法加入Dual-LSTM算法,利用LSTM進行退化分析和RUL預測[15],優點是去除對固定變化點的假設,逐單元檢測變化點,并在C-MAPSS數據集上驗證了該方法的有效性。本文嘗試在CNN中加入分段和線性RUL衰減模型和RUL衰減起始點判斷方法以取得更準確的預測結果。
本文使用的壽命衰減模型如圖3所示。

圖3 改進后的壽命衰減模型
圖3中改進的壽命衰減模型中有2種不同的衰減模型,包括線性衰減模型和分段衰減模型。通過RUL衰減起始點來判斷該航空發動機RUL衰減模型。
在測試集中,若RUL大于或等于訓練集中的最大壽命時,則說明測試開始的一段時間內航空發動機壽命未衰減,此時,壽命衰減起始點為RUL等于s1id的點,對應分段RUL衰減模型。當RUL大于s1id時,RUL置為最高壽命,如式(4)所示:
(4)
若RUL一直小于訓練集中的最大壽命,此時,壽命衰減起始點即為測試起始點,對應線性RUL衰減模型。
本文將每次訓練的壽命衰減模型保留并作為下一次訓練的初始模型進行訓練,繼承訓練結果。圖4為訓練過程流程圖。

圖4 訓練過程流程圖
本文采用卷積神經網絡對時間序列數據進行預測,以FD001為例,重構后的數據片為:
(5)
卷積運算是利用卷積核對數據進行特征提取,采用共享網絡權值的方法降低了網絡復雜度,提升訓練速度。若采用卷積核u,大小為k×1。
u=(u1,u2,…,uK)
(6)
若該卷積核提取的數據為p,大小為1×k。
p=(ai,j,ai+1,j,…,ai+k-1,j)T
(7)
卷積結果為:
Ci=φ(up-b)
(8)
式中:φ為激活函數,一般采用非線性函數;b為偏置;p為感受野,長度為k,經過多層卷積,將結果輸入到全連接層,得到結果與真實值差值,采用梯度下降算法更新網絡權值。
本文使用卷積神經網絡分為7層(包括5個卷積層,2個全連接層),深度卷積神經網絡結構如圖5所示。本文選擇2種卷積核,大小分別為(10,1)和(3,1),池化層選擇最大池化,大小為(2,2),每層添加dropout()操作,防止產生過擬合。激活函數統一采用Relu()函數。

圖5 深度卷積神經網絡結構
本文采用雙通道網絡結構對不同的特征進行訓練,采用壽命衰減起始點判斷方法對2種壽命衰減過程進行區分,將壽命衰減前、壽命衰減中2種特征作為雙通道網絡模型的輸入。相較于單通道網絡模型,能保留更多數據,提高預測精度。雙通道網絡模型結構如圖6所示。

圖6 多通道網絡模型
按照前面的模型結構在Intel I7-10750H,2.6 GHz CPU,16 GiB RAM,NVIDA GEFORCE RTX 2070 GPU,Pytorch 1.81的環境下搭建CNN結構。
使用卡爾曼濾波對傳感器數據進行降噪,以train_FD004為例,降噪前的傳感器參數值如圖7(a)所示,降噪后的傳感器參數值如圖7(b)所示。


圖7 降噪前后train_FD004中傳感器參數值
對降噪后的數據進行重構,將重構后的train_FD001~FD004作為訓練集訓練網絡權值,將重構后的test_FD001~FD004作為測試集得到預測結果。
進行誤差分析時通常采用回歸評價標準均方根誤差(root mean square error, RMSE,公式中簡寫為ERMS),如式(9)所示:
(9)
相對預測誤差Err,如式(10)所示:
(10)
該評價標準很好地反映了觀測值同真實值之間的偏差,值越小就說明偏差越小。
此外,得分可以反映該模型超前或者滯后預測的程度,因此,在進行評價時,要將得分函數sf也作為評價標準之一。在RMSE相同時,得分函數越小,說明RUL預測結果偏向于預測值小于真實值,符合航空發動機RUL預測問題特性[14],單個預測結果的得分s的計算如式(11)所示,得分函數sf計算如式(12)所示:
(11)
(12)
式中:m為數據量;yi true為真實值;yi predict為預測值;t為該航空發動機總壽命。
將數據輸入到卷積神經網絡中訓練,迭代20次,并使用訓練后的數據進行預測,以數據集FD004為例,預測誤差分布直方圖(預測值-真實值)如圖8所示。

圖8 預測誤差直方圖
從預測誤差分布直方圖可以看出在數據集FD004中41 214條數據的預測誤差范圍在-20~10之間,其中大部分誤差小于0,表示本方法預測結果偏向于預測值小于真實值。在航空發動機壽命預測角度上,預測值小于真實值帶來的安全隱患較小,符合航空發動機壽命預測問題特性。
從test_FD004中隨機選取4個航空發動機作為測試樣本,降噪前預測值和真實值對比如圖9所示。降噪后預測值和真實值對比如圖10所示。




圖9 降噪前FD004中樣本航空發動機的預測結果




圖10 降噪后FD004中樣本航空發動機的預測結果
圖9和圖10中對比了降噪前后預測結果的差異,說明了降噪之后可以有效減少數據噪聲帶來的影響。預測開始時,誤差相對較大,是由于模型帶來的誤差,經過迭代,預測的誤差相對較小。
同理,對FD001和FD003數據進行預測,取5次實驗結果的平均值,數據集FD003的sf和ERMS指標和其他方法[15]的對比如表3所示。
數據集FD001和FD003的相關指標和其他算法[15]的對比如表4所示。
從表3中可以看出,數據量的大小不會引起兩項指標的大幅變化,分布比較均勻。
表4中pn表示預測相對誤差小于或等于n的樣本百分比,在樣本大小相同時,p5越大,預測表現越好。p5相等時,p10越大,預測表現越好,以此類推。
本方法在數據量較多時,預測結果明顯優于其他方法,當剩余周期次數大于20時,sf和ERMS兩項指標均優于其他方法,原因在于本方法預測結果偏向于預測值小于真實值,計算sf時較有優勢。符合航空發動機壽命預測問題特性,驗證了該方法在航空發動機RUL預測上具有顯著優勢。

表3 數據集FD003的評價結果對比

表4 數據集FD001和FD003的評價結果對比
本文針對航空發動機RUL難以準確預測的問題,提出了TCDCNN方法,通過對2種壽命衰減模型進行分類,實現C-MAPSS渦輪風扇發動機壽命退化數據的預測,并與其他算法的預測結果進行比較分析,驗證了該方法在測試數據范圍較大時,可以更加準確地判斷航空發動機壽命衰減起始點和RUL,進一步提高預測準確度。決策者可以根據預測結果,及時地做出有效的維修決策,防止剩余使用壽命浪費和因航空發動機故障而導致其他部件的損壞,以提高壽命利用率、降低維修成本和事故頻率。