李 杰,孟凡熙,張子辰,朱 瑋
(長安大學電子與控制工程學院,陜西 西安 710064)
在飛機起動和起飛階段, 其排氣溫度(exhaust gas temperature,EGT) 和排氣溫度裕度(exhaust gas temperature margin, EGTM) 是一種與發動機狀態及性能強相關的氣路參數, 是航空發動機健康管理監測的重要參數之一[1-2]。 航空公司在實際運營中,通過監測及預測飛機EGTM 的變化情況, 了解飛機發動機的健康狀態, 對于發動機運行的安全性與經濟性具有重要意義。 隨著人工智能技術的發展,以大數據為基礎的深度學習算法在壽命預測方向的成功應用為EGTM 的預測提供了新的思路。 例如,Ding 等[3]提出了一種基于卷積神經網絡 (comvolutional nearal network,CNN)的鋰電池剩余使用壽命預測和健康管理方法,使用CNN 捕獲剩余信號中的預期成分,具有較好的預測穩定性。Miao 等[4]設計并建立了以長短期記憶網絡(long-short term memery,LSTM)為基礎的雙任務深長短時記憶網絡, 用于航空發動機退化評估和剩余使用壽命預測的聯合學習。 Ren[5]提出了一種基于改進CNN 和LSTM 的鋰電池壽命預測方法,來挖掘有限數據中的深層信息。
經驗模態分解 (empirical mode decomposition,EMD)[6-7]和CNN-LSTM 相融合的EGTM 預測方法,采用EMD 將原始EGTM 序列分解為多個固有模態分量和殘差分量, 從而從不同模態上, 進一步解釋了EGTM 信號的物理含義,將所得分量作為卷積長短期記憶網絡模型輸入,加深了神經網絡對EGTM 信號的理解。 為了驗證該方法的有效性,設計了多層感知機(multi-layer perceptron,MLP)、CNN、 循環神經網絡(recurrent neural network,RNN)、LSTM 和CNNLSTM作為競爭模型,對比驗證了所提出模型的性能。
EGTM 定義為航空發動機在海平面壓力以及拐點溫度條件下,全功率起飛時發動機排氣溫度(EGT)與EGT 最大值之間的差值TEGM計算方法為

式中:TEmax為發動機最大排氣溫度,℃,即發動機工作過程中,所容許出現的排氣溫度最大值,是該型發動機設計廠商給定的重要設計參數;TEa為發動機處于全功率狀態時的排氣溫度值,℃,當發動機處于起飛狀態時,應對其進行檢測,為反映發動機健康狀態的關鍵參數之一,即EGTM 包含了該型發動機在翼劣化程度的信息。
本文采用某航空公司的某型30 臺民航發動機在采樣頻率為200 個飛行循環(Cycle)下的EGTM歷史測量數據(同一測量環境)作為數據集,以評價所提出模型的性能。 本文將隨機選取的25 臺民航發動機的EGTM 數據作為訓練集(包含1 465 個工作點,飛行循環次數為1 465×200=293 000 次),剩余5 臺民航發動機的EGTM 數據作為測試集(包含291 個工作點,飛行循環次數為291×200=58 200 次)。
圖1 展示了該30 臺民航發動機的EGTM 數值的正態分布情況,由圖可知,數據整體符合以均值為70 ℃的正態分布(對稱分布),這將有利于訓練集和測試集的劃分。 值得注意的是,當民航發動機在下發一段時間后, 排氣溫度裕度處在以均值70 ℃為中心的[60 ℃,80 ℃]范圍內的點占比最高,可反映此時民航發動機處于穩定的工作狀態。 若當EGTM 值下降到60 ℃附近時,可說明該型民航發動機將由穩定工作區過渡到[50 ℃,60 ℃]的敏感工作區,此時可將60 ℃作為敏感點。若當EGTM的值持續下降時,[40 ℃,50 ℃]的點的數量出現了驟降情況, 這意味著該型民航發動機開始出現了不同程度的性能衰退現象, 即由敏感區域過渡到衰退區。

圖1 民航發動機EGTM 的數據分布Fig.1 Data distribution of EGTM of civil aviation engine
另外,處在[105 ℃,120 ℃]范圍內的點可作為航空發動機的出廠數據, 其幅值較大且占比最小,不能準確反映實際的工作狀態, 且處在30 ℃以下范圍內的點接近于失效狀態,即不在1%~99%范圍內的數據點參與訓練時,可能會導致預測模型在過擬合,對EGTM 預測的準確度產生較大影響,即考慮將其在后續模型的訓練過程中予以剔除。 同時,為了提升模型的收斂速度和模型精度,本文采用線性函數歸一化(max-min normalization)方法,將EGTM數值轉換為區間(0,1)內的小數。 歸一化方法如下

式中:X 為原始數據,x?為歸一化后的數據。
由于EGTM 數據和時間有著很高的依賴關系,這種依賴關系是處理時間序列的關鍵,所以需要選擇合適的時間窗口捕獲這些依賴關系。 在原始數據中通過滑動時間窗口來生成網絡輸入,從而生成大小為D@S 的樣本序列進行模型訓練,其中S 表示窗口寬度,D 表示數據特征維度(本文為1)。 假設第一個輸入的樣本序列可由S1=[x1,x2,…,xS]表示,當滑動時間窗口滑動L 步之后, 可得第2 個輸入樣本序列S2=[x1+L,x2+L,…,xS+L],其中xi∈R1×D。 若當訓練數據共有φ 個采樣點時,則可獲得(φ-S×L+1)個樣本序列。
在上述序列的構造基礎上,對每個輸入樣本序列添加相應的標簽。 設所需要預測的時間標簽的個數為N(N≥1),則S1的標簽可表示為y1=[xS+1,xS+2,…,xS+N],S2的標簽可表示為y2=[xS+L+1,xS+L+2,…,xS+L+N],不失一般性地可以為所有的樣本序列添加相應的標簽。 同時若需要預測某個時間段內的EGTM 時,則僅需要一個寬度為S,高度為D 的時間窗口大小的數據即可。
在本文中,為了能夠及時預測出EGTM 的變化趨勢,取滑動步長L(N 與L 代表相同的含義,只是為了方便表示)的長度為1,即實時預測相鄰時刻的EGTM 值,同時考慮到EGTM 的非線性,若S 取值較大時, 則樣本序列之間的相關程度會變得稀疏,容易使得CNN 丟失有用的信息; 因此S 的取值不宜過大。 經過多次試驗發現,當取S 取值為7 時,可滿足相關的實驗要求。
民航發動機EGTM 受到多方面因素的影響,例如發動機氣動核心部件的氣動效率,外界大氣溫度的變化等,表現出了非線性、波動性的特點。 非線性和波動性會直接影響EGTM 預測的準確性,因此需要對排氣溫度裕度數據進行初步處理。EMD 可以將具有非線性和非平穩性特點的原始信號序列,如EGTM 序列, 通過經驗識別分解為更為穩定的一系列內涵模態分量(intrinsic oscillatory mode,IMF)和一個殘差項(residual model,Res),其中殘差項可作為EGTM 變化的長期趨勢模態,即[6]

式中:X(t)為EGTM 原始序列;IMFi(t)為X(t)分解出來的第i 個IMF 分量;m 為IMF 分量數目,r(t)為殘差項;t 為序列的時間尺度,本文中t=15 min。 由于IMF 分量必須滿足兩個約束條件[6]:
1) 在整個時間序列上,IMF 分量的極值點和過零點的個數必須相等或相差不超過一個;
2) 任意時刻,IMF 分量的局部上、 下包絡線均值為0;因此所分解出的IMF 分量較為平穩,弱化了原始信號中包含的非線性和波動性成分,通過預測每個IMF 分量,可緩解EGTM 數據的非線性和波動性對預測結果的影響。
本文提出了一種基于CNN-LSTM 的深度融合模型用來建立EGTM 的IMF 分量預測模型,該網絡包括兩層卷積神經網絡和兩層長短期記憶網絡,其中每層卷積神經網絡均由卷積層和池化層組成,如圖2 所示。

圖2 CNN-LSTM 模型結構Fig.2 Structure of the CNN-LSTM model
圖2 所示模型首先利用CNN 強大的空間提取能力從IMF 分量的時間窗信息數據中提取出隱藏特征,實現數據的降維,以捕獲所提取特征中的重要信息,并且可有效抑制噪聲信號;其次,EGTM 的衰退過程是有關時間序列的, 所以將CNN 提取的重要特征通過全連接層拼接后作為LSTM 的輸入;隨后充分利用LSTM 的順序敏感性提取數據中的時間特征,即根據長短期記憶層中某一時刻的單元狀態和網絡輸出值,進行EGTM 有關時間的衰退特征的提取,建立EGTM 預測模型;最后將測試集放入模型中,實現對數據的擬合,輸出預測的EGTM 值。
融合模型中的長短期記憶網絡如圖3 所示。 首先, 細胞狀態中的信息通過遺忘門進行選擇性遺忘,即進行選擇性記憶;其次,新的信息通過輸入門選擇性地記錄到細胞狀態中;最后將前面的信息通過輸出門保存到隱層中去。

圖3 單個LSTM 單元的內部結構Fig.3 Internal structure of a single LSTM unit
在t 時刻,細胞狀態的更新過程如下[8-9]

式中:it為輸入門的計算結果;ft為遺忘門的計算結果;Ot為輸出門的計算結果;xt以及ht-1分別作為t時刻的輸入以及上一時刻的LSTM 輸出值, 且將兩者進行拼接, 作為t 時刻的輸入狀態;Wf、Wi、Wc和Wo分別對應遺忘門、 輸入門和輸出門的權值矩陣,bf、bi、bc和bc為相應的偏置矩陣;Ct-1為舊的細胞狀態,ft×Ct-1為遺忘門決定忘記的狀態信息,為新的候選值向量,Ct為更新后的細胞狀態(t 時刻細胞狀態);“×”表示兩個向量按元素相乘,σ(*)為sigmoid激活函數,th(*)為tanh 激活函數。
神經網絡的層數和各層神經元數目對訓練結果有重要影響,即訓練時間和訓練難度隨著神經網絡層數加深而增加,可能會出現過擬合問題,因此并不能依靠增加網絡層數和神經元數目來提高訓練結果。 經過多次實驗發現,建立如表1 所示的神經網絡時,可獲得最優結果。

表1 模型參數設置Tab.1 Parameter settings of the model
本文所有算法是在Python3.7 和PyCharm 2019上運行的,計算設備是Intel Core i5-8250U CPU,8 GB RAM 計算機。
選用平均絕對誤差(mean absolute error,MAE),均方根誤差(root mean square error,RMSE)以及擬合優度R2作為本文所提出算法的性能指標,對EGTM 的預測性能做評價。 其中MAE 和RMSE,R2分別衡量預測值與真實值之間的誤差,以及評價預測值與真實值之間預測擬合度,且定義MAE 為損失函數(Loss)。 MAE,RMSE 以及R2的計算方法為[10]

從MAE、RMSE 以及R2的表達式可知,當預測值與真實值越接近時,MAE,RMSE 的值越小,R2值越大,即誤差越小,擬合度越高,模型的準確度和精度越高。
EGMT 序列經過EMD 進行經驗模態分解后,得到8 個IMF 分量和1 個殘差項(Residual),如圖4 所示。 由圖4 可知,單臺發動機原始的EGTM 具有較為明顯的下降趨勢,但原始EGTM 數據仍然存在波動性和不穩定性。 經過EMD 分解后的殘差分量的趨勢與原始數據相符,且殘差分量具有較大的幅值,但相較于原始數據而言更加平滑穩定。 相較而言,IMFS 分量存在不同程度的波動,包含短期波動,如IMF1~IMF4 分量;中期波動,如IMF5~IMF6,短期波動,如IMF7~IMF8,且IMFS 分量具有較小的幅值, 這說明IMFS 分量代表了原始數據中的多種波動成分, 體現出原始數據的波動性。 由此可見,IMFS 分量決定了原始數據的波動性, 是原始數據不穩定的原因;殘差分量決定了原始數據的整體趨勢,是原始數據的主要組成部分。對IMFS 的精準預測有利于提高預測精度,而對殘差分量的精準預測是整體預測結果準確的關鍵。

圖4 EMD 分解結果Fig.4 The result of EMD decomposition
本節設計了MLP,CNN,RNN 和LSTM 等深度神經網絡模型作為競爭模型, 對比驗證所提出的EMD-CNN-LSTM 組合預測模型的精度和可靠性,同時為了驗證EMD 的貢獻, 考慮競爭模型在EMD作用下的預測性能。
圖5 展示了上述不同模型在訓練過程中的損失函數變化情況,其中橫坐標表示模型訓練過程中的迭代次數。

圖5 訓練過程中的loss 值變化Fig.5 Iterative trend of loss value during training
由圖5 可知,競爭模型的損失函數在迭代過程中存在不同程度的波動情況,這說明競爭模型在訓練過程中陷入了局部最優點。 而EMD-CNN-LSTM的損失函數在迭代過程中不存在波動情況,且保持較低的穩定值。
在上述訓練的基礎上,為了全面展示所提模型的性能, 隨機從測試集中選擇一臺發動機進行分析,結果如圖6 所示。 圖6 中展示了不同的深度神經網絡模型預測的EGTM 變化趨勢。 由圖6 可知,在EGTM 的早期預測時,所有模型均存在不同程度的波動, 導致其無法準確捕捉到EGTM 的變化趨勢,即敏感區域內EGTM 的準確預測的實際意義更大,這是因為敏感區域內的EGTM 較低,發動機會接近維修或者下發邊界,若能提前準確獲知隨后飛行循環中EGTM 的變化情況, 可為發動機及時維修、維護、飛行計劃制定提供技術依據。 在EGTM 處于敏感區域內時,競爭模型均不同程度地偏離真實值,CNN-LSTM 也出現了較為嚴重的超前預測或滯后預測情況,這說明原始數據的非線性和非平穩性對于EGTM 的準確預測具有嚴重的干擾作用。 在EMD的作用下,CNN-LSTM 的預測偏離有所改善,其在敏感區域內展示出了最好的精確度和穩定性。 測試集中的預測結果如表2 所示。

圖6 單一民航發動機的EGTM 預測Fig.6 EGTM prediction results of a single civil aviation engine

表2 實驗結果的比較Tab.2 Comparison of the experimental results
由表2 可知, 相較于MLP,CNN,RNN,LSTM,CNN-LSTM 等競爭模型,EMD-CNN-LSTM 的MAE分別下降了62.98%,48.40%,56.50%,47.28%,37.82% ;RMSE 分 別 下 降 了62.06% ,48.53% ,53.49%,44.44%,33.01%;R2分別上升了5.31%、2.59%,3.12%,1.95%,1.02%, 另外, 相較于EMDMLP,EMD-CNN,EMD-RNN,EMD-LSTM 等模型,EMD-CNN-LSTM 的MAE 分別下降了33.56%,37.01%,28.15%,20.49%;RMSE 分別下降了38.05%,29.29%,25.53%,24.29%;R2分別上升了1.22%,0.92%,0.71%,0.51%。 預測結果的誤差范圍在一定程度上可以反映預測結果的穩定性。
圖7 展示了模型在測試集下的預測誤差分布圖。

圖7 不同模型的預測誤差范圍比較Fig.7 Comparison of the prediction error ranges ofdifferent models
由圖7 的箱線圖可知,EMD-CNN-LSTM 的1%~99%的預測誤差落在[-4,4]范圍內,遠小于其他模型的分布范圍,且[-0.2,0.2]范圍內的誤差值占比最高,且更接近于0,同時并沒有出現異常點,這表明所提出的模型具有最佳的預測穩定性。
為了驗證所提出模型的單點預測性能,本文對測試集的EGTM 預測值和EGTM 真實值通過回歸函數進行線性回歸分析, 回歸函數可以表示由式(13)所示。

其中:Y 為預測值;T 為真實值;θ 和b 分別為最佳線性回歸直線的截距和斜率。
由回歸函數的定義式可知,在理想條件下,5 臺發動機的所有預測值完全等于其真實值時,回歸曲線是一條斜率為1,截距為0 的直線。同時為了進一步強化回歸的可靠性,引入R(皮爾遜相關系數)表示所提模型的EGTM 預測趨勢與實際的EGTM 變化趨勢的相關性,R 值越大相關性越強。
由表3 統計的回歸參數可知, 相較于競爭模型,所提模型的R 具有最大值,這說明,所提模型的EGTM 預測趨勢與實際的EGTM 變化趨勢具有較強的相關性,即融合模型對于EGTM 的變化趨勢具有較好的跟隨性。 同時結合斜率θ 和截距b 的指標進一步分析可知,所提出模型的回歸直線最接近于理想狀態,即擬合效果最優。

表3 擬合分析的參數比較Tab.3 Parameter comparison of fitting analysis
1) EMD 使得神經網絡實現了對EGTM 時間序列在不同模態上的深入理解,全面提升了神經網絡的預測效果。 CNN 和LSTM 兩者融合可實現數據的深度挖掘,從而提升了EGTM 預測的準確度、穩定性。
2) 當EGTM 處于敏感區域時, 競爭模型的預測值與真實值出現了較大的偏差,即出現了較為嚴重的滯后或超前預測,而EMD-CNN-LSTM 仍能保持較好的預測精度及穩定性。 這表明了所提出的融合神經網絡在EGTM 預測中具有較好的適用性。