王奕首,余映紅,卿新林,殷 鍇,趙 奇
(1.廈門大學航空航天學院,福建廈門361102;2.中國商用航空發動機有限責任公司,上海200241)
航空發動機健康管理(Engine Health Moni-toring,EHM)是利用分布在發動機上的傳感器所獲得的數據,借助各種先進智能算法來監控、預測和管理發動機的健康狀態[1],以提高飛行安全性和可靠性,縮短發動機停機時間,提高運行效率,并減少發動機維修費用[2]。氣路監控是EHM的核心[3]。其中,航空發動機排氣溫度(Exhaust Gas Temperature,EGT)是反映發動機工作狀況的重要氣路參數,在發動機起動和飛機起飛階段,通過監控該參數值來保護發動機,防止發生意外事故。如果EGT超過規定值,就可能是燃燒室、渦輪葉片和尾噴管等發動機部件出現了異常,所以建立發動機排氣溫度基線具有重要意義。
由于航空發動機工作過程復雜,所處的環境惡劣,基于回歸分析求解具體基線方程的方法無法實時滿足任意1組輸入和輸出的定量描述要求。隨著人工智能的快速發展,神經網絡為解決這種不確定輸入和輸出描述提供了可能[4]。國內外學者在人工神經網絡基線建模領域取得了眾多研究成果。付金華等[4]以CFM56-5B發動機為例,使用NeuroSolutions6軟件實現RBF神經網絡算法,并建立EGT、燃油流量(Fuel Flow,FF)和高壓轉子轉速(High-Pressure Rotor,N2)健康基線;彭云飛[5]采用基于回歸分析的方法挖掘出廠家監控系統內的基線庫,并提出基于過程神經網絡(Process Neural Network,PNN)的發動機氣路狀態參數預測方法;王珃[6]利用遺傳算法優化的反向傳播(Back Propagation,BP)神經網絡分別求解CFM56-7B發動機的狀態參數的基線模型。神經網絡已廣泛應用于回歸預測領域,但由于神經網絡理論上的缺陷,使得神經網絡模型存在一些不可避免的缺陷,例如:網絡中心較難確定;網絡結構容易受到局部極值的影響等[7]。為了從理論上克服傳統神經網絡的缺點,學者們提出了許多深度學習的方法,如自編碼器(Auto-Encoder,AE)[8]、深度置信網絡 (Deep Belief Network,DBN)[9]、卷積神經網絡(Convolutional Neural Networks,CNN)[10]、循環神經網絡 (Recurrent Neural Net-works,RNN)[11]等模型。其中深度置信網絡是應用最廣的算法之一,近幾年,在語音識別[12-13]、圖像處理[14]、故障分類[15-16]等研究領域得到廣泛應用。
在發動機EGT基線模型建立過程中,發動機EGT值的變化受眾多參數影響,各參數與EGT的相關程度各不相同,并呈現出復雜的非線性關系。因此,在利用深度置信網絡建立發動機EGT基線模型時需要預先對非線性高維特征樣本數據進行特征提取,來解決輸入數據的維度災難問題,簡化網絡結構。數據降維一般采取主成分分析法(Principle Component Analysis,PCA),但PCA處理非線性問題的效果并不理想[17]。因此采取將PCA與核方法有機融合形成核主成分分析(Kernel Principle Component Analysis,KPCA),不僅可解決非線性特征提取問題,而且能蘊含更多的信息。
為解決高維數據非線性特征提取以及數據特征中隱含信息挖掘的問題[18],本文提出1種基于核主成分分析(KPCA)和深度置信網絡(DBN)相結合的建模技術,構建CFM56-7B發動機EGT基線模型。
KPCA法首先通過非線性映射函數φ(x):x→φ(x),RN→Z,將樣本數據 x1,x2,…,xn∈RN映射到高維空間Z:φ(x)中,學習算法在轉換的高維空間Z中進行。根據核函數技術有

式中:K(xi,yi)為核函數;xi和 xj∈RN。
KPCA原理如圖1所示。本文選用高斯核函數作為KPCA的核函數。

圖1KPCA原理
深度置信網絡DBN是由若干層受限玻爾茲曼機(Restricted Boltzmann Machines,RBM)和 1層反向傳播網絡組成的1種深層神經網絡。其中,每層RBM由1個可視層v和1個隱含層h組成,節點間的連接只存在于層與層之間,a和b分別為可見層和隱含層神經元的偏置,w為可見層和隱含層各神經元之間的權重連接。其結構如圖2所示。

圖2RBM網絡結構
受限玻爾茲曼機可以看作是1個編碼和解碼的過程,從可見層到隱藏層是編碼,而反過來從隱藏層到可見層是解碼。令f和d分別代表編碼函數與解碼函數。則有

式中:af和bd分別為編碼器和解碼器偏置向量;Wf為可見層和隱含層神經元之間的權重連接;wd為隱含層和可見層神經元之間的權重連接。
RBM的作用是實現數據重構,使輸入數據與輸出數據的誤差盡可能達到最小,RBM一般采用對數損失函數,即期望對下式最小化

式中:P(v(i))為可見層第i個神經元被激活的概率。
KPCA降維后的數據經多層RBM實現數據重構后,還未具備預測功能,還需在最后1個RBM的輸出處添加回歸層,構成深度置信網絡。其結構如圖3所示。
從圖中可見,DBN網絡結構的參數主要包括RBM層數、輸入層節點數、隱含層節點數以及輸出層節點數等。
深度置信網絡訓練過程主要分成2部分:(1)利用無監督的學習對每層RBM進行預訓練;(2)全網絡自上而下的權值微調。在RBM的訓練過程中,只能保證本層的特征向量達到最優,無法保證整個深度置信網絡的特征向量達到最優,因此在DBN的最后1層設置BP網絡,微調整個DBN網絡,使DBN克服了BP網絡因隨機初始化權值參數而容易陷入局部最優的缺點[19]。

圖3DBN網絡結構
基于KPCA非線性特征提取的深度置信網絡DBN如圖4所示。模型的建立步驟如下:
(1)分析并確定與EGT相關的數據作為自變量X;
(2)對自變量X進行數據預處理及標準化處理;
(3)對自變量X進行KPCA降維,根據累計貢獻率[20]確定主成分個數;
(4)將降維數據輸入到深度置信網絡模型;
(5)訓練模型,直至達到誤差要求。

圖4KPCA-DBN混合模型
民用飛機在運行過程中各系統產生的快速存取(Quick Access Recorder,QAR)數據主要包括發動機、飛行控制、液壓控制以及環境控制等4個系統的大量重要狀態參數。除排氣溫度EGT外,QAR數據還包括燃油流量 FF、飛行高度(Altitude,ALT)、大氣總溫(Total Air Temperature,TAT)、滑油量(Oil Quality,OILQ)、滑油壓力(Oil Pressure,OILP)、滑油溫度(Oil Temperature,OILT)、 高 壓 轉 速 N2、 低 壓 轉 速(Low-Pressure Rotor,N1)、 燃 油 計 量 活 門(Fuel Metering Valve,FMV)、高壓壓氣機出口壓力(High pressure compressor delivery pressure,P3)、高壓壓氣機出口溫度(High pressure compressor delivery temperature,T3)、低壓壓氣機進口溫度(Low pressure compressor inlet temperature,T2.5)、低壓壓氣機出口溫度(Low pressure compressor delivery temperature,T2)、馬赫數(Mach,MA)、可調靜子葉片(Variable Stator Vane,VSV)等與EGT相關的參數。利用與EGT相關的重要參數建立EGT基線模型,令
X=[FF,ALT,TAT,OILQ,OILP,OILT,N2,N1,FMV,P3,T3,T2.5,T2,MA,VSV]
X經KPCA降維后的向量設為X',則可得

式中:f為X'和TEG的非線性函數,用于表征X'和TEG之間的非線性關系。
數據預處理主要是先對數據進行野點剔除,然后再進行參數修正。發動機各參數的測量值與發動機進氣道的溫度和壓力條件密切相關,進氣道溫度和壓力的變化與氣路參數值的變化是互相耦合的,為了能在不同條件下比較傳感器測量值,首先要對參數值進行修正。
對于給定的氣路參數k,其等效修正參數表示為k'。進氣道入口條件(如溫度T1和壓力P1)的變化,會導致氣路下游參數的變化。修正參數k'的目的是給出1個不隨入口條件變化的固定近似值,也就是說k'代表在某個固定入口條件下的值。通常是選擇1個標準天氣條件(即 T0=288.15 K,P0=101.325 kPa)作為基準,采用的修正式[21]為

式中:a和b為相應的系數;T1為氣路入口溫度;P1為氣路入口壓力。
若定義2個無量綱參數θ=T1/T0,δ=P1/P0,則可推導出k'的修正公式[20]

經過上述修正公式處理,轉子轉速N、燃油流量FF、溫度T和壓力P的修正系數和計算公式見表1。

表1 發動機參數的修正公式及系數取值
本文采用基于核主成分分析(KPCA)和深度置信網絡(DBN)相結合的建模技術構建航空發動機EGT基線模型,主要步驟如下:
(1)選取與EGT值相關的QAR數據X,并進行野點剔除和參數修正,作為輸入向量矩陣;
(2)將輸入向量X通過核主成分分析降維,根據主成分的累計貢獻率確定降維向量,將降維后的向量矩陣X'作為深度置信網絡的輸入;
(3)構建深度置信網絡的訓練樣本矩陣和預測樣本矩陣;
(4)構建深度置信網絡結構,確定RBM層數和層間節點數;
(5)把訓練樣本輸入到深度置信網絡中,先自下向上訓練DBN中所有的RBM,得出權值W和偏置值 b和 c;
(6)把訓練得出的參數輸入到頂層BP神經網絡中進行反向優化訓練,得到最終的深度置信網絡模型;
(7)輸入預測樣本矩陣,確定模型精度,檢測模型效果,如果沒有達到誤差要求,則返回第(3)步;
(8)得出診斷及預測結果。
具體建模流程如圖5所示。

圖5 EGT基線建模流程
在模型預測階段采用平均絕對誤差(Mean Absolute Error,MAE)值來表示模型的預測精度

式中:m為預測數據的樣本數;Xobs,j為實際觀測數據;Xpre,j為預測輸出數據。
平均絕對誤差表示預測值偏離期望值(真實值)的平均水平。平均絕對誤差值越大,說明該模型的預測值偏離期望值越遠,模型精度越低。為了能夠清晰展示本文所提出的改進DBN模型的優勢,以A320機型的民用飛機產生的QAR數據為例,給出了改進的DBN與傳統的DBN,以及與改進的BP神經網絡在預測效果上的對比結果和建模誤差趨勢。
目前各文獻中對DBN模型各參數的選擇還沒有較為明確的定義,因此本文采用試錯法確定DBN網絡的最佳參數。在DBN網絡訓練過程中,逐步增加隱藏層數,利用MAE值的大小來判斷隱藏層節點數對預測精度的影響,從而確定最佳隱藏層數和隱藏層節點數。具體過程如下:將RBM的層數分別設置為2、3和 4,隱含層的節點數設置為 10、15、20、25 和 30。在訓練每層RBM時的參數設置為:學習速率設為0.01,分組訓練設為20。經過反復訓練得到的最佳網絡結構的參數為:DBN模型的層數為4,輸入層的節點數為2,第1層隱藏層的節點數為10,第2層隱藏層的節點數為10,最后1層的節點數為1,RBM的學習速率為0.0001,迭代次數為250。
3.3.1 KPCA降維對預測精度的影響分析
輸入向量矩陣在DBN網絡訓練前需經KPCA降維以簡化網絡結構,提高模型精度。為確定降維后主成分數對預測精度的影響,分別將降維后的1、2、3、4維主成分作為深度置信網絡的輸入向量,建立EGT基線模型。KPCA降維對改進DBN模型預測精度的影響分析見表2。

表2 KPCA降維對改進DBN模型預測精度的影響
從表中可見,經非線性特征提取后,累計貢獻率[21]隨主成分數的增加而增加,1維主成分的累計貢獻率為90%,2、3、4維的累計貢獻率沒有明顯提高。以1維主成分作為DBN模型的輸入向量時,EGT基線模型的MAE值為0.6010,以2、3、4維主成分作為DBN模型的輸入向量時,EGT基線模型的MAE值顯著減小,基線模型精度顯著提高,但MAE值變化趨于平緩,因此,為了最大程度簡化網絡結構,提高模型精度,本文選取2維主成分作為深度置信網絡的輸入向量。降維后的前2維主成分為原始輸入向量的非線性特征表達,不具備任何參數意義。

圖6 KPCA-DBN網絡的預測結果和預測誤差對比
3.3.2 不同建模方法的預測精度比較
KPCA-DBN網絡的預測結果和預測誤差對比如圖6所示。本試驗包含1000個訓練樣本,500個預測樣本。從圖中可見,KPCA-DBN網絡預測效果穩定,和真實數據變化趨勢一致,預測曲線和真實曲線十分吻合,KPCA-DBN網絡的預測相對誤差為0.4349。
為了驗證本文所提出的KPCA-DBN模型的優越性,將該模型的預測結果與遺傳算法優化的BP神經網絡的預測結果相對比。同樣地,以與EGT值相關的QAR數據X作為GA-BP神經網絡和DBN網絡的輸入向量,分別建立EGT基線模型。傳統的GA-BP網絡與單一的DBN網絡模型的預測輸出對比以及預測相對誤差分別如圖7、8所示。幾種基線模型的精度對比見表3。

圖7 GA-BP網絡預測輸出對比及預測相對誤差

圖8 DBN網絡預測輸出對比及預測相對誤差

表3 不同基線模型的精度對比
傳統BP神經網絡由于網絡參數初始化的隨機性,導致模型的預測誤差較大。因此,本文利用遺傳算法(Genetic Algorithm,GA)優化BP神經網絡的初始權值和閾值,提高BP網絡的預測精度。從圖7(a)中可見,GA-BP網絡模型在數據拐點處(采樣點50、100、200、300處)預測效果較差。圖 7(b)是 GA-BP網絡的預測相對誤差,經過遺傳算法優化后的BP網絡的預測平均絕對誤差MAE為0.9068,遠大于DBN網絡和KPCA-DBN的預測平均絕對誤差MAE。
單一的DBN網絡模型由于沒有進行非線性特征提取預處理,在數據的頻繁波動區域波動頻繁區域(采樣點為350~400)和數據拐點變化處預測精度也不夠高,但是DBN網絡在數據拐點處的預測精度比GA-BP網絡的高。DBN網絡模型的平均絕對誤差值為0.6076。從圖6中可見KPCA-DBN混合模型在降維的同時并不會降低建模的精度。并且,經過非線性特征處理的DBN網絡建立的模型精度明顯高于其余2種建模方法,在數據頻繁波動區域和拐點變化處都能達到很好的預測效果。從表3中也可見,KPCA-DBN混合模型的MAE值明顯小于其它幾種模型的MAE值,表明KPCA-DBN模型在預測精度上具有一定優勢。當訓練樣本數據一定,預測數據量越多時,由于BP網絡和傳統的DBN網絡本身預測能力不足將導致BP網絡和傳統的DBN網絡累積的預測MAE值增長得比KPCA-DBN網絡的預測MAE值快。因此,當預測數據量日益增多時,KPCA-DBN網絡的基線模型優勢就越明顯。
本文以配裝CFM56-7B發動機飛機的QAR數據作為數據樣本,提出了1種基于核主成分分析和深度置信網絡的航空發動機EGT基線建模方法,得到如下結論:
(1)多維冗余的輸入數據會導致深度置信網絡結構復雜化,采用核主成分分析法進行降維處理并提取高維數據的非線性特征,輸入到深度置信網絡,可以簡化網絡結構,并提高模型精度;
(2)與傳統GA-BP網絡和單一的DBN網絡模型相比,本文提出的KPCA-DBN模型的預測精度最高;在后續研究中,還可從DBN網絡自身結構出發,優化網絡模型,融合其他算法,進一步提高模型精度。