(海軍航空大學 煙臺 264001)
航空工業的飛速發展帶動了航空發動機研究的高潮。一方面由于發動機是飛機的核心部件,飛行發動機的運行狀態對飛機的安全性、可靠性和操作性具有直接影響,航空發動機的維修成本占到了整個飛機維修成本40%甚至以上;另一方面,其經常工作在高溫高壓的環境下,不可避免地面臨各種異常及故障[1]。因此,準確評估航空發動機的運行狀況,對飛機整體的健康監控,航空公司降低維修成本,提高飛行安全具有重要意義。
目前,對于狀態預測國內外的研究主要分為三大類:基于數學模型的預測方法,基于經驗專家知識庫的預測方法和基于數據驅動的信號處理方法[2]。基于數學模型的方法,其預測效果與模型的準確性正相關,多用于檢測系統,但是對于復雜系統(例如飛行發動機)很難有精確的模型表達?;诮涷瀸<抑R庫的方法,綜合主客觀分析,考慮領域專業知識與人工判定相結合,使用概率模型和隨機模型對發動機進行狀態預測,但結果不足以適應發動機的復雜動態過程?;跀祿寗拥姆椒?,挖掘監測數據間的內部聯系,將原始檢測傳感器數據轉化為相關的發動機行為模式,從而完成狀態預測與故障診斷。目前的研究大多集中于此,Jain和Lad[3]使用逐步回歸特征子集選擇技術構建ANN模型,實現了狀態預測。馬建倉等利用振動信號時域指標和小波包分解對發動機進行故障診斷[4]。陳恬[5]等提出運用粗糙集理論實現對發動機的智能診斷方法。Sun等[6]基于通過觀察發動機數據的線性回歸特性,建立健康指數,執行貝葉斯狀態估計和預測公式,以順序更新當前健康狀態,然后預測發動機未來的健康狀態。李愷欽[7]通過使用遺傳算法,對航空發動機故障診斷專家系統進行推理和自學習。現階段,在航空公司看來,無論是基于機器學習類的數據驅動方法(如神經網絡、支持向量機),還是基于統計分析類的數據驅動方法(如數據降維)都相對于前兩大類方法更加透明、直觀、簡單,在硬件實現方面也日漸成熟。但是,隨著航空產業的增長和航空飛行監測系統完善,航空飛行數據量不斷增大,數據維度不斷增多,數據類型日趨復雜,現有的數據驅動方法面臨著參數最優解的選擇,易陷入局部最小,計算復雜度提高等問題。所以,選擇適合大數據的預測方法決定了飛行發動機數據監測的有效性。
近年來,深度學習作為大數據處理方法逐漸在發動機監測領域得到應用。崔建國等提出一種結合LSSVM和HMM的方法,利用不同狀態特征量進行狀態預測[8]。洪驥宇等[1]針對航空發動機性能退化形式及規律,提出一種基于降噪自編碼的航空發動機性能退化評估方法。深度神經網絡在面對海量高維數據處理時,能夠提取數據內在的隱含特征,非線性表達能力強,判別效果好。
受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)是一種可以通過輸入數據集學習概率分布的隨機神經網絡,具有雙層結構的無向圖模型[9]。結構如圖1所示,v是表示數據輸入的n可視層,h是用于提取高階相關特征的m維隱藏層,是受限玻爾茲曼機的網絡參數,W∈Rm×n是可視層和隱藏層連接的權重。

圖1 受限玻爾茲曼機的構成示意圖
對于布爾型二值數據,定義RBM的網絡能量函數如下:

給定狀態(v,h)的能量函數E(v,h),可見單元與隱單元的聯合概率分布定義為:

Z(θ)是和網絡結構有關的歸一化因子(也成為配平函數),根據條件獨立的假設,對于給定的可見單元,隱單元即為獨立的伯努利隨機變量,第j個隱單元的激活概率為

同理,對于給定的隱單元,可見單元為對立的伯努利隨機變量,第i個激活概率為

通過最大化訓練集上的聯合概率密度來訓練網絡的最優化參數,由此給出RBM網絡參數的優化函數

由于航空發動機的性能數據都是連續分布的實值,經典RBM模型會面臨著變量不匹配的問題。需要將可視層的二值輸入拓展為實值變量,故建立高斯受限玻爾茲曼機模型[10]。此時整個網絡的能量定義為

其隱單元激活概率與經典RBM模型一致,可見單元激活概率變為

其中vi是滿足均值為∑wijhj+ai,方差為1的高斯分布的實數值。
通過計算可見單元的激活概率,高斯RBM模型將實值隨機變量轉化為二值隨機變量,然后再利用經典RBM模型進行處理分析。
為了提高網絡對發動機噪聲干擾的魯棒性,在高斯受限波爾茲曼機中引入稀疏編碼機制[11]。在受限玻爾茲曼機中增加稀疏編碼,是指激活盡可能少的特征節點來提取數據中蘊含的信息或者說對于分類問題,只在某種特定的故障中被激活,其他類別的數據輸入時激活狀態受到抑制,隱藏層的激活具有稀疏特性。一方面能夠有效地去除冗余信息,另一方面,有利于深層網絡更好地學習到數據的內在特征。
具體做法[12]是在高斯RBM的網絡參數目標函數中疊加一個正則化項,添加稀疏性約束,對于n個輸入樣本優化目標函數如下:

其中,λ表示正則化常數,p表示稀疏常數控制隱藏節點的稀疏性。
本文使用 C-MAPSST 數據集[13~14]。商用模塊化航空推進仿真系統(C-MAPSST)是由開發,用于逼真模擬大型商用渦扇發動機。仿真的飛機燃氣渦扇發動機擁有包括風扇轉速控制器,調節器和限制器在內的整套內置控制系統。
使用C-MAPAAT代碼在不同的操作設置和故障模式的組合下進行發動機性能退化模擬,得到渦扇發動機退化模擬數據集。發動機在每個時間序列開始時正常運行,并在運行期間的某個時間點發生故障[15]。在訓練集中,異常的大小會增加,直至系統發生故障。在測試集中,時間序列在系統故障前的某個時間點結束,數據集中每列對應于不同的監測變量。
為了更好地評估發動機傳感器與實際性能退化狀態預測的相關性,使用單調性,可預測性和趨勢性三個方面的度量來選取傳感器參數[16],優化評估效果。
單調性(Monotonicity)是表征傳感器參數正向或者負向參數的簡單方法,定義如下:

其中n是訓練軌跡的數量。通過每條路徑的正和負導數的分數的平均差來計算傳感器參數的單調性。接近1的單調性測量結果表明傳感器是單調的并且對狀態估計有用,而接近0的結果表明傳感器是非單調信號并且不進一步考慮。
可預測性(Prognosability)定義為每條路徑的故障點偏差和傳感器在整個壽命期間平均變化的商。這個度量指數加權,范圍在0~1之間。

接近1的可預測性度量指示故障閾值是相似的并且傳感器變量可用于檢測,而接近0的可預測性度量指示故障彼此不同不適合檢測。
趨勢性(Trendability)定義為所有訓練軌跡計算出的最小相關性的絕對值。

通過將合適度函數定義為這三個度量值的和函數作為傳感器選擇的度量,為特征提取提供依據。每個度量都接近1的傳感器參量包含著航空發動機有效的退化狀態信息,適應度函數在區間[2,3]之間。計算結果顯示傳感器2,3,4,7,8,9,11,12,13,14,15,17,20,21適合后續的降維和狀態預測研究。
對數據集進行清洗和歸一化,主要的有三個步驟。
1)對數據集設置參數名稱。
2)在數據集中,基于剩余壽命運行時間將運行狀態劃分為四種模式。
(1)0~50 周期:urgent;
(2)51~125周期:short;
(3)126~200周期:medium;
(4)200~周期:long。
3)對數據集去中心化和歸一化:

數據清理保證了數據集的可理解性,對數據集的規范化處理賦予了參數屬性相等的權重,有助于加快DSRBM網絡學習階段的速度。
在高維非線性的航空發動機數據中獲取數據的隱藏特征,并利用這些特征進行運行狀態的預測,從而為航空發動機維修維護提供依據。采用PCA和DSRBM的方法對發動機數據進行降維提取特征,而后通過決策樹、支持向量機和近鄰分類進行狀態預測,方法流程如圖2所示。

圖2 實驗算法流程圖
發動機經參數選擇之后可視化結果如圖3所示。在數據可視化之后參數圖形的走向特點與實際計算得到的單調性、可預測性和趨勢性相符,反映了參數選擇過程的正確性。

圖3 參數選擇可視化
4.2.1 主元分析特征提取
主元分析主要流程是將中心化后的樣本求得協方差矩陣,通過數據的空間映射,得到降維后的特征集。原有的20631×26數據集降維到了20631×2的特征集,使其可視化如圖4。

圖4 PCA數據降維可視化結果
由圖4可見,整體上發動機數據集使用PCA降至2維之后,安全狀態集點群效果明顯,緊急狀態和故障狀態點發散,體現了發動機運行退化的不同模式和不同故障類型,辨識度較高。從單一的unit1上看,狀態點具有明顯的退化趨勢,各狀態類型之間分布區域明顯,但對航空發動機維護維修重點關注的緊急狀態分布較為發散,不利于模型對發動機故障的預測,有針對性地提出檢修方案。
4.2.2 DSRBM特征提取
稀疏受限玻爾茲曼機能夠有限避免學習過程中的數據過擬合,并對隱藏節點按概率進行抑制達到稀疏的目的,減少噪聲對特征的影響。完成數據清理與歸一化后,設置DSRBM超參數,初始化網絡。最大迭代次數Maxepoch設置為100,RBM采樣方法選擇FEPCD,稀疏方差Sparsity Variance設為0.1,稀疏度Sparsity Target為0.02,稀疏代價Sparsi-ty Cost設為3,網絡表現方法選擇為“Reconstruction”。最后將設置好的SRBM網絡和微調的反向傳播BP網絡相結合,構成整體的深度受限玻爾茲曼機網絡,完成航空發動機的數據降維工作。
考慮與PCA方法進行對比,使用DSRBM將26維數據降至2維空間,將結果可視化如圖5所示。

圖5 DSRBM數據降維可視化結果
在整體上,DSRBM網絡與PCA的降維效果類似,呈現出安全狀態集中,緊急狀態和故障狀態發散的全局特點。但在單一單元Unit1上看,DSRBM降維后的狀態點各狀態點分布區域明顯且聚合度更高,重點的緊急狀態相較于PCA降維離差更小,減小了后續機器學習算法的誤差,提高了預測精度,特征提取效果更好。
將4.1節特征提取后的發動機數據分別輸入到決策樹(CART算法)模型、KNN模型和SVM模型中,訓練得到預測結果。由于數據的多狀態屬性,針對各個狀態的預測準確性,采用數據正陽率(True Positive Rate)進行計算,將全部算法對各狀態的數據正陽率列表如表1。

表1 各類算法的預測準確率
進一步,在各個狀態的預測準確率中,發動機“Urgent”狀態是故障和安全狀態的分界點,重點考察各算法中“Urgent”狀態的數據正陽率。兩種降維方法對狀態預測的影響結果如圖6。

圖6 各類降維預測算法比較
從圖6和表1中可知,在相同的降維算法下,SVM算法的“Urgent”狀態準確率83%和87%均高于其余兩種算法,而決策樹算法和KNN算法的“Urgent”狀態預測準確率大致相當。其它發動機狀態的預測中,決策樹算法在“long”狀態預測準確率低于2%,KNN在“long”狀態相較于上一個“Medium”狀態跳變巨大,而SVM算法對各種狀態的預測更加穩定。因此,SVM算法更適合發動機狀態預測;在相同的預測算法下,DSRBM算法的“Urgent”狀態準確率均高于PCA算法,其中DSRBM-SVM相較于PCA-SVM提高3%,反映了深度稀疏受限玻爾茲曼機網絡在數據降維方法上的優越性。
本文提出運用深層神經網絡DSRBM對航空發動機數據進行特征提取和降維,結合經典算法實現了對航空發動機的狀態預測。充分運用DSRBM對數據特征提取的優勢,綜合提高了航空發動機風險狀態的預測準確率,具有一定的工程價值。
從整體上看,本文的算法還存在預測結果解釋困難,對非敏感狀態預測準確率偏低等問題。進一步可以考慮將增加人工經驗知識,加入推理規則來進一步提高非敏感狀態區域的預測準確率,作為下一步的研究重點和方向。