李泱,李德文,蔡景,左洪福,張營,,韓辰球
(1.南京林業大學汽車與交通工程學院,江蘇南京 210037;2.南京航空航天大學民航學院,江蘇南京 211106;3.杭州??低晹底旨夹g股份有限公司,浙江杭州 310051)
航空發動機是飛機重要的動力源,長時間在惡劣的工作條件下運行,其安全性和可靠性面臨很大的挑戰[1]。氣路參數通常被選擇為健康參數,作為表征發動機健康狀態的重要指標?;跀祿寗拥臍饴樊惓z測方法不依賴建模和知識經驗,在數據特征挖掘方面具備很大優勢,逐漸成為航空發動機異常檢測研究的熱點。
數據驅動的熱門領域,如機器學習[2]和深度學習[3]在模型擬合方面具有突出性能。WANG等[4]提出基于概率神經網絡和支持向量機的發動機控制系統故障診斷與優化方法,提高了故障診斷的準確性。LIN等[5]結合集合經驗模態分解和支持向量機識別復雜設備軸承的故障狀態,提高了診斷精度。WANG等[6]提出一種基于噪聲的發動機故障診斷的不完全小波包分析預處理方法,能同時處理平穩和非平穩信號,實現發動機的故障診斷。以上方法對于故障診斷能取得很好的效果,但依然存在訓練樣本獲取困難、模型復雜度高、易受高維特性和關聯復雜的數據影響的問題。隨著綜合信息處理技術的發展以及多學科的不斷交叉,信息融合技術[7]為提高狀態監測和故障診斷智能化程度開辟了廣闊的前景。楊潔等人[8]利用一維卷積神經網絡對軸承故障振動數據進行特征提取與分類,將不同傳感器采集的波形信號進行融合,有效提高了航空發動機軸承故障診斷的準確率。YAN等[9]將多個選定特征融合為表征發動機性能的健康指標,并用滑動窗口檢測方法確定當前健康狀態的觀測指定規則,實現航空發動機的退化評估。但無論是哪種數據驅動方法,都依賴大量的監測數據。而飛行過程數據包括大量的非線性動態信息和故障信息,且不同氣路參數間關系復雜、噪聲多,因此有效提取數據特征將直接影響異常檢測的準確性。一些傳統的特征提取方法,如主成分分析[10]、偏最小二乘法[11],能將高維數據投射到低維子空間,使其保留原始數據的主要差異特征,但二者使用條件基于的假設在實際應用中不容易被滿足。慢特征分析(Slow Feature Analysis,SFA)作為一種新的特征提取方法,能夠從時間序列數據中提取受時間影響較慢的特征,以較低的算法復雜度充分提取工業過程的基本特征,逐漸廣泛應用于故障診斷領域。LIU等[12]提出一種動態相關特征選擇的慢特征分析算法,解決數據變量間的高維、高相關問題。ZHANG等[13]開發一種基于雙向動態核慢特征分析的監控方案,構建Hotelling的T2和SPE統計量來檢測故障。ZHONG等[14]提出一種具有最小冗余最大相關度的分布式動態慢特征分析方法,實現全廠過程的故障檢測。以上研究都充分利用慢特征分析的優勢提取固有退化特征,為有效檢測故障提供完整的特征信息。
通過慢特征分析得到的原始特征空間,要經過突變點檢測以實現故障診斷。突變點檢測算法包括基于統計[15]、聚類[16]和密度[17]等方法。其中基于密度的方法簡單便捷,且不受數據分布的影響,量化每個點的異常程度。對于航空發動機氣路參數的異常檢測,考慮使用基于密度的異常點檢測方法,能夠敏感識別數據點與近鄰數據的波動情況。為了在發動機開始退化時發出警報,需設置合適的閾值線。相較于傳統的固定閾值線,自適應滑動窗能根據不同窗口的數據分布特點調整窗口大小,通過設置動態閾值線降低異常檢測對正常的數據波動的敏感度,減少虛假報警的次數,有更高的檢測精度。LOU等[18]提出一種基于自適應閾值的條件高斯網絡方法,有效避免在故障監測中過程變量因噪聲或干擾引起的微小波動而造成的誤判。PARSAI、AHMADI[19]開發一種自適應閾值函數來代替固定閾值取零的方法,提高識別技術的準確性。ZHAO等[20]提出一種基于核密度估計和向后指數均值濾波的自適應閾值設置方法,提高航空發動機故障檢測的精度和效率。
綜上所述,本文作者設計一種基于慢特征分析、局部離群因子(Local Outlier Factor,LOF)和局部分布差異(Local Distribution Difference,LDD)的動態閾值異常檢測方法,用于航空發動機氣路異常檢測。該方法首先利用慢特征分析對發動機氣路參數原始差值提取有效特征,然后對原始特征空間構造局部離群因子監控統計量,定量表征發動機的健康狀態,最終篩選出異常值。通過滑動窗設置動態閾值線,充分利用不同窗口數據分布特點,自適應調整窗口大小,提高異常檢測的效率和精度。并以民航客機實際運行數據進行實驗研究,證明所提方法的可行性和有效性。
機載QAR是一種記錄飛機發動機氣路狀態監測參數的設備,涵蓋飛行操縱品質監控的絕大部分參數的記錄。采樣頻率為1 Hz,能完整記錄圖1中包括滑行、起飛、爬升、巡航、下降、著陸等飛行階段的數據。其中巡航階段是一種持續推進的、接近于定常飛行的飛行狀態,該狀態下發動機的氣路狀態監測參數相對穩定,因此本文作者選擇QAR數據中巡航階段的數據進行研究。

圖1 飛機的飛行階段
文中研究對象為B737飛機CFM56-7B型發動機QAR數據中的監控參數。QAR數據包含大量飛行狀態參數,若將所有參數都納入異常檢測的范圍,會降低檢測效果。因此需要篩選合適的參數使其滿足:(1)與發動機的健康狀態關系密切;(2)QAR數據中記錄完整。根據工程師經驗與發動機原理,選擇表1中發動機排氣溫度(Exhaust Gas Temperature,EGT)、燃油流量(Fuel Flow,FF)、低壓轉子轉速(N1)、高壓轉子轉速(N2)、低壓壓氣機出口總溫(T25)、高壓壓氣機出口總溫(T3)這6個參數構成發動機異常檢測數據集。

表1 實驗選取的航空發動機性能參數
常規的發動機異常檢測是建立在單臺發動機狀態參數的數據基礎上,此類檢測方法無法排除飛行工況、高度、溫度及馬赫數等因素干擾而出現的波動。B737飛機包含左、右兩臺發動機,以某架飛機發動機巡航階段的EGT為例,分別作出左、右發動機EGT隨時間的變化趨勢如圖2所示。

圖2 左(a)、右(b)發動機EGT
由圖2可知:左、右發動機EGT均穩定在500 ℃左右。從單臺發動機的EGT變化曲線來看,左、右發動機的變化趨勢非常接近且穩定,未見明顯的異常波動,直觀上很難判斷是否出現故障。且實際工程經驗表明同架飛機上的所有發動機由于所處工況及外界環境等因素十分接近,發動機同時發生故障的可能性很小,發動機間性能參數的差值一般穩定在較小的波動范圍內,因此雙發動機性能參數差值對發動機健康狀態的變化更加敏感。文中計算同機雙發動機性能參數差值作為數據源,如式(1)所示:
Δ=M1-M2=[N11-N21,N12-N22,…,N1n-N2n]
(1)
式中:Δ為同機雙發性能參數差值向量;M1為左發動機性能參數向量;M2為右發動機性能參數向量;N11,N12,…,N1n為左發動機性能參數值;N21,N22,…,N2n為右發動機性能參數值。
提出一種基于SFA-LOF-LDD的動態閾值異常檢測方法,流程如圖3所示。該方法分為離線階段和在線階段,具體的步驟如下所示:

圖3 異常檢測流程
(1)離線階段。①計算訓練數據的同機雙發性能參數差值;②構建健康狀態SFA模型,并獲得模型的參數。
(2)在線階段。①計算測試數據的同機雙發性能參數差值;②利用離線階段獲得的SFA模型參數,構建SFA模型,獲得原始慢特征矩陣;③構造LOF監控統計量,進行異常檢測;④基于窗口局部分布差異,自適應調整窗口大小,設置動態閾值線,連續10點超過閾值則發出警報。
該模型主要包括慢特征分析、局部立群因子和局部分布差異三部分內容,描述如下。
航空發動機氣路性能會有隨時間正常退化的趨勢,這類緩慢平穩的退化趨勢一般不會出現較大異常波動。慢特征分析是一種從輸入信號向量中學習沒有隨時間變化或隨時間緩慢變化特征的方法[21]。利用慢特征分析提取航空發動機中隨時間變化緩慢的特征,通過該類特征變化趨勢來反映發動機運行是否出現異常。
慢特征分析的目標是找到一個映射函數g(x),滿足輸出變量f(t)=g(x(t))具有隨時間變化緩慢的特征。
給出一個M維時間序列輸入信號:
x(t)=[x1(t),x2(t),...,xM(t)]
(2)
式中:t∈[t0,t1],表示時間范圍。
找到式(2)映射函數,使式(3)的輸出變量隨時間變化緩慢,通常以關于時間的一階導數平方的均值為指標反映變化速率。
g(x)=[g1(x),g2(x),...,gN(x)]
(3)
f(t)=[f1(t),f2(t),...,fN(t)]
(4)
構建優化目標:
(5)

約束條件(6)(7)(8)分別保證各變量均值為0、 方差為1,以及各變量之間互不相關,每個變量的變化速率均比下一個變量緩慢:
〈fn(t)〉t=0
(6)
〈(fn(t))2〉t=1
(7)
〈fm(t)fn(t)〉t=0 ?m (8) 對每個慢特征f(t)進行線性特征轉化,慢特征與原始輸入信號的線性組合形式為 (9) SFA優化問題的求解要先利用白化處理使各變量互不相關,通過奇異值分解來實現。定義x(t)的協方差矩陣: P=〈x(t)xT(t)〉t (10) 根據奇異值分解有: P=UΛUT (11) 式中:U和Λ分別表示特征矩陣和特征值對角陣。根據白化矩陣Q=Λ-1/2UT,白化后的數據為 Z=Λ-1/2UTx=Qx (12) 將式(12)代入式(9),得: (13) 〈fn(t)fn(t)T〉t=R〈ZZT〉RT=RRT=I (14) (15) 根據奇異值分解: (16) W=RQ=RΛ-1/2UT (17) 通過慢特征分析得到的原始特征需進行特征融合,構造監控統計量以實現異常檢測。局部離群因子(LOF)是一種基于密度的局部離群點檢測算法,能識別無動態性的非線性過程的離群點[22]。給定一個數據集D,D中各個數據點的LOF計算過程如下: 任取一個數據點p,D中除p以外的任意一個數據點為o,p和o之間的歐氏距離定義為d(p,o); 點p的第k距離dk(p)=d(p,o),是以p為圓心向外覆蓋第k個鄰近點,并滿足:(1)數據集除點p外至少有k個點o′使d(p,o′)≤d(p,o);(2)數據集除點p外至多有k-1個點o′使d(p,o′) p的第k距離鄰域Nk(p)為p的第k距離及其以內所有數據點的集合,即: Nk(p)={o′|d(p,o′)≤dk(p)} (18) 點o到p的第k可達距離dk,reach(o,p)為點o到p的歐氏距離與點o的第k距離的較大值: dk,reach(o,p)=max{d(o,p),dk(o)} (19) 計算點p的第k局部可達密度dk,lr(p): (20) 計算點p的第k局部離群因子fLOF,k(p): (21) 基于慢特征分析和局部離群因子的異常檢測模型能夠實現航空發動機氣路性能健康監測,但需設置合理的控制限判斷是否發生突變。局部分布差異(LDD)是一種描述不同片段數據分布情況的方法。通過LDD自適應調整滑動窗口大小,能充分利用數據局部特征信息,提高突變點檢測精度[23]。 假設第i個窗口數據的均值波動記為Vi,差值波動記為Di。 (22) (23) 式中:Zi為第i個窗口的數據Z,包括初始窗口到目前窗口內的所有待觀測數據;var為求方差;std為求標準差。 定義變量fLDD,i,表示第i個窗口與上一個窗口數據分布差異情況。 (24) 式中:i>1且為正整數,fLDD,i為百分值。 由此可計算每個窗口相對于上一窗口的局部分布差異,制定自適應滑動窗調整策略如下:設置相似度閾值為δ。若fLDD,i≤δ,認為兩個窗口數據的局部分布差異小,擴大窗口以提高檢測速度;若fLDD,i>δ,認為兩個窗口數據的局部分布差異大,縮小窗口以提高檢測精度。 航空發動機排氣溫度指發動機渦輪出口噴出的燃氣平均溫度,它是衡量發動機工作正常與否的重要參數。航空公司通常以此監測飛機發動機的健康水平,排氣溫度超溫是一種典型的航空發動機異常事件。為驗證本文作者提出的基于SFA-LOF-LDD的動態閾值異常檢測方法能否準確識別異常點,以某航空公司B737飛機發動機兩個排氣溫度超溫異常事件為例進行驗證。 3.1.1 實驗數據準備 實驗選取某航空公司某架B737飛機發動機QAR數據中從2019年6月9日到2020年6月20日期間巡航狀態下的6個監控參數為數據源進行驗證。分別作出雙發動機6個參數及其差值隨時間變化的曲線如圖4所示。 圖4 雙發動機6個參數及其差值變化曲線(案例一) 由圖4可知:單臺發動機氣路參數整體變化穩定,未見明顯異常波動,偶有1~2個突變點在作差后消失,這表明雙發動機性能參數差值相比于單臺發動機的性能參數能夠降低對外界環境和所處工況的敏感程度。雙發動機氣路參數差值在前段循環變化穩定,但部分參數差值在尾部出現明顯異常波動,這表明同架飛機雙發動機性能參數差值相比于單臺發動機性能參數表征航空發動機健康狀態更具有優勢。因此案例一中計算同架飛機左、右發動機巡航階段的6個氣路參數差值作為數據源。由于數據量十分龐大,則每600個點取一個平均值。 3.1.2 基于SFA-LOF-LDD的動態閾值異常檢測 計算雙發動機6個性能參數差值發現部分參數在末尾處出現異常波動,但是表征不夠明顯,因此運用SFA對雙發動機差值提取相關特征進一步分析,從而得到圖5六個隨時間變化最緩慢的特征。與原始參數差值相比,這6個慢特征更能代表發動機性能參數隨時間變化的固有屬性,反映發動機的健康狀態。 由圖5可知:6個慢特征在前六千多個時間點都處于穩定狀態,而在末尾處有不同程度的明顯波動。通過慢特征變化規律可以大致判斷末尾處出現異常,但由于不同特征開始異常波動的循環和波動程度不同,無法準確識別突變點所在循環,需要通過特征融合進一步判斷。 圖5 案例一的慢特征提取結果 運用LOF方法將提取的6個慢特征融合為一個監控統計量,并用指數加權移動平均法(Exponentially Weighted Moving Average,EWMA)[24]進行平滑。 vt=βvt-1+(1-β)θt (25) 式中:β表示加權下降的速率;θt為t時刻的LOF值;vt為t時刻的EWMA值。 采用基于LDD的自適應窗口調整策略,設置初始窗口長度為150,相似度閾值δ為0.4,每次移動時窗口擴大或縮小原來長度的1.5倍,窗口長度最小不低于150,構建航空發動機健康狀態隨時間變化曲線如圖6所示。 圖6 基于SFA-LOF-LDD的航空發動機 圖6為SFA提取的6個特征融合成的LOF統計量隨飛行時間的變化趨勢??芍涸谇?48個循環內,LOF始終處于穩定狀態;在949循環開始突變并發出警報,增加到一定高度后維持一小段的波動,再次超過閾值線并急劇上升,并在992循環到達峰值后下降。此案例中,所提方法發出警報時對應的時間為2020年3月30日,而航空公司在2020年6月2日收到報警信號,即峰值處對發動機進行維修。可見文中所提方法能夠提前航空公司發出警報,為制定可靠的發動機維修計劃預留更多的時間。 3.2.1 實驗數據準備 為了進一步驗證文中所提異常檢測方法的有效性,將這套異常檢測方法應用于該航空公司另一架B737飛機排氣溫度超溫異常事件。實驗選取該飛機發動機QAR數據中從2019年3月20日到2019年6月26日期間巡航狀態下的監控參數作為數據源,同樣選擇左、右發動機的TEGT、QFF、N1、N2、T25、T3這6個參數的差值進行實驗。分別作出雙發動機6個參數及其差值隨時間變化的曲線如圖7所示。 圖7 雙發動機6個參數及其差值變化曲線(案例二) 由圖7可知:案例二中不同發動機同一參數的變化趨勢穩定,無法直接從單臺發動機性能參數變化曲線識別異常波動。而對雙發動機性能參數作差后的變化曲線也較為穩定,未見明顯異常波動。與案例一相比,案例二發動機退化趨勢不明顯,因此需要運用SFA對雙發動機差值提取相關特征進一步分析,同樣每600個點取一個平均值以減少數據量。 3.2.2 基于SFA-LOF-LDD的動態閾值異常檢測 經過SFA得到圖8反映發動機健康狀態的6個隨時間變化最緩慢的特征。 圖8 案例二的慢特征提取結果 由圖8可知:在整個飛行時間內,特征1最穩定,幾乎沒有出現異常波動。其余特征在前半段循環也較穩定,但在尾部出現不同程度的明顯波動。依靠所得慢特征信息,無法準確識別異常點。因此運用LOF方法將提取的6個慢特征融合為一個監控統計量,并用EWMA進行平滑。采用與案例一相同的自適應窗口調整策略,構建航空發動機健康狀態隨時間變化曲線如圖9所示。 圖9 基于SFA-LOF-LDD的航空發動機 由圖9可知:在前335個循環內,LOF始終處于穩定狀態;從336循環開始突變并發出警報;在351循環達到峰值,此時航空公司接到報警對發動機進行維修。此案例中,所提方法發出警報對應的時間為2019年6月18日,而航空公司接到報警的時間為2019年6月27日。由此可見,在退化趨勢不明顯的情況下,所提方法也能夠敏感識別異常點,提前航空公司發出報警,從而預留更多的時間制定發動機維修計劃。 支持向量數據描述(Support Vector Data Description,SVDD)是一種重要的單值分類算法,通過尋找盡可能小的超球體包圍盡可能多的數據樣本,而超球體之外的視為異常樣本,可用于航空發動機的異常檢測[25]。針對案例一和案例二計算的6個參數差值,基于SVDD的發動機健康狀態評估結果如圖10所示。 圖10 基于SVDD的發動機健康狀態評估 由圖10可知:案例一基于SVDD的發動機健康狀態評估結果在400~680循環間波動相對增大,容易產生假警,在最后失效階段的趨勢不明顯,未能準確反映發動機的健康狀態變化;案例二基于SVDD的發動機健康狀態評估結果在整個過程中出現多處頂峰干擾,容易產生連續誤警。可見SVDD算法在航空發動機異常檢測領域的適用性不高。 除了直接觀察算法對發動機健康狀態的過程評估結果外,魯棒性、單調性和趨勢性可作為評估健康模型的性能指標[26]。圖11總結了所提方法與SVDD的3個性能指標比較結果。可以看出:與SVDD相比,所提出的SFA-LOF方法更適用于航空發動機異常檢測。 圖11 SFA-LOF與SVDD在魯棒性、單調性和趨勢性方面的比較 高斯混合模型(Gaussian Mixture Model,GMM)是一種聚類算法,也可用于故障診斷領域[27]。在此基礎上以貝葉斯推斷的距離(Bayesian Inference-based Distance,BID)定量表征發動機的性能衰退程度。針對案例一和案例二計算的6個參數差值,基于GMMBID的發動機健康狀態評估結果如圖12所示。 圖12 基于GMMBID的發動機健康狀態評估 由圖12可知:案例一基于GMMBID的發動機健康狀態評估能夠較好表征發動機的健康狀態,但在案例二的評估過程中,GMMBID出現明顯頂峰干擾,容易發生假警。同樣將GMMBID的魯棒性、單調性和趨勢性與文中所提方法進行對比,結果如圖13所示。可見:文中所提方法能有效降低頂峰干擾,且在魯棒性、單調性和趨勢性方面綜合性能更優,相比于GMMBID在航空發動機異常檢測領域更具優勢。 圖13 SFA-LOF與GMMBID在魯棒性、單調性和 為了證明所提動態閾值方法的優越性,將其與傳統的固定閾值相比較。針對案例一和案例二,運用文中所提的基于SFA-LOF的異常檢測算法,設置固定閾值線,如圖14所示。 圖14 基于SFA-LOF的固定窗口異常檢測 由圖14可知:在兩個排氣溫度超溫事件中,固定閾值無法根據數據分布特點動態調整控制限,在異常檢測過程中易受正常波動干擾發生虛假報警。由此可見,文中所提基于LDD的動態閾值設置方法能避免正常波動造成的假警,提高異常檢測的準確性。 提出一種基于SFA-LOF-LDD的航空發動機異常檢測方法,研究結果表明: (1)計算同架飛機左、右發動機巡航階段氣路參數差值能夠減少飛行工況、高度、溫度及馬赫數等外界因素對實驗數據的干擾,且對航空發動機健康狀態的變化更加敏感。 (2)提出的SFA-LOF異常檢測方法能提前航空公司識別異常點,與SVDD和GMMBID方法相比有效減少頂峰產生,降低假警的可能性,且在魯棒性、單調性和趨勢性方面的綜合性能更優,更適用于航空發動機的異常檢測。 (3)提出的LDD方法能自適應調整窗口大小,設置動態閾值線,避免數據波動造成的虛假報警,提高異常檢測的精度,為航空發動機在線健康監測提供了技術支撐。





2.3 基于密度的局部離群因子算法
2.4 基于局部分布差異的自適應窗口調整策略
3 航空發動機異常事件案例驗證
3.1 排氣溫度超溫異常事件一



3.2 排氣溫度超溫異常事件二



4 比較與分析
4.1 與基于SVDD的異常檢測方法比較


4.2 與GMMBID融合方法比較


4.3 動態閾值與固定閾值比較

5 結論