吳 帥,李艷軍,曹愈遠,張博文
(南京航空航天大學民航學院,南京 211106)
飛機輔助動力系統(Auxiliary power unit,APU)實際是一臺恒速的燃氣渦輪發動機,是民航客機上一個不可或缺的重要系統,然而其在航班運行中故障率較高。在民機發動機啟動前,APU是飛機電、氣源供給的關鍵系統,雖然在最低放行設備清單中,APU可以保留故障,但是如果機場缺乏地面相關設備,處于故障狀態的APU導致飛機失去電、氣源的供給,航班將無法正常運行,嚴重影響航空公司的利潤水平和服務質量。因此,如何預測APU的在機壽命,以便航空公司提前做好資源調配、備件計劃、視情維修的工作,有重要的研究意義。
航空發動機的壽命預測研究相對較成熟,李艷軍等[1]提出了用模糊信息粒度將排氣溫度裕度(Exhaust gas temperature margin,EGTM)等性能參數數據粒化,再用改進的SVM對性能參數的變化空間和變化趨勢進行預測,解決了故障邊界模糊的發動機故障預測問題。唐王[2]建立了相似度回歸和DE_SVM的集成模型,實現了性能參數單調退化的發動機壽命預測,解決了不同退化程度的航空發動機剩余壽命的預測問題。來晨陽等[3]基于RF_SVR對發動機的燃油計量裝置性能衰退進行檢測并對剩余壽命進行估計,解決了考慮環境不確定性因素,對燃油計量裝置的剩余壽命進行預測的問題。上述研究對APU壽命預測有重要參考價值。
與航空發動機相比,APU壽命方面的研究較少,高飛鵬等[4]利用快速存取記錄器(Quick access recorder,QAR)中啟動時間數據對APU的起動電門故障進行了預測,蔡坤燁等[5]提取了4個性能參數,采用SVM對APU進行故障診斷,結合A13報文實時性的特點,一定程度上實現了故障預測,上述APU部件的故障預測,時效性較差,預測時間點離故障時間僅僅提前了幾個飛行循環。董平[6]提取了排氣溫度(Exhaust gas temperature,EGT)等6個性能參數,采用基于比例危險模型的APU剩余壽命預測方法,對APU整機的剩余壽命進行預測,但是精度較差,APU整機壽命的影響因素復雜,性能參數數據退化趨勢不明顯,無法做到精確地預測剩余壽命,所以本文將對APU的渦輪部件進行壽命預測研究分析。
APU渦輪的性能衰退過程是機械部件長期累計工作的結果,傳感器收集的性能參數數據是多工況的、包含大量噪聲的數據,經過降噪、修正后,當與渦輪相關的性能參數開始出現明顯變化趨勢時,渦輪處于衰退階段,到達閾值時,APU渦輪到壽拆下。整個衰退過程就是性能參數的一段時間序列,采用時間序列的預測方法就可以實現APU渦輪的剩余壽命預測,本質是一個回歸問題,所以可以采用機器學習算法進行建模分析。
相 關 向 量 機(Relevance vector machine,RVM)是一種適用于回歸和分類問題的有監督學習模型,RVM基于貝葉斯框架,模型的優化目標是非凸函數[7]。

式中:N為樣本數,y(xi;w)為非線性函數,εi為獨立同分布的高斯噪聲。RVM的向量形式可表示為

式中:w=(w0,w1,…,wn)T為RVM的權重;Φ=(φ1,φ2,…,φn)為核函數矩陣,φi(xi)為非線性基函 數,其 中φi(xi)=[1,K(xi,x1),…,K(xi,xN)],K(?)為核函數。
由貝葉斯推理可以得到,數據集的似然估計為
Tipping[8]不僅定義了關于ω的零均值高斯型先驗分布,并且確定了σ2的超先驗分布,如式(4,5)所示,假設參數a、b、c、d取很小的值。

在先驗分布和似然分布的基礎上,根據貝葉斯推理計算,后驗分布也滿足高斯分布

其中權重的后驗方差和均值為

上述模型中,非零權重對應的樣本稱為相關向量,是數據集核心特征的體現[9]。至于α、σ2可以用迭代法來確定,如式(9)所示,不斷重復步驟,直到收斂為止。

確定α、σ2后,對于一組新的輸入集x*,輸出t*的概率分布服從高斯分布,如式(10)所示,t*為預測值,為預測方差,為迭代時的收斂值。

高斯核函數是RVM最常用的核函數,如式(11)所示,σ>0是需要優化的參數,代表核函數半徑。高斯核函數中測試點在源空間中比較密集,當映射到高維特征空間后,測試點會變得非常稀疏,而要改變這一特性,必須滿足2個條件:(1)在測試點附近有較快的衰減;(2)在無限遠處仍能保持適度的衰減[10]。傳統的高斯核函數無法滿足上述要求,為了構造能同時滿足上述2個條件的核函數,提高預測的精度,可以將核函數構建成如式(12)所示,根據新構造的核函數的曲線特性可知,滿足上述的2個條件。為了提高預測性能,引入位移核參 數λ,此 時 核 函 數 如 式(13)所 示,其 中σ>0,λ>0,本文需要優化的核參數只有2個,可以在提高預測性能的情況下,降低尋找最優參數的時間。

遺傳算法、進化算法、粒子群算法等都可以用來優化核參數,但是效率較差,天牛須搜索算法(Beetle antennae search,BAS)[11-12]是近年流行的一種高效的啟發式優化算法,類似于遺傳算法、粒子群算法等,BAS不需要知道函數的具體形式,不需要梯度信息,就可以實現高效尋優[13]。相較于其他啟發式算法,BAS只需要一個個體,即一只天牛,運算量大大降低,更適用于在線壽命預測。具體數學模型如下[13-14]:
(1)隨機方向向量

式(14)為天牛須朝向的隨機向量,其中,k表示空間維度,rand(?)為隨機函數。
(2)天牛左、右須空間坐標

式中:xtl、xtr分別表示天牛左須和右須在第t次迭代時的空間坐標,d為左右須的相對距離。
(3)適應度值
適應度值用來判斷左右須氣味強度,可以分別表示為f(xlt)和f(xrt),其中f(?)為適應度函數。
(4)步長因子

式中:δt為第t次迭代的天牛須搜索步長,初始值一般設置較大,以保證足夠大的搜索范圍;eta一般取[0,1];c為常數。
(5)天牛位置更新

式中:sign(?)為符號函數,fl、fr分別為左右須的適應度值。
用BAS算法對RVM改進核函數的2個參數進行優化,具體流程如圖1所示。

圖1 BAS_RVM算法流程Fig.1 BAS_RVM algorithm flow
(1)數據準備。將處理后的數據集進行歸一化,并劃分為訓練集和測試集。
(2)初始化BAS算法的參數。設定合適的eta=0.95 ,c=5,初始化天牛步長為30,由式(15)計算左右須的位置。
(3)適應度函數確立。評價天牛須位置的優劣,在優化預測模型時可以表示為

(4)更新適應度值。由式(18)求出左右須對應的適應度值。
(5)更新天牛須的空間位置。比較左右須適應度值的大小,并由式(17)更新天牛須的位置。
(6)迭代結束條件。當適應度值達到設定的最大迭代次數時或者精度滿足要求時,取最大迭代次數為80,精度取0.01 。如果沒有滿足停止條件,則重復(4~6)。
(7)確定最優解。最優解為RVM中的2個核參數,最后代入RVM回歸模型,對APU渦輪的壽命進行預測。
如圖2所示,展示了壽命預測的流程,原始退化數據集的獲取,需要傳感器對數據進行采集,這個過程中數據包含大量的噪聲,受外界環境影響較大,如果一組EGT參數的原始退化數據序列為O=[o(1),o(2),…,o(n)],故參考丁慧峰[15]的修正公式可以消除外界壞境對原始退化數據的影響,根據式(1)和式(2)可實現對原始數據的移動平滑降噪并建立相關參數的退化模式庫。

圖2 APU渦輪剩余壽命預測流程Fig.2 Prediction process of APU turbine remaining life

式中:l為滑動窗口,m(k)為原始數據序列。
從退化模式庫中可以整理訓練樣本的輸入和輸出集,如一組數據渦輪EGT參數的失效數據Tn=(t1,t2,…,tn),當輸入維度為d時,則輸入集可以表示為xk=(tk-d+1,…,tk),輸出集可以表示為yk=n-k,其中yk單位是飛行循環(Flight cycle,FC),如圖3所示。通過訓練樣本建立的預測模型,可以用測試集驗證預測效果,精度達到要求,對于新的一組輸入集,預測模型就可以輸出其預測點的剩余壽命。

圖3 EGT退化數據集的輸入和輸出Fig.3 Input and output of EGT degradation dataset
評價預測模型的優劣,可以用平均絕對誤差(Mean absolute error,MAE)和均方根誤差(Root mean squared error,RMSE)表示,分別為

本文中APU的EGT數據來自A13號報文,報文系統實際是QAR數據的一部分,是特定的觸發邏輯,特定的傳輸方式的QAR數據。如圖4所示,A13號報文為APU的啟動/慢車報,報文一共由4部分組成:報頭、APU的履歷信息、啟動發動機運行參數和APU啟動時參數。N1、S1行是第1臺發動機啟動時APU的參數信息;N2、S2是第2臺發動機啟動時APU運行參數;N3、S3是APU在慢車情況下的運行參數[5]。

圖4 A13號報文Fig.4 Message A13
A13號報文中關于APU的性能參數眾多,包括使用循環、使用小時、排氣溫度、引起壓力、啟動時間、滑油溫度、引氣流量和轉速等。丁慧峰[15]用相關性分析選取排氣溫度、引起壓力作為衡量APU渦輪性能的參數指標。與航空發動機類似,根據APU的EGT變化就可以判斷APU渦輪的性能狀態,EGT過高會導致APU無法正常使用,對于航空公司一線機務人員,主要根據EGT參數來確定APU渦輪的失效與否,決定下發時間,故本文選擇對退化趨勢最敏感的EGT作為衡量APU渦輪性能的唯一指標。
航空發動機在出廠時會有其對應的EGT紅線,當發動機達到EGT紅線時即需要下發,而APU并 沒 有 規 定 的EGT紅 線,丁 慧 峰[15]推 薦APS3200排氣溫度紅線的經驗值為645℃,但并沒有給出該EGT紅線的具體工況和適用范圍,故根據報文中的23臺APU全壽命的監控數據和維修記錄,將他們失效時的EGT進行修正、降噪處理,最后求出APU渦輪失效時的EGT平均值,再結合一線機務的建議,本文將APU的EGT紅線設定為420℃,條件如下:
(1)標準大氣壓;
(2)環境溫度為15℃;
(3)N3記 錄 的EGT數 據 即APU慢 車 狀 態EGT數據。
從A13號報文中篩選出的23臺APU的EGT退化數據集,經過修正處理后如圖5(a)所示,將此數據代入式(9)和式(10)進行平滑降噪,得到退化模式庫如圖5(b)所示。

圖5 EGT退化序列Fig.5 EGT degenerate sequence
將23臺APU對應23組的EGT退化數據集中的20組用來訓練,3組用來測試模型的性能,數據集的輸入為連續的EGT數值,輸出為APU渦輪剩余壽命,輸入數值的維度過小會影響算法精度,過大會增加訓練時間,根據試算結果,本文數據維度選擇30,如一組失效數據Tn=(t1,t2,…,tn),則輸入集可以表示為xk=(tk-29,…,tk),輸出集可以表示為yk=n-k,故共有1529條訓練數據和275條測試數據。本文采用五折交叉驗證的方法,在訓練集中,每次隨機選擇4組數據來訓練核函數參數,剩余1組用于驗證。
為了驗證BAS_RVM在APU渦輪剩余壽命預測中的預測性能,將數據集代入模型,用BAS算法對RVM核參數進行優化,結果如圖6所示,σ=3.46 ,λ=2.32 。得到最優核參數后用訓練集訓練RVM模型,如圖7所示為測試集的3組退化數據的測試效果,預測的曲線在真實剩余壽命曲線附近波動變化,改進核相較于高斯核更接近真實的壽命曲線,當預測點越接近真實失效壽命時,預測的精度趨于升高。

圖6 最優適應值迭代過程Fig.6 Optimal fitness iterative process

圖7 測試集預測結果Fig.7 Test set prediction results
將其他算法與BAS_RVM的預測性能進行比較,使用差分進化算法(Differential evolution,DE),粒 子 群 算 法(Partical swarm optimization,PSO)對RVM核函數進行優化,采用式(21)中的MAE和RMSE對模型進行評價。評價結果如表1所示,在同一運行環境中,BAS_RVM和DE_RVM、PSO_RVM的MAE相差很小,但是在平均訓練時間上,前者可以提高40%以上的速度,更適用于在線預測,同時,改進核比傳統高斯核在預測精度上提高20%。
在實際運用中,機務人員從A13號報文中可以獲取模型的輸入集即連續30個EGT值,經過處理后,輸入文中模型,可以一定程度上實現APU渦輪的剩余壽命預測,可為航空公司做好維修計劃和備件計劃提供依據。

表14 種算法預測效果對比Table1 Comparison of prediction effect of four algo?rithms
BAS算法的初始步長用來控制天牛須的搜索范圍和區域,初始步長的選取影響到BAS的全局搜索能力,足夠大的步長才能避免陷入局部最優,但是太大的初始步長也會影響搜索精度,如圖8所示,對于不同的初始步長,預測精度MAE出現小范圍波動,可以選定35為合適的初始步長,此時MAE的值最小。

圖8 初始步長與MAE關系Fig.8 Relationship of initial step size and MAE
回歸預測模型的輸入維度對預測精度也會有很大的影響,過小會影響算法精度,過大會增加訓練時間和數據采集時間。如圖9所示,輸入維度從10到30時,MAE呈 下 降 趨 勢,到30后MAE趨 于平緩,故30為合適輸入維度大小。

圖9 輸入維度與MAE關系Fig.9 Relationship of input dimension and MAE
本文通過分析APU的EGT退化數據,提出了一種預測APU渦輪剩余壽命的方法。本文總結如下:
(1)針對高斯核函數的缺陷和多參數核函數無法優化的問題,提出改進的RVM核函數,并使用BAS對核參數進行優化,提高了RVM回歸預測的準確性和效率。
(2)使用APU的EGT退化數據集實現了APU渦輪剩余壽命的預測,對比發現BAS_RVM在精度和效率上有明顯優勢。
(3)具體分析了影響BAS_RVM算法性能的幾個參數,確立了用于APU渦輪剩余壽命的最佳初始步長和輸入維度。