李冬,黃帥,曹明川(.海軍航空工程學院,山東煙臺6400;.海軍駐常州地區航空軍事代表室,江蘇常州30)
基于支持向量機的發動機性能衰退指標分類和預測
李冬1,黃帥2,曹明川1
(1.海軍航空工程學院,山東煙臺264001;2.海軍駐常州地區航空軍事代表室,江蘇常州213022)
基于支持向量機幾何距離建立表征發動機性能衰退程度的指標,并基于相空間重構理論對該指標進行多步預測,表明回歸支持向量機結果優于神經網絡預測結果。利用主元分析、核主元分析方法對發動機性能特征量約簡并提取其主元,得到核主元分析的分類效果更好。利用交叉驗證的方法優化分類支持向量機和核函數中相關參數,給出發動機性能衰退指標曲線。通過建立統計量的方法分析發動機性能變化,確定性能變化關鍵點。所得結論對做好發動機維護保養工作,延長發動機使用壽命具有一定的指導意義。
支持向量回歸;性能衰退指標;支持向量分類;預測;概率密度分布
對發動機進行狀態監控和故障診斷,及時準確地評估和預測發動機性能狀況,發現性能衰退跡象及潛在故障隱患,這對推動視情維修、減小維修使用成本和提高飛行安全具有重要意義。實際中,可供測量的發動機參數有限,且這些參數大多反映發動機整機的性能狀況,缺少部件的特性參數,這對開展部件方面的性能研究具有一定的難度。本文結合發動機模型,通過計算得到性能衰退前后部件的性能參數和表征整機性能衰退的數據,作為發動機性能變化研究的基礎。由于性能變化是一個逐漸變化的過程,受自身、環境的雙重影響,給性能衰退研究帶來很大困難。支持向量機和構建殘差統計量是研究數據變化較新且很有效的方法,本文應用此兩種方法對發動機性能衰退指標分類和預測進行研究。
基于支持向量機幾何距離建立發動機性能衰退指標。在分類支持向量機中,特征空間內反映發動機性能特征的參數向量x,及到最優分類面H的距離d,可由式(1)計算[1]。

式中:w為分類面的權系數向量,b為偏置系數。
式(1)表明,在分界面表征性能衰退數據的一側,離分類面距離越遠的發動機性能特性參數,表示性能衰退越嚴重。
將d進行歸一化處理,有-1≤d≤1,di<0時,xi∈{正常},di>0時,xi∈{異常}。在此基礎上采用下式衡量發動機性能衰退指標,且0≤d≤0.8。這樣就將發動機性能特性量變成了性能衰退指標。

在分類支持向量機中,對于兩類分類問題,采用Fisher線性判別準則優化選取相關參數。對于兩類訓練樣本集X,X={xi,yi},xi∈Rd,yi∈{-1,1},i=1,2,…,n。這兩類數據的數學描述分別給定為:

Fisher準則考慮將數據映射到一維向量上,判別準則可描述為:

式中:|m1-m2|表示兩類樣本間的距離,越大越好;同時各類樣本內部盡量密集,即類內離散度越小越好。在這種情況下,判別函數J(θ)取得最大值。采用式(6)確定分類時所用數據的形式(原始數據,主元分析所得數據,核主元分析所得數據)。
基于支持向量機幾何距離概率統計構造核函數參數優化準則[1]。構造數據方差:

構造目標函數:

搜索Jd(θ)最大值,確定最優核函數相關參數θ。
采用回歸支持向量機預測分析性能衰退指標。對于給定序列{x1,x2,…,xn},建立映射關系f:Rm→R,滿足:

式中:l為預測步長,m為嵌入維數,τ為時間延遲。
對于上述時間序列,為了能采用回歸支持向量機進行預測,首先應進行相空間重構,即將一維時間序列轉化為矩陣形式獲得數據間的關聯,以挖掘盡可能大的信息量[2],建立如下輸入:

與輸出y(t)=f{xˉ(t)}間的映射關系f:Rm→R。
從式(11)中可看出,m和τ值的優化選取,反映了利用最少且最有效的原始時間序列數據信息,最大限度地挖掘原始一維數據的時間序列信息。而對具體m和τ值的優化選取,尚無理論可借鑒,多采用反復試驗和智能算法。m的最優選取說明了最大限度地挖掘原始數據序列中的相關信息;原始序列中的信息可能在幾個時間點不變,但對未來性能衰退指標預測來講,這幾個點的貢獻不大。τ的最優選取反映了以最少、最有效的數據信息進行預測,保證了所用數據進行預測的效率。
使用回歸支持向量機對性能衰退指標進行預測分析。同時,為評價預測效果,引入下列評判標準:
絕對誤差

式中:y(t)為真實值,y?(t)為預測值,n為樣本大小。
在支持向量機分類和回歸分析中,支持向量機中相關參數是影響分析精度的關鍵因素,因此有必要對其進行優化選擇。本文采用交叉驗證的思路,以優化兩個參數(c1、c2)為例,具體步驟為:
(1)給定其最大值為c1,max和c2,max。
(2)使i=1:c1,max和j=1:c2,max變化,遍歷所有的i和j。對于每一組i和j,對應著一組重構預測矩陣,利用其數據訓練支持向量機,并記錄此時的ik和jk(k∈[1,c1,maxc2,max])。
(3)采取打擂法,選取最小的i和j,記錄此時最優的ibest和jbest。
(4)利用最優的ibest和jbest對未來測量參數時間序列進行預測,并對測量數據預測效果進行檢驗。
利用回歸支持向量機結合相空間重構理論,對發動機性能衰退指標進行預測。與實際值相減,得到性能衰退指標殘差的時間序列。由于支持向量機方法的預測結果比較平穩,性能衰退點對應的殘差變大,因此利用殘差序列能較好地分析發動機性能狀況。本文利用所求的性能參數指標殘差序列構造統計量,完成發動機性能狀況分析。
構建的基本思想[3]為:建立發動機性能衰退指標的殘差序列ej(t)。當發動機工作在未知狀況(健康或出現性能衰退)時,若性能處于健康狀態,則殘差方差在一定范圍限制內;而發動機發生某種故障后,殘差方差將顯著增加。依據該屬性,設計一統計量,用于檢測發動機性能衰退程度。
(1)構造故障檢測統計量。考慮當前時刻t,來自當前時刻(未知狀況)、健康狀況的殘差方差分別為t)和(t)。利用q個向量計算當前時刻的方差估計量,并假定前幾個樣本方差在發動機健康狀態下得到,利用初始q0個e(t)序列計算健康狀態的樣本方差。假定統計量F(t)=[t]服從F分布,則在不可信率α(置信水平1-α)下假設:

式中:Fu=F1-α(q-1,q0-1)服從F分布,如圖1所示。
(2)構造故障分離統計量。下面測試所用序列e(t),來自性能健康或不受考慮故障影響的發動機。設計q個樣本的滑動窗口向量[e(t-(q-1)),…,e(t)]T在時刻t形成,構造如下統計量:

式中:s表示求和序號下限,通常取為1[4];ρ?i為序列e(t)的自相關系數;Q統計量服從自由度為(r-s+1)的 χ2分布。
在不可信水平α(置信水平1-α)下,假設表述為:

式中:χ2(r-s+1)為服從(r-s+1)個自由度的χ2分布統計量,如圖1所示(陰影部分為H0接受區域,空白部分為H1接受區域)。

圖1 統計量假設的概率密度分布函數Fig.1 Probability density function ofstatisticalhypothesis
7.1 原始數據新主元的構建
首先,確定表征發動機性能的特征參數。本文取為{低壓壓氣機流量,高壓壓氣機流量,高壓渦輪效率,低壓渦輪效率,低壓轉子轉速,高壓轉子轉速,高壓壓氣機后壓力,尾噴口溫度},為八維數據,均為相對變化量[5]。其中,絕對值在0~0.2%變化的參數為性能正常數據(分類記為-1),否則為性能衰退數據(分類記為+1)。其次,按前文方法將八維發動機性能特征量轉化為一維數據,建立反映發動機性能變化的性能衰退指標。最后,采用支持向量機對發動機正常數據和性能衰退數據進行分類。三種形式的數據分別取為原始數據、原始數據利用主元分析[6]所得數據和原始數據經核主元分析[1]所得數據,對應的類內類間距離。計算結果見表1。
由表1可知,原始數據形式與主元分析所得類內類間距離相同,均比核主元分析的小。原因為主元分析是對原始數據進行線性變換,并不改變原始數據的類內類間距離;而核主元分析(高斯核函數)進行的是非線性變換。因此采用原始數據經核主元分析所得數據進行分類。

表1 三種數據形式對應的類內類間距離Table 1 Corresponding distance data ofinside classes and between classes
7.2 核函數的選取
采用原始數據經核主元分析所得數據進行分類。采用參數優化準則和交叉驗證方案優化核函數相關參數,結果見表2。可見,高斯核函數對應的類內類間距離最大,因此采用高斯核函數進行分類。

表2 核函數及其參數的選取Table 2 Selection ofkernelfunction and parameter
7.3 支持向量機分類
采用支持向量機方法對三種形式數據(經過標準化處理)進行分類。取前三個主元在二維和三維情況下進行分類,結果如圖2~圖4所示。其中,PC1,PC2,PC3為原始數據、主元分析所得數據和核主元分析所得數據的前三維數據。

圖2 原始數據分類結果Fig.2 Classification oforiginaldata

圖3 主元分析所得數據分類結果Fig.3 Classification ofdata with PCA

圖4 核主元分析所得數據分類結果Fig.4 Classification ofdata with KPCA
由圖中分析可知,二維分類情況下,三種數據形式都能得到很好分類;三維分類情況下,原始數據、主元分析所得數據得不到很好分類,而核主元分析所得數據仍能得到很好分類。原因為:二維情況下,兩個主元的線性趨勢較強,所以三種數據形式都能得到很好分類。三維情況下,三個主元的線性趨勢變弱,非線性趨勢增加,雖然采取了主元分析方法,但主元分析是一種線性變換,對非線性程度很強的性能衰退數據并不能得到很好分類;核主元分析則把低維的非線性不可分關系變成高維的線性可分關系,兩個主元和三個主元情況都呈線性趨勢,所以能得到很好分類。從圖4中核主元分析情況看,性能衰退越嚴重,主元參數離最優分界面越遠;三維分類中主元參數對應的衰退程度依次增大。因此,前文基于支持向量機幾何距離建立的性能衰退指標合理。
7.4 性能衰退指標的報警閥值設置
按照自適應報警閥值算法[1],所得報警閥值曲線如圖5所示。圖中的報警閥值計算,采取前幾個點用于產生正常狀態下的均值和標準差,不設報警限。設定n=10,即新進值連續10次超過數據的3倍標準差,才判斷出現報警。每次輸入14個指標并設置其報警限。第一級和第二級、第二級和第三級報警限之間均存在過渡地帶,且出現超限報警。由于性能衰退指標是增函數,故只關注報警上限。

圖5 性能衰退指標及報警閥值曲線Fig.5 Performance degradation index and alarm threshold curves
7.5 性能衰退指標的回歸預測
采用相空間重構方法重構性能衰退指標數據。選擇合適參數,利用回歸支持向量機方法進行多步預測[7],并與神經網絡預測結果進行比較。其中,一步預測參數為懲罰因子C=1.3,不敏感損失系數ε= 0.001 2,核函數系數cof=1.1;兩步預測參數為C= 1.3,ε=0.000 9,cof=1.1;三步預測參數為C=1.3,ε= 0.001 2,cof=1.1;四步預測參數為C=1.3,ε=0.001 0,cof=1.0。預測結果如圖6、表3所示。采用式(13)作為評定預測性能的指標。
由圖6、表3可知,支持向量機的預測精度高于神經網絡,且隨著預測步長的增加,兩種方法的預測精度都下降。原因為預測步長越長,數據間的關聯性越差,不確定度加大,預測誤差變大。

圖6 多步預測結果Fig.6 Multi-step prediction results

表3 預測誤差對比Table 3 Comparison ofpredicted error
7.6 性能衰退指標的統計量分析
利用構造性能衰退指標的統計量,分析發動機性能狀況變化,結果如圖7和圖8所示。圖7表明,發動機未出現故障,但F統計量出現先減小后增加的趨勢。在46點前性能變化平穩,之后性能出現衰退。而圖8表明,發動機未受到考慮故障的影響,性能只是出現衰退,也未出現故障。

圖7 性能衰退指標的F統計量Fig.7 F statistics ofperformance degradation index

圖8 性能衰退指標的Q統計量Fig.8 Q statistics ofperformance degradation index
本文基于幾何距離建立表征發動機性能衰退程度的性能衰退指標,該指標能較好地反映發動機所處的性能狀態。采用主元分析和核主元分析,較好地完成了對發動機性能衰退量的約簡和分類。對性能衰退指標的多步預測表明,回歸支持向量機預測精度比神經網絡預測精度高。通過建立統計量的方法分析發動機性能變化,確定性能變化關鍵點,發現發動機目前的性能衰退程度均未超限。所得結論對做好發動機維護保養工作,延長發動機使用壽命具有一定的指導意義。
[1]郭磊.基于核模式分析方法的旋轉機械性能退化評估技術研究[D].上海:上海交通大學,2009.
[2]胡金海,謝壽生,駱廣琦,等.基于支持向量機方法的發動機性能趨勢預測[J].推進技術,2005,26(3):260―264.
[3]Dimogianopoulos D,Hios J,Fassois S.Aircraft Engine Health Management via Stochastic Modeling of Flight Da?ta Interrelations[J].Aerospace Science and Technology,2011:1―12.
[4]S?derstr?m T,Stoica P.System Identification[M].London:Prentice Hall,1989.
[5]尹大偉.某型發動機模型修正研究[D].山東煙臺:海軍航空工程學院,2007.
[6]馬逢時,何良材,余明書,等.應用概率統計[M].北京:高等教育出版社,1989.
[7]馮廣斌,吳震宇,袁惠群.基于混沌理論與SVM的內燃機振動信號趨勢預測[J].振動、測試與診斷,2011,31 (1):64―69.
Classification and Prediction of Engine Performance Degradation Index Based on SVM
LIDong1,HUANG Shuai2,CAO Ming-chuan1
(1.NavalAeronauticaland AstronauticalUniversity,Yantai264001,China;2.Aeronautical Military Representative Office ofNavy in Changzhou Area,Changzhou 213022,China)
The engine performance degradation index was established based on geometricaldistance ofsup?port vector machine(SVM)and predicted by multi-step method based on phase space reconstruction theo?ry.The result of support vector regression(SVR)is superior to neural network.Performance characteristic parameters were simplified by principal component analysis(PCA)and kernel PCA(KPCA).The principal component was extracted and classification of KPCA was better.Parameters of support vector classification (SVC)and kernel function were optimized by cross validation.Curve ofengine performance degradation in?dex was presented.Variation ofengine performance was analyzed by establishing statistics to determine the key pointofperformance variation.The results provide reference forengine maintenance and life extension.
SVR;performance degradation index;SVC;prediction;possibility density distribution
V235.13
A
1672-2620(2012)03-0020-06
2011-07-23;
2012-06-28
李冬(1984-),男,遼寧葫蘆島人,博士研究生,從事航空發動機性能衰退及評估預測技術研究。