999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LightGBM算法的航空發動機基線多參數建模方法

2021-11-23 13:02:28王騰飛曹惠玲曲春剛
科學技術與工程 2021年31期
關鍵詞:發動機模型

王騰飛, 曹惠玲, 曲春剛

(中國民航大學航空工程學院, 天津 300300)

基線方程是指在標準大氣狀態下同一類型的處于性能最佳狀態的航空發動機(或新發動機)的性能參數與控制量、其他飛行參數之間的函數關系。發動機性能參數換算值與基線值之間的偏差反映了發動機健康狀態,所以航空發動機基線模型直接影響了對航空發動機健康狀態的判斷[1],因此航空發動機基線模型是發動機狀態監控、故障診斷和預測的基礎[2],有必要對其進行研究。

龍江等[3]根據現有基線模型,建立單參數的二次模型,進行相關回歸分析。李書明等[4]利用最小二乘法對數據擬合從而實現發動機基線方程的挖掘。鐘詩勝等[5]采用數學統計的多元非線性回歸分析方法對發動機基線進行了挖掘工作。莫李平等[6]提出了考慮數據選擇的航空發動機基線建模方法,該方法 基于多元線性回歸建立基線模型,并通過網格搜索確定最優的建模數據選取方案,最終在一定程度上縮小了基線建模誤差。這些方法雖然可行,但都存在一個精度不高、魯棒性不強等問題。隨著機器學習和人工智能的發展,利用機器學習和人工智能進行基線建模也層出不窮。王聃[7]對現有的支持向量回歸機(support vector regression,SVR)和BP(back propagation)神經網絡算法改進后應用到航空發動機的基線挖掘上,并且獲得了較好的結果。閆峰等[8]利用以高斯函數為隱含層激勵函數、以線性函數為輸出層激勵函數的多參數 RBF(radial basis function) 神經網絡對航空發動機進行了數據挖掘也獲得了不錯的結果。劉淵等[9]利用堆疊降噪自編碼器和支持向量回歸相結合的方法進行了基線建模,并且得到了預期的預測精度和魯棒性。這些方法在精度上有了很大的提高,但當樣本量少時,訓練時間和收斂速度方面卻表現不佳。

以上建模所用數據都是來源于穩態報文數據,曹惠玲等[10]利用快速存儲記錄器(quick access recorder,QAR) 數據通過支持向量回歸機進行了基線挖掘,有效提高了發動機基線建模的準確性,為基線建模提供了一種新的數據選擇。王奕首等[11]利用大量QAR數據作為數據源,提出一種基于核主成分分析和深度置信網絡相結合的航空發動機排氣溫度基線模型構建方法,建立了CFM56-7B發動機排氣溫度( exhaust gas temperature,EGT)基線模型。曹惠玲等[12]針對穩態報文數據和QAR數據的基線建模方法分別進行了總結分析,并對兩種數據源進行了實例建模,并驗證了基于QAR數據建立基線建模的可行性與便利性。穩態報文數據較為難獲取且需取得許可后購買,而QAR數據直接從航空公司下載獲得,故利用QAR數據比穩態報文數據更加便利。

以上研究中,基于擬合方程的顯性建模所得的方程雖然直觀,但精確度不高,而SVR、BP神經網絡等算法雖然能夠很好地挖掘出發動機基線模型,但是由于神經網絡自身的原因,在訓練樣本相對比較少的情況下,訓練時間長并且難以收斂是最常見的問題。以上都是中國對于航空發動機的研究現狀,目前國外研究發動機基線的相對較少。而在這些已有的基線建模方法中,無論是基于穩態報文數據的建模還是基于QAR數據的基線建模,均沒有考慮引氣和滑油溫度因素的影響。而從廠家資料[13]中明確說明了挖掘發動機基線時,應考慮引氣因素的影響。針對上述傳統算法難以收斂,精度不高且選擇數據時考慮因素不全面等問題,提出基于QAR數據考慮引氣和滑油溫度影響下的LightGBM航空發動機基線建模方法,來解決發動機考慮引氣等因素影響和縮短訓練時間的問題。

1 QAR數據處理

發動機基線模型是發動機廠家通過臺架試驗再經數據處理所得,由于客觀原因,航空公司用戶只能使用卻無法獲得基線模型。為了自主監控的需要,大多數學者均是通過穩態巡航報文——飛機通信尋址與報告系統(aircraft communications addressing and reporting system,ACARS)報文獲取數據進行相似修正,并且通過發動機監控軟件得到相應的小偏差值,將兩者做差最終得到基線數據,再用這些基線數據訓練得出基線模型。雖然這樣得到的基線點數據最為真實有效,但穩態巡航報文數據需要結合趨勢圖來提取特征數據,而趨勢圖數據種類有限,并沒有廠家規定的引氣數據,其次由于每次航班只下發兩份報文數據,所以導致可提取數據量少,利于訓練出精度高的基線模型;而作為與穩態巡航報文數據同源的QAR數據,其種類繁多(包括航空發動機油路、氣路和引氣等參數),可以滿足基線建模的數據特征要求,故而可采用新發與之同源的、數據量大且易獲取的快速存取記錄器中所記錄的QAR數據作為替代[14]。

1.1 基線點數據的提取

依據穩態巡航報文觸發邏輯規定,一個航班一般會產生和下發2個發動機穩態報文,在首次滿足所有判定條件之后立即下發第一個報文,巡航階段內最后一個滿足判定提取條件的報文將作為第2個下發報文[14]。但為了能夠盡可能地達到與穩態巡航報文數據同樣的基線建模效果,可以按照穩態巡航報文觸發邏輯從QAR數據中篩選并提取出多組滿足提取條件的穩態數據作為基線點數據,以便為后期的基線建模打好基礎。

在QAR數據中,包含許多可能影響航空發動機基線模型的參數[15],包括馬赫數、飛行高度、溫度、大氣壓力以及發動機很多其他氣路參數,如低壓轉子速度、高壓轉子速度和推力桿角度。本文中在參考飛機性能手冊的基礎上,初步選擇了13個參數作為影響基線建模的參數,分別為飛行高度(ALT)、馬赫數(MA)、排氣溫度(EGT)、低壓轉子轉速(N1L)、高壓轉子轉速(N2L)、大氣靜溫(AST)、大氣總溫(TAT)、計算空速(CAS)、燃油流量(FF)、高壓壓氣機入口溫度(TAP)、引氣(BLEED)、空氣流量(AIR)、滑油溫度(TEMP)。

本次所用的QAR數據為GE90-115B發動機的剛服役半年時間內的數據,即為新發動機的數據,可用于本次基線挖掘,按照穩態巡航報文觸發邏輯從QAR數據中共提取1 160條數據,整理出EGT、N2L和FF及N1L、引氣等影響其基線建模的共13種數據,如圖1所示為EGT、N2L和FF以低壓轉子轉速N1L為自變量的散點圖。可見,數據點總的趨勢明顯,但聚集性并不好,說明N1L是影響這些因變量的主要因素,同時這些因變量還受到其他參數的影響。因此需要通過相關性分析,從以上13種數據中確定基線建模所需數據。

圖1 基線點數據散點圖

1.2 相關性分析

在相關性分析中,一般認為相關性系數低于0.3則被認為是弱相關,0.3~0.6被認為是中度相關,超過0.6則被認為是高度相關。對1.1節所選用的13種數據做相關性分析結果如圖2所示。

圖2 相關系數圖譜

以EGT基線模型為例,通過相關性圖譜可以看出,與EGT高度相關的數據參數有低壓轉子轉速、大氣總溫、大氣靜溫。然而通過相關性圖譜可以看出大氣總溫和靜溫有著高度相關性也可稱為共線性,所以這里舍棄大氣靜溫,選擇相關性更高的大氣總溫。而以往的基線模型也基本考慮了這兩個因素的影響。通過相關性圖譜也可以明顯看出引氣和滑油溫度對排氣溫度、高壓轉子轉速和燃油流量也具有較高的相關性,所以不能忽視其對基線模型的影響,所以本文中亦引入了發動機引氣量和滑油溫度作為排氣溫度、高壓轉子轉速和燃油流量基線模型的重要輸入參數。

通過以上相關性分析,同時結合廠家給出的基線模型建議,確定了EGT、N2L和FF基線模型的重要輸入參數有:低壓轉子轉速大氣總溫、飛行高度、馬赫數、引氣量和滑油溫度。并且通過下文的實例建模效果來看,在加入引氣量和滑油溫度之后建立的排氣溫度、高壓轉子轉速和燃油流量基線模型具有更高的模型精度和泛化能力。

1.3 基線點數據預處理

根據航空發動機原理可知,同一臺發動機在不同的環境條件下,其主要性能參數差別很大,所以建立基線模型的參數必須轉化到標準大氣條件下(P0=101 325 Pa,T0= 288.15 K)才能用于建立基線模型。根據相似原理,各性能參數相似換算公式為

EGTcor=EGTraw/(Tt2/T0)

(1)

(2)

(3)

(4)

式中: N1L為低壓轉子轉速;N2L為高壓轉子轉速;Tt2為壓氣機進口總溫;T0為標準狀態大氣溫度;Pt2為壓氣機進口總壓;P0為標準狀態大氣壓力;x為與實際發動機有關的參數,一般由發動機制造廠商提供,這里x選取理論值0.5。

由于各種數據在量綱和單位上存在差別,所以需要對數據進行歸一化處理以保證各參數對回歸分析的影響程度一致,歸一化公式為

(5)

式(5)中:Xn為歸一化后的數據;Xraw為原始數據;Xmin是數據中的最小值;Xmax是數據中的最大值。

至此,挖掘基線模型的數據預處理工作已經完成,下面將采用帶交叉驗證的網格搜索LightGBM算法對以上數據進行訓練,來獲取基線模型。

2 帶交叉驗證的網格搜索LightGBM算法

2.1 LightGBM算法

LightGBM算法是微軟2017年提出的屬于梯度提升決策樹 (gradient boosting decision tree,GBDT)的一種基于直方圖的分割算法,可用于做分類和擬合。相比于傳統的XGBoost算法而言,在不降低準確率的前提下,不僅訓練速度提升了10倍左右,而且內存的占用也下降到原有的1/3,還能有效防止訓練的過擬合,由于速度的提升更適用于訓練大量的高維數據[16-17]。

它是將弱學習器組合成強大的學習器的集成學習算法,算法采用基于Histogram的決策樹算法把連續特征離散化,同時通過構造直方圖來遍歷數據并進行統計,以此尋找最優的分割點[18]。使用帶有深度限制的Leaf-wise的葉子生長策略,每次迭代從當前所有葉子節點中,找到分裂增益最大的葉子節點進行分裂,降低誤差來得到更好的精度[19]。LightGBM訓練過程如圖3所示。

圖3 LightGBM訓練過程

2.2 帶多折交叉驗證的網格搜索算法

2.2.1 網格搜索

在機器學習過程中,模型參數的設置非常重要,直接影響著訓練結果,而在LightGBM的訓練過程中需要設置很多參數,比如樹的最大深度,每個決策樹的最大葉子數量,學習率,特征選擇,數據的隨機采樣,迭代次數,執行切分的最小增益,一個子葉上數據的最小數量等,都需要進行人工設置,然而由于參數較多,導致其參數可能的組合太多(LightGBM參數范圍如表1所示),所以人工設置會導致其訓練次數變多,費時費力。故而為了提高學習器學習的性能和效果,需要對其進行網格搜索,從而給學習機選擇一組最優參數組合。

表1 LightGBM參數范圍設置

對于需要設置的參數,網格搜索是將每個參數的所有可能的組合通過循環遍歷,最終找到一個最佳參數組合,從而實現對所有可能的參數組合的運算。

2.2.2 多折交叉驗證

目前評估機器學習模型的最好標準就是交叉驗證,而傳統的較為簡單的交叉驗證是將數據劃分為訓練集和驗證集,然后使用驗證集調整訓練集訓練出來的模型參數,并且還能對模型的泛化能力進行初步評估。這種簡單的交叉驗證方法就是隨機將原始數據分為兩組(訓練集和驗證集),雖然這種交叉驗證方法操作簡單并且容易實現,但是它并沒有達到交叉的目的,因為它只是隨機的將數據分組,然后進行訓練驗證,故而不太具備可信度,不能證明其模型的泛化能力強弱,所以文中采用多折交叉驗證。

多折交叉驗證基本原理如下:首先將原始訓練集平分為N組,使其每一個子集都作為一次驗證集,而其他的N-1個子集便作為訓練集,這樣就會得到N個模型,最終取每個模型參數的平均值作為其模型參數。基本原理如圖4所示。

圖4 多折交叉驗證基本原理

2.3 基線建模步驟

利用帶交叉驗證的網格搜索LightGBM算法訓練基線模型步驟如下。

(1)將篩選好的基礎數據劃分為訓練集和驗證集:訓練集數據用來訓練基線模型,驗證集數據用來驗證模型精度。

(2)對經過預處理的上述數據做歸一化處理,目的在于避免各特征數據由于數量級的差別而影響基線模型精度。

(3)利用帶多折交叉驗證的網格搜索算法對LightGBM算法參數進行選擇。

(4)將數據導入到優化好的LightGBM算法進行訓練,得到最終的基線模型。

(5)利用驗證集數據對訓練好的基線模型進行驗證。

3 實例建模及驗證

以GE90-115B發動機為例,根據上文提取出來的基線數據進行建模,為了充分對比在輸入參數中加入引氣量和滑油溫度對基線擬合效果的影響,首先將修正后的低壓轉子轉速、大氣總溫、飛行高度和飛行馬赫數作為輸入參數,以排氣溫度為輸出參數進行建模;后面再在這4個輸入參數(修正后的低壓轉子轉速、大氣總溫、飛行高度和飛行馬赫數)的基礎之上引入滑油溫度、引氣量作為輸入參數進行建模。

選用平均絕對誤差(mean absolute error,MAE)和對稱平均絕對百分比誤差(symmetric mean absolute percentage error,SMAPE)作為模型精度的評價標準,其定義式為

(6)

(7)

式中:xi是數據樣本值;m(xi)是其對應的標準值;n表示樣本容量。MAE和SMAPE的數值大小直接反映了基線模型的誤差大小,MAE和SMAPE數值越小,則表示基線模型的整體誤差越小。

3.1 基線建模實例

3.1.1 基線點數據樣本獲取

本次按發動機ACARS報文觸發邏輯提取的QAR基線點數據共1 160組,提取的部分結果如表2所示。

表2 QAR提取數據的部分結果

3.1.2 基線建模

在上述的1 160組數據中隨機選取1 118組數據作為訓練集,用來訓練基線模型,剩下的48組數據作為驗證集。

通過相似修正,將提取的基線點數據修正到標準大氣狀態下的性能參數EGTcor、N1Lcor、N2Lcor和FFcor,并對數據進行歸一化處理,修正公式和歸一化公式見1.3節。

確定輸入參數和輸出參數,構造訓練集和驗證集。這里輸入參數和輸出參數的確立共分為3組,以便對比引氣和滑油溫度對基線模型的影響。3組輸入方式下EGTcor的基線關系分別為

EGTcor=(ALT,MACH,TAT,N1L)

(8)

EGTcor=(ALT,MACH,TAT,N1L,TEMP)

(9)

EGTcor=(ALT,MACH,TAT,N1L,TEMP,BLEED)

(10)

對于高壓轉子轉速和燃油流量的基線建模,只需將這3組中的因變量更改為N2Lcor和FFcor即可。

通過帶交叉驗證的網格搜索算法確定最佳的LightGBM參數,最終確定上述3種基線模型的LightGBM參數如表3所示。

表3 Light GBM參數尋優結果

使用優化后的LightGBM對1 118組訓練集數據進行訓練,最終得到3種不同輸入參數下的EGT基線模型,并用剩余的42組數據驗證其模型的精度。

3.2 結果分析

分別以3組不同輸入數據為基礎的多參數EGT基線挖掘訓練結果如圖5~圖7所示。

由圖5~圖7可以看出,在考慮滑油溫度的影響后,模型精度略有提高,但效果并不是特別明顯,但在綜合考慮滑油溫度和引氣的影響后,EGT基線模型精度有了很大的提升,絕對誤差保證在4以內。

圖5 第一組輸入方式在EGT驗證集上的預測結果及誤差

圖6 第二組輸入方式在EGT驗證集上的預測結果及誤差

圖7 第三組輸入方式在EGT驗證集上的預測結果及誤差

在考慮了引氣和滑油溫度的影響下對N2L、FF基線模型進行挖掘,其結果如圖8、圖9所示。

圖8 N2L基線模型預測結果及絕對誤差

圖9 FF基線模型預測結果及絕對誤差

通過訓練結果顯示,當加入滑油溫度和引氣這兩個影響因素時,預測精度有了很大的提高。訓練所得的基線模型MAE和SMAPE如表4所示。

表4 3組輸入方式所得MAE和SMAPE

以上采用LightGBM算法對3種不同輸入變量的模型進行了擬合,在對誤差結果進行分析后,可以發現絕對誤差均在允許的誤差范圍之內,尤其在輸入變量中考慮了滑油溫度和引氣的共同影響之后,訓練出的基線模型精度有了大幅度的提高。通過圖7~圖9可以看出,EGT、N2L和FF最大絕對誤差分別保持在了4、0.5、20之內,平均絕對誤差MAE分別提升了49.7%、33.3%和55.3%,可見在輸入參數中考慮到引氣和滑油溫度的影響之后使基線模型精度有了很大的提高。

4 結論

首先從QAR中提取數據,通過相關性分析確定了模型輸入參數,并對其做了相似修正。之后通過帶多折交叉驗證的網格搜索LightGBM算法對3種不同輸入變量組合進行基線挖掘,發現在考慮引氣和滑油溫度影響之后所得的EGT、N2L和FF的基線模型精度更高,EGT基線模型的平均絕對誤差為1.49,N2L基線模型的平均絕對誤差為0.26,FF基線模型的平均絕對誤差為8.55,相比之前沒有考慮引氣和滑油溫度時,EGT、N2L和FF的基線模型精度分別提升了51%、11.1%、55.2%,擁有很好的基線模型精度,為以后的航空發動機基線建模提供了新的方法和思路。

猜你喜歡
發動機模型
一半模型
元征X-431實測:奔馳發動機編程
2015款寶馬525Li行駛中發動機熄火
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
新一代MTU2000發動機系列
發動機的怠速停止技術i-stop
新型1.5L-Eco-Boost發動機
主站蜘蛛池模板: 中文字幕丝袜一区二区| 操操操综合网| 欧美激情第一区| 亚洲天堂色色人体| 欧美日韩在线成人| 91伊人国产| 成人亚洲视频| 91九色国产porny| 国产精品成人啪精品视频| 欧美亚洲另类在线观看| 内射人妻无套中出无码| 色成人综合| 欧美黄网站免费观看| 她的性爱视频| 2022国产无码在线| 91国内在线观看| 久久精品丝袜高跟鞋| 无码高清专区| 成人字幕网视频在线观看| 日韩中文无码av超清| 毛片免费视频| 亚洲成人动漫在线观看| 为你提供最新久久精品久久综合| 欧美 亚洲 日韩 国产| 嫩草在线视频| 亚洲一区二区在线无码| 欧美不卡二区| 天堂网亚洲综合在线| 91黄色在线观看| 日本不卡在线视频| 亚洲精品久综合蜜| 精品国产污污免费网站| 青草视频在线观看国产| 88国产经典欧美一区二区三区| 国产91视频免费| 18禁黄无遮挡免费动漫网站| 暴力调教一区二区三区| 国产av一码二码三码无码| 2021亚洲精品不卡a| 亚洲IV视频免费在线光看| 香蕉国产精品视频| 91福利国产成人精品导航| 四虎精品黑人视频| 欧美人与性动交a欧美精品| 国产精品开放后亚洲| 一本大道香蕉久中文在线播放| 色综合久久88| 亚洲欧美日韩综合二区三区| 一级一级一片免费| 精品国产Ⅴ无码大片在线观看81| 国产精品九九视频| 欧洲在线免费视频| 夜夜操国产| hezyo加勒比一区二区三区| 无码中文AⅤ在线观看| 婷婷色丁香综合激情| 无码日韩人妻精品久久蜜桃| a级毛片视频免费观看| 91国内在线视频| 9cao视频精品| 国产chinese男男gay视频网| 免费看a毛片| P尤物久久99国产综合精品| 亚洲毛片网站| 国产成人精品2021欧美日韩| 日韩精品无码免费一区二区三区 | 国产男女XX00免费观看| 毛片免费试看| 国产婬乱a一级毛片多女| 婷婷午夜影院| 谁有在线观看日韩亚洲最新视频| 热思思久久免费视频| 一区二区三区毛片无码| 天堂久久久久久中文字幕| 亚洲最新网址| 精品国产一区91在线| 全部免费特黄特色大片视频| 香蕉久久国产超碰青草| 在线国产综合一区二区三区| 日韩在线欧美在线| 国产成人精品视频一区二区电影| 又黄又爽视频好爽视频|