莫李平 王奕首 王奕惟 趙奇 卿新林
摘要:航空發動機基線是發動機狀態監控的基礎,當前國內使用的基線大部分都由發動機制造商所提供。近年來,為打破發動機制造商對基線的技術封鎖,從飛機通信尋址與報告系統提供的數據中挖掘基線的方法受到了廣泛的研究。但是,當前大部分關于基線建模的研究忽略了建模數據的影響。因此,本文提出考慮數據選擇的航空發動機基線建模方法。該方法基于多元線性回歸建立基線模型,并通過網格搜索確定最優的建模數據選取方案。以建立排氣溫度基線為例,該方法在某航空公司提供的CFM56-7B發動機巡航報上進行試驗。結果表明,使用發動機開始服役2201個飛行循環后的4405個飛行循環的數據進行基線建模可以得到最小的建模誤差。
關鍵詞:基線建模;航空發動機;狀態監控;數據選擇;網格搜索
中圖分類號:V263文獻標識碼:ADOI:10.19452/j.issn1007-5453.2020.07.007
隨著航空發動機技術的不斷發展,發動機性能要求的不斷提高,發動機的安全性變得愈發重要[1]。發動機狀態監控可以為發動機的工作安全提供保障。發動機狀態監控技術使用發動機性能參數的測量值(如燃油流量、核心機轉速、排氣溫度等)與對應性能參數的基線值的差值作為征兆量,并基于征兆量建立相應的算法對發動機的狀態進行監控[2]。基線是健康狀態發動機(或新發動機)的性能參數與發動機控制參數和發動機工作環境參數的函數關系[3-4]。基線的精度會影響征兆量的精度,進而影響狀態監控的效果。因此,基線是進行發動機狀態監控的前提。
航空發動機的基線一般由發動機生產商經過大量試驗才能得到,因此基線屬于發動機生產商的機密信息。隨著大數據時代的到來,使用飛機飛行過程采集的數據,如飛機通信尋址與報告系統(ACARS)提供的巡航報等數據,建立基線模型的方法得到廣泛的研究。用于基線建模的參數包括基線值和基線相關參數。建立基線模型的總體思路是尋找某一時間段內基線值和基線相關參數的最優的擬合關系。當前基線建模方法主要有基于統計回歸的方法和基于機器學習的方法。
基于統計回歸的基線建模方法,首先假設基線值可以表達為基線相關參數的線性或非線性方程,然后通過給定某個時間段內的數據求解方程系數。鐘詩勝等[2]假設基線方程為增壓比的一元二次方程,并使用發動機服役期間的50個航段的數據,通過高斯-牛頓迭代的方法求解和驗證基線方程。李書明等[5]則假設基線為發動機增壓比的二次方程,使用發動機服役期間的30個航段的數據進行基線方程求解。隨著人工智能技術的發展,機器學習算法因具備較強的擬合能力,被廣泛應用于基線建模。2015年,閆峰等[6]選取馬赫數、風扇轉速、海拔高度、主動渦輪間隙控制閥開度等作為基線相關參數,利用徑向基神經網絡(RBF)建立發動機燃油流量基線模型,并通過850個航段的數據進行模型訓練,150個航段的數據進行模型驗證。2016年,王聃[7]選取500個航段的數據用于模型訓練,300個航段的數據用于模型驗證,使用支持向量機(SVM)建立了發動機基線模型。2020年,王奕首等[8]選取風扇轉速、核心機轉速、燃油流量等15個基線相關參數,使用深度置信網絡(DBN)建立排氣溫度基線模型,并通過1000個航段的數據進行模型訓練,500個航段的數據進行模型驗證。
當前的基線建模方法[2,5-8]是在提前給定建模數據的情況下,尋找基線值和基線相關參數的最優擬合關系。如果提前給定的建模數據可以較好地反映基線值與基線相關參數的函數關系且數據量充足,則當前的基線建模方法可以獲得較高的精度。但是,倘若提前給定的建模數據中包含不適合基線建模的數據或者建模數據量不足,則可能導致基線模型精度的降低。因此,本文提出考慮數據選擇的基線建模方法。
1考慮數據選擇的基線建模
考慮數據選擇的基線建模方法的流程圖如圖1所示,整體可以分為以下三個步驟:(1)對原始巡航報進行數據預處理;(2)設計數據選擇的方法,并確定數據選擇方案集;(3)對每一種數據選擇方案進行基線建模并記錄建模誤差,然后從方案集中選取建模誤差最小的基線模型。
1.1巡航報數據的預處理
某航空公司提供了從服役開始記錄的近5年的發動機ACARS巡航報數據,共計9393個飛行循環。每一條巡航報包含如下數據:發動機參數:風扇轉速(N1)、排氣溫度(EGT);環境參數:大氣總溫(TAT)、海拔高度(ALT)、馬赫數(Ma);原制造商(OEM)提供的排氣溫度征兆量(ΔEGTOEM);其他信息:記錄時間、發動機編號。
在不同航段的發動機參數,不僅與發動機功率有關,而且與發動機環境參數(如進氣道的溫度等)密切相關,因此需要將相關的發動機參數轉換到標準狀態下,才能用于基線建模。式(1)為N1和EGT的相似轉換公式[9]:
圖2(a)為相似轉換前的排氣溫度時序圖,其與圖2(c)大氣總溫時序圖有相同的變化趨勢。而如圖2(b)所示,相似轉換后的排氣溫度時序圖則消除了這種趨勢。這說明通過相似轉換可以排除外界溫度對于測量值的影響。
由于巡航報數據中僅提供排氣溫度征兆量ΔEGTOEM,而未提供基線值。因此根據征兆量的定義,通過式(2)將征兆量轉換為基線值EGTbaseline。
1.2多元線性回歸基線建模
根據參考文獻[10]可知,CFM56-7B的基線與N1,ALT,TAT,Ma和引氣狀態相關。由于通常情況下發動機引氣狀態均為正常,因此忽略引氣狀態的影響,建立基于多元線性回歸的基線方程如下:
利用求解的β*,結合式(3),在給定N1cor,ALT,TAT和Ma的情況下,則可以求出基線值。1.3最優建模數據選取
1.2節中的多元線性方法是在給定數據的情況下對模型的參數進行求解。由于參與建模的數據可能也會對模型產生影響,因此本文設計數據選擇方法,通過網格搜索獲取最優的建模數據。
如圖3所示,通過設定建模數據起始點N_start和建模數據段長度N_len兩個參數用于確定基線建模的數據段。圖3中的陰影部分為使用N_start和N_len選取的建模數據段。通過設定不同的N_start和N_len就可以實現不同的數據段選擇。為方便處理,N_start和N_len使用飛行循環為單位進行計算。如N_start=1000,N_len=100的數據選擇方案為:發動機開始服役1000個飛行循環后的100個飛行循環作為建模數據。
基于選取的建模數據,結合1.2節中的基線建模方法可以求解獲得基線模型。在給定N1cor,ALT,TAT和Ma的情況下,使用基線模型可以求出基線值,并通過式(7)計算征兆量ΔEGT:
定義基線建模誤差為計算的征兆量與OEM的征兆量的平均絕對誤差,如式(8)所示:

2試驗結果與討論
根據1.3節中的數據選擇方法,設定數據選擇方案集為N_start取1~3000,步長200,N_len取5~6000,步長200。對數據選擇方案集中的每一個方案進行基線建模,其建模誤差結果如圖4所示。
如圖4所示,在N_start=2201,N_len=4405時,建模誤差最小為0.950。當N_start>1000且N_len>2000時,建模誤差較小,該范圍內的數據選擇方案適合基線建模。無論N_start選取多少,在N_len<2000時建模誤差都較大。這是由于建模數據不足導致的。值得注意的是,當N_start<1000時,即使N_len>2000,即數據量充足的情況下,建模誤差仍然較大。如圖5所示,當N_start<1000時候,發動機處于磨合期,磨合期內ΔEGT迅速增加。因此使用磨合期內的數據進行建模可能導致建模誤差較大。
N_start=2201,N_len=4405的數據選擇方案下計算的征兆量如圖6所示,建模計算的征兆量和OEM提供的征兆量在所有的飛行循環上的誤差較小,且保持相同的趨勢。這說明考慮數據選擇的基線建模方法的有效性。

3結論
本文基于多元線性回歸和網格搜索提出考慮數據選擇的基線建模方法。在某航空公司提供的巡航報數進行驗證結果表明:當N_start=2201,N_len=4405時,建模誤差最小;為了獲取建模誤差較小的模型,用于發動機建模的數據應該大于2000個飛行循環,且避開發動機處于磨合期的數據。
參考文獻
[1]齊義文,曹崢,崔建國.航空發動機安全保護控制研究綜述[J].航空科學技術, 2017, 28(8): 1-6. Qi Yiwen, Cao Zheng, Cui Jianguo. Survey of aeroengine safety protection control study [J]. Aeronautical Science & Technology, 2017,28(8): 1-6.(in Chinese)
[2]鐘詩勝,崔智全,付旭云. Rolls-Royce發動機基線挖掘方法[J].計算機集成制造系統,2010 (10): 253-258. (in Chinese) Zhong Shisheng, Cui Zhiquan, Fu Xuyun. Baseline mining method of RRs engine[J]. Computer Integrated Manufacturing Systems, 2010 (10): 253-258. (in Chinese)
[3]鐘詩勝,周志波,張永,等.基于三次回歸分析的試車臺基線庫的建立[J].計算機集成制造系統,2005 (2): 122-126. Zhong Shisheng, Zhou Zhibo, Zhang Yong, et al. Construction of test cell baselines based on thrice regression analysis[J] Computer Integrated Manufacturing Systems, 2005 (2): 122-126. (in Chinese)
[4]Luan Shenggang,Zhong Shisheng,Li Yang. Hybrid recurrent process neural network for aero engine condition monitoring[J]. Neural Network World,2008,18(2):133.
[5]李書明,任沛,黃燕曉.航空發動機基線方程的擬合[J].機械工程與自動化, 2016, 194(1): 153-154. Li Shuming,Ren Pei, Huang Yanxiao. Baseline equation fitting of aeroengine[J]. Mechanical Engineering & Automation, 2016, 194(1): 153-154. (in Chinese)
[6]閆鋒.一種航空發動機燃油流量基線的建模方法[J].計算機測量與控制, 2015, 23(5): 1635-1638. Yan Feng. A modeling method for fuel flow baseline of aeroengine[J]. Computer Measurement & Control, 2015, 23(5): 1635-1638. (in Chinese)
[7]王聃.基于多方法的CFM56-7B發動機基線挖掘研究[D].成都:中國民用航空飛行學院, 2016. Wang Ran. Baseline mining method of CFM56-7B engine[D]. Chendu: Civil Aviation Flight University of China, 2016. (in Chinese)
[8]王奕首,余映紅,卿新林,等.基于KPCA和DBN的航空發動機排氣溫度基線模型[J].航空發動機, 2020(1): 54-60. Wang Yishou, Yu Yinhong, Qing Xinlin, et al. Exhaust gas temperature baseline model of aeroengine based on kernel principal component analysis and deep belief network [J]. Aeroengine, 2020(1): 54-60. (in Chinese)
[9]唐慶如,李一帆,楊曉強. FJ44型發動機狀態監控與故障診斷[J].航空科學技術, 2011 (3): 25-27. Tang Qingru, Li Yifan, Yang Xiaoqiang. FJ44 condition monitoring and fault diagnosis. [J]. Aeronautical Science & Technology, 2011 (3): 25-27.(in Chinese)
[10]GE Aircraft Engine /CFMI. Engine condition monitoring trend threory and philosophy[Z]. GEAE /CFMI,2006.
(責任編輯陳東曉)
作者簡介
莫李平(1992-)男,博士研究生。主要研究方向:發動機健康管理。
王奕首(1978-)男,博士,副教授。主要研究方向:結構健康監測、飛行器布局設計與優化。
王奕惟(1996-)男,碩士研究生。主要研究方向:發動機健康管理。
卿新林(1967-)男,博士,教授。主要研究方向:飛行器健康管理、結構健康監測。
Tel:18759287299
E-mail:xinlinqing@xmu.edu.cn
Aircraft Engine Baseline Modeling Method Based on Data Selection
Mo Liping1,Wang Yishou1,Wang Yiwei1,Zhao Qi2,Qing Xinlin1,* 1. Xiamen University,Xiamen 361000,China
2. AECC Commercial Aircraft Engine Co.,LTD.,Shanghai 200240,China
Abstract: Aircraft engine baseline is the key foundation of engine condition monitor. The baseline is usually provided by engine original equipment manufacture. In recent years, there are lots of researches on baseline modeling method based on airlines data. However, most of current researches focus on model selection and optimization, and ignore the modeling data factor. In this paper, a baseline modeling method that considers the modeling data is proposed. The proposed method develops baseline by using multi-liner regression and obtains the best modeling data selection by using grid searching. The proposed method is verified in CFM56-7B cruising data collected from an airline. The results show that the optimal baseline is obtained by using 4405 cycles after engine is commissioned 2201 cycles.
Key Words: baseline; aircraft engine; condition monitor; data selection; grid search