
















摘" 要: 隨著航空發動機運行狀態的變化,其故障模式也會發生變化。針對航空發動機的運行退化趨勢,提出一種基于1DCNN?BiLSTM的航空發動機故障分類模型。該模型可以直接用于原始監測數據,不需要其他算法提取故障退化特征,并且能充分利用1DCNN提取時間維度局部特征的優勢,以及BiLSTM處理非線性時間序列及利用雙向上下文信息的特點,最后連接全連接層來學習雙向時序依賴的特征信息,并使用softmax函數來診斷故障類別。在美國航空航天局公開的CMAPSS數據集上進行驗證,將故障模式分為無故障、HPC故障(單一故障)、HPCamp;Fan故障(混合故障)三種類型。實驗結果表明,與其他模型對比,所提模型具有較高的分類精度,這對提高航空發動機運行可靠性和進一步進行剩余使用壽命預測有一定的實用價值。
關鍵詞: 航空發動機; 發動機故障; 故障分類; 1DCNN; BiLSTM; 非線性時間序列
中圖分類號: TN911.23?34; TP301.6" " " " " " " " " "文獻標識碼: A" " " " nbsp; " " " 文章編號: 1004?373X(2024)20?0129?07
Research on aero?engine fault classification based on 1DCNN?BiLSTM
KONG Linggang1, KANG Shijia1, WU Jiaju1, 2, ZUO Hongfu2, YANG Yonghui1, CHENG Zheng1
(1. Institute of Computer Application, China Academy of Engineering Physics, Mianyang 621999, China;
2. College of Civil Aviation, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
Abstract: As the operating status of aircraft engines changes, their failure modes will also change. A fault classification model for aircraft engines based on 1DCNN (1 dimensional convolutional neural network) BiLSTM is proposed to address the operational degradation trend of aircraft engines. This model can be directly used for raw monitoring data without the need for other algorithms to extract fault degradation features. In this model, the advantages of 1DCNN in extracting local features in the time dimension, and the ability of BiLSTM to handle nonlinear time series well and the characteristics of bidirectional contextual information are utilzied. A fully connected layer is connected to learn the feature information of bidirectional temporal dependencies, and the softmax function is used to diagnose fault categories. The verification is performed on the publicly available CMAPSS dataset by NASA, and the fault modes are classified into three categories: faultless, HPC fault (single fault), and HPC amp; Fan fault (mixed fault). The experimental results show that, in comparison with other models, the proposed model has higher classification accuracy, which is of practical value for improving the operational reliability of aero?engines and further remaining useful life (RUL) prediction.
Keywords: aircraft engines; engine malfunction; fault classification; 1DCNN; BiLSTM; nonlinear time series
0" 引" 言
航空發動機作為航空航天領域的核心裝備之一,其健康狀況決定了飛行器能否穩定可靠的運行。隨著航空工業的發展和對航空發動機的性能需求不斷提高,其內部構造越來越復雜。在飛行器日常運行的過程中,發動機的很多精密零部件需要在高溫、高壓、高轉速和高負荷等嚴苛條件下可靠運行,這會導致發動機零部件發生故障的頻率越來越高。同時,由于飛行的場景和時間不同,航空發動機的不同部件會出現不同程度的性能衰退,進而產生不同的故障類型。因此,為了降低不必要的維修工作而耗費的人力、物力、財力,提前預測未知故障,進而保障精準維修和視情維修,已經成為航空維修領域中重要的追求目標[1]。
目前,航空發動機等裝備的故障診斷方法可大致分為三類:基于物理建模的方法、基于數據驅動的方法和數模混合驅動的方法。首先,基于物理建模的方法是利用裝備的真實物理模型和數字仿真建立其退化模型,來評估當前的健康狀態和預測未來的健康狀況。文獻[2]提出了一種基于模型的在線故障診斷方法。但是,基于物理模型的方法難以獲得普適的物理仿真模型,并且隨著物理實體的日益復雜化和多樣化,模型精度不高。隨著物聯網技術的快速發展,在裝備運行過程中,通過傳感器可以監測到的數據越來越多,這使得基于數據驅動的故障診斷方法得到了快速發展。文獻[3]提出了一種自動學習數據特征的MTF?CNN新方法。該方法結合了馬爾可夫變換場(Markov Transition Field, MTF)和卷積神經網絡(Convolutional Neural Network, CNN),首先利用MTF將原始時間序列轉化為相應的時頻圖像,然后利用CNN提取圖中的深層特征信息,完成了滾動軸承的故障診斷?;跀祿寗拥姆椒ú恍枰耆莆昭b備內部復雜的工作機理,但前提是要收集到大量物理實體的有效退化數據。數模混合驅動是一種結合機理模型和數據驅動的方法,在某些方面,可以彌補數據驅動模型可解釋性差的不足。但是,基于數模驅動方法的運用門檻較高,往往需要對物理實體有豐富的專家知識和經驗。
隨著邊緣裝備自身產生可用的數據越來越多,基于大數據技術的數據驅動方法以簡單、高效和便捷的優勢,得到了學術界和工業界的廣泛關注。尤其是在算力和智能芯片的幫助下,人工智能技術可以部署到邊緣設備,深度神經網絡(Deep Neural Network, DNN),如卷積神經網絡(CNN)、循環神經網絡(Recurrent Neural Network, RNN)、堆疊降噪自編碼器 (Stacked Denoising Auto Encoder, SDAE)、深度信念網絡(Deep Belief Network, DBN)等深度學習算法,被廣泛應用于實際工業生產和管理中。相比于傳統淺層機器學習模型,深度學習算法具有擬合非線性系統的能力,能夠從數據中自動學習退化的內在特征。文獻[4]提出了一種基于ReliefF?主成分分析(Principal Component Analysis, PCA)和DNN的混合故障診斷方法。ReliefF?PCA算法用于提取故障敏感特征和降維,然后利用DNN模型來提高風力渦輪機的故障診斷精度,取得了良好的預測效果。文獻[5]提出了一種基于CNN的自動導引車(Automated Guided Vehicle, AGV)狀態監測與故障診斷。首先,將AGV核心部件的振動信號轉換為二維圖像,然后將二維圖像輸入CNN進行訓練和預測。文獻[6]提出了一種基于DBN聯合信息融合技術的故障診斷方法,采用DBN和小波能量熵相結合的技術,對工業機器人進行故障診斷。但是,這些研究大多數都需要其他算法來輔助提取特征,或者使用其他算法將原始信號轉換為圖像,然后再進行故障診斷。在得到故障診斷模型的同時,也花費了大量時間用于特征提取和信號轉換。近年來,一維卷積神經網絡(One?Dimensional Convolutional Neural Network, 1DCNN)被用來處理具有時間依賴特性的時序數據,在準確度和時間方面表現出了良好的性能。同時,原始數據可以直接輸入模型中進行訓練,解決了上述模型的缺點。文獻[7]提出了一種融合多模態傳感器信號的新方法,利用基于1DCNN的深度神經網絡來預測軸承故障。韓光潔等提出了一種在多工況下,基于1DCNN的航空發動機故障模式分類模型,將故障模式分為兩種:HPC故障、HPCamp;Fan混合故障;然后,建立了1DCNN二分類故障診斷模型[8]。但是,該模型沒有對航空發動機的無故障模式進行診斷,因為航空發動機在飛機運行初期的一段飛行周期內都是健康模式(即無故障模式)。
基于上述研究,本文提出一種基于1DCNN?BiLSTM的航空發動機故障分類模型。該模型可以直接用于原始監測數據,不需要其他算法提取故障退化特征,并且能充分利用1DCNN提取時間維度局部特征的優勢以及BiLSTM能很好地處理非線性時間序列及利用雙向上下文信息的特點,最后連接全連接層來學習雙向時序依賴的特征信息,并使用softmax函數來診斷故障類別。在美國航空航天局公開的CMAPSS數據集上進行驗證,將故障模式分為無故障、HPC故障(單一故障)、HPCamp;Fan故障(混合故障)三種類型。
1" 故障模式分類框架
1.1" 1DCNN模型
卷積神經網絡(CNN)是在20世紀60年代提出的視覺感受野的基礎上發展而來的。相比于其他神經網絡結構,CNN最大的特征是加入了卷積層和池化層,通過權值共享,降低了網絡模型的復雜度,簡化了網絡模型的訓練和優化過程,在一定程度上減小了模型過擬合的風險。
卷積一次的數學表達公式如下:
[yc=fcx*kc+b]" (1)
式中:[fc]表示激活函數;[x]表示輸入;“*”表示卷積操作;[kc]表示卷積核;[b]表示偏置項。
一維卷積神經網絡(1DCNN)是專門用于時間序列上的網絡,區別于應用圖像處理的CNN,1DCNN的卷積核是一維的。圖1展示了一種用于處理時序問題的CNN深層網絡結構。
1.2" BiLSTM模型
循環神經網絡(RNN)是一種用于處理序列數據的網絡。RNN的核心在于其存在記憶功能,可以記住當前序列的前序序列信息,從而得到不同時刻數據之間的關系。裝備部件的健康狀態是隨時間不斷退化的,因此由傳感器監測到的數據也是相互關聯的。
但是,RNN在訓練的過程中會產生數據間的長期依賴問題,而且在誤差反向傳播的過程中可能會導致梯度爆炸或者梯度消失的問題。長短期記憶(Long Short?Term Memory, LSTM)網絡是一種特殊的RNN,可以解決模型訓練過程中的梯度消失和長時序列數據的長期依賴問題。LSTM內部結構如圖2所示。
由圖2可知,LSTM由三個門來控制細胞狀態,這三個門分別稱為遺忘門、輸入門和輸出門。遺忘門通過[sigmoid]單元處理上一時刻的保留信息[ht-1]和當前的輸入[xt],來決定細胞狀態[Ct-1]保留多少信息,公式如下所示:
[ft=σWf*ht-1,xt+bf]" (2)
[σx=11+e-x] (3)
式中[bf]表示遺忘門的偏置項。式(3)表示[sigmoid]的計算操作。
輸入門通過[sigmoid]單元處理上一時刻的保留信息[ht-1]和當前的輸入[xt],來決定更新多少信息,其中更新的信息由[tanh]單元處理[ht-1]和[xt]的信息得到,公式如下:
[it=σWi*ht-1,xt+bi]" (4)
[C′t=tanh WC*ht-1,xt+bC]" " (5)
[tanhx=ex-e-xex+e-x] (6)
式中[bi]和[bC]表示偏置項。公式(6)表示[tanh]的計算操作。
然后細胞狀態[Ct-1]根據輸入門和遺忘門更新為[Ct],公式如下所示:
[Ct=ft*Ct-1+it*C′t]" "(7)
最后根據[Ct]、輸出門[ht-1]和[xt]決定最終的[ht],公式如下所示:
[ot=σWo*ht-1,xt+bo]" "(8)
[ht=ot*tanhCt]" "(9)
式中:“[*]”表示[Hadamard]乘積;[ht]傳入下一層,繼續上述操作。但是,LSTM只能捕捉前向的依賴信息,而BiLSTM可以更好地捕捉數據間的前后向依賴。單層的BiLSTM是由兩個LSTM組合而成,一個是從前到后去處理輸入序列;另一個是從后到前反向處理序列。單層BiLSTM網絡結構如圖3所示。
在圖3中,只有正反向所有的時間步計算完成后,將這兩個結果向量拼接起來,才能得到最終的BiLSTM輸出結果。文獻[9]提出了一種基于CNN?BiLSTM的可解釋性軸承故障診斷模型,該模型具有較高的診斷精度。首先利用CNN進行特征提取和分析,然后結合BiLSTM進行故障診斷。
1.3" 分類框架
結合航空發動機全生命運行周期中產生的故障模式以及飛行周期間的雙向數據依賴,本文提出了一種基于1DCNN?BiLSTM的故障模式診斷模型。該分類模型可分為3個部分,分別是數據預處理、特征選擇和挖掘深層雙向時序依賴、故障分類,具體流程如圖4所示。
1.3.1" 數據預處理
本文提出的模型為有監督學習模型,需要為不同故障模式數據設置標簽,如:無故障模式,標簽為“0”;單一故障模式,標簽為“1”;混合故障模式,標簽為“2”。
傳感器數據的處理分為3個部分。
1) 去噪。刪除隨著飛行循環數的增加,測量值恒定不變的傳感器。
2) 標準化。在不同的飛行場景下,各個傳感器測量值的量綱不同且差異十分明顯,將這些數據直接輸入到網絡模型中會導致特征權重分配不均衡。
3) 時間序列轉換。往往單個飛行周期的退化與之前的飛行周期息息相關,原始傳感器數據是按照飛機的飛行循環數測量得到的,孤立了每個飛行循環的依賴關系。
1.3.2" 1DCNN特征提取和BiLSTM時序依賴
1DCNN可以在卷積核滑動方向上自動地學習傳感器數據的內部關系,提取到故障退化的有效局部特征。BiLSTM網絡可以利用LSTM單元的門(Gate)機制來控制特征在時序維度的保存和損失,而且可以捕捉數據間的雙向作用。
1.3.3" 故障模式識別
本文使用[softmax]分類器,第[i]個輸入樣本判別為類別[k]的概率為:
[pyi=kxi;θ=eθTkxi=1keθTkx] (10)
2" 實驗驗證
2.1" 數據集介紹
本文在美國國家航空航天局(National Aeronautics and Space Administration, NASA)公開的渦扇發動機CMAPSS數據集上,驗證了1DCNN?BiLSTM模型的有效性。該數據集模擬了渦扇發動機隨著飛行循環從健康狀態到運行到失效(Run to Failure, RtF)的實際退化過程。該數據集分為4個不同的子集,如表1所示。
表中,發動機的故障模式有兩種,其中單一故障模式數據集FD001、FD002只包含HPC退化,混合故障模式數據集FD003、FD004包含HPCamp;Fan退化;運行工況也分為兩種,其中FD001、FD002只包含單一工況,FD003、FD004包含多種工況。在每個子集中分別記錄了發動機編號、工作循環數、發動機的3種工況參數和21個傳感器測量值。CMAPSS數據集被廣泛應用于渦扇發動機的剩余使用壽命(Remaining Useful Life, RUL)預測。在大多數預測RUL的文獻中,都將RUL的退化看作分片線性退化模型[10?13],如圖5所示。
圖5中,在開始的若干個周期,RUL被分配到一個固定值,這個固定值稱為早期RUL。在早期RUL,飛機平穩運行,可以認為無故障發生;在RUL線性退化階段,可以認為發動機處于故障狀態?;诖耍疚倪x取FD001、FD003數據集,根據文獻[10?11]的研究,早期RUL的值設置為125, 并將故障模式細分為三類(無故障、HPC單一故障、HPCamp;Fan混合故障)進行研究。
2.2" 數據預處理
1) 故障標簽編碼
為防止類別變量的數值之間無實際意義的關系對模型帶來無價值的額外信息干擾,在進行模型的訓練前,首先需要對這些故障類別進行獨熱編碼(One?Hot Encoding),如表2所示。
2) 去噪
為了反映原始傳感器數據的分布,本文繪制了FD001數據集的3種運行工況和21種傳感器的箱線圖,如圖6所示。
通過觀察圖6,剔除運行工況3和傳感器1、5、6、10、16、18、19。除此之外,由于FD001和FD003的運行工況相同,在此將不考慮運行參數的影響,只使用傳感器的測量值。因此,本文保留了14個傳感器數據[12]。
3) 標準化
將表3中每個傳感器的監測數據分別進行去均值和方差歸一化處理,公式如下:
[X*=X-μσ]" (11)
式中:[X]表示原始傳感器數據;[μ]表示該傳感器所有樣本的均值;[σ]表示標準差;[X*]表示歸一化處理后的數據。
4) 時間序列轉換
根據文獻的時間窗選取,FD001、FD003數據集的時間窗大小[10,13]設置為30,偏移為1。FD001、FD003數據集時間序列轉換前后的數據規模如表3所示。
相比于原始數據維度,時間窗轉換后的數據增加了一個時間維度,這能夠幫助BiLSTM模型挖掘特征間的時序依賴,符合故障隨時間退化的機理。經過數據預處理的各個步驟之后,本文統計了三類故障模式的樣本個數,如表4所示。
由表4可知,各類故障占總樣本數的比例相差不大,不會造成數據分布不平衡的情況。
2.3" 評估指標
為了驗證和評估所提方法的有效性,本文應用了4個常用的性能指標,即平均精確率(Macro?Precision)、平均召回率(Macro?Recall)、準確率(Accuracy)和[F1]。平均精確率和平均召回率表示分別計算出每一類的精確率和召回率,再計算其算術平均值;準確率表示正確分類的樣本數與總樣本數之比。精確率、召回率和準確率的值都可以根據混淆矩陣得到,分別如公式(12)~公式(14)所示。
[Precision=TPTP+FP]" (12)
[Recall=TPTP+FN]" "(13)
[Accuracy=TP+TNTP+TN+FP+FN]" (14)
式中:TP表示樣本真實類別為正,預測出的類別也為正;TN表示樣本真實類別為負,預測出的類別也為負;FP表示樣本真實類別為負,預測出的類別卻為正;FN表示樣本真實類別為正,預測出的類別卻為負。為了能夠綜合考慮平均精確率和平均召回率,[F1]被提出。它表示平均精確率和平均召回率的加權調和平均,如公式(15)所示。
[F1=1+β2Precision·Recallβ2·Precision+Recall]" (15)
式中[β]常取1,記為[F1]。其目的是平衡[Precision]和[Recall]對預測結果的影響,綜合得到一個相對合理的評估指標。上述所有指標的值越大,模型的效果越好。
?2.4" 實驗結果
本文在CMAPSS數據集的“train_FD001”和“train_FD003”上進行驗證,隨機選取70%的數據用于訓練,20%的數據用作驗證集,10%的數據作為測試集。
為了驗證1DCNN?BiLSTM模型的有效性,本文與單一1DCNN模型和單一BiLSTM模型進行了對比,在測試集上的平均精確率、平均召回率、準確率和[F1]如表5所示。
表5中,1DCNN和BiLSTM的網絡結構與1DCNN?BiLSTM類似。比較結果表明,本文模型在測試集上的平均精確率、平均召回率、準確率和[F1]的值最高,綜合表現能力最好。因此,本文所提出的模型對于航空發動機的故障模式分類是有效的,整體優于單一1DCNN模型和單一BiLSTM模型。
為了進一步說明1DCNN?BiLSTM模型的有效性,本文使用t?SNE技術將1DCNN層和加入BiLSTM層的特征進行可視化,如圖7所示。
由圖7的t?SNE降維效果圖可以看出,加入BiLSTM層的網絡模型對不同類別的樣本也可以很好地進行分類,且分類結果優于只包含1DCNN層的網絡模型。
3" 結" 語
本文針對航空發動機的故障預測和健康管理問題,利用NASA公開的CMAPSS數據集,提出了一種基于1DCNN?BiLSTM的航空發動機故障模式分類模型。該方法對航空發動機的三種故障模式(無故障、HPC單一故障、HPCamp;Fan混合故障)進行了分類。通過對比其他的分類模型,驗證了本文1DCNN?BiLSTM模型具有較高的分類精度。
未來,隨著人工智能技術的發展,基于邊緣孿生數據的裝備實時診斷和剩余使用壽命預測方法,以及對應的精準維修與庫存管理方案將會深度融合。本文提出的方法可以為此提供一個良好的研究基礎,也可以將得到的故障信息用來輔助裝備的剩余使用壽命預測。
但是,本文仍有以下不足。
1) 只考慮了單一工況的數據集,沒有考慮實際運行場景下的復雜多工況問題,未來利用遷移學習將模型拓展到多工況背景下,以增強模型的魯棒性和適用性。
2) 針對人工智能的落地需求,未來將進行深度學習模型的可解釋性研究,以供在實際工業場景中,從語義級別來理解“黑盒”模型。
注:本文通訊作者為孔令剛、康時嘉、吳家菊、程錚。
參考文獻
[1] WU J, KONG L, CHENG Z, et al. RUL prediction for lithium batteries using a novel ensemble learning method [J]. Energy reports, 2022, 8: 313?326.
[2] IM S H, GU B G. Study of induction motor inter?turn fault part II: online model?based fault diagnosis method [J]. Energies, 2022, 15(3): 977.
[3] WANG M, WANG W, ZHANG X, et al. A new fault diagnosis of rolling bearing based on markov transition field and CNN [J]. Entropy, 2022, 24(6): 751.
[4]" WEN X, XU Z. Wind turbine fault diagnosis based on ReliefF?PCA and DNN [J]. Expert systems with applications, 2021, 178(11): 115016.
[5] WANG B Y, HUO D Y, KANG Y Y, et al. AGV status monitoring and fault diagnosis based on CNN [J]. Journal of physics: conference series, 2022, 2281: 012019.
[6] JIAO J, ZHENG X J. Fault diagnosis method for industrial robots based on DBN joint information fusion technology [J]. Comput intelligent neuroscience, 2022, 26: 4340817.
[7] WANG X, MAO D, LI X. Bearing fault diagnosis based on vibro?acoustic data fusion and 1D?CNN network [J]. Measurement, 2021, 173(6): 108518.
[8] 韓光潔,田晨,緱林峰,等.多工況下航空發動機的故障模式分類[J].小型微型計算機系統,2022,43(8):1776?1781.
[9] 劉之航,鐘玉華.基于CNN?BiLSTM的可解釋性軸承故障診斷[J].組合機床與自動化加工技術,2022(9):59?63.
[10] JANG J, KIM C O. Siamese network?based health represent?ation learning and robust reference?based remaining useful life prediction [J]. IEEE transactions on industrial informatics, 2021, 18(8): 5264?5274.
[11] LI X, DING Q, SUN J Q. Remaining useful life estimation in prognostics using deep convolution neural networks [J]. Reliability engineering amp; system safety, 2018, 172: 1?11.
[12] LIN Y H, LI G H. A Bayesian deep learning framework for rul prediction incorporating uncertainty quantification and calibration [J]. IEEE transactions on industrial informatics, 2022(10): 18.
[13] KROKOTSCH T, KNAAK M. Improving semi?supervised learn?ing for remaining useful lifetime estimation through self?supervision [J]. International journal of prognostics and health management, 2022, 13(1): 10241?10248.
作者簡介:孔令剛(1998—),男,河北石家莊人,碩士研究生,研究方向為裝備綜合保障信息化,故障監測、診斷及健康管理。
康時嘉(1999—),男,吉林長春人,碩士研究生,研究方向為裝備綜合保障信息化,故障監測、診斷及健康管理。
吳家菊(1978—),女,四川資陽人,博士研究生,碩士生導師,高級工程師,IEEE會員,研究方向為裝備綜合保障信息化,航空器監測、診斷及健康管理,軟件工程等。
左洪福(1959—),男,江蘇南京人,教授,博士生導師,研究方向為航空器監測、診斷及健康管理,可靠性工程。
楊永輝(1973—),男,江西九江人,研究員,博士生導師,研究方向為裝備綜合保障信息化、數據安全。
程" 錚(1981—),男,湖北襄陽人,博士研究生,高級工程師,研究方向為裝備綜合保障信息化、人機工程。
DOI:10.16652/j.issn.1004?373x.2024.20.020
引用格式:孔令剛,康時嘉,吳家菊,等.基于1DCNN?BiLSTM的航空發動機故障分類研究[J].現代電子技術,2024,47(20):129?135.
收稿日期:2023?12?27" " " " " "修回日期:2024?02?23
基金項目:國家自然科學基金項目(U1933202);裝備預研領域基金(MJ?2020?Y?011)