, , , ,
(1.海軍航空大學 岸防學院,山東 煙臺 264001; 2.96917部隊,河北 邢臺 054100; 3.海軍航空大學 航空基礎學院,山東 煙臺 264001)
航空發動機是由風扇、壓氣機、燃燒室和渦輪等氣路部件組成的復雜機械系統,氣路部件的性能對于航空發動機的穩定性具有重要意義。由于氣路部件長時間工作在高溫、高轉速及大應力的惡劣條件下,加上侵蝕、腐蝕以及外來物打傷等問題,因此氣路部件容易出現性能衰退故障,從而使發動機的性能受到影響。實現對發動機氣路部件故障的識別,可以幫助地勤維護人員發現早期異常,從而達到有針對性地按狀態或視情形維修,使維修成本大大降低。
目前,對于航空發動機氣路部件的故障診斷方法主要分為基于仿真模型、基于數據和基于知識規則等3類[1]。在很多情況下,由于種種條件的限制,難以獲得準確的發動機部件特性,并且不容易建立準確的單機數學模型,因此無法采用基于仿真模型的故障診斷技術。
然而,測量數據容易得到,因此可采用數據驅動方法進行航空發動機的故障診斷。目前數據驅動的故障診斷方法主要有反向傳播(BP)神經網絡算法、徑向基函數(RBF)神經網絡算法和支持向量機等。這些方法本質上都屬于淺層神經網絡算法,存在容易收斂到局部最優或者泛化能力差等問題[2]。因此,基于淺層神經網絡算法的發動機故障診斷對于一些復雜故障存在診斷精度不高或容易誤診等問題。
Hinton等[3]提出了深度置信網絡(DBN)算法,該算法在圖像處理、語音識別和大數據處理[4-6]等方面取得較大進展。
由于深度置信網絡算法具有優秀的特征提取能力和學習能力,對數據有更本質的刻畫,因此有利于解決分類問題。本文引入深度學習理論進行發動機氣路部件故障診斷,以克服傳統淺層神經網絡算法的不足。
深度置信網絡是由多個受限玻爾茲曼機(RBM)疊加而成的神經網絡結構,如圖1所示。RBM2接收底層RBM1的輸出作為自己的輸入,同時向頂層RBM3輸入數據。通過逐層疊加,受限波爾茲曼機對特征進行逐層提取,最頂層的反向傳播神經網絡則依據抽象得到的特征進行分類。深度置信網絡和傳統的反向傳播神經網絡不同,深度置信網絡是由隨機神經元組成的一種二值型隨機網絡。隨機神經元是指神經元按照一定的概率取值為0或者1,分別對應“關”和“開”2種狀態。
深度置信網絡算法的訓練包括預訓練和微調2個階段。首先,通過無監督訓練階段對每個受限波爾茲曼機進行逐層訓練,得到的網絡權值和偏置作為初始值;然后,在有監督的訓練過程中,利用反向傳播神經網絡的反向傳播算法對整個網絡的權值進行微調,以獲得更好的網絡性能。兩階段訓練是深度置信網絡算法所特有的,雖然增加了訓練的時間,但是可以有效地避免網絡陷入局部最優,提高網絡收斂的有效性。

圖1 深度置信網絡結構Fig.1 Structure of deep belief network
受限波爾茲曼模型是由二值隨機神經元組成的一個2層結構(見圖2),由低層的可見層和頂層的隱含層組成[6]。可見層和隱含層之間的節點相互連接,但是每層網絡節點之間不存在網絡連接。每個節點只有2個狀態,即開和關,取值為{0,1}。

圖2 受限玻爾茲曼機的結構Fig.2 Structure of restricted Boltzmann machine
設可見層v=(v1,v2,…,vn),隱含層h=(h1,h2,…,hm),則能量函數定義為
E(v,h)=-avT-bhT-vTWh=
(1)
式中:a為可見層的偏置向量;b為隱含層的偏置向量;W為層間的連接權值矩陣。對于某個受限波爾茲曼機,其2層神經元取當前某一狀態所對應的聯合概率分布值,由以下公式計算:
(2)

(3)

(4)
在給定的可見層節點狀態的基礎上,隱含層第j個節點hj被激活的概率
(5)
式中:f(x)為激活函數。同理,可求得第i個可見層單元的激活概率
(6)
深度置信網絡算法通過極大似然估計方法進行學習,目的在于學習出參數θ(θ={Wij,ai,bi})的值,以擬合給定的訓練數據。參數θ可以通過在訓練集上(訓練樣本個數為N)的極大似然函數得到,如下所示:
(7)
式中:L(θ)為參數θ對應的極大似然;k為對應樣本編號。
該參數的求解可以用對比散度準則完成。對整個深度置信網絡的訓練,即第2階段的“微調”訓練,是在每個受限波爾茲曼機完成預訓練之后進行的。采用反向傳播神經網絡的誤差反饋傳播調整網絡各層的權值和偏置,是一種有監督的訓練方式。將網絡的實際輸出結果與標簽結果進行對比,利用計算得到的誤差對輸出層及頂層隱含層之間的權值進行調整;按照同樣的方法將誤差逐層向下傳播,依次調整各隱含層的權值,從而完成整個網絡的微調過程。
發動機的長期工作使得發動機部件偏離出廠時的良好狀態,導致部件性能出現衰退。氣路部件的性能衰退體現在實際流量值和效率值比設計值小,導致發動機整體性能參數發生變化,如發動機排氣溫度升高或者轉子超轉[7-8]。
然而,大量真實的發動機故障數據是很難獲取的[9]。為了給利用深度置信網絡算法進行的故障診斷提供數據,本文采用航空發動機性能模擬軟件GSP(gas turbine simulation program)來生成故障數據(見圖3),以滿足對算法訓練和測試的需求。

圖3 GSP軟件界面Fig.3 Interface of GSP software
本文主要研究10種故障模式,包括風扇的流量衰退、效率衰退、增壓比衰退,高壓壓氣機的流量衰退、效率衰退、增壓比衰退[8],高壓渦輪的流量衰退、效率衰退,低壓渦輪的流量衰退、效率衰退。
選擇8個發動機工作參數作為網絡的輸入,如表1所示。

表1 選定測量的參數
選擇衰減步長為0.001,在[0.001,0.050]的范圍內按步長逐漸減少單個部件性能值,最終計算得到部件性能衰減情況下的發動機工作參數。分別生成如下數據:風扇(低壓壓氣機)流量衰減數據50組,效率衰減數據50組,增壓比衰減數據50組;高壓壓氣機的流量衰減數據50組,效率衰減數據50組,增壓比衰減數據50組;高壓渦輪的流量衰減數據50組,效率衰減數據50組;低壓渦輪的流量衰減數據50組,效率衰減數據50組。總共生成500組衰減數據。所有參數在輸入網絡前均需要進行歸一化處理。
為了驗證深度置信網絡算法在發動機氣路部件故障診斷方面的有效性,本文選擇反向傳播和徑向基函數2種淺層神經網絡算法進行發動機故障診斷的比較研究。
深度置信網絡的結構為:輸入層的節點有8個;隱含層有2個,每個隱含層由30個神經節點組成;輸出層的節點有10個,代表10種故障模式。
深度置信網絡所有隱含層的神經元激活函數選擇sigmoid函數。在預訓練階段,每一層受限波爾茲曼機訓練次數設置為50,微調的反向傳播訓練次數設置為2 000。
Matlab神經網絡工具箱帶有反向傳播和徑向基神經網絡函數,為標準化起見,2種淺層神經網絡均用工具箱自帶函數完成。反向傳播神經網絡算法分別采用newff( )、train( )和sim( )函數進行反向傳播神經網絡的構建、訓練和擬合。訓練函數選擇應用較為廣泛的trainlm函數,即Levenberg_Marquardt訓練算法。最大迭代次數設置為1 000,學習率設置為0.1,訓練目標設置為0.000 01。徑向基函數神經網絡算法采用newrb( )、train( )和sim( )函數進行徑向基函數神經網絡的構建、訓練和擬合。和反向傳播神經網絡算法不同,采用newrb函數來創建網絡是一個不斷嘗試的過程,需要不斷增加隱含層神經元,直到網絡誤差滿足預先設定精度要求或者達到最大神經元個數。本文預設的最大神經元個數為500,誤差標為缺省值(0),徑向基擴展常數為1.5。
總計有500個故障數據樣本,從中選擇一部分作為訓練樣本,剩余的即為測試樣本。由于樣本選擇比例對測試結果有一定影響,因此本文設置了不同的訓練樣本比例,分別為40%、 60% 、80%。每個訓練樣本比例情況都重復進行10次計算,以消除訓練的隨機性。表2為不同訓練樣本比例下3種算法故障診斷的平均精度。

表2 不同訓練樣本比例下3種算法故障診斷精度比較
由表2可以看出,深度置信網絡算法對于發動機故障診斷精度的提高具有很大優勢。在3種訓練樣本比例情況下,深度置信網絡算法診斷精度均明顯高于反向傳播神經網絡算法和徑向基函數神經網絡算法。
圖4為訓練樣本比例80%時深度置信網絡算法一次運行結果的混淆矩陣。從圖4可以發現,10個類別中有5個類別是100%被正確識別的,其他5個類別各有一個樣本被誤認為是其他類別,這充分說明了深度學習的診斷有效性。

圖4 深度置信網絡算法故障診斷結果的混淆矩陣Fig.4 Confusion matrix of fault diagnosis results from deep belief network algorithm
表3為3種算法在訓練樣本比例80%情況下的平均運行時間。

表3 3種算法平均運行時間比較
從表3可以發現,徑向基函數神經網絡算法的平均運行時間要比其他2種算法都短,主要原因是徑向基函數神經網絡屬于一種局部逼近網絡,所以其訓練過程運行量要比全局逼近網絡少。深度置信網絡算法由于包含2個階段的訓練過程,所以其運算消耗的時間要比淺層神經網絡算法更長。對于非實時的發動機故障診斷來說,更關注的是診斷精度,較長的訓練時間對于非在線應用還是可以接受的。
實際的發動機參數在測量過程中往往會被噪聲干擾,所以為了更加接近真實情況,在原始數據中加入噪聲,如下所示:
Xn=X+Kσrand( )
(8)
式中:Xn為加入噪聲后的參數;X為未加入噪聲的參數;K為噪聲的水平;σ為整個樣本的標準差;rand()為[0,1]范圍的隨機數。分別給樣本添加不同水平的噪聲(K=0.02,0.04,0.06,0.08,0.10),然后在訓練樣本比例80%情況下,利用3種算法進行比較。表4為5個不同噪聲水平下算法故障診斷精度比較。

表4 不同噪聲水平下3種算法故障診斷精度比較
從表4可以發現,隨著樣本噪聲水平的提高,診斷精度都有不同程度下降,但基于深度置信網絡算法的診斷精度下降不明顯。即使在最大噪聲水平下,深度置信網絡算法的診斷精度也能在90%以上,抗噪效果較反向傳播神經網絡算法和徑向基函數神經網絡算法有顯著改善。
本文以渦扇發動機為研究對象,利用GSP軟件模擬各種氣路部件性能衰退故障,進而產生故障樣板。深度置信網絡算法以及反向傳播和徑向基函數神經網絡算法的故障診斷比較結果表明,深度置信網絡算法的精度要明顯優于另2種算法,并且在有噪聲的情況下仍具有較好的分類性能,這充分說明深度學習在故障診斷領域具有良好的應用前景。需要指出的是,由于深度置信網絡結構復雜且參數較多,為獲得最優結果,還需要對其結構進行更深入研究。
[1] YANG Xinyi,SHEN Wei,PANG Shan. A novel gas turbine engine health status estimation method using quantum-behaved particle swarm optimization[J].Mathematical Problems in Engineering,2014,11:1-12.
[2] SADOUGH VANINI Z N,KHORASANI K,MESKIN N.Defect detection and isolation of a dual spool gas turbine engine using dynamic neural networks and multiple model approach[J]. Information Sciences,2014,259:234-251.
[3] HINTON G,SALAKHUTDINOV R. Reducing the dimensionality of data with neural networks[J]. Science,2006,313:504-507.
[4] MARKOFF J.Scientists see promise in deep-learning programs[N].The New York Times,2012-11-23.
[5] HINTON G,OSINDERO S,TEH Y.A fast learning algorithm for deep belief nets[J]. Neural Computation,2006,18(7): 1527-1554.
[6] HINTON G E.A practical guide to training restricted Boltzmann machines [J]. Report of Momentum,2010,9(1):1-20.
[7] OGAJI S O T,LI Y G,SAMPATH S,et al. Gas path defect diagnosis of a turb of an engine from transient data using artificial neural networks[C]// 2003 ASME Turbine and Aeroengine Congress.Atlanta:ASME,2003:GT2003-38423.
[8] JAW LINK C.Recent advancements in aircraft engine health management (EHM) technologies and recommendations for the next step[C]// 50th ASME International Gas Turbine & Aeroengine Technical Congress.Atlanta:ASME,2005:683-695.
[9] LEE S-M,ROH T-S,CHOI W-J.Defect diagnostics of SUAV gas turbine engine using hybrid SVM-artificial neural network method[J]. Journal of Mechanical Science and Technology,2009,23:559-568.