(南京航空航天大學 南京 211106)
航空發動機身為飛行器的重要部件,其性能狀態不僅對飛機有著直接影響,同時考慮到飛行器全機的維修成本中,航空發動機的維修成本占到了50%以上,將直接影響航空公司運營成本。因此準確評估發動機的運行狀態以及其安全風險對民航安全有著重大意義,本文根據某型飛機的故障庫和可靠性報告對某型飛機發動機的可靠性進行深度分析。
故障樹分析在安全性與可靠性分析中是十分有效的分析工具。FTA被廣泛應用于航空電子、核能和化工領域等安全關鍵領域。ANN可以應用于過程系統的風險評估。FT可作為開發此類ANN模型的信息基礎。Zhang和Lowndes[1]應用耦合人工神經網絡和故障樹分析模型預測了煤和瓦斯方面的突發事件,他們將FT被用于識別主導模型參數作為ANN模型的輸入變量。結果發現,他們提出的將FT與ANN耦合的方法可以作為預測采礦業煤與瓦斯突出的有效工具。T.Nagpal,Ys Brar[2]提出了基于人工神經網絡算法的實現,以對電力變壓器中不同類型的故障進行分類,特別適用于變壓器故障分類的非破壞性測試,對概率神經網絡(PNN)和反向傳播網絡分類器進行性能分析,并作了對比研究。Li[3]等基于數據處理和分組,開發了一種神經網絡模型來預測CO2泄露的風險,并對其進行驗證,解決了未來油井方面建設的實踐規劃等問題。ANN的參數可以更新為貢獻因子的新狀態,并從實際現場數據進行訓練[4]。ANN不需要有關輸入和輸出變量之間關系的信息[5]。ANN建模中有許多重要方面會對網絡性能產生重大影響,包括數據分析,神經元設置等[6]。貝葉斯網絡(BN)也可以明確地表示原因和結果的依賴關系,更新概率,處理不確定性以及合并多狀態變量[7~8]。ANN相對于BN的一個明顯優勢是ANN可以模擬輸入變量之間的相關性;而BN假設所有輸入變量(即可變狀態)都是獨立的。這解釋了為什么在本研究中選擇ANN。
以上研究成果為基礎,結合航空發動機系統的特點,通過將故障樹映射到人工神經網絡來建立可靠性模型,是本文重點解決的問題。本文旨在某型發動機的運行可靠性及安全風險,建立故障樹,將其映射到ANN中,進行系統風險評估,并研究該方法在民航安全分析中的有效性。
本文提出的方法實施流程具體如圖1所示。

圖1 ANN網絡映射方法及預測流程圖
步驟1識別故障或危險源,構建出故障樹模型。
步驟2針對故障,采集故障數據樣本并構建樣本矩陣。
步驟3判斷所采集的故障樣本以及樣本數量是否有效可用。當樣本數據可用率不夠的時候,需要重新采集樣本;當樣本數不夠時,我們就用Boot?strap方法隨機生成可用數據,然后進行計算,獲得初步數據。
步驟4根據樣本,確定ANN要訓練和調試的輸入值以及相應輸出的測試數據。根據經驗法則設置ANN網絡中的參數。隨后進行ANN網絡的訓練,在多次試驗后,得到最終的ANN模型。
步驟5 重復試驗,得到ANN預測的TE結果。
步驟6 將ANN結果與FT模型預測結果進行對比,統計可用情況。如果匹配程度好,就可用將ANN網絡進行實際應用,否則返回步驟4、5,進行重新調試。
FT(Fault Tree)用于識別已識別的危險可能導致系統故障或事故的方式。原因正在被演繹地識別,并且以樹的圖形形式作為中間或基本事件,取決于它們進一步發展的可能性。IE和BE都使用’gate’連接,’gate’是布爾邏輯運算符’OR’或’AND’或’PAND’等。使用歷史故障率數據或專家判斷的統計分析來估計BE的失敗概率。使用“AND”和“OR”門連接的樹組件的失敗概率(P)由下面式(1)和式(2)分別計算:

其中Pi是事件作為門的輸入的概率;P是事件作為門輸出的概率。FT用于識別系統故障的原因,作為要開發的ANN中的輸入變量。FT應用于有助于識別或選擇ANN的適當輸入變量。
對于動態故障樹中的PAND門以及HSP等,本文采取將其轉化為馬爾可夫模型來估算失敗概率的方法。李彥鋒[9]提出了將復雜動態故障樹轉化成馬爾可夫鏈的相關方法。在這里先介紹故障屏蔽機制,就是指在故障發生前,會出現一個確定概率來避免故障的產生,這里記為PM。故障屏蔽機制能夠簡化系統,同時減少狀態轉移的次數。本文假設轉換過程中的基本事件服從離散時間概率分布,同時基本事件相互獨立。系統狀態取“正常”或“故障”兩種。設定邏輯門中,輸入事件發生的順序組合作為馬爾可夫的基本狀態,其狀態遷移概率將設置為輸入事件故障率。DFT(Dynamic Fault Tree)的 DTMC(Dual Translation Monte Carlo)模型轉化以PAND門為例說明如下,FDEP門,HSP等詳見文獻[10],本文不再贅述。
圖2中,“00”是最初狀態,代表兩個輸入事件均正常工作的系統狀態,“01”代表輸入事件B失效而A正常運行,“10”代表輸入事件A失效而B正常工作,“11”表示兩個輸入的事件都失效,“Op”表示系統運行正常,“Fail”即指系統處于失效狀態,“Mask”是前文提到的故障屏蔽機制產生的狀態;pA和pB分別表示輸入事件A和B的失效率。pM表示故障屏蔽概率,是一個給定的固定值。

圖2 PAND門轉化成離散馬爾可夫鏈
輸入變量之間的相關性是ANN中必不可少的考慮因素。選擇相關性的輸入變量分析可以改善ANN在訓練階段及其開發后應用的性能[11]。在FT映射過程中,故障樹的元素被轉換為ANN的組件。基本事件(BE)和故障樹的TE分別被映射為ANN的輸入和輸出神經元。BE對應于第一層的神經元;而TE成為人工神經網絡的輸出。FT的邏輯門和IE(Intermediate Event)的數學函數被用作ANN中的突觸權重和傳遞函數。例如,具有兩個輸入的“AND”邏輯門可以用兩個輸入神經元和一個輸出神經元模擬,其具有指定閾值的步進傳遞函數和具有突觸權重的偏差。具有IE的突觸權重和邏輯門之間沒有明確的數學關系。基于BE的數量來指定網絡的第一層中的神經元的數量;而單個神經元呈現網絡輸出。
該步驟旨在定義ANN參數,包括:1)隱藏層和神經元的數量;2)每層的傳遞函數;3)學習算法。這些參數正確配置有助于避免過度擬合和欠擬合問題。所謂網絡過度擬合,指網絡未能對其訓練的數據進行概括。這種網絡的信息處理能力太大。因此,訓練集中的數據量不足以訓練隱藏層中所有神經元。基于FT結構和規則,ANN參數配置規則詳見文獻[12]。
隱藏層的數量根據建模要求確定。在沒有隱藏層的情況下,模型僅能夠表示線性可分離函數或決策。具有一個隱藏層的網絡通常可以近似表示從一個有限空間到另一個有限空間的數據映射的任何函數。具有兩個隱藏層的ANN可以使用合理的激活函數表示任意精度的任意決策邊界。由于其復雜性和長訓練時間而沒有充分提高效率,具有三層和更多隱藏層的ANN很少實施[13]。因此,在所提出的方法中選擇了兩個隱藏層。
反向傳播訓練算法用于調整連接權重。觀察在訓練期間從輸入到輸出和向后的信號的通道,并且使用預測中的相應誤差來調整權重[14]。因此,ANN可以根據指定的參數設置處理來自每個節點的輸入。在文獻[15]中廣泛使用的反向傳播算法被建議用于所提出的方法。
當BE的實際數據不充分可用時,Bootstrap用于生成本研究中的網絡訓練數據。由于實際數據量不多且局限性較大,為了說明目的,14個BE中的每一個生成了一組500個隨機故障概率。Matlab函數“randn”與給定故障樹的計算代碼一起實現,以生成500個TE失敗概率樣本。文中表2顯示了在案例研究中用于ANN培訓和測試的數據樣本。
在訓練好ANN網絡之后,需要對該網絡進行測試。測試目的是用測試數據集檢查訓練的ANN的性能。回歸系數用于確定映射的質量。測試過程包括使用測試數據集進行計算以及將結果與實際輸出數據進行比較。此步驟在映射過程中至關重要,因為這些結果可以指示其他數據的需求,網絡結構的變化以及映射是否正確。
通過某型飛機可靠性報告以及故障庫數據分析,發現發動機故障占到該飛機故障統計表的38.62%。由于航空發動機是飛機飛行中的重要的起飛裝置和動力來源,對飛機的正常飛行有著重要的保障意義。開展對某型飛機使用的某型發動機進行發動機危害性后果“發動機起火不可控”的實驗。在分析故障發生之間的依賴關系之后,建立故障樹,如圖3所示。發動機組成單元壽命分布基本符合指數分布規律,本文將假設每個基本事件只有正常運行和故障狀態兩種情況,而且兩狀態間相互獨立。

圖3 “飛機起火不可控”故障樹圖
該故障樹圖分析了發動機不可控火情的具體原因。在圖3中,橢圓是基本事件,矩形表示中間事件和頂事件。其中基本事件數量是14個,中間事件數量是10個,邏輯門數量為12個(含有5個動態邏輯門)。基本事件描述和發生概率如表1所示。

表1 基本事件描述和失敗率數據
故障樹的頂事件是發動機起火不可控。根據收集的數據,頂部事件在1000h內發生的概率為3.7983E-7。在采集到初步的數據之后,本文用boostrap方法對數據進行了擴充,具體擴充數據如表2所示。
3.2.1 ANN的構架
ANN(見圖5)是根據圖4所示的FT開發的,根據圖形映射(圖4)算法以及圖1所示流程,將480個樣本用作訓練數據,并且30個樣本專用于測試ANN。所有14個基本事件都被視為網絡的輸入變量;top事件用作模型的輸出。按照經驗法則定義具有兩個隱藏層和一個輸出層的前饋反向傳播型ANN。培訓功能設定為trainlm,性能函數設定為MSE。隱藏神經元中神經元的傳遞函數是logig,并且對于輸出層是線性的。驗證檢查用于確保網絡概括輸入數據的能力。當子集錯誤率連續超過十個時期迭代增加時,訓練停止,數據生成。

圖4 從FT到ANN的映射圖

圖5 構造的ANN網絡
3.2.2 映射性能檢查
對構建的ANN進行了測試,以便用不同的輸入數據模擬FT并預測頂級事件的失敗概率。30個不同BE的情況和相應的TE失敗概率被用于ANN測試。從ANN和FT模型獲得的結果進行了比較,并在圖6中顯示,其顯示出良好的匹配。對于映射性能檢查,還計算了這兩個模型的結果之間差異的均值,最大值和MSE:1)平均差異為1E-07;2)最大差異為0.0061%;3)MSE為1.12E-07。
設置故障的屏蔽概率值分別是5.00E-6和10.00E-6,每個基本事件(BE)發生導致頂事件(TE)發生概率情況如圖7所示,隨著MASK的增加,BE導致TE發生概率降低,且對越底層的時間影響越大,其中BE3、BE9是該系統中最不可靠構件,如果發生系統失效的情況,就應該先從“電子元器件”和單向活門開始檢修和維護。這為航空發動機維修提供了參考。

圖6 DFT和ANN預測比較圖

圖7 BE失效導致TE失效概率分布圖
為了進一步驗證本文方法和傳統方法的準確性,取原始的ANN網絡,BN網絡以及FTA方法進行比較。測試樣本使用30個不變,訓練樣本不斷增加,結果如圖8所示。

圖8 四種方法測試準確率對比圖
由圖8可知,ANN方法相比傳統BN方法以及FTA方法在模擬輸入變量相關性上效果更好。其次在使用了FTA建模之后的ANN網絡在原始ANN上有了很大提升,在僅有的150個訓練樣本時評估準確率就達到了89.49%,遠遠好于BN與原始ANN。隨著訓練樣本的增加,FT-ANN與其余兩者相比仍有很大優勢。
本文提出了基于故障樹模型與ANN網絡結合解決復雜系統的方法,對某型航空發動機危害性后果“發動機起火不可控”進行了分析,針對BE、TE失效率,挖掘TE和BE對發動機安全的影響,提取出有利于評估發動機危害性后果數據。此方法在數據采集過程層運用了bootstrap方法,bootstrap方法可以自原始樣本按放回抽樣方法擴充樣本量,較好地解決了小規模子樣試驗評估問題。同時,本文在之前靜態故障樹與ANN結合可靠性分析方法基礎之上提出了改進,將動態故障樹與靜態故障樹一起融入ANN網絡,解決了靜態故障樹無法描述系統失效動態行為的缺陷。研究模型結構簡單,輸入輸出直觀清晰,只要建立好故障樹模型,就能很快地構建ANN網絡的輸入層和輸出層。其準確性和穩定性都優于傳統深度學習方法和BN網絡。通過實例對比,可知本文方法行之有效,有利于提高航空發動機可靠性分析的準確性,能夠為下一個階段發動機等維修管理內容提出側重點和具體應對措施,具有相應工程推廣價值。本文僅針對DFT與FT融入ANN網絡作了一些研究,對于故障樹其他定量分析,比如結構的重要度等,尚未做相關研究,后續將對參數優化和結構模型等做進一步優化。