梁露月, 呂克洪, 程先哲, 李 強, 劉冠軍, 邱 靜
(1.國防科技大學 智能科學學院,湖南 長沙 410073; 2.國防科技大學 裝備綜合保障技術重點實驗室,湖南 長沙 410073)
航空電連接器是飛機和航空器上最常見的一種機電元件,一架大型運輸機上的電連接器數量可高達4500多件[1]。隨著現代航空設備的集成度提高、結構日益復雜以及工作環境越發惡劣,部分在役飛機和航空設備無故障發現(No Fault Found,NFF)問題日益嚴重,維修頻率急劇增加。大量的現場采集數據和故障統計結果表明[2-4],間歇故障是導致裝備NFF問題的主要原因和故障來源。航空電子系統故障中70%的失效是由于元器件,而在這些故障中又有40%是電連接器的失效引起的[5]。如果能基于間歇故障對航空電連接器進行可靠的狀態評估,則會保障其安全高效工作,如果能進一步進行永久故障預測,則會對基地級的維修決策提供技術支撐。
基于間歇故障對航空電連接器進行狀態評估,重點是要利用間歇故障動態特性構建合理的評估模型。目前對間歇故障特征的應用停留在定性層面,基于間歇故障特征的評估方法較少,通常是基于間歇故障幅值或次數進行閾值判別。Kamal等[6]基于間歇故障次數提出評估方法,由于間歇故障發生極其隨機,單純基于故障次數或幅值的評估方法可能會造成虛警。Correcher等[7]提出偽周期和失效密度的概念,建立評估模型計算間歇故障發生頻率和預測更換設備的最佳時間。Pan等[8]提出了度量間歇性脆弱因子(Intermittent Vulnerability Factor,IVF)來綜合評估間歇故障對微處理器的影響程度。
國防科技大學從2011年起,對振動環境下電連接器間歇故障機理、診斷與狀態評估開展了一些研究[9-10],在硬件方面開發了間歇故障檢測儀、基于FPGA(Field Programmable Gate Array)的線纜連接型間歇故障原位檢測系統,重點放在檢測上,在狀態評估與故障預測方面的工程應用成果較少。
合理的間歇故障動態特征要盡可能包含完整的電連接器的退化狀態信息,而單一的間歇故障幅值或次數不足以進行全面的表征。因此,為了充分利用間歇故障動態特征,本文開發了基于間歇故障廣義強度的狀態評估與故障預測軟件(后簡稱軟件),服務于航空電連接器在間歇故障方面的狀態評估與故障預測。首先對間歇故障內涵和動態特征進行梳理,構建間歇故障廣義強度特征作為評估指標,介紹了軟件總體架構設計和模塊化功能設計,最后在電連接器案例上進行了軟件實現與驗證。
按照GJB 3365-1998定義,間歇故障是指產品發生故障后,不經修理而在有限的時間內自行恢復規定功能的故障[11]。2015年,美軍發布了間歇故障檢測軍用性能規范,從故障持續時長的角度明確了間歇故障的定義,迄今為止是間歇故障檢測與診斷方面較為權威的依據[12]。該規范中將間歇故障劃分為短時、中時、長時間歇故障,持續時長分別為100 ns以內、101 ns~500 μs、501 μs~5 ms。在裝備的全壽命周期中,尤其是服役中后期階段,其間歇故障特征隨時間演化如圖1所示[9]。

圖1 間歇故障的演化過程
第1階段間歇故障表現不明顯,也不會成串出現,具體表現為單一脈沖的毛刺,對裝備影響輕微;第2階段中,間歇故障的持續時長與幅值明顯增大,可能在同一部位反復出現且出現較長時間,裝備可能會表現為一些間歇性功能異常,過段時間又恢復正常;到了第3個階段,間歇故障的影響已經不容忽視并可能會發展為永久故障,給裝備帶來致命的傷害。
間歇故障從誘因來看,可以分為以下兩類。
① 設計型間歇故障:主要是指在制造過程中產生的制造殘余物、工藝尺寸縮小帶來的器件特性的變化,或者是設計不足導致的缺陷。這類間歇故障不僅具有很強的隨機性,而且不具有規律性,難以復現和分析。
② 耗損型間歇故障:這類故障大多是因為裝備長時間服役造成的間歇性連接,其表現形式主要為老化磨損、焊點開裂、連接器針腳疲勞等造成的間歇性連接,符合圖1中的“三步走”退化階段,與設計型相比有一定的規律性,有可能進行復現與檢測。
從表現形式來看,間歇故障在裝備級、系統級、器件級的表現各有不同,但是通過層級又逐漸產生深層影響。以數字電路發生連接型間歇故障為例,在邏輯器件級可能表現為間歇性“固定”故障,即將故障信號線上的正確值間歇性地轉換為固定值,即邏輯值“1”或“0”,在集成模塊級別可能會表現為時序的間歇性延遲,從而導致時序違規,并在發生時影響數據傳輸。例如,由于時序延遲,觸發器無法鎖定新計算的值,導致向存儲單元中寫入錯誤的數據。故障傳播到裝備級,輕者導致計算機間歇性異常如重啟、顯示屏間歇閃爍,嚴重則導致裝備掉電或死機,這將會造成不可估量的損失。因此,裝備在長時間服役過程中,間歇故障往往是永久性故障的征兆,會導致永久性故障的發生。
想要利用間歇故障特征來對裝備的退化狀態進行評估,并進行永久故障預測,首先要明確哪些間歇故障特征可以作為退化過程的指標。合適的動態特征可以對故障進行較為定量的描述,目前典型的間歇故障動態特征可以歸納為3個,分別是間歇故障次數、持續時長和幅值。
間歇故障動態特征如圖2所示,其中,T表示一次任務周期、統計時長或采樣時間;i表示在時間T內發生的第i次間歇故障。

圖2 間歇故障動態特征
間歇故障次數N即在時間T內發生的間歇故障總次數。

(1)
間歇故障幅值MF是指實測值偏離正常值的幅度。
這3個動態特征都從不同層面上揭示了間歇故障的內涵,在一定程度上反映了間歇故障發生的強度大小,可以對電連接器進行評估與故障預測。目前基于間歇故障動態特征的故障預測算法已經有了一些研究[13-14],但目前未在工程上實現應用。為了將理論研究應用到實際工程中,需要能夠結合已有的算法設計開發故障預測軟件。
軟件總體架構設計如圖3所示,共分為3層:人機交互界面、模塊層和系統資源層。人機交互界面實現數據的選擇、導入與顯示,系統資源層實現數據存儲和模型庫支撐功能,存儲模塊層所需的間歇故障時長、幅值等數據,提供數據訓練所需的模型。

圖3 功能模塊化設計
模塊層設計共分為4個部分:特征提取模塊、模型訓練模塊、狀態評估模塊和故障預測模塊。軟件各模塊通過菜單欄進行切換。下面進行簡要介紹。
① 特征提取模塊:導入訓練樣本,提取樣本響應特征曲線,提取間歇故障廣義強度特征作為下一步模型訓練的基礎。
② 模型訓練模塊:基于間歇故障廣義強度特征,利用HSMM構建退化狀態轉移模型,利用訓練樣本對模型進行訓練,構建退化狀態評估分類器。
③ 狀態評估模塊:將被測樣本的間歇故障廣義強度導入狀態評估分類器中可評估其當前退化狀態。另外,利用該模塊可以對長時間采樣數據進行退化狀態變化分析,實現長時間狀態監控的功能。
④ 故障預測模塊:根據全壽命周期數據訓練永久故障預測模型,結合待測樣本的當前狀態可以進行永久故障預測,即預測剩余使用壽命。
通過實驗研究了間歇故障總持續時長、幅值和次數隨航空電連接器退化的趨勢分析,變化趨勢如圖4所示,為了統一到一個坐標系中,對持續時長、幅值和退化狀態均做了歸一化處理。

圖4 間歇故障特征隨電連接器退化的變化趨勢
由圖4可以看出,一次任務剖面內的間歇故障幅值和總持續時長均與退化狀態呈正相關,可以作為狀態評估的指標。但是,間歇故障幅值在退化過程中表現出了較大的波動性,而持續時長雖然呈單調遞增,卻不包含間歇故障次數的信息。間歇故障次數隨電連接器的退化呈現先增加后減少的趨勢,不能作為評估指標。
因此,單一的間歇故障時長或幅值都無法全面而準確地表征航空電連接器的退化狀態。綜合間歇故障在時間維度與幅值維度的表現,構建間歇故障廣義強度作為間歇故障的新動態特征,用I來表示,定義為間歇故障特征曲線與時間軸所圍成的面積,如圖2中所示的陰影面積,計算公式為[10]
(2)

(3)

特征提取模塊是整個軟件設計的基石,實現了訓練數據的導入與間歇故障廣義強度提取功能,步驟如圖5所示。

圖5 特征提取步驟
首先根據航空電連接器測試數據幅值和時長,識別采樣點中的間歇故障數據點,將間歇故障幅值和時長進行提取,利用式(2)、式(3)計算出每一個訓練樣本的間歇故障廣義強度,供模型訓練使用。
模型訓練模塊是從特征提取模塊中接收訓練樣本的間歇故障廣義強度特征,基于該特征構建狀態評估分類器,完成訓練功能,步驟如圖6所示。

圖6 模型訓練步驟
HSMM(Hidden Semi-Markov Models)模型能夠表征同一宏觀狀態下的不同片段時間的微觀狀態,符合航空電連接器的退化特點。首先根據HSMM模型構建狀態評估模型,根據間歇故障廣義強度特征,進行模型訓練,從而構建退化狀態分類器[8],以進行下一步的狀態評估。
航空電連接器從正常到故障共經歷了N個宏觀退化狀態,這就需要設計N個狀態分類器:HSMM(1),HSMM(2),…,HSMM(N)。以其中一個狀態分類器為例,此時模型只含有一種退化狀態,其模型參數λ=(N,π,A,B,Pi(d))。模型參數中的各項定義如下:N為使用狀態數;π為初始概率的分布矢量,π=[π1,π2,…,πN];A為狀態轉移矩陣{aij}N×N;B為觀測值矩陣{bjk};Pi(d)為狀態駐留時間概率分布。
利用HSMM模型構建狀態評估分類器過程如下。
① 用K-means聚類算法對訓練數據進行初始估計,得到B的初始參數值,確定初始模型參數λ1。
② 根據前向-后向算法計算初始參數條件下的輸出概率P(O|λ1)。

狀態評估模塊識別待測樣本的當前狀態,為故障預測模塊提供基礎。使用狀態評估過程如圖7所示。

圖7 狀態評估步驟
狀態評估模塊設計了3種評估模式,分別為單一狀態評估、同一狀態下多樣本狀態評估和長時間退化狀態評估。前兩種評估模式樣本采樣時間短,處于單一退化狀態。此時計算待測數據的間歇故障廣義強度,將其輸入到訓練好的狀態分類器中,計算模型的概率P(O|λi),其最大后驗概率值即為該樣本的當前退化狀態。同一狀態下多樣本狀態評估是為了電連接器在同一使用狀態下的多個樣本同時識別其狀態設置的。長時間退化狀態評估直觀顯示了時間退化過程。此時需要將待測樣本根據其采樣時間可變地分為多個樣本區間,分別對單個區間計算間歇故障廣義強度,再導入狀態分類器進行狀態識別。在這種模式下能夠更直觀地看到裝備隨時間的退化狀態變化趨勢。
故障預測模塊是根據待測數據的當前退化狀態,對其剩余使用壽命進行預測,對航空電連接器的使用達到預警的作用,避免其服役至接近使用壽命,出現永久性故障。故障預測模塊步驟如圖8所示。

圖8 故障預測步驟
首先根據全壽命故障觀測序列提取間歇故障廣義強度特征,利用參數重估算法確定各個使用狀態的均值和方差,并計算每個退化狀態的駐留時間,再結合待測樣本數據的當前使用狀態hi,計算剩余使用壽命。
剩余使用壽命區間計算過程如下。
首先計算每個退化狀態的駐留時間[13]:
D(hi)=μ(hi)+ρσ2(hi)
(4)
式中,μ,σ2為駐留時間的均值和方差。
(5)

假設電連接器當前狀態為i,RULi表示當前時刻的剩余壽命區間,計算式為
(6)
其中,
(7)
(8)
由于Matlab具有高效的模型訓練和模式識別計算能力,設計開發了基于Matlab的航空電連接器間歇故障狀態評估與故障預測軟件,軟件界面如圖9所示。

圖9 軟件界面示例
(1) 特征提取。
為了驗證軟件的可行性,對故障預測方法進行驗證,針對航空電連接器的退化過程進行了恒加振動應力間歇故障加速復現試驗,對電連接器進行了不同程度的磨損來模擬不同退化狀態,通過測量接觸電阻采集全周期壽命數據。所使用的航空電連接器、試驗原理與試驗平臺如圖10~圖12所示。

圖10 航空電連接器實物圖

圖11 試驗原理圖

圖12 振動平臺及試驗現場圖
通過試驗采集到電連接器的接觸電阻數據,通過本軟件進行狀態評估與故障診斷驗證。將樣本數據導入特征提取模塊,當接觸電阻大于10 Ω且持續時間在[100 ns,5 ms]時視為發生間歇故障[9]。按照圖5步驟,提取間歇故障數據的幅值和時長,計算間歇故障廣義強度特征,作為模型訓練的基礎。
(2) 模型訓練。
在確定退化狀態數量上,根據電連接器全壽命周期數據,劃分為5個狀態等級,分別為正常狀態、輕度損傷狀態、中度損傷狀態、重度損傷狀態和永久故障狀態。
導入不同退化狀態下的多個電連接器試驗數據,提取各個樣本的間歇故障歸一化廣義強度用于模型訓練,最后進行狀態分類器訓練。如圖13所示,訓練完成了5個狀態分類器,分別對應5個退化狀態等級。

圖13 模型訓練
(3) 狀態評估。
① 單個采樣點狀態評估。
針對單個采樣點,導入數據后分別顯示波形圖和超過故障閾值的故障點。將待測點的廣義強度輸入到狀態分類器中進行狀態識別,識別完成后顯示在下方的坐標軸中,如圖14所示。

圖14 單一采樣點狀態評估
該待測數據的歸一化廣義強度值為0.038839,識別當前狀態為輕度損傷狀態,與實際狀態進行對比,評估正確。
② 同一狀態下多采樣點狀態評估。
在實驗過程中發現,就算在同一運行工況、相同退化狀態下的數據有較大的波動,因此為了獲得更完整的全壽命周期數據,也為了對同一狀態下采集多個樣本,因此對多個電連接器進行了加速振動試驗。在該模式下,同時導入多個數據,左方坐標軸內顯示多測試樣本的歸一化廣義強度值,右方坐標軸顯示的概率值最大的狀態即為當前識別狀態,如圖15所示。

圖15 多采樣點狀態評估
測試中導入了同一退化狀態(輕度損傷狀態)下的10個樣本進行測試,評估結果中除第2個樣本評估為正常狀態產生錯誤外,其余均為輕度損傷狀態,評估結果較為滿意。
③ 長時間退化狀態評估。
在此界面可以更直觀地觀察到電連接器隨時間的退化狀態,因此輸入數據為較長時間的監控結果。用恒加振動應力加速電連接器退化過程,振動時間為30 min。導入長時間采樣樣本,如圖16所示,左邊顯示數據的時域波形,右邊可以較為直觀地看到電連接器使用狀態隨時間的退化趨勢。

圖16 長時間退化狀態評估
該連接器經歷了正常狀態、輕度損傷狀態和中度損傷狀態,與實際退化情況吻合。并且可以看到,退化趨勢表現出了較大的波動性,這正是因為間歇故障有較強的隨機性,但總體上電連接器狀態是隨時間不斷惡化的。
(4) 故障預測。
故障預測需要根據計算出的不同退化狀態的駐留時間、均值和方差,結合測試樣本當前的退化狀態,給出當前的剩余使用壽命區間預測值。
導入全壽命周期數據,由式(4)、式(5)計算各個使用狀態的均值、方差和駐留時間,顯示在表格中。導入測試樣本,由當前退化狀態和式(6)~式(8)計算出預測的剩余使用壽命區間,如圖17所示。

圖17 剩余使用壽命預測
從正常狀態,輕度、中度和重度損傷狀態中選取12個電連接器數據,振動加速其退化過程至發生永久故障,記錄其實際剩余壽命,與預測結果進行對比。若實際剩余壽命在預測區間內,則可以認為預測正確。這12個樣本的實際與預測結果如表1所示。

表1 剩余使用壽命預測
從表1可以看出,有2個樣本實際剩余使用壽命不在預測區間內,預測錯誤,剩余10個樣本預測正確。造成錯誤的原因可能有以下兩點:① 退化狀態劃分不夠細致,預測錯誤的樣本實際剩余壽命在區間上下限附近;② 剩余壽命預測模型精度有待提高,本算法是根據當前狀態計算出預測區間,因此同一個退化狀態的預測區間相同,不能細致地根據同一個狀態下不同退化過程進行預測,預測精度有待提高。但是總的來說,本算法基本實現了故障預測功能,驗證了該評估方法的可行性。
本文著眼于航空電連接器,基于間歇故障特征分析,設計并實現了間歇故障狀態評估與故障預測軟件,并進行了案例驗證。結果表明,基于間歇故障廣義強度特征的狀態評估有較強的適用性,評估和故障預測效果較好,軟件填補了航空電連接器在間歇故障上評估與預測工程應用上的空白,為無明顯故障征兆的航空電連接器狀態評估與故障預測提供了依據。軟件顯示直觀、操作簡單,并且可推廣到其他與惡劣的使用環境密切相關、受間歇故障困擾而無明顯征兆的電子器件上,有較廣泛的工程應用價值。