肖翼洋 申傳俊 鐘多就
(1、海軍航空大學青島校區,山東 青島264001 2、海軍湛江航保修理廠,廣東 湛江524002)
軍用飛機所使用的接觸器是電磁類開關器件, 用于頻繁接通和斷開主電路, 具有可遠程操作和以小控大的優點, 由于接觸器長期連續工作在頻繁分斷的工作狀態, 一旦發生故障將造成巨大損失, 因而國內外都非常注重接觸器的維護。對接觸器進行針對性的特征分析, 將特征參數用于壽命預測, 可指導維修人員對繼電器進行及時的維護更換, 避免重大事故的發生。
目前對交流接觸器進行特征分析的方法主要有: 主成分分析、經驗模態分解和小波分析,并取得較好效果。主成分分析來源于統計學, 優勢在于可以降低原始數據冗余度和預測模型的復雜度。例如:田琨利用主成分分析法對交流接觸器的試驗數據進行分析,提取了交流接觸器兩個新特征,對新特征進行神經網絡預測的誤差比原特征小[1]。高筱婷對主成分分析進行了改進,用于交流接觸器狀態檢測特征的主要信息提取, 同時建立了一種評價機制, 利用分析的結果對改進的方法進行了仿真驗證[2],結果表明改進的方法能較好的剔除噪聲信息。王圓圓利用經驗模態分解同樣實現了對交流接觸器數據的去噪, 為交流接觸器性能的評估提供了保證[3]。
為了研究飛機直流接觸器的電氣參數退化特征, 本文對直流接觸器試驗數據進行主成分特征分析,獲取特征參數,利用隨機森林算法對接觸器試驗數據進行分析與處理, 得到該特征的評價值,以確定接觸器有關參數為接觸器的退化特征,并根據該退化特性,指導直流接觸器壽命預測。

表1 試驗樣本集
本文研究對象為接觸器的電氣參數,主要包括:線圈電阻,反峰電壓,啟動電流,保持電流,吸合電壓,釋放電壓,吸合時間,釋放時間,回跳時間,絕緣性能,接觸電阻。上述參數可以利用標準儀器測量。MZJ-200 型直流接觸器第二期試驗中的接觸器數據試驗所獲得的樣本集如表1。
基變換實現了數據從一個空間到另一個空間的映射, 這組基(一組方向)選擇的要求為:(1)在變換過程中保留原始數據的更多信息;(2)基變換后的數據特征之間的數據冗余盡可能小[4-7];(3)實現降低特征目標, 把原始數據中主要的成分都保留在新的空間下。
將接觸器試驗數據在基上投影,作主成分分析,判斷提取的特征是否有隨吸合次數增加的退化趨勢。步驟如下:
(1)數據標準化。
(2) 算樣本集D 進行標準化處理后的數據X 的協方差矩陣,獲取協方差,

(3)求取協方差矩陣C 的特征值λi和特征向量ei。
(4)將重要的特征向量按照與其對應的特征值的大小降序排列,并且合并這些特征向量組成代表樣本主要信息的特征矩陣,利用原始數據與特征矩陣基變換獲得提取的特征矩陣[8]

(5) 將特征值降序排列,求出每個特征值的比重并計算累加比重,并繪制圖表如圖1,表2- 表4。
如提取原始數據70%的主要信息, 選取第1、2、3 主成分已經足夠,實際結果中包含了80%的信息。第1、2、3 主成分對應的特征向量E1、E2和E3組成的特征矩陣如表5。

表2 樣本集D 的11 個特征值降序排列

表3 11 個特征值的特征比重

表4 11 個特征值的特征累加比重

圖1 11 個特征值的特征比重和累加比重
(6)計算樣本集D 的特征矩陣。繪制提取的特征隨吸合次數增加的變化曲線,分析提取的特征是否有退化趨勢。
圖2-4 中,橫坐標表示吸合次數,縱坐標表示提取特征的值。
結論:從圖2、圖3 中可以得出:①隨吸合次數的增加,提取的特征1 的值在不斷下降,下降過程中有非常小的波動,且規律明顯;②隨吸合次數的增加,提取的特征2 的值在600 次吸合以前大致在[-1.2,1]之間波動,僅有少許值游離在范圍外。特征2 在600-1400 次,1600~2000 次、2000~3000 次吸合時不斷下降。且在這三段下降之間的位置的某個特定值附近都有突然的上升;③隨吸合次數的增加,提取特征3 的值在不斷上升,上升過程僅有少量波動。

表5 樣本集D 的特征矩陣

圖2 特征1 隨吸合次數增加的變化曲線

圖3 特征2 隨吸合次數增加的變化曲線

圖4 特征3 隨吸合次數增加的變化曲線
集成學習思想是為了解決單個模型或者某一組特征的模型所固有的缺陷,從而整合了更多的模型,取長補短,避免局限性。隨機森林就是集成學習思想下的產物, 將許多棵決策樹整合成森林, 并合起來用來預測最終結果或者投票決定測試樣本的最終類別。

圖5 隨機森林原理圖
隨機森林主要包括4 個部分:隨機選擇樣本;隨機選擇特征;構建決策樹;隨機森林投票分類。
假設一個分類系統的樣本空間(D,Y),D 表示樣本集,Y 表示基于特征X 的最優分割點確定的k 個類別,可能的取值是C1,C2,……,Cn。每一個類別出現的概率是P(C1),P(C2),……,P(Cn)。該分類系統的熵為:

熵值越高,則數據混合的種類越多,其蘊含意義是一個變量可能的變化越多(跟變量具體的取值沒有任何關系,只和值的種類多少以及發生概率有關),它攜帶的信息量就越大。
根據信息增益的公式,分類系統中特征X 的信息增益為:

信息增益是針對特征而言的,對一個特征X,系統有無特征X 時信息量的差值就是這個特征給系統帶來的信息增益。每次選取特征的過程都是通過計算每個特征值劃分數據集后的信息增益,然后選取信息增益最高的特征。
經過一輪信息增益計算后會得到一個特征作為決策樹的節點,該特征有幾個取值,節點就會有幾個分支,每一個分支都會產生一個新的數據子集, 余下的遞歸過程就是對每個新的數據子集再重復,直至子數據集都屬于同一類。
使用scikit-learn 庫中的隨機森林模塊構建隨機森林, 需要確定三個參數:決策樹的個數、葉子節點上包含的樣本最小值、分割內部節點所需的最少樣本數量。確定這三個參數的依據7折交叉驗證準確率。
由于隨機森林中各個決策樹并聯訓練,互不影響,且最終分類結果為所有決策樹投票表決。故決策樹數量這個參數,對另外兩個參數對7 折交叉驗證準確率的影響沒有干擾。故在確定另外兩個參數的最佳值時, 決策樹數量可以任意取值, 這里取74個。
特征評價:依據特征評價思想,依次完全破壞各個特征,求出對應的特征重要性。

圖6 隨機森林特征重要性評價
由圖6 可知,釋放電壓、接觸壓降、釋放時間和吸合回跳這四個特征的特征評價最高, 且其他的各特征的特征評價相對而言較低。
結論:選取釋放電壓、接觸壓降、釋放時間和吸合回跳為接觸器的退化特征。由接觸器的這四個特征隨吸合次數增加的變化趨勢可知,這四個特征的確具有退化趨勢(圖7)。
對飛機直流接觸器的電氣特征參數作主成分分析,提取特征量,對兩個新特征隨動作次數增加的變化趨勢進行分析,發現兩個新特征均具有良好的退化趨勢。利用隨機森林算法對接觸器特征參數進行特征分析與處理,結果表明釋放電壓、接觸壓降、釋放時間和吸合回跳為接觸器退化特征。退化特征可用于壽命預測,預測結果可直接指導該型接觸器的維修工作,具有重要的軍事與經濟效益。