池程芝, 潘震, 徐釗, 張一童
(1.中國航空無線電電子研究所 航空電子系統綜合技術重點實驗室, 上海 200233;2.西北工業大學 電子信息學院, 陜西 西安 710072)
在某些特定的作戰環境中,極端的作戰環境會使航電系統中的器件參數更容易產生變化,進而影響飛機系統的安全性和可靠性[1-2],如何保障作戰效率成為目前亟待解決的問題。在航電系統中,電源轉換模塊(power conversion module,PCM)的功能是將飛機電源系統的供電電壓轉換為飛機內部機架的直流電壓,通過控制電源陣列開關給各模塊供電;DC-DC功率變換器是PCM模塊中的核心部分,其健康狀態會影響到其他所有模塊,是其他模塊正常工作的基礎。在DC-DC功率變換器中有各種不同的電壓電流信號,如果不能對電壓電流信號進行有效處理,會使得寶貴的監測信號資源變為“數據爆炸”,且占用航電系統中較大的計算資源,整個航電系統的時效性和穩定性會受到影響。因此對功率變換器進行特征選擇至關重要[2-3]。
為此國內外學者開展了大量的研究工作,文獻[3-5]分析了特征選擇和特征降維在故障診斷方向的作用和意義。文獻[6]提出了基于主成分分析和極限學習機相結合的故障診斷算法,利用主成分分析和方差貢獻率對原始數據進行降維。文獻[7]對特征信號進行了微分,是一種快速的檢測和識別方法。文獻[8]提出堆疊降噪自動編碼器的特征降維方法,對原始特征信號進行數據壓縮,從而達到降維效果。文獻[9]基于一維卷積神經網絡進行自適應特征提取。隨著大規模集成系統的使用,傳感器數量指數型增長,特征降維所需時間大大增加,傳統的方法在處理集成度較高的系統時,會存在精度較低,泛化能力較弱等問題,特征選擇能夠大大縮短對大規模數據進行數據挖掘的時間。本文利用統計分析、智能優化算法等不同技術之間的差異性和互補性,提出更為有效的多模型融合的特征選擇技術,使得所選特征對于不同分類器能有更好的魯棒性。
在DC-DC變換器中常見且易損器件有鋁電解電容、開關晶體管和功率二極管,上述元器件是功率變換器中較易出現故障的部分。鋁電解電容吸收輸出電壓的波動從而使得輸出電壓更加穩定,且去除噪聲導致的輸出電壓中的交流部分。開關晶體管是整個變換器的核心器件,該器件作用是功率轉換。功率二極管用于整波整流。上述器件對于DC-DC變換器的正常工作有著致命性的影響,因此利用特征選擇和故障診斷算法對上述器件進行分類研究非常有必要。
本文以圖1所示的DC-DC變換器電路為研究對象,在Cadence仿真環境中搭建電路。通過仿真軟件中“探針”采集原始數據信息,用于后續數據挖掘與特征選擇工作。

圖1 基于Sepic拓撲結構的電路模型
本文的故障診斷框架如圖2所示。主要包含了數據預處理、特征提取、多特征選擇算法融合、故障診斷。數據預處理對異常數據清洗和缺失數據添補整理;特征提取利用不同算法對原始信號進行分析及數據挖掘。特征選擇模塊是本文的重點部分,利用不同的選擇算法對提取出的大量特征進行選擇;最后通過BP神經網絡算法建立所選特征變量與故障類型之間的對應關系。

圖2 故障診斷框架
ReliefF算法是多分類特征選擇算法。ReliefF給特征以不同的權重,選擇權重較大的特征,進行分類。ReliefF在處理多類問題時,先從訓練集中隨機選取一個樣本R, 從R相同類別的樣本中找K個近鄰樣本,從不同類別的樣本中找K個近鄰樣本,更新不同特征權重,其權重計算準則如(1)式所示
(1)
式中:Δ(A,R,Hj)是樣本R與Hj在特征A上的差;C為與樣本R不同的類別;P(C)為第C類的概率;Cclass(R)為樣本R所在的類;Mj為類別C中與樣本R的第j個最近鄰樣本;Δ(A,R,Mj(C))為樣本R與樣本Mj在特征A上的差。
遞歸特征消除法(recursive feature elimination,RFE)反復多次創建模型,并在每次迭代時保存最好的特征,在下一次迭代時,采用上一次建模中沒有用過的特征來構建下一個模型,最終找到一個性能最優的特征子集。
SVM-RFE特征選擇算法利用支持向量機(support vector machine, SVM)的分類性能作為特征選擇評價標準。SVM-RFE起始于全部特征,然后每次移去一個特征直到特征集合為空,移去的特征是所有特征中‖ω‖2最小的一個,ω為支持向量機中的超平面法向量。這樣對某一變量i,排序評價準則如(2)式所示。
(2)


圖3 SVM-RFE算法流程圖
隨機森林算法(random forest,RF)是基于決策樹(decision tree,DT)算法,其利用多棵決策樹對樣本進行訓練并預測。算法的流程圖如圖4所示。

圖4 隨機森林算法基本思路
CART決策樹(classification and regression tree,CART)算法使用基尼系數來選擇劃分屬性?;嵯禂悼杀硎緸?/p>
(3)
式中:D表示數據集;k表示第k類樣本;Pk和Pk′分別表示不同類別標簽的概率。可根據(3)式,計算出屬性a的基尼系數,獲得基尼指數定義
(4)
式中:屬性a有V個可能的取值{a1,a2,…,aV},使用a來對樣本集D進行劃分,會產生V個分支節點,其中第v個分支結點包含了D中所有在屬性a上取值為av的樣本,記為Dv。 在候選屬性集合A中,選擇基尼指數最小的屬性作為最優劃分屬性,既a*=argminGini-index(D,a)。
多特征選擇算法融合模型可用(5)式表示
(5)

本部分的故障診斷算法研究主要針對于DC-DC變換器中硬故障類型,如易損器件的短路和開路故障,故對前述的3個易損器件分別進行開路和短路的故障仿真,由于開關晶體管的開路故障無法在仿真軟件中實現,所以本部分對其余5種故障進行特征選擇和分類研究。DC-DC變換器的主要參數為輸出電壓,在正常狀態和故障狀態下的輸出電壓值會有明顯的差異。采集不同故障類型下的輸出電壓值,可以根據輸出電壓的特征信息進行有效的分類。在實際電路中,電壓信號可以采取直接測量的方式獲取,而對于電流信號,電路中往往不存在采樣輸出接口,需要利用電磁感應的原理來獲取,因此本文選擇輸出電壓作為信號特征。
對輸出電壓提取時域特征如表1所示。

表1 時域信號
DC-DC變換器是典型的數模混合電路,當電路發生故障時,信號各頻段的能量較正常值必定發生一定的變化,利用離散小波變換只保留了低頻信息,丟失了高頻信息,而利用小波包分解能同時保留低頻和高頻信息,得到較為完備的故障信息。所以在時頻域中,對輸出電壓進行3層小波包分解。
采用以上特征對各輸出電壓信號進行特征提取,對5種不同的故障類型各取10組進行示例,對特征提取部分獲得的故障特征向量進行歸一化處理,以消除不同特征分量之間的量綱之間的差異。時域和時頻域特征提取部分如圖5~6所示。
由上述的時域特征矢量和小波包分解、重構各頻段小波能量頻域特征矢量可知,初選特征矢量維度較高,特征分量間存在較大的信息冗余,如果直接用于BP神經網絡訓練,得出的模型精度不高且計算時間較長。故采用多特征選擇算法對其進行數據挖掘工作,ReliefF算法、RFE-SVM及隨機森林3種特征選擇算法的仿真結果如圖7~9所示。

圖5 時域特征統計量曲線 圖6 時頻域特征統計量曲線 圖7 ReliefF模型特征選擇結果

圖8 RFE-SVM模型特征選擇結果 圖9 隨機森林特征選擇結果圖10 加權平均算法結果圖
由圖7~9可以看出,不同的選擇算法對特征的選擇有著相似性,也有差異性。在ReliefF算法中,時域信號中輸出電壓的偏度和峰峰值具有較大的貢獻度,在時頻域中,重構系數中第三和第四系數權重較大。RFE-SVM算法的返回值為布爾值,可以看出除了ReliefF算法中權重較大部分外,輸出電壓的標準差也被選為主要特征之一。而隨機森林算法和前兩者具有較大的差異,主要體現在時頻域中,重構系數的第一和第二系數大于第三和第四系數;但在時域中,輸出電壓的標準差、偏度及峰峰值和其他算法結果相似。
仿真實驗產生不同故障類型各40組,共200組為訓練集,利用訓練集對模型進行訓練;留出不同故障類型各10組,共50組為測試集,進行故障診斷準確率的評估。如圖10所示,根據加權平均算法的結果,本文仿真實驗中采用時域中輸出電壓標準差、偏度及峰峰值和頻域中第三和第四系數作為特征矢量,首先將上述所選出的5個特征作為特征矢量,利用KNN算法進行分類研究。結果如圖11所示。
選出的5個特征組成的特征矢量能夠在KNN分類算法下實現100%準確率。為了更進一步驗證算法效果,按照權重系數的大小,利用KNN算法分別對5組被選取特征進行分類研究。診斷結果如表2所示。

表2 不同特征分類結果圖
從表2可以看出,輸出電壓峰峰值和標準差都能在KNN算法中實現100%的準確率,為了驗證多特征選擇算法融合的魯棒性,將輸出電壓峰峰值特征放入BPNN網絡中進行驗證,從圖12可以看出,真實測試集和預測的測試集結果完全一致,在仿真實驗的條件下,診斷精度也能達到100%。結合圖11和圖12的分類結果可以得到,本文提出的多特征選擇算法模型僅用最高權重系數的特征即輸出電壓的峰峰值,就能夠在不同的分類器中得到較高的準確率。

圖12 基于BPNN模型硬故障分類結果示意圖
本文對DC-DC變換器不同故障進行失效模型分析,考慮到實際電路信號采集問題,選擇了對DC-DC變換器影響最小的輸出電壓信號,通過仿真獲取原始數據并進行特征提取、多特征選擇算法降維,得到特征矢量,建立了BP神經網絡分類模型。仿真結果表明本文提出的多特征選擇模型融合方法能夠進行多故障分類的任務。
相比于傳統數據,高維數據中的數據量更多、特征之間的相關性也更為復雜,盡管部分機器學習的算法模型對高維數據也能實現分類預測等功能,然而在實際工程中,泛化性較弱的問題是非常常見的。本文在特征選擇方面提出了多模型融合的算法,可以有效避免“過擬合”和“維數爆炸”問題,且增強了模型的泛化能力,相較于特征降維,對于研究人員而言,該方法更易理解。下一步工作是利用更多的數據集去驗證算法模型的魯棒性和準確性。