【摘要】本文提出一種基于旋轉森林的集成極端學習機分類方法,用以提高模擬電路故障診斷的準確性。算法對采樣后的數據進行小波分解獲得故障特征,采用旋轉森林增加集成極端學習機基分類器之間的差異性。實驗結果表明,采用本文方法對模擬電路進行在線故障診斷具有較高的準確性。
【關鍵詞】旋轉森林;極端學習機;模擬電路;故障診斷
1.引言
有理論表明,在復雜電子系統中,模擬電路部分最易發生故障,但由于其自身具有非線性,以及包含元件的容差性等特點使得針對模擬電路的故障建模困難,傳統的故障字典法等方法已很難適應。為了實現模擬電路故障模式的準確分類,本文提出一種基于旋轉森林(Rotation Forest,ROF)的極端學習機(Extreme Learning Machine,ELM)集成模擬電路故障診斷方法。
2.極端學習機算法
極端學習機[1](ELM,Extreme Learning Machine)在隨機給定輸入權值與神經元參數的基礎上,將傳統前饋神經網絡參數訓練問題轉化為求解線性方程組,以直接計算輸出權值的最小二乘解的方式完成網絡訓練過程。
3.旋轉森林算法
ROF[2]是針對集成分類器間的差異性和集成分類器的準確性兩個方面提出的。設x=[x1,x2,…,xn]T表示有n個特征的一個樣本,N個數據點構成一個初始訓練集,用一個N×n的矩陣X表示,Y=[y1,y2,…,yN]T表示這N個點的標記。D1,D2,…,DL表示L個基分類器,F則表示特征集。區別于bagging、boost和隨機森林算法,它是通過以下步驟構造每一個基分類器Di(0≤i≤L)的訓練集:
1)將特征集F劃分為K個不相交的子集。每個子集大約有M=n/K個特征。
2)Fi,j表示第Di分類器的訓練集的第j個特征子集,隨機去掉某一類的樣本,并對剩下的樣本進行75%的重采樣。對Fi,j進行主成分分析(PCA)后得到Mj個主成分ai,j(1),ai,j(2), …,ai,j(M)。
3)重復步驟2)K次,把K個主要成分系數放入一個稀疏“旋轉”矩陣Ri,主對角線元素為j個特征子集的主成分,其余元素為零。
根據原始特征集的順序按列重排這個矩陣,得到旋轉矩陣Ria,最后得到Di分類器的訓練集為XRia。
重復以上步驟L次,得到各個分類器的訓練集XR1a,XR2a, …,XRLa。
4.基于ROF的模擬電路故障ELM集成診斷
步驟1:通過靈敏度分析,選擇參數變化對輸出相應影響較大的元件;
步驟2:設定故障模式,并針對每種故障模式利用Monte Carlo仿真獲取訓練樣本數據;
步驟3:對獲取的故障樣本數據進行小波包分解,提取底層各項系數計算歸一化能量值,作為故障特征;
步驟4:設輸入故障初始樣本X,樣本包括D個故障特征,ELM神經網絡集成分類器個數為L,采用第2節中的步驟得到的訓練集XR1a,XR2a, …,XRLa訓練各個分類器,得到集成分類器組:Ω={C1,C2,…,CL};
步驟5:分別使用L個分類器對測試故障樣本集進行診斷,采用多數投票法獲得集成各分類器的輸出。
5.實例分析
本文以文獻[3]中的帶通濾波器電路為例來驗證所提出算法的有效性。電路施加1V,頻率為1kHz的正弦信號,仿真時間為0-0.5s,時間步長為1ms。利用Multisim10.0軟件進行靈敏度分析,發現C1、C2、R2和R3對輸出響應最明顯,因此選擇這4種元件作為引起的雙故障的故障源。發生故障時,各故障元件分別偏離正常值±50%。這里對表1中包括無故障在內的9種雙故障進行分析。針對每種故障模式分別進行50次Monte Carlo分析,共獲取450組故障樣本數據,選擇db3小波函數對故障樣本數據進行3層小波包分解,并以第3層各項分解系數歸一化能量作為故障特征,得到450×8的故障特征矩陣。選擇各模式30組樣本作為訓練樣本,其余20組樣本作為測試樣本。C1、C2、R2和R3。
表1 雙故障分類
故障模式 故障描述 類別
Df0 NF 1
Df1 C1↑amp;C2↑ 2
Df2 C1↑amp;R2↑ 3
Df3 C1↓amp;R3↑ 4
Df4 C2↓amp;R2↑ 5
Df5 C2↑amp;R3↓ 6
Df6 C2↑amp;R2↓ 7
Df7 R2↑amp; R3↑ 8
Df8 R2↓amp;R3↓ 9
為了驗證采用本文算法進行診斷的效果,選擇集成RBF神經網絡模型進行對比,集分類器個數均選擇為10。在離線故障診斷中,兩種模型訓練準確率均為100%,但采用本文方法的測試準確率達到100%,而集成RBF神經網絡模型的測試準確率僅為79.33%。為了驗證模型在線診斷能力,對電路各故障連續運行5s重新采集50組樣本。設定兩種工況:
(1)電路連續正常運行5s;
(2)正常運行2.5s后出現一種雙故障,這里選擇Df5和Df7兩種故障。圖1和圖2為在線診斷結果。可以看出,對于正常狀態兩種模型都能夠準確實現故障的在線診斷,但對于雙故障集成RBF神經網絡模型全部出現了誤診,而本文算法僅出現了2次誤診,算法在線診斷能力優于集成RBF神經網絡模型。
圖1 正常狀態在線診斷結果
圖2 發生雙故障在線診斷結果
6.結論
本文采用旋轉森林算法提高集成極端學習機基分類器之間的差異性,并將改進后的集成分類器用于對模擬電路進行故障診斷。實驗結果表明,與集成RBF神經網絡模型相比,采用本文方法對模擬電路進行在線故障診斷具有較高的準確性。
參考文獻
[1]YU Q,MICHE Y,EIROLA E,et al.Regularized extreme learning machine for regression with missing data[J].Neurocomputing,2013,102:45-51.
[2]毛莎莎,熊霖,焦李成等.利用旋轉森林變換的異構多分類器集成算法[J].西安電子科技大學學報(自然科學版),2014,41(5):55-61.
[3]王宏力,何星,陸敬輝,等.基于固定尺寸序貫極端學習機的模擬電路在線故障診斷[J].儀器儀表學報,2014,35(4):738-744.
基金項目:河南省科技廳基礎與前沿技術研究項目(No.142300410163);河南師范大學新引進博士科研啟動費支持課題(No.qd12136)。
作者簡介:
敖培(1979-),女,蒙古族,遼寧沈陽人,博士研究生,講師,研究方向:智能信息處理。
李賀(1989—),男,河南周口人,碩士研究生,研究方向:農業信息化。
趙四方(1995—),男,河南林州人,大學本科,研究方向:計算機科學與技術。
馮志鵬(1995—),男,河南新鄉人,大學本科,研究方向:計算機科學與技術。