張雷,黃奕宏,翁勝龍
(華南理工大學 機械與汽車工程學院,廣東 廣州 510640)
基于GA-DS的多神經網絡故障診斷方法
張雷,黃奕宏,翁勝龍
(華南理工大學 機械與汽車工程學院,廣東 廣州 510640)
針對基于信息熵的神經網絡證據形成過程需要專家經驗確定參數這一不足,提出一種改進方法,即用遺傳算法(Genetic Algorithm,GA)進行尋優,自動確定參數,其實質是利用了遺傳算法的高效的并行尋優能力和對初始種群的較低的敏感性,通過訓練樣本自適應調整證據形成過程中的參數,提升DS(Dempster Shafer)證據理論的融合效率。對多類軸承故障數據的診斷結果表明,該方法(GA-DS)能夠自動調整神經網絡的證據形成過程,從而有效地降低了融合過程中證據的沖突性,并且顯著提高了診斷精度和穩定性。
信息熵;神經網絡;遺傳算法;證據理論;故障診斷
神經網絡以其優良的泛化性能被廣泛應用于機械故障診斷[1]。對于神經網絡,特征維度較低難以有效描述分類對象,維度較高則大大降低神經網絡的訓練速度和分類性能;證據理論常用于解決神經網絡這一缺陷,通過融合多個低維特征空間的神經網絡分類結果,起到不同分類結果之間的互補,并消除冗余,大大提高了分類精度和速度[2]。但是證據理論在合成高度沖突證據的性能穩定性較差,很大程度上取決于證據的形成過程。
針對神經網絡的證據形成過程,本文提出一種基于遺傳算法的改進方法,依據訓練樣本自適應調整證據形成過程,有效地消除不同神經網絡形成的證據之間的沖突性。通過對軸承故障分類,結果表明該方法具有較高的正確性和穩定性。
設識別框架Θ={B1,B2,…,Bc},c為命題個數;n個證據進行組合,證據集E={E1,E2,…,En},各證據對應的基本概率賦值函數為mi(i=1,2…n),分配給Θ中命題Bj(j=1,2…c)的基本概率賦值(BPA)為mi(Bj),則DS合成公式為:

q為沖突系數,q∈[0,1],當沖突系數較大時,DS理論融合結果常有悖常理。為了解決DS理論應用于多神經網絡融合過程中沖突系數較大的問題,文獻[3]提出了一種根據信息熵的神經網絡證據形成過程。信息熵是由香農提出的,是用來描述信息的不確定性。信息熵值越大,信息的不確定性越大,提供的信息度就越小,所以該信息在融合過程中被保留的比例越小,所做修正越大,信息熵的計算公式為:

其中si為信息,這里si=pi,pi為神經網絡輸出歸一化結果,當p1=p2…=pn=1/n時,信息熵到達最大Hmax=-log2(1/n),此時不確定性最大。以Hmax為基礎,計算各神經網絡輸出的信息熵H,通過式(4)得到對應的保留因子α:

λ是指數因子,表征保留因子α與信息熵H之間的非線性關系。各類的BPA為:

以一個三分類為例,對同一測試樣本神經網絡1、神經網絡2、神經網絡 3得到的(p1,p2,p3)分別為(0.1 0 0.9),(0.4,0.4, 0.2),(0.33 0.33 0.34),信息熵值大小:神經網絡3>神經網絡2>神經網絡1,如圖1,在相同λ值下,信息熵越大,保留因子α越小;當信息熵不變時,保留因子α與λ反相關,尤其當信息熵很大時,如神經網絡3曲線,α隨著λ的增大而急劇下降;隨著信息熵的增大,α對于λ的取值敏感程度而增大。可見,λ的合理取值對證據的形成過程十分重要,尤其是當神經網絡輸出不確定性較大時。但對于λ的確定需要依據專家經驗參考文獻[3],不利用于智能自動診斷,本文提出用遺傳算法對其進行改進,提出基于GA-DS的多神經網絡模型。

圖1 保留因子α隨指數因子λ的變化曲線Fig.1 The retention factor a variation curve depended by exponential factor λ
遺傳算法[4]廣泛應用于參數優化,適用于解決NP問題,是一種并行隨機搜索最優方法,較好地避免陷入局部極值點。遺傳算法的思想是“優勝劣汰,適者生存”,模仿生物進化中的雜交與變異,保證遺傳算法的尋優過程快速、有效,并且初始種群對其尋優結果影響較小,有很好的魯棒性[7]。
在用DS理論融合多神經網絡之前,提出一種基于遺傳算法的神經網絡證據自適應形成過程,形成一種基于GA-DS的多神經網絡模型,用于故障分類,基本步驟如下:
1)將樣本分為訓練樣本,測試樣本。按著一定比例,將訓練樣本分為訓練樣本a,訓練樣本b。
2)用訓練樣本a來訓練各特征空間所對應的神經網絡,確定各神經網絡各層的權值和閾值。
3)用訓練樣本b輸入訓練好的各神經網絡,通過含指數因子λ的證據形成過程,得到各神經網絡的BPA,用DS理論融合各BPA,進行故障分類,最終得到訓練樣本b的診斷正確率,這一正確率作為遺傳算法的目標值,通過遺傳算法的優化過程來確定λ,如圖2(a)。
4)將訓練樣本a與訓練樣本b的合集來重新訓練各神經網絡,重新確定各神經網絡各層的權值和閾值。
5)將測試結果輸入參數重新確定的神經網絡以及λ確定的BPA形成過程,經DS融合得到最終的診斷結果,如圖2(b)。

圖2 GA-DS優化過程與測試過程Fig.2 Optimum and test process of GA-DS
針對西儲大學驅動端軸承滾動體四種不同故障程度的數據[5]進行分類,故障程度分正常、輕度點蝕、中度點蝕、重度點蝕四類,采樣頻率為12 000 Hz,在4種載荷下采集。對每種故障程度,各載荷下提取15個樣本,每種故障程度共60個樣本。
訓練樣本由載荷0HP、1HP、2HP各1/3的樣本構成,共60個;測試樣本由前3個載荷各剩余的2/3的樣本與載荷3HP的全部樣本構成,共160個。針對GA-DS方法,訓練樣本按照3:2的比例隨機分為訓練樣本a和訓練樣本b。
根據滾動體故障的非線性、非平穩性,提取了樣本的4類特征,構成4個特征空間如表1所示,時域特征分別為均方根值、峰峰值、峭度、偏斜度、方差、均值、波形指標、峰值指標、脈沖指標、方根幅值10個特征。EMD特征,是將時域信號進行EMD分解,取前3個本征模量[6],各本征模量提取上述10個時域特征,共得到30個特征。將時域信號以db1為母小波,進行4層小波包分解得各分量的能量和熵分別得到小波包分量能量分布特征和小波包分量分布特征[7]。

表1 特征提取方法列表Tab.1 The list of feature extraction method
分別單一特征空間神經網絡進行分類以及采用DS和GA-DS方法融合4個特征空間神經網絡進行分類,重復10次,結果如表2所示。

表2 測試樣本的識別結果對比Tab.2 Identification results com parison of test sam ple
相比于DS方法,GA-DS方法得到的識別率的平均值為96.8%,標準差為3.4%,而DS方法得到的識別率的平均值為91.9%,標準差為11.9%,GA-DS方法明顯優于DS方法。第3、7、9次融合過程中,DS得到識別率明顯低于GA-DS方法,特別是第7次過程,DS得到的識別率為61.1%,而GA-DS得到的識別率為87.7%。DS這3次的融合識別率很低,是因為這3次融合過程中,4個特征空間的診斷結果的沖突性很高,導致DS融合識別率明顯下降。可見GA-DS的自適應過程,能夠較好地消除不同特征空間的證據沖突性,提高了融合診斷的準確性。
對同一訓練樣本b,遺傳算法的初始種群的隨機性,會導致優化結果λ的波動。所有用GA-DS對同一優化過程重復10次,得到結果如圖3所示。
由圖3(a)可知,GA-DS得到的平均識別率的最高值為96.8%,最低值為95.6%,平均值為96.2%;由圖3(b)可知,識別率的標準差的最小值為3.4%,最大值為3.9%,平均值為3.66%。可見,GA-DS的最終識別率會有波動,但是波動較小,整體表現的都維持在較高的水平。

圖3 GA-DS穩定性驗證結果Fig.3 Results of the GA-DS’s robust stability test
軸承故障的診斷問題一直是個難點,特別是軸承的滾動體故障,通過上面實證分析可知,利用單一的故障空間來對其進行不同故障程度進行分類,得到的識別率往往較低,且穩定性較差,而通過DS方法融合多個特征空間的分類結果而得到的識別率與這幾個特征空間的分類結果的沖突性密切相關,當沖突性較大的情況下,DS方法得到的識別率很低。通過研究發現,GA-DS方法能夠自適應的調整由各特征空間對應的神經網絡的輸出結果轉換到證據的過程,盡可能地消除證據間的沖突性,融合結果具有穩定且較高的識別率。
參考文獻:
[1]吳蒙,貢壁,何正亞.人工神經網絡和機械故障診斷[J],振動工程學報,1993,6(2):153-163.WU Meng,GONG Bi,HE Zheng-Ya.Artificial neural networks and machinery fault diagnosis[J].Journal of Vibration Engineering,1993,6(2):153-163.
[2]張池平,張英俊,蘇小紅,等.一種基于神經網絡和證據理論的信息融合算法[J].計算機工程與應用,2006(1):174-176,179.ZHANG Chi-ping,ZHANG Ying-jun,SU Xiao-hong,et al.An algorithm of data fusion based on neural networks with DS evidential theory[J].Computer Engineering and Applications,2006(1):174-176,179.
[3]Valente F.Combination of acoustic classifiers based on dempster-shafer theory of evidence[J].IDIAP Research Institute,2006,3(2):23-30.
[4]余有明,李玉樹,閻光偉.遺傳算法的編碼理論與應用[J].計算機工程與應用,2006(3):86-89.YU You-ming,LI Yu-shu,YAN Guang-wei.Encoding theory and application of genetic algorithm[J].Computer Engineering and Applications,2006(3):86-89.
[5]Loparo K A.Bearing data center[EB/OL].[S.l]:Case Western Reserve University[2008-06-20].http://www.eecs.cwru.edu/laboratory/bearing.
[6]王紅軍,付瑤.基于多項式擬合的EMD端點效應處理方法研究[J].機械設計與制造,2010(10):197-199.WANG Hong-jun,FU Yao.Study of polynomial fitting technique for EMD end effect[J].Machinery Design&Manufacture,2010(10):197-199.
[7]車紅昆,呂福在,項占琴.多特征 SVM-DS融合決策的缺陷識[J].機械工程學報,2010,46(16):101-105.CHE Hong-kun,LU Fu-zai,XIANG Zhan-qin.Defects identification by SVM-DS fusion decision-making with multiple features[J].Journal of Mechanical Engineering,2010,46(16): 101-105.
M ultiple neural network fusion method for fault diagnosis based on GA-DS theory
ZHANG Lei,HUANG Yi-hong,WENG Sheng-long
(College of Mechanical&Automotive Engineering,South China University of Technology,Guangzhou 510640,China)
A improved method for neural network evidence formalism process based on information entropy was presented solve the shortage that the parameter definition relied on expert experience,where the parameter in evidence formalism process was defined automatically by GA method among training samples,with a high efficiency of parallel optimization and a low sensitivity of initial population,and the fusion efficiency of DS method was promoted.The improved method was verified in the multi-class bearing fault data processing,the evidence conflict in the fusion process was eliminated effectively,and the rate of fault diagnosis was improved remarkably in stability by adjusting the neural network evidence formalism process automatically.
information entropy;neural network;GA method;DS method;fault diagnosis
TN602
A
1674-6236(2015)10-0014-04
2014-09-14 稿件編號:201409113
張 雷(1990—),男,江蘇南通人,碩士。研究方向:車輛性能與故障診斷。