陳遠帆,李舜酩
(南京航空航天大學,南京 210016)
?
基于高斯混合模型與改進網格搜索法的軸承故障診斷
陳遠帆,李舜酩
(南京航空航天大學,南京210016)
摘要:為提高軸承復雜故障的診斷準確率,將高斯混合模型與改進網格搜索法相結合,開展了軸承故障診斷方法的研究,對不同情況下的軸承故障進行了診斷。首先將采集的數據進行了適當分段,利用混合高斯分布擬合各段數據,提取統計特征量作為故障特征指標;然后分別采用普通網格搜索法和改進的網格搜索法進行參數優化;最后以支持向量機作為分類器對軸承故障進行了診斷,并將2種優化算法的準確率進行了對比。結果表明:所提出的故障診斷方法準確率更高。
關鍵詞:高斯混合模型;統計特征量;支持向量機;改進網格搜索法;故障分類
軸承是機械設備的關鍵部件,如何快速、高效地診斷出其故障就顯得尤為重要。目前常見的軸承故障診斷方法有Wigner-Ville分布、小波分析、Hilbert-Huang變換、神經網絡等。Wigner-Ville分布[1-2]時頻分辨率高,具有明顯的物理意義,但是對于多分量信號存在嚴重交叉項干擾;小波分析[3-6]有良好的自適應性,但其存在窗函數的局限性,無法準確描述頻率隨時間的變化;Hilbert-Huang變換[7-8]不受傅里葉分析的局限,適用于分析非線性、非平穩信號,但是當特征信號中混有強噪聲時分析效果就不太理想;神經網絡[9-11]具有很好的泛化能力,容錯性較高,但其結構和類型的選擇過分依賴先驗知識或經驗。混合高斯分布可以較好地擬合非高斯信號,而支持向量機在數據樣本較少時仍能達到較好的分類效果。因此,本文采用混合高斯分布[12-14]來擬合各個數據點的概率密度函數,并在此基礎上提取統計特征量均值、方差和峭度作為信號的故障特征指標,以改進的網格搜索法進行參數優化,最后以支持向量機作為分類器進行故障的識別與分類。
1高斯混合模型及其參數估計
高斯密度函數是一種參數化的模型,分為單高斯模型(single gaussian model,SGM)和高斯混合模型(gaussian mixture model,GMM)2類。其中,SGM僅僅適用于兩類別劃分的問題,而GMM適用于多類別劃分問題。
1.1高斯混合模型
單一的高斯分布模型在二維空間近似于橢圓,在三維空間近似于橢球。但在很多分類問題中,樣本并不滿足這種“橢圓”特性,這就要引入高斯混合模型。高斯混合模型是單一高斯模型的一種延伸,它采用若干單一高斯分布模型的加權平均來表示。高斯混合模型定義如下:
(1)
其中:M為模型的混合數;wk為混合模型的權重系數,且∑wk=1;N(x;μk,Σk)為第k個單一高斯概率密度函數,計算式如下:
(2)
由于高斯混合模型能夠平滑地近似任意形狀的密度分布,因此近年來常被用在語音、圖像識別等方面,取得了不錯的效果。
1.2高斯混合模型的參數估計
確定高斯混合模型的個數是一個難點。對于混合模型中的3個參數,本文采用最常見的最大期望值算法(expectation maximum,EM)進行估計[15]。該算法基本步驟如下:
1) 初始化參數:包括協方差矩陣、均值、權重系數;
2) 期望步:計算響應度;
3) 極大化步:計算加權均值和協方差;
4) 計算對數似然:檢查參數和對數似然是否已經收斂,若不收斂,則返回步驟2)。
(3)


(4)
(5)

(6)
將表達式(4)~(6)按照上述迭代算法進行計算即可得到最佳估計值。
2故障特征量分析與改進的網格搜索法
2.1故障特征量的提取與分類
故障特征的提取原則是希望特征量對故障信號十分敏感,且對其他無關信號的抗干擾能力很強。即要求一旦在正常信號中混入故障信號,故障特征量能及時地反映出來;當混入的故障信號不同時,特征量能顯示出其區別;當信號強度、頻率等改變時,特征量仍可較穩定地反映出信號中的故障。但在實際操作中,由于不同故障所表現出來的特性并不完全相同,所以并不能保證提取的靈敏度與穩定性都達到最佳,故本文選用穩定性較好、但是靈敏度較差的均值μ與穩定性和靈敏度都一般的方差σ2,以及靈敏度最好、但穩定性較差的峭度K作為進行故障分類的特征指標。計算公式如下:
(7)
支持向量機(SVM)[16-18]是20世紀90年代中期發展起來的基于統計學習理論的一種機器學習方法,其優點是在統計樣本較少的情況下亦能獲得良好的統計規律。SVM廣泛地應用于統計分類和回歸分析中,其本質是尋找一個最優的分類面。對于一般的非線性分類問題,在引入拉格朗日函數、松弛因子ξ、一個懲罰因子C以及核函數后可以轉化為一個二次優化問題。

約束:yi(wTxi+b)-1≥ξi,i=1,2,…,n;ξi≥0。
常見的核函數有多項式函數、線性函數和徑向基函數,而對于核函數的選擇,目前還沒有確定的標準。本文采用徑向基函數作為核函數。對于參數c和g,本文采用改進的網格搜索法進行優化,分類時的參數設置為“-s=0”,“-t=2”。因為該問題屬于分類問題,所以s取0,它表示選取C-SVC模型;t取2表示核函數選擇徑向基函數。c和g則由優化得到,初始條件不同,兩者的值一般是不同的。
2.2改進的網格搜索法
采用網格搜索法搜索最優的c和g的值,原理如下:搜索給定范圍內的所有可能的c和g的值,然后進行交叉驗證,找出使交叉驗證精確度最高的c和g的值,即為最優值。但由于該方法是一種遍歷整個區域的搜索方法,所以搜索效率并不高。在參數較少的情況下,網格搜索法復雜度比其他高級算法高不了多少,又由于其搜索范圍廣、可并行性高,所以仍然是比較常見的搜索方法。通常最優值在一個較小的范圍內,其余大部分范圍都屬于不必考慮的區域,因而希望在大部分區域搜索速度加快,而在最優值附近的最優區域放慢步伐,仔細搜索,找到最優值。本文中c的搜索范圍是[2-8,28],g的搜索范圍是[2-8,28]。對于未改進的網格搜索法,步距均采用0.5;對于改進的搜索法,首先在整個區域以步距3進行粗略的搜索,在找到最優值區域后,在最優值附近以步距0.5進行小范圍搜索,最終得到最優值。采用改進的搜索法[19]可以明顯減少無效搜索時間,提高搜索效率。
3所提出方法的具體步驟
本文提出一種基于高斯混合模型和改進網格搜索法的軸承故障診斷方法,具體步驟如下:
1) 對于每一種故障均取前120 000個數據點為計算數據,每500個數據點為1組進行分段,共分240段,給定一個混合高斯數目N,對于每一組的500個數據點均采用混合高斯分布進行擬合,得出1組均值、方差和峭度數據。
2) 將得到的240組統計特征量數據分為2部分:一部分作為訓練數據(例如200組),另一部分作為測試數據(例如40組)。分組情況在每一種比較中具體給出。
3) 對訓練數據分別采用普通網格搜索法和改進的網格搜索法優化參數c和g,得到2組c和g的最優值以及優化所需的時間。
4) 在運用支持向量機分類時分別設置步驟3)中得到的2組最優的c和g值,得出2種優化算法實際最優的分類準確率。
5) 比較2種優化算法所需時間以及最終得到的分類準確率,由此得出以混合高斯模型和改進的網格搜索法相結合的故障診斷方法的優劣。
4仿真及其結果分析
為了評價該方法對故障的分類效率,采用美國Case Western Reserve University電氣工程實驗室的滾動軸承故障模擬實驗臺采集到的數據進行測試,采用的測試數據均為采樣頻率為12 kHz的驅動端軸承數據,測試分5種情況。
4.1混合高斯模型數目不同時2種參數尋優法的故障識別率
采樣頻率為12 kHz,故障軸承直徑為0.177 8 mm。以電機負荷為0馬力的內圈、滾動體、外圈6點位置的驅動端故障數據和0負荷下正常基座數據這4組數據作為測試數據。取前120 000個數據點為計算數據,每500個點分為1組,共分成240組。以前200組數據作為訓練數據,后40組數據作為測試數據。混合高斯模型數目不同時采用普通網格搜索算法和改進網格搜索算法進行參數優化的用時和準確率對比,結果分別如圖1(a)、(b)所示。

圖1 兩種優化算法參數優化用時和準確率對比
由圖1(b)可以看出:采用普通網格搜索法和改進的網格搜索法尋優,分類準確率都大致隨混合高斯模型數目的增加先提高后降低,且實際準確率均有小幅提高,最優的混合模型數目均為N=6。由圖1(a)可以看出:在相同高斯混合模型數目下,改進的搜索法用時小于普通的搜索法;隨著混合模型數目的增加,改進搜索法用時與普通搜索法用時的差距越來越大。這是由于用時主要由兩部分組成:一部分為高斯擬合用時;另一部分為參數搜索用時。在計算中可以發現:隨著N的增大,高斯擬合時間會增加;混合模型數目超過10后,擬合時間會顯著增加。所以,在N較大時,擬合占主要時間。由于數據的選擇是隨機的,所以假設在其他情況下的最優混合模型數也是6。
4.2訓練組數不一樣時的故障識別率
采樣頻率為12 kHz,故障軸承直徑為0.177 8 mm。以電機負荷為0馬力的內圈、滾動體、外圈6點位置的驅動端故障數據和0負荷下正常基座數據這4組數據作為測試數據。取前120 000個數據點為計算數據,每500個點分為1組,共分成240組。取N=6。下面分幾種情況來分別計算準確率。不同分組情況下普通網格搜索法和改進網格搜索法對參數c和g的網格優化結果以及準確率對比如表1所示。
由表1可得:分類準確率隨訓練組數的增加而提高;在訓練組數相同的情況下,采用改進的網格搜索法可使準確率提高。所以,在條件允許的情況下,訓練組數應盡可能多,以達到最優的分類準確率。
4.3不同類別故障下的故障識別率
情況1故障尺寸、電機負荷、故障類型相同,故障位置不同。采樣頻率為12 kHz,故障軸承直徑為0.177 8 mm。以電機負荷為0馬力的外圈6點、3點、12點位置的驅動端故障數據和0負荷下正常基座數據這4組數據作為測試數據。取前120 000個數據點為計算數據,每500個點分為1組,共分成240組。取N=6。
情況2電機負荷、故障類型、故障位置相同,故障尺寸不同。采樣頻率為 12 kHz,故障軸承直徑分別為0.177 8,0.355 6,0.533 4,0.711 2 mm。以不同故障軸承直徑以及電機負荷為0馬力的內圈驅動端故障數據和0負荷下正常基座數據這6組數據作為測試數據。取前120 000個數據點為計算數據,每500個點分為1組,共分成240組。取N=6。
情況3故障尺寸、故障類型、故障位置相同,電機負荷不同。采樣頻率為12 kHz,故障軸承直徑為0.177 8 mm。以電機負荷分別為0,1,2,3馬力的內圈驅動端故障數據和0負荷下正常基座數據這5組數據作為測試數據。取前及120 000 個數據點為計算數據,每500個點分為1組,共分成240組。取N=6。
在3種情況下普通搜索法和改進搜索法對參數c和g的網格優化結果以及準確率對比如表2所示。

表1 不同訓練組數下普通網格搜索法和改進網格搜索法對參數c和g的網格優化結果以及準確率

表2 不同類別故障下普通網格搜索法和改進網格搜索法的參數選擇及分類準確率
由表2縱向比較可得:不同類別故障下的分類準確率是不同的,情況1和情況2較好,但情況3相對較差,說明所選擇的特征量對故障的尺寸變化和位置變化較敏感,而對于電機負荷的變化則不太敏感。所以在實際檢測過程中,對于不同的情況應選擇不同的特征量作為檢測標準,以達到最佳的檢測效率。由表2的橫向比較可得:采用改進網格搜索法的分類準確率高于普通網格搜索法。
5結論
本文采用高斯混合模型與改進的網格搜索法相結合的故障診斷方法,對不同情況下的軸承進行故障診斷,并與高斯混合模型結合普通網格搜索法的故障診斷方法進行了對比。結果表明:
1) 所提方法的準確率與效率均高于后者。
2) 所提方法的故障識別率隨高斯混合模型數目的增加先增后減,且故障識別率隨訓練組數的增多而提高。
3) 相同的特征量并不一定適用所有情況的故障診斷。對于高斯混合模型數目的確定,目前還沒有一種被廣泛認可的方法,一般采取窮舉法求得。
參考文獻:
[1]李舜酩,李香蓮.振動信號的現代分析技術與應用[M].北京:國防工業出版社,2008.
[2]LI H,ZHENG H,TANG L.Wigner-Ville Distribution based on EMD for faults diagnosis of bearing[M].Berlin:Springer,2006.
[3]陶新民,徐晶,杜寶祥,等.基于小波域廣義高斯分布的軸承故障診斷方法[J].機械工程學報,2009,45(10):61-67.
[4]NIKOLAOU N G,ANTONIADIS I A.Rolling element bearing fault diagnosis using wavelet packets[J].Ndt & E International,2002,35(3):197-205.
[5]PETER W T,PENG Y H,YAM R.Wavelet analysis and envelope detection for rolling element bearing fault diagnosis—their effectiveness and flexibilities[J].Journal of vibration and acoustics,2001,123(3):303-310.
[6]RAFIEE J,RAFIEE M A,TSE P W.Application of mother wavelet functions for automatic gear and bearing fault diagnosis[J].Expert Systems with Applications,2010,37(6):4568-4579.
[7]李常有,徐敏強,郭聳.基于改進的 Hilbert-Huang 變換的滾動軸承故障診斷[J].振動與沖擊,2007,26(4):39-41.
[8]RAI V K,MOHANTY A R.Bearing fault diagnosis using FFT of intrinsic mode functions in Hilbert-Huang transform[J].Mechanical Systems and Signal Processing,2007,21(6):2607-2615.
[9]楊宇,于德介,程軍圣.基于 EMD 與神經網絡的滾動軸承故障診斷方法[J].振動與沖擊,2005,24(1):85-88.
[10]LI B,CHOW M Y,TIPSUWAN Y,et al.Neural-network-based motor rolling bearing fault diagnosis[J].Industrial Electronics,IEEE Transactions on,2000,47(5):1060-1069.
[11]WANG C C,KANG Y,Shen P C,et al.Applications of fault diagnosis in rotating machinery by using time series analysis with neural network[J].Expert Systems with Applications,2010,37(2):1696-1702.
[12]肖涵,李友榮,呂勇.高斯混合模型與小波包能量相結合的齒輪故障分類[J].起重運輸機械,2009 (1):92-95.
[13]孫賢昌,田學民,張妮.一種基于 GMM 的多工況過程故障診斷方法[J].計算機與應用化學,2014,31(1):33-39.
[14]李元,孫健.基于高斯混合模型和變量重構組合法的故障診斷與分離[J].南京航空航天大學學報,2011,43(7):207-210.
[15]肖涵.基于高斯混合模型與子空間技術的故障識別研究[D].武漢:武漢科技大學,2007.
[16]王明剛,朱永忠,王峰.SVM 在監控小批量生產中的應用及比較分析[J].重慶理工大學學報(自然科學),2014,28(3):140-144.
[17]崔建國,李明,陳希成,等.基于支持向量機的飛行器健康診斷方法[J].壓電與聲光,2009(2):266-269.
[18]楊麗, 高美婷.支持向量機無損測量組織光學參數的研究[J].激光雜志,2014(11):68-71.
[19王健峰,張磊,陳國興,等.基于改進的網格搜索法的 SVM 參數優化[J].應用科技,2012,39(3):28-31.
(責任編輯陳艷)
Bearing Fault Diagnosis Based on Gauss Mixture Model and the Improved Grid Search Method
CHEN Yuan-fan, LI Shun-ming
(Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
Abstract:The paper carried out the study of the method of bearing fault diagnosis under different conditions and combined the Gaussian mixture model with the improved grid search method to improve the diagnosis accuracy of complex bearing fault. The paper paragraphed the data appropriately and fitted the segment data using the mixed Gauss distribution, extracting statistical characteristics as the fault feature index, and then using common grid search method and the improved grid search method respectively, we had parameter optimization; finally, the paper used the support vector machine as a classifier for bearing fault diagnosis and compared the accuracy of two kinds of optimization algorithm.The results show that the accuracy is higher by using the proposed fault diagnosis method.
Key words:Gauss mixture model; statistical characteristics; support vector machine; improved grid search method; fault classification
中圖分類號:TH13
文獻標識碼:A 1674-8425(2016)03-0034-06
doi:10.3969/j.issn.1674-8425(z).2016.03.006
作者簡介:陳遠帆(1991—),男,江蘇常熟人,碩士研究生,主要從事機械零件故障診斷研究。
基金項目:中央高校基本科研業務費專項資金資助項目(NZ2015103);機械結構強度與振動國家重點實驗室開放課題資助項目(SV2015-KF-01)
收稿日期:2015-10-23
引用格式:陳遠帆,李舜酩.基于高斯混合模型與改進網格搜索法的軸承故障診斷[J].重慶理工大學學報(自然科學),2016(3):34-39.
Citation format:CHEN Yuan-fan, LI Shun-ming.Bearing Fault Diagnosis Based on Gauss Mixture Model and the Improved Grid Search Method[J].Journal of Chongqing University of Technology(Natural Science),2016(3):34-39.