李 力 張全林 李 驥 余新亮
(三峽大學 機械與材料學院,湖北 宜昌 443002)
齒輪作為機械設備的關鍵傳統件,其運行狀態關乎整個設備的可靠性與穩定性,齒輪故障檢測和診斷方法的研究也備受重視.目前一些常用的故障診斷方法如人工神經網絡等,都需要大量的訓練樣本,但在實際工程中大量的故障樣本數據難以獲得,使得這些方法的應用受到一定限制[1].
建立在統計學習理論基礎上的支持向量機(Support Vector Machine)是一種專門研究小樣本情況下的新型機器學習方法,它具有完備的理論基礎,在解決小樣本、高維模式識別問題中表現出許多特有的優勢,能夠在有限的樣本條件下,最大限度地挖掘數據中的隱含特征.因此,針對齒輪小樣本故障數據,本文采用SVM進行齒輪故障診斷,以提高小樣本情況下的診斷準確率.
對于給定的內積空間H,存在超平面{(w·x)+b=0|x∈H,w∈H,b∈R}將樣本集T 分離.其中,w是一個垂直于超平面的向量,設w為單位長度,則(w·x)是向量x沿w方向的長度.SVM是從線性可分情況下的最優分類面發展而來的,基本思想可用圖1所示的二維平面來說明.圖1中,小方框和圓圈分別代表兩類樣本,中間的實線為分類線,其附近的兩條虛線分別為過各類中離分類線最近且平行于分類線的直線,它們之間的距離為分類間隔.所謂最優分類線就是要求分類線不但能將兩類正確分開,即訓練錯誤率為零,而且使分類間隔最大.對分類線(w·x)+b=0進行標準化處理,使得分類間隔等于2/‖w‖,使間隔最大等價于使‖w‖/2最小.訓練樣本正確可分,且使‖w‖/2最小的分類面就是最優分類面,位于兩虛線上的訓練樣本點就稱作支持向量[2].則構建最優超平面的問題可以轉化為最優化(二次規劃)問題:min(‖w‖2/2).實際故障診斷應用中,需要解決的常常是非線性的多類分類問題,解決這個問題的3個步驟為[2-3]:

圖1 兩類線性分劃的最優超平面
step 1:在線性可分的基礎上增加一個松弛項ξi≥0和懲罰因子C,將約束放寬,目標函數為:

式中,C為可調參數,表示對某種故障識別錯誤的懲罰程度,C越大懲罰越重.
step 2:根據泛函的有關理論,尋找一種核函數K(x,y)=φ(x)φ(y),通過非線性映射φ:Rn→H,將輸入變量映射到高維Hilbert空間H中.此時非線性SVM轉化為高維空間中線性最優化問題:

常用的核函數有線性核函數、多項式核函數、徑向基核函數和sigmoid核函數,根據文獻[4-5]指出,在大多數情況下徑向基核函數分類法將獲得更高的分類精度,選擇徑向基核函數:K(x,y)=exp(-γ·‖x-y‖2),γ>0,此核函數僅有一個參數γ,在訓練優化過程中,大大降低運算量.
step 3:采用分解法,即通過某種方式構造一系列標準的兩類SVM分類器,并將它們組合在一起來實現多類分類.針對齒輪故障診斷分類器,選擇OVO(one vs.one)方法[6]進行快速訓練建模,對于k類分類問題,OVO方法構造k(k-1)/2個SVM分類器模型為

獲取齒輪振動狀態信號.試驗采用齒輪故障試模擬試驗臺,它由控制臺、直流電動機、加載電機、直流調速加載系統、齒輪減速箱組成.故障信號源來自齒輪箱,其傳動簡圖如圖2所示,上面布置有各種模擬故障.其中,輸入軸與輸出軸上齒輪Z1、Z4均為正常齒輪(Z1=26,Z4=85,m=2mm);中間軸上,Z2為一個正常、一個有故障(Z2=64,m=2mm)的二聯齒輪;Z3為一個正常、兩個有故障(Z3=40,m=2mm)的三聯齒輪.不同故障狀態通過調節齒輪箱前后換檔手柄獲得.

圖2 齒輪箱傳動簡圖
由于故障齒輪在嚙合過程中常伴有高頻振動信號的產生,振動信號頻帶在1Hz~10kHz之間,故采用加速度傳感器測取齒輪信號,選取齒輪箱中間軸兩側軸承座附近剛性較好的部位安裝傳感器.數據采樣頻率為20kHz,數據序列長度N=8 192,輸入軸轉速1 000r/min.分別采集齒輪4種狀態的信號(正常、磨損、剝落和斷齒),每種狀態采集40組數據,共160組數據.
2.2.1 特征提取
提取信號特征作為SVM的輸入特征向量.機械信號常見的特征有時域特征、頻域特征、時頻域特征及能量特征等.基于時域統計特征的無量綱指標滿足對機器的狀態敏感和運行參數不敏感的要求,且從不同方面反映機器狀態變化的物理本質[7],因此,本文選取識別能力較強的標準差、峭度指標、偏度指標、峰值指標、波形指標、脈沖指標、裕度指標和能量特征共8個參數,得到8維特征向量.限于篇幅,列出齒輪4種狀態前5組信號的特征向量見表1.

表1 齒輪4種狀態下的特征向量
2.2.2 SVM參數選取與故障分類
SVM實現過程中要確定兩個參數,即核函數參數γ和懲罰因子C.采用K-CV方法進行參數優化[8],最佳參數搜索優化過程如圖3~4所示.先使用粗網格(如圖3所示)在2-10~210上進行粗略搜索,找到最佳參數C,γ的范圍分別為2-2~24,22~26,隨后再在該領域上進行精確搜索(如圖4所示)找到K-CV方法下的最佳參數.

圖3 粗略選擇參數的準確率等高線圖
搜索結果表明,C=22,γ=23時,SVM取得最優的故障識別精度,由此得到基于SVM的齒輪診斷分類結果見表2.由表2可知,SVM不僅將齒輪正常狀態與故障狀態完全識別,而且也能夠完全正確地識別出齒輪兩類不同屬性(局部故障與均布故障)的故障;對同類故障(均布故障)下的兩種不同故障模式(磨損、剝落)識別率也達到100%,其多故障的識別率為100%,達到了故障診斷要求.

圖4 精確選擇參數的準確率等高線圖

表2 SVM分類結果混淆矩陣
1)SVM參數直接影響其分類精度,利用K-CV網格搜索法優化分類器參數,可以有效地提高診斷準確率.
2)采用基于參數優化的SVM正確識別出齒輪的4種不同運行狀態,其故障診斷準確率為100%,診斷效果顯著.
3)SVM適合于解決小樣本故障診斷問題,是一種先進的智能故障診斷方法,在狀態監測與故障診斷方面具有良好的應用前景.
[1] 朱穎輝,李友榮,劉安中,等.SVM在齒輪小樣本故障診斷中的應用[J].煤礦機械,2006,27(11):186-188.
[2] 鄧乃揚,田英杰.數據挖掘中的新方法-支持向量機[M].北京:科學出版社,2004.
[3] 劉志剛,李德仁,秦前清,等.支持向量機在多類分類問題中的推廣[J].計算機工程與應用,2004(7):10-13.
[4] Christopher J C.Burges.A Tutorial on Support Vector Machines for Pattern Recognition[J].Data Mining and Knowledge Discovery,1998(2):121-167.
[5] 于德介,陳淼峰,程軍圣,等.一種基于經驗模式分解與支持向量機的轉子故障診斷方法[J].中國電機工程學報,2006,26(16):162-167.
[6] Chih-wei Hsu,Chih-Jen Lin.A Comparison of Methods for Multiclass Support Vector Machines[J].IEEE Trans On Neural Networkss,2002,13(2):415-425.
[7] 李 力.機械信號處理及應用[M].武漢:華中科技大學出版社,2007.
[8] Yoshua.No Unbiased Estimator of the Variance of KFold Cross-Validation[J].Journal of Machine Learning Research,2004,1089-1105.