陸建濤,姚 通,李舜酩,崔榮慶
(南京航空航天大學 能源與動力學院,南京 210016)
滾動軸承廣泛應用于大型旋轉機械中,如航空發動機、風力發電機、動車組等,是其不可或缺的支撐部件。在旋轉機械運行過程中,軸承不可避免發生故障,輕則造成巨大的經濟損失,重則機毀人亡造成災難性事故。若能及時對其進行智能故障診斷,就有望能夠保障設備運行安全,避免重大經濟損失和事故發生。因此,對滾動軸承進行智能故障診斷具有重要的工程應用價值[1-2]。
振動信號中蘊含著豐富的故障信息,因此基于振動信息的滾動軸承故障診斷一直是研究熱點[3]。振動信號常規時域特征指標主要包含兩類:一類是有量綱指標,例如最大值、最小值、峰峰值、均值和方差等;另一類是無量綱指標,例如峭度因子,脈沖因子,波形因子等。這些指標在一定程度上反映設備故障特征,如峭度因子反映信號中沖擊成分大小,裕度因子反映機械裝備的磨損狀況,波形因子能反映轉子點蝕或者磨損。因此,特征參數的變化可反映出設備運行狀態變化情況,可作為對其進行故障診斷的依據。然而,有量綱指標易受外界運行環境和運行工況影響,無量綱指標雖然受外界因素影響較小,但其在故障特征相似程度較高時,識別效果不佳。因此,僅使用常規特征對設備進行故障診斷,診斷準確率較低[4-5]。
超階分析是在去趨勢波動分析法(detrended fluctuation analysis,DFA)基礎上提出的用于分析子系統激勵源區分度的新方法,利用極值點包含的豐富狀態信息,分析極值點背后的因素,有助于解釋信號的本質特征[6]。江星星等[7]提出基于超階分析的排量檢測法,提取泵車液壓泵體振動信號標度指數,實現泵車的排量標定。超階分析法既保留了去趨勢波動分析法的原有優點,減小序列中趨勢成分的影響,又能反映信號的長程相關特性,突出時間序列本來的狀態特征,能夠揭示信號波動的內在驅動機制。
支持向量機(support vector machine,SVM)是Cortes等[8]提出的基于統計學習理論的機器學習方法,對小樣本和非線性問題有較好的表現,目前主要應用于模式識別領域。SVM是從線性可分情況下的最優分類超平面發展而來,首先轉化成二次規劃問題,然后利用拉格朗日乘子法轉化成二次規劃的對偶問題來求解。對于線性不可分問題,先把原始數據映射到線性可分的更高維空間,在高維空間構造最優超平面,并映射回原空間,能夠較好地解決原空間內線性不可分問題。然而SVM參數的選取較為困難,參數選擇不恰當,會造成過擬合或者欠擬合現象,而且核函數中包含的參數對訓練和預測的速度有較大影響[9]。
本文針對采用傳統特征指標進行故障診斷準確率較低的問題,提出一種基于混合特征指標的滾動軸承智能故障診斷方法。將超階分析所得標度律指數作為故障特征指標,與常規特征指標相結合構造混合特征指標矩陣,并采用SVM實現滾動軸承的智能故障診斷。為了實現SVM參數的自適應選取,提出基于粒子群優化(particle swarm optimization,PSO)的改進SVM(improved SVM,ISVM)法。最后,通過軸承故障模擬試驗臺數據對提出方法有效性進行驗證。
常規有量綱指標容易受到外界工況因素的影響,難以用于實際的故障診斷。無量綱特征指標能夠在一定程度上反應設備故障情況,包括:峭度因子、脈沖因子、峰值因子、裕度因子和波形因子等。
(1) 峭度因子
峭度因子是表征振動信號波形尖峰度的一個統計量,具體的含義表示波形的平緩程度,用來描述變量的分布特征[10]。計算公式為
(1)
式中:μ為信號x的均值;σ為信號的標準差;E(t)為t期望值。當軸承發生故障時,振動信號中通常出現周期性的沖擊成分,此時峭度因子值大于3,振動信號的整體分布曲線會呈現“陡峭”現象。
(2) 脈沖因子
脈沖因子表征信號振動脈沖的頻率,用來檢測信號中有無沖擊成分的一個指標,其值是振動信號的峰峰值與其整流平均值的比值,計算公式為
I=pk/av
(2)
式中:I為脈沖因子;pk為所監測振動信號的峰峰值;av為所監測振動信號的整流平均值,亦即信號絕對值的平均值。
(3) 峰值因子
峰值因子表征信號峰值在振動信號整體分布波形中的極端程度,跟脈沖因子類似,也是用于檢測是否存在沖擊成分的一個指標[11],計算公式為
C=pk/rm
(3)
式中:C為信號的峰值因子;rm為振動信號的有效值(信號的均方根值)。由于振動信號的整流平均值小于有效值,所以脈沖因子大于峰值因子。
(4) 裕度因子
裕度因子是信號的峰峰值與方根幅值的比值,同樣對沖擊特征比較敏感,但當故障逐漸加重時,其數值反而會下降,表明裕度因子對振動信號中蘊含的早期故障具有較高敏感性,因而常被用來表征機械運行裝備磨損狀況,計算公式為
L=pk/xr
(4)
式中:L為振動信號的裕度因子;xr為振動信號的方根幅值。
(5) 波形因子
波形因子S是信號有效值與平均幅值之比,可以反映轉子出現點蝕或者磨損故障的信號特征,其計算公式為
S=rm/av
(5)
上述5個無量綱特征參數都可以反映設備發生故障時產生的故障特征,但是與信號的頻率無關,這也使得在變工況狀態下,這5個常規特征參數仍能夠表征故障信息。
對振動信號進行超階分析過程如下:
(1) 對原始時間序列取極值
(6)
式中,xn≤xn+1,xn+1≥xn+2或xn≥xn+1,xn+1≤xn+2。
(2) 將極值序列變換為極值增量序列
(7)
(3) 對于序列Δxm,計算其累積離差y(t)
(8)

首先濾去了時間序列的平均值。由于一個時間序列可能有隨機成分,把序列的這些成分過濾掉有助于后續分析。
(4) 序列重構
對具有N個數據的y(t)分別進行等長分割,以長度n將序列分割成m個不重疊的區間,其中
(9)
由于序列長度N并不總是長度n的整數倍,序列尾端有時會出現小部分的數據信息未能被利用。為了充分利用數據,對序列的顛倒順序進行同樣的操作,共得到m個等長度的區間。
(5) 對每個區間v,用最小二乘法對所包含的數據進行一階線性擬合,如下
yv(i)=ayv+byv×i
(10)
式中:i=1,2,…,n;yv=1,2,…,m。
(6) 計算每個區間濾去趨勢后的均方差。
(7) 對所有等長度區間求均值并開方,計算得到DFA波動函數。
(11)
(8) 如果時間序列x(t)長程冪律相關,則F(n)與n滿足冪律關系。
在雙對數坐標{lgn,lg[F(n)]}中做散點圖,用最小二乘法擬合數據,其中直線部分的斜率即為超階分析方法所得的信號標度律指數,記為α。
超階分析所得到的標度律指數可以作為表征故障信號故障信息的特征參數,突出信號序列本來的狀態特征。因此,與1.1小節得到的常規信號特征參數(峭度因子、峰值因子、脈沖因子、裕度因子和波形因子)相結合,就可得到混合信號特征參數向量,作為滾動軸承智能故障診斷的特征向量。
在利用SVM進行數據分類時,需設定兩個重要參數:懲罰系數C和核函數參數γ。懲罰系數C決定對所取樣本依賴程度,當C為無窮大時,所有樣本將都滿足約束,造成過擬合現象;而當C太小時,只有少數樣本滿足約束,導致欠擬合現象。γ是選擇高斯核函數后自帶的一個參數,代表著映射之后的空間分布。γ值越大,SVM個數越少,反之,γ值越小,SVM個數越多。γ值的選取對訓練和預測速度有較大影響。為了實現參數自適應選取,本文采用PSO對SVM的參數進行優化選取。
PSO是從鳥類捕食行為的研究中發展而來,每個問題的解稱為“粒子”,所有粒子的搜索空間都是N維的解空間,粒子優劣由適應度函數判定。每個粒子需保存自己搜索到的最佳位置,其速度根據其當前位置、其歷史最優位置和群體最優位置動態調整[12-13]。粒子的速度和位置更新公式分別為
(12)
(13)

信號故障特征提取與人工智能結合形成新故障診斷方法是智能故障診斷領域的一種趨勢[14-16]。本文將構造的混合特征指標向量與ISVM相結合,形成基于混合特征向量和ISVM的滾動軸承智能故障診斷方法,其基本步驟為:
步驟1常規信號特征提取。將采集的信號分組,并標記每個分組的故障類別標簽,對每個樣本信號分別計算峭度因子、峰值因子、脈沖因子、裕度因子和波形因子。
步驟2標度律特征參數提取。按照超階分析法的流程,提取每一個樣本的標度律指數作為表征信號故障信息的特征參數。
步驟3混合特征向量構造。結合已提取的常規信號特征和標度律特征,構造混合特征參數向量。所有樣本的特征向量構成一個特征矩陣,矩陣的每一行代表一個樣本的特征集,依次為峭度因子、峰值因子、脈沖因子、裕度因子、波形因子和標度律指數屬性值,特征矩陣的每一列樣本的特征屬性。
步驟4歸一化。用最值歸一化方法分別對特征矩陣的每一列進行歸一化處理,并將歸一化后的混合特征矩陣作為ISVM的輸入。
步驟5模型訓練。利用PSO對SVM的參數進行優化,用交叉驗證法防止訓練模型的過擬合,并將模型訓練準確率用作判斷模型訓練好壞的標準,獲得最佳模型參數。
步驟6智能故障分類。對測試數據進行類似處理,得到測試數據的特征集,用已獲得分類模型對測試數據集進行智能故障分類。
提出的滾動軸承智能故障診斷方法框圖,如圖1所示。

圖1 提出的滾動軸承智能故障診斷方法框圖Fig.1 Block diagram of the proposed intelligent fault diagnosis method for rolling bearing
采用UCI標準數據庫中Wine數據集(網址:http://archive.ics.uci.edu/ml/datasets/Wine)對提出的ISVM的有效性進行驗證,并與傳統SVM方法性能進行對比。數據集的基本信息如表1所示。

表1 Wine數據集Tab.1 Dataset of Wine
粒子群算法的適應度函數取為支持向量機訓練的準確率,提出算法優化過程的適應度曲線如圖2所示。從圖2中可知,第3代粒子最優適應度上升到92.7,第6代粒子最優適應度達93.26,此后迭代過程一直穩定在93.26保持不變。由圖中平均適應度曲線可以看出,隨著搜索得到的最佳適應度的穩步上升,當前迭代代數的平均適應度并不是線性上升的,而是呈現無規律的變化,說明C和g值對適應度的影響并不是線性變化的,一點小小的擾動就可能導致較大適應值的變化。

圖2 粒子群算法適應度曲線圖Fig.2 Fitness curve of particle swarm optimization algorithm
傳統方法選取參數時,多采用網格搜索法,即用一個預先設置的網格去全域搜索k折交叉檢驗法下的最佳準確率。傳統方法得到的最佳參數配合下的最佳準確率曲線,如圖3所示。由圖3可知,隨著γ值的增加,所得模型訓練的準確率在穩步上升。由傳統方法得到的最佳準確率在90.45,小于ISVM所得到的最佳準確率,驗證了提出方法的有效性。

圖3 傳統方法準確率曲線圖Fig.3 The accuracy curve of traditional method
采用QPZZⅡ型滾動軸承故障模擬試驗臺對提出滾動軸承智能故障診斷方法的有效性進行驗證,試驗臺如圖4所示。采集的數據有4種故障類型:正常、內圈故障、外圈故障和滾動體故障。每一類故障包含3個故障尺寸,0.2 mm,0.4 mm,0.6 mm,一共10類數據。每一個樣本組的數據長度為1 000,各個樣本組數據之間沒有重疊。每一類數據有20個樣本組,共計200個樣本。

圖4 QPZZⅡ型故障診斷試驗臺總體布置圖Fig.4 Layout of fault diagnosis test bed of QPZZⅡ
按照7∶3的比例對樣本數據集進行訓練集和測試集的分組,即每一類標簽數據中有14個樣本作為訓練集,6個樣本作為測試集,數據分組情況如表2所示。

表2 滾動軸承數據集Tab.2 Dataset of rolling bearing
對每一個樣本故障數據進行混合特征向量的提取,包括峭度因子、波形因子、峰值因子、脈沖因子、裕度因子和標度律指數。不同故障類型的標度律指數分布曲線圖如圖5所示。由圖5可知,在同一故障類型和故障尺寸下不同樣本間的標度律指數值波動較小,可以作為表征故障的特征指標。不同故障類型間相比較,不同故障類型故障信號的標度率指數均有一定的波動,但波動范圍較小,不同的故障之間有較明顯的區分,因此標度律指數可以作為特征指標對不同故障進行智能診斷。

圖5 不同故障類型的標度律指數分布曲線圖Fig.5 Scale exponent exponential distribution curve of different fault types
將得到的標度律指數向量與常規特征指標向量結合組成混合特征矩陣,并將歸一化之后的特征矩陣輸入到提出的ISVM中。設置PSO參數為:c1=c2=1.5,粒子數量為20,速度更新的權重設置為線性遞減權重,初始權重wstart=0.9,結尾權重為wend=0.4,按照迭代的次數進行權重的線性插值。SVM的懲罰系數范圍為:Cmin=0.1,Cmax=1 000,徑向基函數參數范圍為:γmin=0.01,γmax=100。所得到的混合特征向量優化的支持向量機模型訓練適應度曲線如圖6所示。由圖6中可以看出,第10代粒子的最佳適應度上升到90.71,此后基本保持穩定。最終得到分類模型的最佳參數為:Cbest=163.037,γbest=10.465。

圖6 基于混合特征的ISVM模型訓練適應度曲線Fig.6 Training fitness curve of ISVM model based on hybrid characteristic vector
使用測試集對訓練模型進行測試,結果如表3所示。由表3知,提出的滾動軸承智能故障診斷方法的分類準確率為96.67%,僅在標簽6(滾動體故障,故障尺寸0.4 mm)的樣本中出現了錯分的情況,其他的故障類型分類準確率都達到100%。

表3 混合特征優化的支持向量機故障診斷結果表Tab.3 Fault diagnosis results of SVM based on hybrid feature optimization
作為對比,僅采用1.1節介紹的常規無量綱特征指標作為故障特征,即峭度因子、峰值因子、脈沖因子、裕度因子和波形因子,采用同樣的處理流程,將得到的常規特征參數矩陣輸入到ISVM中,得到模型的訓練準確率為77.86%,低于采用混合特征得到的訓練準確率90.71%。使用常規特征和混合特征進行分類得到的測試準確率結果對比表如表4所示。由表4可知,使用常規特征的總體測試準確率僅為73.33%,低于使用混合特征得到的測試準確率,驗證了提出方法的有效性。

表4 兩種故障診斷方法測試準確率結果對比表Tab.4 Comparison of test accuracy results of two fault diagnosis methods
采用超階分析法獲得分析信號的標度律指數,并結合常規無量綱參數構造了混合特征參數矩陣,進而采用ISVM實現滾動軸承故障智能診斷,結論如下:
(1) 提出ISVM法能夠實現參數的自適應優化,相比于傳統的網格搜索法,能獲得更好的訓練效果,提高模型的分類準確率。
(2) 由超階分析得到的標度律特征可以作為表征故障的特征參數,通過與常規特征參數結合可以有效實現滾動軸承故障的智能診斷。與僅采用常規特征相比,提出方法得到的測試準確率增加了23%左右。
(3) 提出方法不僅能實現滾動軸承故障類型識別,而且能實現同一故障類型不同故障程度的有效識別。通過對故障程度更精細劃分,有望實現故障程度的定量識別。