呂維宗 王海瑞 舒 捷
(昆明理工大學信息工程與自動化學院 云南 昆明 650500)
由于工業生產的不斷發展,大型復雜機械設備安全可靠的運轉引起了社會的逐漸重視,相關故障診斷技術也得到了迅猛的進展。滾動軸承是大型機械設備的關鍵組成部分,因此大型機械滾動軸承的故障特征診斷相關技術有著十分重要的作用,而這是屬于模式識別方面的問題。平時高負荷運轉時產生的安全故障,安裝、拆卸等多種情況下都會產生故障。所以,滾動軸承運作、維護等工作及其相關故障的診斷工作顯得尤為重要。故障主要包括外圈出現裂紋、內圈點蝕、滾動體點蝕三類[1]。而以上故障是很多因素共同作用所導致的,但是故障及其成因并不是一一對應,且往往對應關系較為復雜。目前復雜機械設備故障診斷的方法中,人工神經網絡和模糊綜合評價法等較為常見[2-6]。后者在體現模糊觀點方面效果十分突出,缺點是它設定評價因子的權重時要不斷地依賴有關專家的以往經驗,進而導致上述結果將產生一定程度的偏差。人工神經網絡更擅長自學和對任何非線性函數有更好的逼近,并且更為形象地擬構了人類腦神經系統方面的物理結構以及多種多樣的網絡結構,但其在呈現模糊信息方面的表現不好,甚至相對較差[7-9]。
大型機械故障狀態下的訓練樣本的獲得,是一件非常不易的工作。原因是實際過程中能訓練的樣本并不多,這就導致很難展開一系列的訓練,這時便有處于故障隱患樣本數據出現。進行識別時選取分類器必須以這種樣本數據特征來著重注意是否能對小樣本展開明確分類,并且得到的分類結果有著較高的不定性。針對上述情況,文獻[10-11]運用SVM方法將故障數據進行高維投影以達到確定故障產生的原因,且準確率較高。
綜上所述,本文把諧波小波包和改進自適應遺傳算法的SVM相結合,將滾動軸承數據用諧波小波包分解后便可知各頻段的小波分解系數,獲得的特征能量做相應的歸一化處理后成為特征向量。把上述向量輸入到SVM模型并展開訓練,此時再將SVM的參數通過IAGA去優化,進而對搗固車滾動軸承故障類型進行診斷[12]。通過與其他方法對比可知此模型效率更高且更加準確。
支持向量機是將有關統計學習的方法和結構風險的理論兩者結合的方法,其處理小樣本、非線性和高維的模式識別時便突顯出優勢[13]。它可以從有限的樣本信息中學習并獲取訓練樣本特征并展開相關預測,所以得出的結果往往有著很強的泛化能力,在處理過學習問題時,是神經網絡所不能比擬的。
支持向量分類機運用支持向量機模型與復雜變換非線性相結合,對低維數據進行高維空間投影并在高維空間中產生最優分類面。SVM的核心就是將結構風險最小化的思想在分類領域中得以體現。處理線性可分的相關分類問題時,SVM可以尋出符合條件的最優超平面,分類結果距離分類界面要遠,也就是空白區域最大,如圖1所示。

圖1 SVM的最優分界面
圖中圓圈和方塊分別為兩類樣本,實線為樣本分類線。兩條虛線是穿過全部樣本里距離分類線最近的樣本點,由此可知,不僅要使兩條虛線間的空白區域最大,同時還必須使兩類樣本能被分類樣本準確區分出來。這里,ω·xi+b=0代表分類線,經歸一化處理后,其對線性可分樣本集(xi,yi),i=1,2,…,l,x∈Rd,y∈{1,-1},滿足:
(1)
s.t.yi[(ω·xi)+b]≥1i=1,2,…,l
(2)
s.t.yi[(ω·xi)+b]≥1-ξii=1,2,…,l
ξi≥0i=1,…,l
式中:C>0為懲罰系數。因為往往不能找到超平面,所以只要用可以準確劃分樣本的所有超曲面中最優的那個來頂替超平面。但是因為超曲面并不像超平面那樣存在可以間隔的特點,要找出來符合條件的超曲面的難度也比較大。因此在此類最優求解中添加能將數據從低維映射到高維特征空間的核函數K(x,x′),再展開線性分析,便可篩選懲罰系數C>0。以下為最優求解模型:
(3)
式中:αi、αj為拉格朗日乘子,K(x,xi)為滿足Mercer條件的核函數。
由此可求得分類決策函數為:
(4)

本文采用基于“一對多”算法的多值分類SVM模型,其基本思想是:對N類分類問題建立N個SVM,在每個類和余下其他類之間訓練1個SVM將彼此分開。整個過程中測試樣本通過所在分類器識別失敗時就要再依次通過接下來的分類器,重復整個過程尋找出可以將故障識別出來的分類器并輸出診斷結果。
由于核函數對SVM來說非常關鍵,因此支持向量機的核函數及參數選擇不同時會造成相關性能有著較大差別[14]。核函數構造的合理程度會對支持向量機的分類泛化性能有著很大的影響。所以在此所用的徑向基核函數有助于故障分類準確度的提升。在最優求解中添加可以將數據從低維特征空間映射到高維特征空間的核函數:
(5)
用K(x,x′)代替式(4)中的K(x,xi),此時支持向量機分類決策函數如下式:
(6)

遺傳算法把解空間用相關編碼變換成相關染色體空間,把決策變量也隨之變成某一結構的染色體個體并構成群體,此群體經選擇、交叉及變異之后從中篩取高適應度部分用來產生下代個體,再組成下代的群體[15]。滿足終止條件后遺傳尋優過程結束,從而得到適應度最佳的個體,整個流程如圖2所示。

圖2 遺傳算法處理流程
這里所涉及的交叉概率及變異概率大多是不變的,而次優解使得到最優解的時間加長。一旦遺傳算法出現局部最優或全局最優時,隨著交叉及變異概率的上升也將導致近似的最優解有一定損失[16]。上述原因會使遺傳算法失掉很大一部分性能,所以這里選用自適應遺傳算法,使用該算法后便可以根據輸入值來更正交叉概率及變異概率,如下式所示:
(7)
(8)
式中:f1是兩交叉個體中相對大的個體的適應度值,f2代表著變異的個體的適應度值,Pc和Pm分別表示交叉概率和變異概率,favg和fmax分別為平均適應度值、最大適應度值。這就可以極大概率地留住群體中的優秀個體,在此考慮交叉及變異的存在,所以k1及k2是提前定好的一個值且不超過1.0,它們的值根據之前經驗可以設成0.4、0.1。
改進的自適應遺傳算法可以針對某個解給出最佳交叉概率和變異概率。適應度比平均適應度低時就選取較大交叉率及變異率,若適應度值比平均適應度值高,則取對應的交叉率及變異率[17]。由式(7)、式(8)可得,個體適應度值和fmax近似時,交叉、變異概率越小;與fmax相等則交叉、變異概率為0。式(7)、式(8)并不完全適用于進化初期群體,相反會適用于進化后期群體。這是由于初期可基于自適應遺傳算法給出改進,交叉概率及變異概率經過更改后可由下式來做調整。
(9)
(10)
式中:fmax代表最大適應度值,favg代表著平均適應度值,f1、f2各代表兩交叉染色體其中相對大的一個的適應度值及待突變個體的適應度值。Pcmax、Pcmin表示最大、最小交叉概率,Pmmax、Pmmin表示最大、最小變異概率。λ為常數,一般情況下λ=2。在人工經驗的基礎上可令Pcmax=0.9、Pcmin=0.6、Pmmax=0.1、Pmmin=0.001。
綜上所述,交叉概率及變異概率能夠在染色體進行交叉變異時進行自適應調節,算法才可以尋找全局最優解,保證群體的多樣性及遺傳算法的收斂性。
Newland根據諧波小波的信號分析的具體特征構建出了諧波小波,并依次每層都展示出小波所處的頻段,由于信號細化的原因,所有頻段并不能出現在同一分解層上,所以再進行細分即可獲得某部分頻段。諧波小波在頻域有著優良的盒形譜特性,其相應頻域表達式如下:
(11)
時域內表達式可如下表示:
ωm,n(x)=[exp(in2πx)-exp(im2πx)]/[i2π(n-m)x]
(12)
式中:i為諧波小波在相應時域中的相關系數。
小波變換中的層次取決于式(12)的m、n,根據諧波小波的濾波功能可以對待分析的所需頻段進行保存。
但諧波小波包的最終分析并不能進行選擇,對頻段的細分不能滿足要求,對時域振動信號進行篩選時有局限性。運用二進制小波包細化的原理來進行無限細分的自適應分解,公式如下:
(13)
式中:B表示分析頻帶的寬度,等價于2-jfh;其中fh是最高頻率表達式。
由諧波小波核心思想可得諧波小波包的頻域分析圖如圖3所示。

圖3 諧波小波包的頻域分析圖
上述可知信號一旦分解到了特定程度的層,再結合m、n值就能得到頻段的上下限,以下是變換算法完成的流程:
(1) 結合信號的先驗知識、帶寬及頻段寬度將其所對應的頻段值及層數求出來,頻段值和層數j可從B及下式得出:
m=sBn=(s+1)Bs=0,1,2,…,2j-1
(14)
(2) 算出頻段值:

(15)
(3) 對離散信號的時間序列fd(r)經快速傅氏變換處理便可得處于頻域的離散值fd(ω);
(4) 當前涉及的頻段小波變換可由下式獲得:
Wf(m,n,ω)=fd(ω)φm,n[(n-m)ω]
(16)
(5) 如果要對時域上的信號特征展開分析,則進行逆快速傅氏變換。
因為諧波小波包在進行特征提取時具有很大的優勢,所以它是特征提取這一部分的良好手段。這一過程用以下步驟表示:
(1) 求小波系數,利用諧波小波包將測試數據做分解處理即可;
(2) 利用下式求出不同尺度時的小波系數能量值:
(17)
式中:N、M分別為頻帶個數及各頻帶的小波系數所擁有的數量。
(3) 將所獲得的能量做如下式標準化相關的操作:
(18)
式中:mean和Dσ分別為小波頻帶的能量的均值及其標準差。
從而由下式可知特征向量:
(19)
諧波小波包的分解、定位能力相對強一些,它的表達式以及運算過程也比較簡易,并可以更加細化分析信號的任何一個頻段。
進行支持向量分類機建立時,適用的懲罰系數C及核函數參數σ顯得尤為重要。而傳統的經驗或梯度下降法將對支持向量分類器的泛化效果造成影響[18],而本文設計基于諧波小波包和IAGA-SVM的滾動軸承故障診斷模型。首先利用諧波小波包得到特征向量,再把特征值輸入SVM模型中訓練并對核函數和懲罰系數進行優化,增強 SVM分類器的泛化及學習能力,再根據其識別方法來構造相應的診斷的算法,這樣才能使識別的速度和正確率得到提升。
多值分類問題是由二值分類問題提出來的,它是將多個數目的兩類SVM分類器結合在一起再進行分類的。該算法首先根據改進的自適應遺傳算法來設立N類故障分類器;當建立到第i個分類器的時候,將這類SVM訓練樣本劃分成為同類,類別標號為1;接下來把上述故障之外的全部訓練樣本統稱一類并記作-1。圖4給出本文所述多值分類SVM故障診斷模型。

圖4 基于IAGA優化的多值分類SVM故障診斷模型
綜上所述,提出基于改進的自適應遺傳算法優化SVM的搗固車滾動軸承故障診斷方法,過程實現如下步驟:
(1) 尋找本模型中待優化的參數,也就是徑向基核函數參數σ及懲罰系數C。
(2) 確定個體編碼方式,在SVM分類機中的待優化參數有兩個,數量少,所以實施二進制編碼可使優化搜索速度得到提升。
(3) 隨機產生個體數量為M個的初代種群。
(4) 用諧波小波包處對各狀態下的多組訓練數據進行信號分解,計算出能量。經過歸一化處理小波頻帶能量均值及標準差后可得各故障狀態時的滾動軸承特征向量。
(5) 在訓練數據集基礎上對種群中全部個體在多值SVM模型中展開訓練,訓練樣本故障類型是第i類SVM時,標號為1,反之為-1。
(6) 檢驗訓練后的各SVM模型,并以此為依據評判種群中全部個體的適應度值。
(7) 判斷是否滿足算法的終止條件。若滿足則轉(9),不滿足轉(8)。
(8) 當前種群進行無回放最大值選擇、均勻交叉和變異的相關操作,轉(5)。
(9) 從種群中選一個適應度最高的個體,并把該個體的表現型參數當作經過IAGA算法處理過的SVM模型的參數C*和σ*。
(10) 以優化處理后的懲罰系數C*及徑向基函數參數σ*為基礎,構造支持向量機診斷模型。
(11) 運用構建的SVM故障診斷模型進行診斷。
本文選取美國西儲大學的實驗數據,特征提取方法為諧波小波包,其過程為: 把測試數據多層諧波小波包分解后得出各個尺度的小波系數,再算出全部尺度的小波系數能量并做相關歸一化處理,求出特征向量。當故障的直徑以及轉速分別是7 mil和1 750 r/min時,圖5為某一組時域波形。這里選用美國凱斯西儲的滾動軸承數據文件,內圈故障107.mat,滾動體故障120.mat,外圈故障132.mat,正常99.mat。

(a) 正常數據時域波形

(b) 滾動體故障時域波形

(c) 內圈故障時域波形

(d) 外圈故障時域波形圖5 各種狀態下的時域波形
用諧波小波包對此實驗數據做相應處理操作后可得出4種不同特征能量如圖6所示。

圖6 不同狀態的特征提取能量分布圖
由此可得諧波小波包可完整細分全部分析頻帶,在滾動軸承故障頻率特征的提取中表現得更好,因此諧波小波包提取特征時會對要診斷的故障進行更好的細分。
因此,只要將諧波小波包對不同故障下的振動信號展開分解及重構后所提取的頻帶能量作為特征向量輸入到已構造好的IAGA-SVM模型中,便知是哪種類型的故障。這里把提取出來的故障特征分為訓練樣本及測試樣本,將訓練樣本通過SVM模型訓練、測試;再經過改進的自適應遺傳算法去尋優得到SVM的最佳核參數σ及懲罰系數C,把測試樣本輸入到經過優化的SVM當中,便可知滾動軸承故障診斷的結果。此實驗由100 ×4組特征樣本,選取各狀態下的前50組,也就是200組當作訓練數據。在有了判別4種不同狀態的能力的情況下,再運用剩余200組數據展開相應測試。其中的一組測試數據和判別情況如表1所示。

表1 搗固車滾動軸承各故障類型對應的特征樣本和診斷結果
進化到最終代數就會終止尋優并記錄最優參數。在此將改進的自適應遺傳SVM、自適應遺傳SVM、簡單遺傳SVM三種模型相互對比,分別將滾動軸承故障的樣本數據用這三種方法做相應的處理,再根據展現出來的收斂效果及診斷誤差來判斷此實驗中IAGA-SVM的抗變換性。圖7反映出三種不同算法對SVM參數進行優化時的迭代次數和平均適應度兩者的具體對應情況。圖8反映出三種不同算法對SVM參數進行優化時訓練的次數和誤差平方和兩者的具體對應情況。

圖7 不同算法對SVM參數優化時的迭代次數和平均適應度的關系曲線

圖8 不同算法對SVM參數進行優化時的訓練次數和誤差平方和的關系曲線
由圖7、圖8可知,用IAGA處理SVM參數時可使收斂情況呈現出的效果最好且誤差最小,原始算法GA表現最差,出現全局最優的結果并不理想。確保分類準確率的同時,IAGA在第70代就可以尋找到最優值且之后基本有平緩的趨勢,那么可得最優懲罰系數和核參數分別為C=0.0573、σ=0.4105。AGA和原始的GA算法還要繼續進化到上百代才可以尋找出最優,且兩者皆沒有IAGA的好。
需要說明的是:懲罰系數C可將系統的學習能力體現出來,核參數σ體現的是樣本所處的高維空間里的呈現情況的復雜程度,分類器泛化能力就與此相關。分類正確率與兩者的關系如圖9所示,此時核函數為徑向基函數。

圖9 樣本分類正確率和核函數參數、懲罰系數三者之間的關系圖
在圖9三維曲面中可得,由于核參數及懲罰系數的取值的多樣性,使得分類時的準確程度會出現局部最優的情況,恰好由于IAGA使這種情況不會存在,這展現出IAGA優良的全局尋優能力。并且因為支持向量機良好的分類識別性能使得分類正確率大多在最佳識別精度上下。因此IAGA算法和SVM的有效結合是有很大的運用價值。
將獲得的最優參數運用在建立好的分類器上,從而給出關于測試樣本在判別分類完成后的效果如圖10所示。

圖10 IAGA最優參數建立的多值SVM分類效果圖
從圖10效果可以看出此模型分類效果優良且判別準度高。為了使本文所提模型更有說服力,在同樣的訓練及測試樣本的條件下,用本文的方法與BP及RBF神經網絡故障識別的效果展開對比,得出3種算法分類性能的詳細對比如表2所示。

表2 三種算法分類性能比較
由表2看出,SVM參數經過IAGA尋優后的診斷準確率可以到100%,完全符合工程中所涉及的實際需求,BP和 RBF測試結果都相對較低。說明針對小樣本集時SVM的分類性能要強于BP及RBF神經網絡,且小樣本問題可用本文提出的模型展開處理。
本文將諧波小波包在特征提取方面的優良性能、IAGA出色的全局尋優能力以及SVM在模式識別時展現出的優良性能相結合。用改進的遺傳算法對SVM模型中的參數做自適應優化,再根據多值SVM模型對搗固車滾動軸承故障進行分類,可提升診斷精度、效率及泛化性能。實驗表明,諧波小波包有著將所有分析頻帶細化的特性,且本文所提出的IAGA-SVM搗固車滾動軸承多值診斷技術相對AGA-SVM和GA-SVM可以更迅速尋找出最優參數,同時其診斷結果相對BP及RBF神經網絡準確性更高,可靠性更強,抗變換性也更強。所以此模型有著突出的優越性以及實際運用價值。