張華偉 左旭艷 潘 昊
(武漢理工大學計算機科學與技術學院 湖北 武漢 430070)
基于混合核學習支持向量機的主減速器故障診斷
張華偉 左旭艷 潘 昊
(武漢理工大學計算機科學與技術學院 湖北 武漢 430070)
主減速器是汽車的重要零部件,同時也是汽車主要的故障源,據(jù)此實現(xiàn)一種基于混合核學習支持向量機的故障診斷方法。利用經驗模態(tài)分解(EMD)與小波閾值函數(shù),以達到對振動信號降噪。利用核主成分分析(KPCA)進行特征向量的提取,獲取特征子集的低維向量。以提取的特征向量作為輸入值,以支持向量機(SVM)為分類器,經遺傳算法參數(shù)優(yōu)化后獲取故障識別率。通過研究混合核函數(shù)即單核函數(shù)的線性組合,實驗結果表明,相比與傳統(tǒng)的單核學習故障診斷方法,該方法提高了主減速器故障診斷的精度。
經驗模態(tài)分解 小波閾值函數(shù) 核主成分分析 支持向量機 遺傳算法
在復雜的工況中,機械設備的振動信號不可避免地會受到噪聲污染,從混有噪聲的振動信號中提取出有效的信號信息,是影響后續(xù)故障診斷精度的關鍵點。利用經驗模態(tài)分解(EMD)與小波閾值函數(shù),以達到對振動信號降噪,經過降噪預處理后的信號減少了對后續(xù)診斷的干擾[1]。利用主減速在不同故障狀態(tài)下所表達的信息量不同及小波正交分解的特點,構造特征空間。但得到的原始特征不可避免地存在信息的冗余,導致故障診斷的精確度下降,因此,需要對原始特征子集進一步的提取特征向量。
隨著國內外研究學者對故障診斷展開研究,YU GAO等人利用PCA的特征提取方法與SVM故障檢測,在實際中有很好的應用[2];RENPING SHAO等人比較了PCA與KPCA提取特征的有效性,得出使用KPCA的優(yōu)越性[3];黃宏臣等人通過使用LE算法和傳統(tǒng)的降維方法PCA、MDS進行對比,提取低維特征量,再使用模式識別對滾動軸承故障進行分類,驗證了拉普拉斯特征映射LE(Laplacian Eigenmaps)的高效性[4]。為了提取有效的特征向量,文中通過KPCA與LE的對比研究,實現(xiàn)振動信號的最優(yōu)特征提取。
利用SVM進行故障識別時,一般選取的核函數(shù)都是單核,LU等人利用單核RBF支持向量機實現(xiàn)實時動力傳動系統(tǒng)齒輪箱的故障診斷[5]。然而實際的特征并不是單領域的,為了充分利用不同核函數(shù)的特征映射能力,將多個核函數(shù)進行線性或非線性組合構成核函數(shù)。由于混合核函數(shù)能夠集成各成員核函數(shù)的優(yōu)點并具有更加優(yōu)越的性能,因此成為核函數(shù)領域研究的熱點。魏延等驗證了利用線性核函數(shù)與RBF核函數(shù)的組合優(yōu)于普通核函數(shù)構造的支持向量機[6]。為了有效地進行主減速器的故障診斷,本文將使用遺傳算法來實現(xiàn)參數(shù)的優(yōu)化,充分發(fā)揮了支持向量機較高泛化能力的優(yōu)勢。
1.1 經驗模態(tài)分解獲取本征模函數(shù)

1.2 閾值函數(shù)的小波降噪
閾值降噪的基本原理就是對小波信號能量進行處理,設置一個門限值為λ,把大于門限值λ的小波系數(shù)作為信號的主要成分,小于λ的小波系數(shù)認為是噪聲,然后重構新的小波系數(shù)得到圖像。
一般閾值降噪的方法有2種,硬閾值和軟閾值。
(1) 硬閾值定義為:

(1)
(2) 軟閾值定義為:

(2)
其中,f(x)為含噪信號,λ為門限值。由于硬閾值函數(shù)存在間斷點,而軟閾值在小波系數(shù)絕對值較大的區(qū)域引起高頻信息損失。因此本文利用一種新的閾值函數(shù)進行降噪處理[8]。新閾值函數(shù)定義如下:
(3)
其中,x為小波分解的系數(shù),通過調節(jié)a的大小使得函數(shù)f(x)收斂于軟硬閾值函數(shù)的程度,克服了硬閾值函數(shù)存在間斷點的問題。
在降噪的過程中,通常認為大量的信息在低頻部分,一般不作處理,只對剩余的高通部分進行處理。在對信號進行EMD分解后,得到不同頻率的IMF分量,對高頻IMF分量進行小波降噪處理,重構得到的信號即為去噪的信號。其過程原理如圖1所示。

圖1 去噪過程原理圖
2.1 構造特征空間
基于主減速器在不同故障狀態(tài)下所表達的信息量不同的特點,在時域和頻域特征中選擇特征量。在時域特征中選用均方根植、方根幅值、歪度、峭度、峰值指標、波形指標、脈沖指標、裕度指標作為維度指標。由于小波包分解采用正交基對信號進行重構,不存在信號丟失的現(xiàn)象的特點,選用db4小波包函數(shù)進行3層小波包分解,得到8個子頻帶的濾波信號,將每個頻帶的相對能量比作為頻域統(tǒng)計特征參數(shù),歸一化處理之后得到一個16維的特征向量。16種特征量如表1所示。

表1 16個特征量
2.2 核主成分分析(KPCA)
核主成分分析[9]是一種非線性的特征提取方法,通過核函數(shù)的引入將數(shù)據(jù)從輸入空間映射到特征空間。對于給定的數(shù)據(jù)集XT={x1,x2,…,xl}∈Rn×l,n表示系統(tǒng)變量數(shù)目,l表示系統(tǒng)樣本數(shù)目,輸入空間Rn到特征空間F的映射為φ,J(w)的目標是在特征空間尋找一個投影向量w,使得投影后的yi=(φ(xi))Tw保留原始數(shù)據(jù)的大部分信息,其中,i=1,2,…,l。核主成分分析的目標函數(shù)J(w)可以表示為:

(4)
式中,wTw=1。
投影后的特征空間由映射值φ(x1),φ(x2),…,φ(xl)組成,所以投影向量w必定在特征點φ(xi)展開方向上,即存在一個向量滿足:
(5)
將式(5)代入式(4),目標函數(shù)轉化為如式(6)所示:


(6)

(7)
對于核函數(shù)的選取,常用的核函數(shù)[10]如下:
(1) 線性核函數(shù)
K(xi,xj)=(xi·xj)
(8)
(2) 多項式(poly)核函數(shù)
K(xi,xj)=[(xi·xj)+c]d
(9)
(3) 徑向基(RBF)核函數(shù)
(10)
(4)Sigmod核函數(shù)
K(xi,xj)=tanh(v(xi·xj)+t
(11)
2.3 拉普拉斯特征映射
拉普拉斯特征映射LE是通過Beltrami算子來構造相應空間嵌入目標函數(shù),實現(xiàn)高維數(shù)據(jù)在低維空間的嵌入[11]。給定Rm中的N個數(shù)據(jù)點X={x1,x2,…,xN},尋找低維空間Rd(d< (1) 確定每個xi∈Rm的近鄰點,構建鄰域關系圖G,可使用K近鄰或ε近鄰。 (2) 確定鄰接權矩陣,可選擇熱核方式或簡單連接方式: 熱核方式表示為: 簡單方式表示為: (3) 構建Lapacian矩陣,計算數(shù)據(jù)的低維嵌入,廣義特征向量求解:Ly=λDy,其中D是對角矩陣,滿足Dii=∑jWji,L=D-W是對稱的半正定矩陣為拉普拉斯矩陣。經特征分解后,得到的第2到第d+1項的非零特征值對應的特征向量作為降維后的d維輸出。 LE算法的本質是從鄰域關系圖G到低維空間Rd中一組像點Y={y1,y2,…,yN}的映射,使得近鄰的點盡可能地鄰近,由LE算法的描述可知,鄰域選取很重要。LE算法不需要迭代,因此計算時間大大減少。 3.1 支持向量機 支持向量機SVM是一種基于結構風險最小化的機器學習方法。SVM的主要思想在樣本空間里建立一個最大間隔超平面,對應的模型f(x)=wTx+b,其中w和b是模型參數(shù),并使兩個類最近點之間的距離最大,這個距離叫做間隔w,邊緣上的點叫作支持向量[12]。 對于非線性可訓練空間xi∈Rd,在d維特征空間上通過引入松弛變量ξi最大化幾何間隔得到常用的SVM優(yōu)化模型如下: (12) s.t.yi(wTxi+b)≥1-ξiξi≥0i=1,2,…,m (13) 其中:C為代價參數(shù),ξi為松弛因子。通過拉格朗日乘子法得到其對偶問題: (14) 對于線性不可分的情況,將原特征向量映射到高維,引入核函數(shù),決策函數(shù)為: (15) 其中K(xi,xj)=<φ(xi),φ(xj)>為核函數(shù)。核函數(shù)是支持向量機的基礎,常用的核函數(shù)在KPCA中已提到,不同的核函數(shù)會導致支持向量機的學習性能和預測精度不同。RBF核函數(shù)因其具有極好地學習能力和分類的高效性,被認為是實際應用中最好的選擇,其公式如式(11)。 3.2 混合核學習 若k1和k2為核函數(shù),對于任意整數(shù)γ1和γ2,其線性組合也是核函數(shù)γ1·k1+γ2·k2,核函數(shù)的直積也是核函數(shù)k1?k2(x,z)=k1(x,z)k2(x,z),對于任意函數(shù)g(x),k(x,z)=g(x)k1(x,z)g(z)也是核函數(shù)。混合核學習中的合成核可以定義為: (16) (17) 本文采用單核函數(shù)線性組合的方法構造混合核函數(shù),確定不同的核函數(shù),可通過權值的調整來找到更適合的核函數(shù),比單核具有更強的魯棒性。 懲罰參數(shù)C和核函數(shù)參數(shù)σ的選擇,對于SVM診斷的準確率影響很大。只有正確選擇參數(shù),才可以使SVM的分類得到比較好的效果。避免參數(shù)選擇的盲目性,文中使用遺傳算法來實現(xiàn)SVM中的參數(shù)優(yōu)化。 3.3 遺傳算法(GA) 在SVM參數(shù)優(yōu)化的方法中,遺傳算法[13]GA的應用較廣泛,并取得了較好的實踐成果。其實現(xiàn)的一般步驟如下: (1) 進行個體編碼,產生初始群體。 (2) 評估每條染色體所對應個體的適應度,用于衡量個體被遺傳到下一代的幾率,適應度值越大則有可能進入下次迭代。 (3) 選擇操作是按照適應度越高選擇概率越大的原則,從種群中選擇父代將基因信息遺傳到下一代。 (4) 交叉操作是將種群內的個體隨機搭配成對,再隨機交換其中一個或幾個位于同一位置的編碼來產生子代。 (5) 變異操作是在種群內隨機選擇個體,按照二進制變異的方式進行二進制串中的某位的翻轉,進而產生新的個體。 (6) 重復步驟(3)、(4)、(5),直至得到預設的分類識別率或到達最大迭代數(shù)。 4.1 信號降噪 本文的實驗數(shù)據(jù)取自廣西某汽車公司車橋廠生產的主減速器振動數(shù)據(jù)集,采樣頻率為10kHz。在800r/min的轉速下模擬主減速器最常見的幾種故障類型,包括磕碰、斷齒故障、齒面磨損以及正常模式,一共4種狀態(tài)。實驗環(huán)境:Inter(R)Core(TM)CPU2.3GHz/4GB內存,軟件環(huán)境:Windows7/MATLAB2015a。 采集磕碰故障2 048個數(shù)據(jù)點作為樣本數(shù)據(jù)集,列舉了磕碰故障的400個數(shù)據(jù)點如表2所示。 表2 磕碰故障400個數(shù)據(jù)集 現(xiàn)對采集的故障模式進行EMD分解得到IMF分量,對含噪聲的高頻信號進行軟閾值、硬閾值和改進閾值函數(shù)小波降噪,選取具有正交、對稱性的db類小波,分解層數(shù)為3層,低頻部分不做處理,然后將信號重構,可以大大降低信息的噪聲成分。降噪前后的時域與頻域圖對比如圖2、圖3所示。 圖2 降噪前后時域圖 圖3 降噪后的頻域圖 使用信噪比SNR和均方根誤差RMSE來衡量降噪效果,SNR參數(shù)越大,RMSE參數(shù)越小處理效果越好。由表3可得使用改進的閾值方法對故障信號降噪效果比較好。SNR定義為: (18) RMSE定義為: (19) 由此可知EMD和新改進的閾值降噪方法得到的降噪效果比較好。使用改進閾值的降噪方法對采集的振動信號進行降噪實驗。 4.2 特征提取 在正常模式及幾種故障模式下,經降噪后信號的每個特征量的幅值如圖4所示。 圖4 四種模式的特征量 從圖4可以看出,通過時域特征分析以及小波包分解得到的指標特征互不相同,具有一定的可分性,說明使用上述時域頻域信息作為故障特征是可行的。列舉20個齒輪斷齒故障的故障樣本在經過降噪處理后,得到16個歸一化的特征指標,如表4所示。 表4 斷齒故障歸一化的16個特征量 如圖5所示是4種模式的時域信號圖。 圖5 四種信號的時域圖 原始的振動信號在經過去噪、時域信息提取、小波包分解計算頻帶能量這些預處理后,輸入的原始維度為R16,可以視為一個高維度空間,不可避免地存在信息冗余,這些信息會隱藏故障特征,降低診斷的精確度。因此,需要對預處理的數(shù)據(jù)進行降維,提取能反映出故障特征的信息。考慮到特征向量維度對計算時間成本的影響以及數(shù)據(jù)分布的可觀性,選取降維維數(shù)為故障類型數(shù)減1即R3。列舉四種模式分別用KPCA和LE進行維數(shù)約簡處理后得到的3維特征量,如表5所示。 表5 四種模式的3維特征量 經維數(shù)約簡后的特征量需用分類器對降維的數(shù)據(jù)進行分類,通過得到的故障識別率來衡量維度算法的優(yōu)良。維數(shù)約簡后的樣本作為分類器的輸入特征向量,經SVM的模型訓練,以進行故障的分類識別。 4.3 模式識別及參數(shù)優(yōu)化 對采集的振動信號進行預處理之后,其中每組信號包含1 024 000個點,將其劃分為1 000份生成1 000個樣本,因此每個樣本有1 024個點。每組數(shù)據(jù)集中選取800個樣本作為訓練數(shù)據(jù)集訓練SVM分類模型,200個作為測試集。其數(shù)據(jù)集分配如表6所示。 表6 數(shù)據(jù)集分配 先采用常見的四種核函數(shù)進行單核SVM分類,經遺傳算法參數(shù)優(yōu)化過程如下: (1) 采用二進制編碼形式產生初始個體,創(chuàng)建一個種群最大數(shù)量為50,個體長度為20的種群。設定懲罰參數(shù)C的取值范圍為[0,100]。 (2) 計算個體的適應度:以支持向量機的分類確率作為衡量個體適應度的標準。分類正確率R的計算公式如下: (18) 其中,m表示分類正確的樣本數(shù),n表示樣本總數(shù)。 (3) 采用隨機遍歷抽樣選擇法選擇適應度高的個體。 (4) 采用兩點交叉法即在兩個個體編碼串中隨機設置兩個交叉點,交換兩個交叉點之間的部分基因進行交叉操作。為了得到更好的對比效果,交叉概率取值為0.4。 (5) 采用二進制變異中的離散變異法進行變異操作。本文將變異概率取值為0.01。 (6) 設定終止條件,將迭代次數(shù)T取值100~500,當?shù)螖?shù)達到500時,或故障識別率達到92.75%時,終止運算。 根據(jù)上述參數(shù)優(yōu)化過程,對于單核函數(shù)的參數(shù)設置范圍如下,進行實驗,得出的最優(yōu)故障識別率如表7所示。 表7 四種核函數(shù)的故障識別率 續(xù)表7 由表7的故障識別率可知,高維數(shù)據(jù)經過傳統(tǒng)的流形學習算法降維后,造成了有效信息的丟失,因而其識別率低于使用核主成分分析進行分類的識別率。因此在使用混合核函數(shù)時,本文選取KPCA對歸一化的四種模式特征量進行特征提取。 由表7可得采用RBF核函數(shù)分類所得的故障識別率最高,因局部性核函數(shù)(RBF核函數(shù))的學習能力強,泛化性能力較弱,而全局性核函數(shù)(多項式核函數(shù))泛化性能力強、學習能力較弱,因此把兩類核函數(shù)組合起來,可進一步提高核函數(shù)支持向量機分類器的性能。 構建混合核矩陣K=kij,選取多項式與RBF作為多核函數(shù)的線性組合,核矩陣中的元素為: kij=kmulti(xi,xj)=mkpoly(xi,xj)+(1-m)krbf (21) 其中m為權值,m∈(0,1)。根據(jù)經驗取值,交叉概率為0.8,變異概率為0.01,經遺傳算法優(yōu)化后的實驗結果參數(shù)取值及混合核函數(shù)經SVM分類所得的故障識別率如表8所示。 表8 混合核函數(shù)的故障識別率 經過多次的實驗比較,由表8和表7的所得結果可知,使用組合核函數(shù)的支持向量機分類器的性能得到了進一步的提高。 針對主減速器故障診斷的研究,本文基于混合核學習支持向量機的故障診斷方法,進行了振動信號采集降噪、構造特征空間、提取故障特征以及故障識別分類等一系列研究。通過KPCA和LE的比較,利用非線性映射核函數(shù)將原始空間投影到高維特征空間的方法,保留了原始數(shù)據(jù)的大部分信息。由于混合核函數(shù)的引入,支持向量機分類利用多項式核函數(shù)、RBF核函數(shù)的線性組合得到的混合核函數(shù),經遺傳算法參數(shù)調優(yōu),得到的故障識別率比僅僅利用單核函數(shù)RBF得到的故障識別率高了7%。 [1]MertA,AkanA.Detrendedfluctuationthresholdingforempiricalmodedecompositionbaseddenoising[J].DigitalSignalProcessing,2014,32(2):48-56. [2]GaoY,YangT,XingN,etal.Faultdetectionanddiagnosisforspacecraftusingprincipalcomponentanalysisandsupportvectormachines[C]//2012IEEE7thInternationalConferenceonIndustrialElectronicsandApplications(ICIEA),2012:1984-1988. [3]ShaoR,HuW,WangY,etal.Thefaultfeatureextractionandclassificationofgearusingprincipalcomponentanalysisandkernelprincipalcomponentanalysisbasedonthewaveletpackettransform[J].Measurement,2014,54:118-132. [4] 黃宏臣,張倩倩,韓振南,等.拉普拉斯特征映射算法在滾動軸承故障識別中的應用[J].中國測試,2015,41(5):94-98. [5]LuD,QiaoW.AdaptivefeatureextractionandSVMclassificationforreal-timefaultdiagnosisofdrivetraingearboxes[C]//2013IEEEEnergyConversionCongressandExposition(ECCE),2013:3934-3940. [6] 鄔嘯,魏延,吳瑕.基于混合核函數(shù)的支持向量機[J].重慶理工大學學報(自然科學版),2011,25(10):66-70. [7] 徐明林.基于小波降噪和經驗模態(tài)分解的滾動軸承故障診斷[D].哈爾濱:哈爾濱工業(yè)大學,2013. [8] 彭洪江,陳盛雙,曾延安.基于改進閾值函數(shù)的小波降噪算法與仿真分析[J].計算機應用與軟件,2015,32(10):188-191. [9]Sch?lkopfB,SmolaAJ,MüllerKR.Kernelprincipalcomponentanalysis[C]//Proceedingsofthe7thInternationalConferenceonArtificalNeuralNetworks,1997:583-588. [10]KungSY.Kernelmethodsandmachinelearning[M].Cambridge,UK:CambridgeUniversityPress,2014:77-140. [11]ChenC,ZhangL,BuJ,etal.ConstrainedLaplacianeigenmapfordimensionalreduction[J].Neurocomputing,2010,73(4-6):951-958. [10] 周志華.機器學習[M].北京:清華大學出版社,2016. [13] 李凌劍.基于遺傳算法與支持向量機的接地網故障診斷[D].長沙:湖南大學,2014. FAULT DIAGNOSIS OF MAIN REDUCER BASED ON MIXED KERNEL LEARNING SVM Zhang Huawei Zuo Xuyan Pan Hao (SchoolofComputerScienceandTechnology,WuhanUniversityofTechnology,Wuhan430070,Hubei,China) The main reducer is an important part of the automobile, and it is also the main fault source of the automobile, so a fault diagnosis method based on mixed kernel learning SVM is realized. The empirical mode decomposition (EMD) and the wavelet threshold function are used to denoise the vibration signal. The kernel principal component analysis (KPCA) is used to extract the feature vectors, and obtain the low dimensional vectors of the feature subsets. Extracted feature vectors as input values and SVM as classifier, the genetic algorithm parameters are optimized to obtain the fault recognition rate. By studying the mixed kernel function, the linear combination of single kernel function, the experimental results show that compared with the traditional single-core learning fault diagnosis method, the method improves the accuracy of fault diagnosis of the main reducer. Empirical mode decomposition Wavelet threshold function Kernel principal component analysis SVM Genetic algorithm 2016-03-25。湖北省武漢市武漢理工大學面上項目(21376185)。張華偉,副教授,主研領域:數(shù)據(jù)挖掘,大數(shù)據(jù),人工智能。左旭艷,碩士生。潘昊,教授。 TP306+.3 A 10.3969/j.issn.1000-386x.2017.05.0163 基于混合核學習的支持向量機的故障診斷


4 仿真實驗














5 結 語