張 建,潘海洋,鄭近德,潘紫微
(安徽工業(yè)大學(xué) 機械工程學(xué)院,安徽 馬鞍山 243032)
模式識別方法是人工智能的一個重要應(yīng)用領(lǐng)域,是通過計算的方法根據(jù)樣本的特征對樣本進行分類,在機械設(shè)備的故障診斷中得到廣泛應(yīng)用,并且發(fā)揮著重要的作用,但是不同的模式識別方法在分類精度和準(zhǔn)確性上存在較大的差異。
目前應(yīng)用比較廣泛的模式識別方法有人工神經(jīng)網(wǎng)絡(luò)和支持向量機(Support Vector Machine,簡稱SVM),但人工神經(jīng)網(wǎng)絡(luò)需借助經(jīng)驗或先驗知識進行參數(shù)設(shè)置,并且只有在訓(xùn)練樣本趨于無窮多時才收斂于真實模型[1];SVM需要嚴(yán)格的核函數(shù)及參數(shù)調(diào)整,并且SVM是一個尋優(yōu)的過程,當(dāng)樣本的數(shù)目很大時,計算量也相當(dāng)大[2]。另外,人工神經(jīng)網(wǎng)絡(luò)和SVM并沒有考慮特征值之間的相互關(guān)系。基于此,Raghuraj等提出了一種基于多變量預(yù)測模型(Variable Predictive Model Based Class Discriminate,簡稱VPMCD)的模式識別方法,該方法根據(jù)特征值之間的內(nèi)在關(guān)系建立對應(yīng)的數(shù)學(xué)預(yù)測模型,利用得到的數(shù)學(xué)模型對待測樣本的各個特征值進行預(yù)測,然后把預(yù)測結(jié)果作為分類依據(jù),從而完成分類識別[3–4]。楊宇等人已將VPMCD方法及其改進算法引入機械故障診斷中[5–6],并且取得了較好應(yīng)用效果。但是VPMCD方法及其改進算法并沒有考慮特征數(shù)據(jù)中存在“異常值”的情況,然而工程實際中采集的信號往往比較復(fù)雜,使得實測數(shù)據(jù)包含各種噪聲信號以及測量誤差,所提取的特征值也不可避免地出現(xiàn)“異常值”,上述模式識別方法并沒有考慮數(shù)據(jù)中存在“異常值”的情況,導(dǎo)致建立的模型失真。因此,本文提出了一種基于特征評價的優(yōu)化加權(quán)代理判別模型(Agent Discriminate Model Based Optimization Weighted,簡稱ADMOW)模式識別方法。
ADMOW方法是利用數(shù)據(jù)間的對應(yīng)關(guān)系建立Kriging代理判別模型代替數(shù)據(jù)間的真實關(guān)系,Kriging代理判別模型是由回歸模型和相關(guān)模型組合而成,通過兩類模型的不同組合,建立一系列真實模型的近似模型,從不同的組合模型中選出最接近真實模型的一個組合作為最佳預(yù)測模型,使之能充分反映特征值之間的對應(yīng)關(guān)系[7–8],并且針對“異常值”導(dǎo)致模型參數(shù)出現(xiàn)嚴(yán)重偏差的情況,利用特征評價加權(quán)的方法,賦予每項特征值一個權(quán)值系數(shù)。從而削弱異常值對代理判別模型的影響,建立更加真實的代理判別模型,達到模式識別的目的。
綜上所述,本文基于VPMCD思想,將Kriging模型和特征加權(quán)相結(jié)合,提出了基于特征評價的優(yōu)化加權(quán)的代理判別模型模式識別方法,并將該方法應(yīng)用到滾動軸承故障診斷中,首先將所提取的特征值進行特征評價,根據(jù)評價指標(biāo)對特征值進行加權(quán)處理,削弱異常值的影響,然后采用Kriging代理模型中的回歸模型和相關(guān)模型依次組合建立數(shù)學(xué)代理判別模型,并以最小預(yù)測相對誤差平方和為判據(jù)選擇最佳代理判別模型,從而建立基于特征評價的ADMOW預(yù)測模型用來進行模式識別。
ADMOW方法是利用數(shù)據(jù)間的對應(yīng)關(guān)系建立代理判別模型代替數(shù)據(jù)間的真實關(guān)系模型并完成分類,這種內(nèi)在關(guān)系的真實模型可以用具體模型近似替代,只要分類精度達到要求即可。ADMOW選取Kriging函數(shù)作為代理模型,Kriging函數(shù)作為一種估計方差最小的無偏估計模型,其函數(shù)是由回歸模型和相關(guān)模型組合而成。回歸模型是預(yù)測函數(shù)模型的主體框架,而相關(guān)模型則是用來校正回歸模型在整體函數(shù)模型上產(chǎn)生的偏差,使得所建立的模型更加接近真實模型。此外,他們之間的不同組合也會對結(jié)果產(chǎn)生很大的影響,從不同的組合模型中選取最優(yōu)的組合作為最佳預(yù)測模型,從而建立一個描述特征值間內(nèi)在關(guān)系的代理預(yù)測模型。
為了削弱“異常值”對代理判別模型產(chǎn)生的影響,本文采用一種根據(jù)類相似度評價指標(biāo)進行特征加權(quán)的方法,賦予每項特征值一個權(quán)值系數(shù)。該權(quán)值系數(shù)根據(jù)特征評價指標(biāo)的不同,權(quán)值大小隨之不同,評價指標(biāo)反映了特征值的顯著度,即特征值數(shù)據(jù)中異常點的個數(shù)及離群程度。異常點個數(shù)越多、離群程度越大,則該特征值的顯著度越低,反之則顯著度越高。根據(jù)顯著度的高低賦予特征值不同的權(quán)值。
第i類的類內(nèi)離差矩陣表達式為[9]

式中:Ni為第i類的樣本數(shù)目為i類中的第z個樣本;m(i)為i類的平均矢量。

類內(nèi)離差S(i)越小,表明同一類對象之間的相似度越大,異常點數(shù)量以及離群程度越小,這樣的特征參數(shù)顯著度就越高,所加的權(quán)值也越大。
類相似度評價指標(biāo)

將類相似度評價指標(biāo)歸一化

式中:p為特征值個數(shù)為第i類第l個特征值的評價指標(biāo)。
對于g種類別的分類問題,各選取n1、n2、…、ng個樣本作為訓(xùn)練樣本。根據(jù)所采用的特征值對每個訓(xùn)練樣本提取特征,假設(shè)提取p個特征值,即為Y=[Y1,Y2,…,Yp]。計算各類各項特征的評價指標(biāo)J,然后將各類各特征對應(yīng)的評價指標(biāo)J作為權(quán)值系數(shù)w賦予該項特征,得到新的特征向量X=[w1?Y1,w2?Y2,…,wp?Yp]=[X1,X2,…,Xp],然 后 建立預(yù)測模型,此時,各種狀態(tài)類別的樣本特征值的數(shù)量分別為n1×p、n2×p、…、ng×p。
用X=[X1,X2,…,Xp]表示一種狀態(tài)類別,由于同一類別中的不同特征值之間具有對應(yīng)關(guān)系,即Xi=f(Xj)(j≠i),并且在不同的類別中,這種對應(yīng)關(guān)系有所不同。為確定系統(tǒng)的狀態(tài)類別,以Kriging模型為基礎(chǔ),為特征值Xi建立一個線性或者非線性的代理判別模型ADMi。Kriging代理判別模型ADMi可表示成如下形式

式中:g(x)表示模型的確定性函數(shù),即Kriging函數(shù)中的回歸模型,該模型一般分為常數(shù)模型、一次回歸模型和二次回歸模型。這些模型構(gòu)成了Kriging函數(shù)的主體框架。u(x)表示模型的不確定性部分,它可以提供模型對局部模擬偏差的近似值,即Kriging函數(shù)中的相關(guān)模型。只有選擇合適的相關(guān)函數(shù),才能保證模型具有較高的識別精度。
對Kriging代理判別模型ADMi中的g(x)采用特征值Xj(j≠i)對Xi進行預(yù)測,可以得到

其中:Xi為被預(yù)測變量;Xj(j≠i)為預(yù)測變量;e為預(yù)測誤差;b0、bj、bjj、bjk為模型參數(shù),通過訓(xùn)練樣本對代理判別模型進行訓(xùn)練得到。這個過程實際上就是用訓(xùn)練樣本對b0、bj、bjj、bjk等模型參數(shù)進行估計的過程。
(1)對第k(1≤k≤g)類訓(xùn)練樣本選擇被預(yù)測變量Xi(i=1,2,...,p),剩下的Xj(j≠i)作為預(yù)測變量。
(2)令回歸模型的類型為t=1(1≤t≤T()用1、2、3分別標(biāo)記常數(shù)模型、一次回歸模型、二次回歸模型),相關(guān)模型類別為r=1(1≤r≤R()用1到7分別標(biāo)記 Exponential、Generalized exponential、Gaussian、Linear、Spherical、Cubic、Spline),分別用T個回歸模型和R個相關(guān)模型的不同組合對Xi建立nk=T×R個數(shù)學(xué)模型。
(3)把第k類的訓(xùn)練樣本特征值進行函數(shù)回代,得到Xi的預(yù)測量Xip。
(4)分別計算nk個變量代理判別模型的相對預(yù)測誤差平方和為第v個訓(xùn)練樣本為Xiv的平均值。選擇最小的SSE所對應(yīng)的模型作為第k類訓(xùn)練樣本中Xi的變量代理判別模型
(5)令k=k+1,循環(huán)步驟(2)至步驟(4),直至g個類別的所有特征量分別建立變量代理判別模型這些變量代理判別模型構(gòu)成一個大小為g×p的ADM矩陣。
(6)將所有訓(xùn)練樣本作為測試樣本對ADM矩陣回代測試,把分類結(jié)果最好的ADM模型對應(yīng)的回歸以及相關(guān)模型類型選擇為最佳的變量預(yù)測模型。
提取待測試樣本的特征值,用對應(yīng)的權(quán)值w對特征值加權(quán)處理,得到新的特征向量用建立的變量代理判別模型分別對待測樣本的特征值Xi進行預(yù)測,得出預(yù)測值把相同類別的全部特征值計算出來的相對預(yù)測誤差平方和值進行求和,得到并且把SSEk值最小作為判別函數(shù)對測試樣本分類,即在g個類別中,以SSEk最小將測試樣本識別為第k類。
對于模式識別問題來說,特征選擇和特征提取是決定識別效果的關(guān)鍵步驟。在滾動軸承的故障診斷中,選擇合適的特征才能對故障類別進行準(zhǔn)確區(qū)分。為了描述系統(tǒng)的非線性特性,并降低噪聲的影響,采用局部特征尺度分解(Local Characteristic Scale Decomposition,LCD)方法,該方法可以同時在時域和頻域提供非平穩(wěn)信號的局部信息[11],將樣本信號通過LCD分解,得到若干一維單分量信號,再提取前四個分量的奇異值[12]作為特征值。基于特征評價的ADMOW方法的滾動軸承故障診斷步驟如下:
(1)以一定的采樣頻率對軸承的正常狀態(tài)、內(nèi)圈故障、外圈故障以及滾動體故障進行數(shù)據(jù)采集,各采集N組振動信號樣本。
(2)對采集的樣本進行LCD分解,并提取前四個分量的奇異值作為特征值組成特征向量,得到各種狀態(tài)下的特征值矩陣。
(3)對每種狀態(tài)各選取若干訓(xùn)練樣本進行ADMOW訓(xùn)練,建立數(shù)學(xué)預(yù)測模型。
(4)把剩余的樣本采用訓(xùn)練好的預(yù)測模型進行分類測試,根據(jù)測試的結(jié)果確定軸承的工作狀態(tài)和故障類別。
為了檢驗ADMOW方法的效果,本文采用美國凱斯西儲大學(xué)的滾動軸承振動數(shù)據(jù)[13]進行驗證,選用6205-2RS型深溝球軸承,電機的轉(zhuǎn)速為1 730 r/min,采樣頻率為48 kHz,電機負(fù)載為2.24 kW。選取正常軸承、內(nèi)圈故障、外圈故障和滾動體故障的振動信號各200組數(shù)據(jù)作為樣本,取前100組用于訓(xùn)練,后100組用于測試。四種狀態(tài)下的滾動軸承振動加速度信號如圖1所示。
首先對采集的信號樣本進行LCD分解,并提取前四個分量的奇異值作為特征值。各樣本特征值提取完成后,將訓(xùn)練樣本通過特征評價得到各特征的類相似度評價指標(biāo),如圖2所示。

圖1 滾動軸承各狀態(tài)的振動信號時域波形
將各類各特征對應(yīng)的評價指標(biāo)作為權(quán)值系數(shù)對該項特征值進行加權(quán)處理,得到新的特征向量。建立ADM模型,分別用未加權(quán)和加權(quán)的訓(xùn)練樣本對所建立的ADM模型進行訓(xùn)練,得到ADM和ADMOW預(yù)測模型,表1給出了外圈故障下各特征變量通過訓(xùn)練得到的變量預(yù)測回歸模型,表中ADMOW模型的Xi為經(jīng)過特征加權(quán)處理后的值。將剩余的數(shù)據(jù)作為測試樣本分別代入ADM模型和ADMOW模型進行分類測試,測試結(jié)果如表2所示。

圖2 ADMOW的特征類可分性評價指標(biāo)
ADM模型和ADMOW模型在測試中的分類精度如圖3和圖4所示。
圖中橫坐標(biāo)為隨機選取的各類測試樣本的序號,縱坐標(biāo)為該類別的測試樣本分別在各個類別最佳變量預(yù)測模型中的相對預(yù)測誤差平方和的對數(shù)值。
由于分類器是以特征值的相對預(yù)測誤差平方和最小為分類依據(jù)進行分類,所以在對某一類故障樣本進行分類測試時,在該類預(yù)測模型下的相對預(yù)測誤差平方和與其他類預(yù)測模型下的相對預(yù)測誤差平方和相差越大、沒有交叉,則分類精度越高,分類結(jié)果越準(zhǔn)確。

表1 外圈故障下ADM模型與基于特征評價的ADMOW模型對比

表2 ADM和基于特征評價的ADMOW模型分類結(jié)果對比

圖3 ADM在滾動軸承各狀態(tài)下的識別精度
通過表1的對比可以看出,未加權(quán)的ADM模型對軸承的外圈故障識別能力較弱,正確識別率只有82%,總識別率為95%;而基于特征評價的ADMOW模型對各類別的識別率均達到100%。結(jié)合圖3和圖4,圖3中正常軸承和內(nèi)圈故障信號在對應(yīng)預(yù)測模型下的預(yù)測結(jié)果與其他預(yù)測模型下的預(yù)測結(jié)果無明顯交叉點,能夠區(qū)分,但分類效果一般。外圈故障信號在外圈、內(nèi)圈和滾動體故障預(yù)測模型中的預(yù)測結(jié)果有大量交叉重疊,難以準(zhǔn)確分類。滾動體故障信號在外圈、內(nèi)圈和滾動體故障預(yù)測模型中的預(yù)測結(jié)果有少量交叉,分類效果較差;圖4中除內(nèi)圈故障信號分類效果一般外,其余狀態(tài)信號均能以比較明顯的差別進行準(zhǔn)確分類。因此基于特征評價的ADMOW方法在分類能力及分類精度上均明顯高于未加權(quán)的ADM方法。

圖4 ADMOW在滾動軸承各狀態(tài)下的識別精度
為了檢驗基于特征評價的ADMOW方法在各種檢驗法下的識別精度,分別采用Re-substitution(RS)檢驗法、Jack-knife(JK)檢驗法和K-fold cross-Validation(K-CV)檢驗法對加權(quán)和未加權(quán)的ADM模型進行比較。其中RS檢驗法是用來驗證算法的自相容性,K-CV交叉檢驗法用來測試算法的準(zhǔn)確性,JK檢驗法是統(tǒng)計學(xué)中比較客觀和嚴(yán)格的交叉檢驗法,反映了算法的外推能力。另外,再引入一種計算分類精度的Kappa系數(shù),Kappa系數(shù)值越大,表示分類精度越高,檢驗結(jié)果如表3所示。
通過表3中兩種分類方法的對比,無論是總的識別率還是Kappa系數(shù),基于特征評價的ADMOW方法均優(yōu)于未加權(quán)的ADM方法,ADMOW方法在分類精度上有明顯的優(yōu)勢。
(1)本文將特征評價和特征加權(quán)方法融合到模式識別中,弱化了異常數(shù)據(jù)對模型的影響,建立更加真實的代理判別模型,從而達到獲得準(zhǔn)確的模式分類目的。
(2)ADMOW預(yù)測模型建立過程實質(zhì)上是參數(shù)估計的過程,根據(jù)具體的回歸模型和相關(guān)模型的不同組合,自動選擇最優(yōu)的組合作為最佳預(yù)測模型,它不受先驗知識和主觀因素的影響,使得分類結(jié)果更加客觀、準(zhǔn)確。

表3 三種檢驗法的ADM和ADMOW分類性能對比
(3)對滾動軸承4種狀態(tài)分析的結(jié)果表明,基于特征評價的ADMOW模型可以準(zhǔn)確高效地對軸承工作狀態(tài)和故障類型進行分類,為滾動軸承的故障診斷提供了新的方法,同時對其它的模式識別問題也有一定的參考價值。