周志才,劉東風,石新發
(海軍工程大學 青島油液檢測分析中心,山東 青島 266012 )
在工程實際中獲得的機器信號往往含有噪聲,且故障發生時機器不可能長時間運行,所得到的故障樣本數量有限。為了更準確地識別機器的狀態和故障,需通過多種物理量的特征信息進行判別,而利用高維小樣本數據構造分類模型時容易產生過擬合現象。因此,故障特征信息的選取成為機械故障診斷的關鍵。
目前常采用主成分分析(Principal Component Analysis, PCA)對高維故障數據進行壓縮,提取能較好反映故障信息的特征。PCA提取的只是原始特征中的線性成分,而在監測和診斷中反映機器狀態的大量信息蘊含在數據的非線性成分中。文獻[1-2]引入核函數概念,將低維不可分的非線性特征映射到高維可分空間,由此產生核主成分分析(Kernel Principal Component Analysis,KPCA)的概念。KPCA雖很好地考慮了非線性,但在提取新的分類特征向量時,未區別樣本類內、類間信息,因此對于構建故障模式識別模型通常并非最優。
下文考慮采用一種能較好利用先驗信息進行類間區分的非線性特征提取方法——核切片逆回歸(Kernel Sliced Inverse Regression, KSIR),闡述其基本思想和算法,同時采用KSIR和KPCA對軸承故障試驗數據進行維數壓縮和特征提取的對比分析,并討論相關參數的選擇對KSIR特征提取能力的影響。
切片逆回歸(Sliced Inverse Regression, SIR)是由文獻[3]提出的結合逆回歸和PCA的算法,其在尋找最優投影方向時考慮輸出變量(響應變量)和輸入變量的信息,實現高維數據的綜合降維。
假設x為由n個p維觀察樣本xi(i=1,…,n)組成的n×p維觀察矩陣,y為n×1的輸出變量,文獻[3]提出
y=f(β1x,β2x,…,βKx,ε),
(1)
式中:f為RK+1空間的未知函數;β1,β2,…,βK為K個未知向量;ε為與x獨立的分布未知的隨機誤差。
當此模型成立時,p維原始樣本空間變量便映射到K維空間(β1x,β2x,…,βKx)T上,且保留關于y的所有信息。當K
為尋找EDR方向,用逆回歸思想將x和y顛倒角色,由求解p維回歸變成一維回歸,直接避開高維帶來的復雜問題。當y發生變化時,E(x|y)構成1條曲線,稱為逆回歸曲線。由此證明,對x進行標準化矩陣z的逆回歸曲線E(z|y)包含在由標準化的EDR方向β1,β2,…,βK構成的線性空間中,協方差矩陣ΣηCov(E(z|y))在任何一個與βk(k=1,…,K)正交的方向上都退化,從而對應于Ση的最大K個特征值的標準化特征向量βk(k=1,…,K)就是標準化的EDR方向。
切片的思想便是根據y將樣本“切”成h片,然后在每個切片內計算樣本均值,并由此估計總體協方差矩陣,運用PCA求得E(x|y)的前K個EDR方向。
考慮到樣本各物理量間的復雜非線性關系,引入Mercer核函數,通過由核函數定義的非線性映射Φ將初始樣本空間變換到高維特征空間,高維空間映射向量的點積運算轉換為原始樣本空間數據向量的數學運算,避免直接構造映射函數的麻煩,同時也極大減小計算過程的復雜度和數據的存儲量,由此便將線性SIR發展為非線性KSIR[4]。
KSIR通過Φ將樣本映射到更高維空間[5]中,即
Φ:xi→Φ(xi)。
(2)
此時, (1)式變為
y=f(β1Φ(x),β2Φ(x),…,βKΦ(x),ε)。
(3)
利用前述SIR思想對(3)式進行計算求得EDR方向,具體計算過程為:
(1)首先對Φ(x)進行零均值化處理,使滿足E(Φ(x))=0,定義Φ=[Φ(x1),…,Φ(xn)]T,樣本協方差矩陣為
(4)
(2)根據y將樣本切成h片后進行分組,每組切片內的相應映射樣本均值為
(5)
式中:ni為第i切片組內的樣本數;Ii為第i切片組。
(3)利用每組切片的樣本均值和容量加權值計算總體樣本協方差矩陣為
(6)

(4)將Φ沿KSIR的前r個方向投影,即得前r個主要成分。
試驗采用美國Case Western Reserve University的SKF 6023深溝球軸承故障振動數據[6]。軸承故障數據試驗平臺示意圖如圖1所示,包括1臺1.47 kW的電動機、1個轉矩傳感器、1個功率計和電子控制設備,試驗軸承支承電動機軸。使用電火花加工技術在軸承上布置單點故障,深度為0.533 4 mm,設置正常軸承、內圈故障、外圈故障、球故障4種單一故障類型,將振動信號中每4 096個點作為1個樣本,每類各20個樣本。為了獲取較全的故障特征信息,從樣本中提取時域、頻域和經驗模態分解能量熵等共43維故障特征[7],構成80×43維的故障樣本矩陣。

圖1 軸承故障數據試驗平臺示意圖


表1 3種提取方法下特征向量對自變量的解釋能力比較
對于KPCA,特征向量的解釋能力逐漸下降,前3個特征向量的累計貢獻率已達90.89%,在維數壓縮的同時關鍵信息丟失較少;對于KSIR,特征向量對自變量的解釋能力則相對較平均,h取4時,前3個特征向量的累計貢獻率達100%,意味著故障關鍵信息僅通過映射后的3個特征向量便足以表達,大大減少后續訓練模型的復雜程度和計算量;當h大于類別數(h=12)時,可明顯看出特征提取能力不但未增加,反而比KPCA還差,這是由于KSIR對切片分組過于依賴。
方差貢獻率ηk只是在每種方法所獲得的EDR空間進行相對比較。為了比較3種方法下映射到前3個EDR方向的特征向量對故障信息的提取效果,將3種方法映射后的80×9維的特征向量矩陣作為原始特征向量,采用文獻[7]提出的特征選擇的改進方法對其進行計算,各特征向量分類性能比較如圖2所示,值越大則表示特征向量的分類性能越好。

圖2 各特征向量分類性能比較
由圖2可知,在相同評判條件下,KSIR(h=4)映射后的特征向量的故障分類性能最佳,KPCA中方差貢獻率最大的第1個特征向量僅保留原樣本較多的關鍵信息,但從分類性能來講,第3個特征向量卻優于第1個特征向量。
由于類的可分性不僅取決于均值的可分性,還依賴于方差的可分性,所以特征向量對因變量的解釋能力可在圖3所示的前3個特征向量組成的三維空間中的分布得到解釋。圖3d為原始特征樣本中隨機選取的三維特征組成的分布圖,其類別均值的可分性較差,直接采用此原始特征進行判別易產生較高誤判率;圖3a的KPCA和圖3c的KSIR(h=12)方法,類別均值的可分性較明顯,但各類別的方差較大,由此表現出的發散性易引起類別間的誤判;圖3b的KSIR(h=4)方法,不僅類別間邊界明顯,而且同類樣本個體聚集緊密,類別信息對特征向量提取的貢獻得到充分體現。

圖3 樣本在特征空間的分布
綜上所述,KSIR借助核函數實現分類屬性與類別信息間的內在非線性關系,在取得合適h時可用較少特征向量獲得對自變量和因變量較強的解釋能力,而且在低維的EDR空間實現對數據的解釋和可視化,分類性能優于KPCA。
2.2KSIR中h與r的選擇
由2.1節可知,在h選取不當時,原始特征信息在r維主分量上投影時產生較大的丟失。為了研究h與r對原始特征信息提取能力的影響,h與前3個特征向量累計貢獻率的關系如圖4所示。

圖4 h與前3個特征向量累計貢獻率的關系
由圖4可知,隨h增加,前3個特征向量累計貢獻率呈逐步下降的趨勢,切片是為了考慮樣本的先驗類別信息,因此當h大于樣本類別數時,相同類別不同切片內的樣本在投影后間距變大,從而可在更多的EDR方向上進行細分。圖4也間接驗證h與非零EDR空間維數K間的關系[8]:K=h-1。當h小于樣本類別數時,前K維特征向量的累計貢獻率雖為1,但由于把不同類別的故障樣本放到同一切片組內考慮,導致故障類別間的差距信息丟失,造成分類能力降低,故在使用KSIR進行降維特征提取時,當h等于樣本類別數時,為了使分類性能最優,r應當在2≤r≤K間根據需要進行選擇。
KSIR能考慮數據間的非線性關系,通過非線性映射將原始故障樣本映射到高維空間;然后對樣本切片分組計算EDR方向,獲得投影到EDR方向上的特征向量,實現對原始樣本故障信息基本無損失的降維提取;最后采用試驗分析了KSIR相比于KPCA的優越之處。結果表明,KSIR考慮樣本類別的先驗信息,能以更少、分類能力更優的特征向量取得更高的分類精度。另外,分析討論了KSIR中相關參數的確定,為KSIR應用于實際的故障模式判別和分類提供參考。