李月仙,韓振南,黃宏臣,寧少慧
(太原理工大學 機械工程學院,太原 030024)
旋轉機械是工業部門中應用最廣泛的機械設備,齒輪-軸承系統作為旋轉機械的核心部件在工業中發揮著無可替代的作用。目前的機械設備朝著大型化、復雜化發展,旋轉部分復雜的運行工況容易出現各種不同形式的故障而影響正常工作,甚至會發生毀機事故,造成重大的經濟損失。旋轉機械常見的故障包括三類:一是滾動軸承故障,包括軸承內圈、外圈、滾動體及保持架故障;二是轉子本體故障,包括不平衡、不對中、轉子裂紋及支承松動等;三是齒輪故障,包括斷齒、齒面磨損和齒根部裂紋等[1]。
對于復雜結構和系統的旋轉機械在出現故障時所監測到的振動信號具有明顯的非線性和非平穩特性,使用傳統時頻方法難以從復雜信號中提取出有效特征量。為了及時、準確地識別和診斷出故障狀態,從監測信號中提取出有效信息量就尤為重要。常用的方法就是采用多個相關傳感器和提取多個特征量以提高診斷精度,但是大量的冗余信息給故障分類帶來了更大的復雜度。因此,消除信息冗余,提取出有效的故障分類特征量是我們一直所追求的目標之一[2]。
核方法是20世紀60年代由Minsky和Papert等人針對線性特征提取方法對于非線性信號進行特征提取時的局限性,無法解決現實世界中很多復雜的非線性問題而提出的一種非線性學習方法。通過引入核函數,將數據映射到高維空間中,在特征空間中展開學習,發現其存在的線性關系,實現了非線性問題的高效求解,同時避免了復雜的非線性映射的求解。
核主元分析法KPCA是最典型的非線性核方法,在高維特征空間中不涉及非線性優化,僅僅利用線性代數求解特征值問題,且由于KPCA使用了核函數,對非線性問題具有了較廣的適用性,在機械過程檢測和故障診斷領域已經得到了廣泛應用和研究[3-5],但核方法的缺點也是很明顯的,在參數選取時是不需要預先給定的,且在使用核函數時是知道具體的特征空間,使得核方法缺乏物理直觀性。并且核函數對于故障診斷中的類可分性測度影響很大,選擇不當會導致類可分性測度很小,使得不同類別的樣本點在特征空間中出現相互重疊覆蓋。而近年來流形學習方法的發展給機械故障診斷提供了一種新的思路。
流形學習是人們在21世紀信息時代面對海量的高維信息而發展起來的一種新型的非線性降維及數據挖掘的新方法。它能有效地對高維非線性數據進行降維,從高維非線性數據中找出隱藏在高維觀測空間數據中的低維結構表示,揭示其內在流形分布。在2000年發表的三篇論文中開創性地提出局部特征映射LLE和等距映射ISOMAP兩種算法后,迅速在各領域中進行研究,并陸續出現了多種經典方法[6-10],如:拉普拉斯特征映射算法LE和局部切空間排列算法LTSA。因為流形學習已經在一些領域取得了顯著效果,近幾年被故障診斷領域的研究者引入到設備工況特征的高維數據的非線性特征挖掘和降維中,并顯示了良好的效果和前途[11-13]。
LE算法假設數據點分布在光滑黎曼流形上,其主要思想是通過Laplace-Beltrami算子來構造相應空間嵌入目標函數,實現高維數據在低維空間的嵌入。LE算法降維的實質就是尋找到一個平均意義上保持數據點局部鄰近信息,即在原來高維特征空間中是近鄰的點在低維表示中也應該是近鄰點。因此,LE算法的求解
步驟2:定義鄰接權矩陣W,可選擇熱核方式或簡單連接方式。熱核法:如果Xi與Xj是鄰接點,則有Wij,否則為 0,其中 t為熱核的寬度,其取值與鄰域K值相適應;簡單法:可以避免熱核法中參數t的選擇問題,如果Xi與Xj近鄰,則Wij為1,否則為0,在本文中將采用簡單法確定權值和權值矩陣。
步驟3:構建拉普拉斯特征矩陣L=D-W,最小化特征映射誤差相當于計算下式中的最小特征向量。

其中D為對角矩陣ij。L的最小d+1個特征值對應的特征向量u1,u2…ud就構成了低維嵌入結
由上所述,LE方法將降維和特征提取問題轉化成對矩陣特征值和特征向量的求解,過程簡單,不需要進行迭代計算,因此計算量和運算時間大大減少。
根據LE算法的描述,LE算法是一種重點強調保持近鄰關系的流形學習算法,可以有效地保持高維樣本空間中具有相同或相近性質的近鄰樣本點“物以類聚”的聚類特性,因此,LE算法非常適用于機械故障不同樣本分類識別問題。而對于LE算法,局部鄰域的構建對低維流形提取效果至關重要,根據參考文獻[14]在本文中將選用K=8的KNN法構建鄰域圖。轉化為對圖拉普拉斯算子的廣義特征值求解問題[9]。根據圖譜理論,如果數據均勻采樣自高維空間中的低維流形,流形上的拉式算子可以由圖上的Laplacian逼近,而圖上的最前面的幾個特征向量就是流形上L-B算子特征函數的離散逼近。LE算法可以描述為以下幾步:
步驟1:構建鄰接圖G,可采用:近鄰ε法或K近鄰法,在本文中將選用K近鄰域法(KNN);
旋轉機械狀態識別與故障診斷過程是典型的模式識別的過程,特征提取是基礎,識別方法是核心[3]。由于對旋轉機械所監測到的振動信號復雜,包含著大量的冗余信息量,很難直接利用振動信號數據來評估。通過特征提取和轉換技術把原始信號構建到特征空間,利用特定方法提取出能準確描述設備運行狀態的信息。對振動信號進行時域、頻域以及時頻域特征量分析已被廣泛使用,但是由于提取的不同特征參數對設備健康狀態的規律性、敏感性和聚類性各不相同且表征規律不一,很難用某一個或幾個特征參數來準確表征滾動軸承的運行狀態。如何提取出規律性強、敏感性好的狀態特征參數一直是故障診斷領域所追求的,也是研究的熱點和難點之一。
為了提高運行狀態和故障的識別準確率,本文將從多個角度盡可能地進行全方面分析。根據旋轉機械在不同故障狀態下不同特征參數的敏感性不同,構建如表1所示的26個特征量,其中Ei為采用db4小波包函數進行3層正交小波包分解得到均勻劃分的8個子頻帶的濾波信號,將得到的8個子頻帶信號能量與總頻率的相對能量比作為頻域統計特征參數[11]。本文以上述26個特征參數作為訓練樣本,采用降維方法對高維特征數據進行學習,提取特征量。
E3i表示第 i+1個頻帶重構信號的能量,Ei=E3i/E表示第i個頻帶占總能量比,其中 i=0,1,…,7,E=表示總能量。

表1 特征參數表Tab.1 Characteristic param eter
滾動軸承實驗中所采用的數據均來自美國凱斯西儲大學電氣實驗室使用SKF6205-2RS滾動軸承所進行的實驗[15]。所有實驗數據是在選擇下列實驗條件下所測得的數據:電機負載為2 hp,轉速為1 750 r/min,采樣頻率為48 kHz,其傳感器位置為驅動端的軸承座上垂直位置。在本實驗中,軸承內圈、外圈和滾動體上人為制造出滾動軸承三類典型故障類型,選用其故障尺寸為直徑0.53 mm、深度0.28 mm所測數據作為實驗依據。四種故障樣本類型,每種故障選50組樣本,每組樣本26個維度,構建出N×m=(4×50)×26的特征矩陣。根據參考文獻[16-17]所述,確定目標維數dim為選取的故障樣本類型數減一,即dim=3。
從圖1和表2中可知,圖1(a)為PCA方法所得到的結果。從圖中可以看出只有無故障樣本可以準確識別,并且具有很好的聚類性,其他三種故障類型樣本之間出現了相互交叉混疊,尤其是外圈故障樣本分布散亂且識別率最低。可見PCA對滾動軸承故障樣本的識別率和聚類效果不太理想。
圖1(b)為KPCA提取的前三個主元K1K3的三維圖。因為KPCA采用了參數σ=0.5的高斯核函數,所以從圖中可以看出四種故障樣本基本區分開來,各類故障樣本實現了很好的識別和聚集,較PCA在樣本的平均識別率和聚類性均有了較大的提高。但是,仍出現了不少的樣本處于偏離位置,聚集性仍有待提高。
圖1(c)為采用流形學習中的LE算法對高維特征空間進行特征融合提取的結果。滾動軸承的四種樣本在三維空間中都呈現出很好的聚類性,且類與類之間明顯地分離。與PCA和KPCA兩種方法相比,LE方法能對高維樣本空間提取出不同故障狀態下的有效信息,從而實現了對滾動軸承故障狀態的有效識別。

圖1 滾動軸承故障分類識別Fig.1 Different fault classification of Rolling Bearing
轉子故障是旋轉機械中常見的一類故障,在本節中,通過典型故障的分析找出故障的振動特征是進行模式識別的必要條件,是進行精密診斷的基礎。
第一種,轉子不平衡,是一種常見的故障類型,旋轉機械中由于不平衡而失效約占30%;第二種,各轉子軸線之間產生平行、軸線角度或綜合位移等對中變化誤差,即轉子不對中。轉子系統中約60%故障是由不對中引起的,是旋轉機械轉子系統中最常見的故障;第三種是轉子彎曲,轉子彎曲又分為中間彎曲和端部彎曲兩種,在運行時會產生與質量偏心類似的旋轉矢量激振力,同時在軸向發生與角頻率相等的振動。第四種是基座或裝配松動,基座和裝配松動常和轉子不平衡相伴生,表現出強烈的垂直方向振動[1]。
本節中四種典型轉子故障均為某公司實驗平臺上所進行的模擬實驗,選用電機轉速均為2 976 r/min(fr=49.6 Hz)。同理,構建出如滾動軸承故障實驗類似的N×m=(4×50)×26高維特征矩陣。分別采用PCA、KPCA和LE方法進行特征提取,降維結果如圖2所示。
由于四種故障在時域和頻域特征量中差別比較明顯,故PCA方法對于四種故障也能基本識別,但每種故障的聚類性很差,且各種故障相互間的間隔不明顯;KPCA比PCA在類內距有所提高外,樣本識別率并沒有明顯提高,出現一定量的交叉混疊;而LE方法很明顯地把類與類分離,雖然也存在錯誤識別,但相較PCA和KPCA,在高維空間中對狀態樣本的低維嵌入聚類提取敏感特征效果明顯提高。
本文齒輪故障識別實驗數據,是在太原理工大學齒輪研究所振動及故障模擬實驗平臺上所測得,并選用軸承座垂直方向振動加速度信號作為診斷依據。實驗采用的是材料為45#鋼的單級漸開線直齒圓柱齒輪,大齒輪齒數為45,小齒輪齒數為30,壓力角α0=20°,模數m=4,轉速均為N=800 r/min,負載為400 N·m,采樣頻率為10 kHz。實驗選用三個相同的小齒輪,一個為無故障齒輪,一個制造成齒面剝落,而另一個在某個齒根處切割長為5 mm的裂紋,作為齒輪的三種典型狀態。同理,分別采集三種狀態的振動信號,提取特征量構建N×m=(3×50)×26的高維矩陣進行降維和特征提取。由于在本齒輪實驗中只選擇三種類型,所以,目標維數dim=2的二維圖像表示分類結果如圖3所示。

圖2 轉子故障分類識別Fig.2 Different fault classification of Rotors

圖3 齒輪故障類型識別Fig.3 Different fault classification of Gear1
從圖3可以得出以下結論:圖3(a)PCA對于識別分類效果不理想,出現了一些故障信號被識別成無故障類別,無故障信號被識別成故障類別,但基本能區分出故障和無故障,而對于齒面剝落和齒根裂紋兩種故障不能很明顯區分開,混在一起,且無故障的分布非常散亂;KPCA對于三種狀態的識別比PCA在識別率和類內距都有了較好的提高,但是仍出現了一些錯誤識別現象,各種類別聚集性有了明顯提高,但仍有待提高;而LE算法對于三種類別基本實現了較好的識別和區分,無故障類別的50組信號全部識別出來,幾乎聚集在了一個點,對于齒面剝落和齒根裂紋故障信號也基本實現了識別,聚集在一起,但也出現了不少識別錯誤,一部分齒面剝落被識別出成無故障,一部分齒根裂紋被錯誤識別為齒面剝落。總體來說對于齒輪故障分類識別LE算法比PCA和KPCA在識別率、類內距Sb和類間距Sw都更具有優越性,詳細數據見圖4和表2。
在模式識別中所選取的特征評價準則直接或間接反映出樣本的分類效果,本文采用故障樣本平均識別準確率、聚類分析法中的類間距Sb和類內距Sw來衡量提取特征的聚類效果[16-18]。類間距Sb用來描述不同類別分開的距離,類內距Sw表明每個類樣本分布緊湊性。假定特征向量為{f1、f2、…、fdim},特征向量的目標維數dim。Sb和Sw兩個參數的描述如下:

其中是每一類中 Cp(p=1,2,…c)樣本特征向量的平均值是所有類型中特征向量的平均值。類間距Sb是用來描述類與類之間的距離,而類內距Sw則是用來描述每一類樣本聚集程度的好壞,取值越小越好,而Sb/Sw可作為分類能力的主要指標。本文通過類內距和類間距分類指標的鄰域選擇策略,保證同類樣本點的關聯性,從而獲得較好的聚類質量。通過三種方法,計算兩組實驗的Sb和Sw,結果見表2。

表2 特征參數值Tab.2 Characteristic parameters value
由表2和圖4可知:LE方法的識別效果明顯好于PCA和KPCA方法。PCA的效果最差,KPCA由于采用了高斯核函數,所以比PCA有了很大提高;在聚類性方面,尤其是類內距Sw,LE的效果最好,較前兩種都有明顯提高,在滾動軸承故障識別中,類內距Sw幾乎為零,遠遠小于其他兩種方法的結果,而Sb/Sw的比值,LE的比值也是最大,說明LE方法對特征提取降維效果最好。綜上所述:LE方法相對PCA和KPCA在故障樣本分類和識別中具有優越性。

圖4 三種提取方法的識別率Fig.4 The recognition rate of threemethods
本文在拉普拉斯特征映射算法基礎上,首次提出一種基于LE算法的旋轉機械故障識別新模式。通過對旋轉機械三類典型故障:滾動軸承故障、轉子故障以及齒輪故障進行模擬實驗驗證。從模式聚類識別的角度進行分析,使用樣本平均識別率、樣本聚類性的類內距和類間距三個參數作為評價指標,三組模擬實驗結果表明:LE算法相較于傳統的PCA和非線性核方法KPCA,在由多特征量構建的高維特征空間中能夠提取出更敏感、更準確地表征設備運行狀態的特征量,提高了不同故障樣本的分類識別性能,從而實現了旋轉機械的故障診斷。
[1]廖伯瑜.機械故障診斷基礎[M].北京:冶金工業出版社,2003.
[2]鐘秉林,黃仁.機械故障診斷學(第三版)[M].北京:機械工業出版社,2007.
[3]蔣玲莉.基于核方法的旋轉機械故障診斷技術與模式分析方法研究[D].長沙:中南大學,2010.
[4]李巍華,廖廣蘭,史鐵林.核函數主元分析及其在齒輪故障診斷中的應用[J].機械工程學報,2003,39(8):65-70.LIWei-hua,LIAO Guang-lan,SHI Tie-lin.Kernel principal component analysis and its applcation in gear fault diagnosis[J].Chinese Journal of Mechanical Engineering.2003,39(8):65-70.
[5]鄧曉剛,田學民.一種基于KPCA的非線性故障診斷方法[J].山東大學學報(工學版),2005,35(3):103-106.DENG Xiao-gang,TIAN Xue-min.Nonlinear process fault diagnosismethod using kernel principal component analysis[J].Journal of Shandong University(Engineering Science),2005,35(3):103-106.
[6]Seung H S,Lee D D.Themanifold ways of perception[J].Science,2000,290(5500):2268-2269.
[7]Roweis ST,Saul L K.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290(5500):2323-2326.
[8]Tenenbaum J,Silva D,Langford J.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290(5500):2319-2323.
[9]Belkin M,Niyogi P.Laplacian Eigenmaps for dimensionality reduction and data representation[J].Neural Computation,2003,15(6):1373-1396.
[10]ZHANG Zhen-yue,ZHA Hong-yuan.Principalmanifolds and nonlinear dimensionality reduction via tangent space alignment[J].Journal of Shanghai University(English Edition),2004,8(4):406-424.
[11]栗茂林,王孫安,梁霖.利用非線性流形學習的軸承早期故障特征提取方法[J].西安交通大學學報,2010,44(5):45-49.LIMao-lin,WANG Sun-an,LIANG Lin.Feature extraction for incipient fault diagnosis of rolling bearings based on nonlinearmanifold learning[J].Journal of Xi’an Jiaotong University,2010,44(5):45-49.
[12]蔣全勝,李華榮,黃鵬.一種基于非線性流形學習的故障特征提取模型[J].振動與沖擊,2012,31(23):132-136.JIANG Quan-sheng,LI Hua-rong,HUANG Peng.A fault feature extractionmodel based on nonlinearmanifold learning[J].Journal of Vibration and Shock,2012,31(23):132-136.
[13]黎敏,徐金梧,陽建宏,等.一種基于流形拓撲結構的軸承故障分類方法[J].控制工程,2009,16(3):358-362.LIMin,XU Jin-wu,YANG Jian-hong.et al.Classification method of bearing faults based on topological structure of manifold[J].Control Engineering of China,2009,16(3):358-362.
[14]王澤杰,胡浩民.流形學習算法中的參數選擇問題研究[J].計算機應用與軟件,2010,27(6):84-85.WANG Ze-jie,HU Hao-min.On parameter selection in manifold learning algorithm[J].Computer Applications and Software,2010,27(6):84-85.
[15] The Case Western Reserve University Bearing Data Center.http://csegroups.case.edu/bearingdatacenter/home.
[16]He Qing-bo.Vibration signal classification by wavelet packet energy flow manifold learning[J].Journal of Sound and Vibration,2013,332(7):1881-1894.
[17] He Qing-bo.Time-frequency manifold for nonlinear feature extraction in machinery fault diagnosis[J].Mechanical Systems and Signal Processing,2013,35(1-2):200-218.
[18]張學工.模式識別[M].北京:清華大學出版社,2010.146.