胡建中 吳 瑤 謝小欣
東南大學,南京,211189
故障識別的基礎在于特征提取[1],有效故障信息的獲取是特征提取的關鍵。Sugamaran等[2]通過提取信號時域特征來實現滾動軸承故障診斷;Kankar等[3]利用連續小波變換求取能量熵作為故障特征,實現球軸承的故障診斷;Liang等[4]利用PCA提取故障特征信息,實現旋轉機械早期故障的FCM識別。上述特征提取方法主要用于提取線性故障信息,然而在實際識別過程中有些非線性信息并不能完全獲得,由此引入了非線性的流形學習方法來提取故障特征信息。
流形學習作為一種非線性的維數約簡學習方法,從其理論提出開始,經過大量的研究發展,提出了一系列的改進算法且得到廣泛應用[5-7],在故障識別領域也得到了一定的應用。蔣全勝等[8]將拉普拉斯映射引入故障診斷領域,利用拉普拉斯特征映射提取故障數據的內在信息,改善了故障識別的分類性能。Huang等[9]提出了一種魯棒流形學習方法并應用于機械故障監測與診斷。流形學習從非線性的角度得到數據集的內在結構,能更有效地提取故障特征敏感信息。
故障信號一般都含有復雜的信息成分,采用單個的時頻域特征并不能完全地表示出故障信號,因此本文在故障特征提取基礎上,結合流形學習中局部線性嵌入(locally linear embedding,LLE)[10]算法進行二次特征提取獲得新的低維特征集,進一步將二次特征集與原始高維特征集進行融合處理作為故障識別的特征參數集,最終實現故障的精確識別。
旋轉機械故障特征提取是提高其診斷正確性的關鍵,常見的故障特征包括時域特征與頻域特征,時域特征參數主要包括波形指標、峰值指標、脈沖指標、裕度指標、峭度指標等,頻域特征參數主要是基于頻域或時頻域分析方法進行特征提取的結果,包括傅里葉變換、小波分析等常見的信號處理方法,這些特征參數在故障診斷過程中已經得到普遍應用。本文選擇時域幅值統計參數和小波分析結果作為故障信號的描述特征,分別提取時域5個特征參數和時頻域6個特征參數用于機械故障識別。特征參數具體表示如下:
(1)時域特征參數。時域特征參數波形指標、峰值指標、脈沖指標、裕度指標、峭度指標的計算方法如表1所示。

表1 時域特征參數

(2)時頻域特征參數。對故障信號利用db4小波進行5層小波分解,根據小波分解得到的各頻帶成分進行能量提取,共得到5個高頻成分與1個低頻成分的頻帶能量值,即6個時頻域能量參數。

流形學習能夠有效地對故障信號的非線性信息進行描述,流形學習LLE算法的基本思想是將全局非線性轉化為局部線性,數據集中任意一點都可以用其鄰近點的線性組合來表示,對每個局部進行線性維數約簡,進一步將約簡結果根據規則予以組合得到低維的全局坐標,最終實現數據集的非線性維數約簡。
特征級融合根據原始信息先進行特征提取,然后對特征提取結果進行融合處理。特征級融合能夠針對決策分類選擇合適的特征信息,從而使決策分類更精確。
根據LLE算法與特征級融合提出基于LLE特征融合的故障識別方法,首先對故障信號進行特征提取,然后利用流形學習LLE算法對原始特征集進行二次特征提取,進一步將兩種特征集融合,融合特征集涵蓋了信號的線性和非線性信息,最后對融合特征集進行故障識別。識別方法流程見圖1。

圖1 基于LLE特征融合的故障識別方法流程
識別方法具體步驟如下:
(1)原始特征提取,見表2。①提取特征集T1——時域特征參數;②提取特征集T2——時頻域特征參數;③以矩陣M=(I-W)T(I-W)最小的第2個至第d+1個(d為本征維數)特征向量作為低維空間表示,從而獲得原始特征集的二次特征提取結果U。將特征集T1與特征集T2組合獲得原始特征集T。見表2。

表2 故障原始特征集
(2)基于LLE的二次故障特征提取。①設由步驟(1)獲得的原始特征集T={y1,y2,…,yi,…,yM},其中,M為數據點個數,選取鄰域值k,確定每個數據點的鄰域。②對每個數據點yi,由其鄰域關系,計算線性重構系數wij,使得
術前訪視以及手術全程,需加強心理護理,主動介紹手術室環境、醫護人員、手術操作的基本流程以及需要注意事項,將患者送入手術室后,護理人員通過簡短的語言安慰鼓勵患者,緩解患者的緊張,增強成功手術治療信心,麻醉開始后與患者交流,分散患者注意力,緩解患者焦慮。

(3)特征融合處理。①步驟(1)得到的原始高維特征集 T={T1,T2,…,Ti,…,TM},Ti∈ RD,其中,D為特征集數據維數,M為特征集數據個數。②步驟(2)得到的LLE二次特征集為U={U1,U2,…,Ui,…,UM},Ui∈ Rd,其中,d 為二次特征集數據維數。③將高維原始特征集與低維二次特征集融合成新的特征集V={V1,V2,…,Vi,…,VM},Vi∈ R(D+d),(D+d)表示融合特征集的數據維數,融合集V涵蓋了故障信號的二次非線性特征信息與原始的故障特征信息。
(4)故障分類識別處理。①將提取的融合故障特征樣本分為訓練樣本和測試樣本。②以融合特征作為 KNN分類特征參數,進行故障分類識別。
仿真信號分別模擬三類故障,包括質量不平衡、轉子不對中及聯軸節不對中,根據三類信號的主要故障頻率成分所對應的幅值大小,按照4dB的信噪比添加噪聲信息e(t),得到含噪信號,數學表達式如下:

其中,信號x1代表質量不平衡故障;信號x2代表轉子不對中故障;信號 x3代表聯軸節不對中故障。
設采樣頻率為1024Hz,采樣長度為1024,每類信號采樣40組樣本,其中10組用于訓練,30組用于測試。
按表2所示提取信號樣本原始特征集以表征三種信號模式,進一步對原始特征集分別采用基于LLE和PCA的特征融合識別處理。LLE算法參數設置如下:本征維數選取d=7;對于鄰域參數的選擇,采用基于殘差的鄰域選取準則,選取鄰域參數k=12。PCA取前5維作為主分量。分別將LLE和PCA二次提取特征集與原始特征集進行融合處理得到融合特征集。分類識別采用KNN法,鄰域參數選取K=7。采用的四種識別特征集分別為LLE融合特征集、PCA融合特征集、故障信號原始特征集和LLE二次提取特征集。
故障識別精度定義為

式中,NT為故障樣本準確識別數,N為故障樣本數。
定義三種故障模式識別精度的均值為平均識別精度,仿真信號故障識別結果如表3所示。

表3 仿真信號四種特征集識別結果 %
由表3中的故障識別精度可知:在KNN分類識別下,采用基于LLE的特征融合方法獲取的特征集識別效果要優于其他三種特征處理方法。從平均識別精度上可以看出,LLE二次特征集的識別效果優于原始特征集,表明非線性的流形學習方法能夠在保留數據集的內在特性的基礎上,提取出一些敏感的特征信息;相比于PCA特征提取,LLE通過提取非線性的特征信息來實現故障的精確識別。LLE融合特征處理能夠取得最優的識別效果則證明了基于LLE的特征融合的故障識別算法的有效性,采用特征融合的處理方法能更全面地對故障信號予以描述,實現更精確的識別故障。
齒輪箱在各類機械的變速傳動中廣泛使用,其運行狀況對整臺機器的運轉至關重要,常見齒輪箱故障包括齒輪故障、軸承故障以及軸故障。本文實驗所用齒輪箱如圖2所示。齒輪箱運行狀態分為三種模式:正常工況、齒間均勻磨損和非均勻磨損,數據采集采用IMI 608A11型壓電加速度傳感器,分別于齒輪箱外殼水平與垂直方向布置,采樣頻率為3838.77Hz,采樣長度為4096,每類工況分別采集40組運行振動加速度數據。

圖2 齒輪箱設備
按表2所示特征提取方法分別提取故障信號的時域參數特征和時頻域參數特征來表征這三種故障模式,提取每類故障樣本數目40組中的10組用于訓練,另外30組用于測試。
根據樣本原始特征集分別采用基于LLE和PCA的特征融合識別處理。LLE算法參數設置如下:本征維數選取d=7;采用基于殘差的鄰域選取準則,選取鄰域參數k=19。PCA取前5維作為主分量。分別將LLE和PCA二次特征提取結果與原始特征集進行融合處理以得到新的故障識別特征集。故障分類識別采用KNN法,鄰域參數K=7。采用的四種特征集分別為LLE融合特征集、PCA融合特征集、初步特征集和LLE二次特征提取特征集。
齒輪箱故障識別結果如表4所示。

表4 齒輪箱故障信號四種特征集識別結果 %
對比表4中的故障識別精度可知:采用基于LLE的特征融合處理的特征集識別效果較其他三種特征處理方法有較大的提高。從平均識別精度上可以看出,線性的PCA特征融合處理的識別效果與原始特征集一致,說明線性的PCA法在故障分類識別處理上存在不足,在維數約簡的同時丟失了原有的數據類別信息。LLE二次特征集的識別效果則表明非線性的流形學習方法在保留故障數據集內在幾何結構的同時獲取了故障的敏感特征量,實現了故障的精確分類識別。LLE融合特征處理能夠實現最優的識別效果則證明了本文提出的基于LLE的特征融合的故障識別方法的有效性,采用特征融合的處理方法能更全面地對故障信號予以描述,實現更精確的故障識別。
(1)本文提出了一種基于LLE特征融合的故障識別方法。該方法在對故障信號進行初步特征提取的基礎上利用LLE算法對獲得的原始特征集進行二次特征提取后,進一步將原始特征集與二次提取特征集進行融合處理得到融合的故障識別特征。新的融合特征集涵蓋了故障信號的線性與非線性信息,能更有效地表示故障信號。
(2)通過仿真信號和實際故障樣本的識別效果對比,可以看出本文提出的基于LLE特征融合處理的故障識別方法的有效性。相比于線性的PCA法,LLE處理能獲得故障數據集的內在非線性信息;相對于原始特征集與LLE二次特征集,采用LLE特征融合處理可將不同的故障特征描述予以融合,實現故障信號的全面描述。基于LLE特征融合的故障識別方法在對故障數據集進行維數約簡的同時能夠保留數據集的內在流形,融合處理能更有效地描述故障信號的敏感特征,從而實現故障信號的精確識別。
[1]鐘秉林,黃仁,賈民平,等.機械故障診斷學[M].北京:機械工業出版社,2007.
[2]Sugamaran V,Ramachandran K I.Effect of Number of Features on Classification of Roller Bearing Faults U-sing SVM and PSVM[J].Expert Systems with Applications,2011,38(4):4088-4096.
[3]Kankar P K,Sharma S C,Harsha S P.Fault Diagnosis of Ball Bearings Using Continuous Wavelet Transforms[J].Applied Soft Computing,2011,11(2):2300-2312.
[4]Liang Wei,Zhang Laibin,Sun Xiaoyu.Study on Degradation State Recognition for Rotating Machinery Early Fault Based on PCA-FCM[C]//2011 Seventh International Conference on Natural Computation.Shanghai,2011:1686-1690.
[5]Wachinger C,Yigitsoy M,Rijkhorst E J,et al.Manifold Learning for Image-based Breathing Gating in Ultrasound and MRI[J].Medical Image Analysis,2012,16(4):806-818.
[6]Zhang Peng,Ren Yuanyuan,Zhang Bo.A New Embedding Quality Assessment Method for Manifold Learning[J].Neurocomputing,2012,97:251-266.
[7]Raducanu B,Dornaika F.A Supervised Non-linear Dimensionality Reduction Approach for Manifold Learning[J].Pattern Recognition,2012,45(6):2432-2444.
[8]蔣全勝,賈民平,胡建中,等.基于拉普拉斯特征映射的故障模式識別方法[J].系統仿真學報,2008,20(20):5710-5713.Jiang Quansheng,Jia Minping,Hu Jianzhong,et al.Method of Fault Pattern Recognition Based on Laplacian Eigenmaps[J].Journal of System Simulation,2008,20(20):5710-5713.
[9]Huang Yixiang,Zha X F,Jay L,et al.Discriminant Diffusion Maps Analysis:A Robust Manifold Learner for Dimensionality Reduction and Its Applications in Machine Condition Monitoring and Fault Diagnosis[J].Mechanical Systems and Signal Processing,2013,34(1/2):277-297.
[10]Roweis S,Saul L.Nonlinear Dimensionality Analysis by Locally Linear Embedding[J].Science,2000,290(5500):2323-2326.