張 拓,余 何,何愛民,孫義忠,石萬凱
(1.重慶大學 機械傳動國家重點實驗室, 重慶 400044;2.南京高速齒輪制造有限公司, 南京 211100)
旋轉部件在航空航天、冶金、汽車、制造等領域有廣泛的應用,一旦發生故障,輕則導致產品質量下降,重則引發重大事故并造成巨大經濟損失[1-3]。而滾動軸承作為旋轉部件的重要組成部分,其故障是造成旋轉部件故障最主要的原因[4-5]。如果能對通過采集數據對設備進行實時檢測,及時發現設備故障,便可準確的對設備進行干預和維護,減少事故的發生幾率,降低維護成本。因此,故障診斷對設備高效運行降低維護成本有重要的意義。
目前,在故障診斷方面,基于振動信號特征信息是旋轉部件故障診斷的主要方式[6-8]。Vakharia等[9]采用交叉驗證技術對隨機森林分類器進行優化,有效的提高了軸承故障診斷的分類精度。張例宏等[10]利用會議制隨機森林算法對電機滾動軸承不同故障程度進行識別。石志煒等[11]提取滾動軸承振動信號的時域、頻域、小波包節點能量等特征建立了滾動軸承故障診斷模型。孫晉錳等[12]對C4.5、Cart、BP和SVM等分類算法的準確度進行了比較,發現SVM的準確度要優于其他三種算法。在特征提取方面,曾杰等[13]利用信息增益算法對影響諧波電流發射特征的主要因素進行評估,進而識別出主要影響因素。韓衛宇等[14]運用馬田系統對振動信號信息進行特征降維處理,提高了模型計算效率。
盡管振動信號特征信息可以反映部件的故障信息,但為了更全面的提取部件的故障特征信息,提高模型的識別精度,提出了一種綜合考慮部件運行過程中電流和振動信息的基于混合特征和PSO-SVM的故障診斷方法。在故障特征信息提取方面,利用信息增益算法提取了對設備故障相對敏感的特征參數作為敏感特征集,并結合主成分分析對敏感特征集進行降維處理,消除了無關特征和冗余特征對模型的干擾;在故障診斷模型方面,以SVM分類器為基礎,利用粒子群優化算法尋找全局最優參數,提高了模型識別精度,并借助軸承加速疲勞試驗數據集與常用的故障診斷模型進行了對比,結果表明PSO-SVN模型具有更高的識別準確率,有一定的優越性。
當設備發生故障時,電流信號和振動信號的某些特征會發生相應的變化,利用這些特征可以有效的識別設備的運行狀態。
由于軸承健康狀態發生變化,導致驅動電機的負載發生波動,電流信號也隨之波動,由于數據集數據通過封閉試驗臺采集,外部因素對試驗數據影響較小,故認為電流的波動由負載變化引起,而不考慮電網或用電波峰波谷等外部因素對電流變化的影響。根據電流時域波形中隱含的信號[15],如絕對幅值、最大值、最小值等,可以對軸承的健康狀態進行評估,各采樣階段采集電流信號為I=[i1,i2,…,iN],電流指標如表1所示。

表1 電流信號特征參數
隨著軸承故障的加劇,其振動信息也發生變化,在振動信號中隱含多種指標,如均值、方差、均方根幅值、斜度、峭度、頻率方差、重心頻率等,根據這些參數趨勢的變化,可以對軸承的狀態進行評估,并用于故障診斷[16-17]。從時域和時域的角度對傳感器采集的振動信號進行特征參數提取,如表2所示,共提取27個特征參數,其中14個特征(p1—p14)為時域統計特征參數,13個特征(p15—p27)為頻域統計特征參數。
各采樣時間段內采集的振動信號序列為x=[x1,x2,…,xN],其中,N表示振動信號的每個樣本點數。sk為信號xt的譜函數,k∈[1,K],K為譜線數;kf代表第k條譜線的頻率值。參數p1和p2-p7表示時域信號的振幅和能量;參數p2和p8-p13表示時域信號的時間序列分布;參數p14表示時域信號的離散程度。參數p15表示頻域中的振動能量。參數p16-p18、p20和p24-p27描述頻譜功率的收斂程度。參數p19和p21-p23表示主頻的位置變化。

表2 振動信號特征參數
為提高模型故障診斷識別率,需要提取對軸承故障狀態相對敏感的特征參數。信息增益表示在已知特征參數Fpi(A1,…,A11,p1,…,p27)的信息判斷部件故障類別(健康、內圈故障、外圈故障)不確定性的減少程度,特征參數Fpi對應的信息增益越大,則表示該特征參數對軸承的健康狀態越敏感,故可利用信息增益指標來量化各特征參數對軸承健康狀態敏感程度。
定義特征參數Fpi對數據集D的信息增益為IGpi,數據集D的經驗熵為E(D),特征參數Fpi在給定條件下D的經驗條件熵為D(D|Fpi),則信息增益可表示為[13,18]:
IGpi=E(D)-D(D|Fpi)
(1)
(2)
(3)
式中:Ck表示樣本類別;|D|和|Ck|分別表示樣本集和各故障類別對應的樣本數;表示根據軸承故障類別,即健康、內圈故障、外圈故障3類,|Di|表示對應的樣本數。
為減少模型的計算量,降低特征參數數據維度,利用主成分分析(PCA)對數據特征參數進行降維處理,消除特征參數之間的相關性。PCA是一種統計學習算法,其主要原理是利用正交變換將線性相關的觀測數據轉換為少數線性無關的數據,可以在壓縮數據的同時有效保留數據之間的不相關性,其表達式為:
TN×r=XN×MPm×r
(4)
式中,T為主成分分析結果;X為觀測數據樣本矩陣;P為正交矩陣。
支持向量機(SVM)是一種基于統計學習理論的數據挖掘方法,在處理回歸問題、模式識別等方面都有廣泛的應用[19-21]。其基本原理是通過非線性變換,將低維數據映射到高維空間,以結構風險最小化為目標尋找最大分類邊界的超平面。設備故障診斷在本質上屬于一個多模式識別或多值分類的問題,因此SVM可以達到較好的故障分類效果。對于給定的樣本集,選擇合適的核函數和懲罰參數,可以有效的提高故障診斷模型的識別精度。
核函數和懲罰參數C影響SVM分類器的表現性能,常用的核函數有線性核、多項式核、高斯核、拉普拉斯核等[22],其中高斯核函數是最常用的核函數,可將樣本映射到更高維的空間內,通過高斯寬度σ確定。懲罰參數C用于調節分類準確度和間接大小的權重,以避免模型出現過擬合,因此,可通過對參數σ和C的尋優來提高SVM分類器的分類精度。
采用粒子群優化算法(PSO)對SVM分類器參數進行全局尋優,粒子群優化算法又稱微粒群算法,是一種通過模擬鳥類覓食過程中的遷徙過程和群聚行為而提出的一種基于群體智能的全局隨機搜索算法,該算法根據求解的問題在D維空間中隨機生成一個包含N個粒子的粒子群,每個粒子以一定的速度在解空間運動,并向粒子本身最佳位置和種群歷史最佳位置靠攏,以實現候選解的變化。粒子i(i=1,2,…,N)位置向量可以表示為xi=(xi1,xi2,…,xiD),速度向量可表示為vi=(vi1,vi2,…,viD),則速度和位置更新公式為:
(5)

基于PSO-SVM的滾動軸承故障診斷流程如圖1所示。

圖1 故障診斷流程圖
1) 數據預處理。對采集的電流信號與振動信號進行特征提取,按照敏感指標選擇對軸承故障類別比較敏感的特征參數,并利用主成分分析對特征參數進行降維并歸一化處理。
2) 數據集劃分。將歸一化處理后的特征參數為模型輸入,軸承具體故障為模型輸入,隨機劃分訓練數據集和測試數據集,訓練數據集和測試數據集的比例為7∶3。
3) SVM分類器模型構建。選擇高斯核函數作為SVM分類器的基函數,初始化高斯寬度σ和懲罰參數C。
4) 參數選擇與優化。基于訓練數據集利用PSO對SVM分類器的參數進行迭代優化,找出SVM分類器的最優參數。
5) 故障類型識別。利用優化后的SVM分類器模型對數據故障類型進行識別,為故障維修和排除提供參考。
為驗證所提軸承故障診斷方法的有效性,利用德國帕德伯恩大學軸承加速疲勞試驗數據集進行案例研究[23]。電流信號和振動信號采樣頻率64 kHz,工作狀態和軸承編號對應故障狀態分別如表3、4所示,每組軸承在各工作狀態下各采樣20個數據段。

表3 軸承工作狀態

表4 滾動軸承對應故障類型
滾動軸承在不同故障狀態下電流信號和振動信號的時域波形分別如圖2、3所示,可見難以根據單獨的信號特征有效診斷軸承的故障狀態。

圖2 軸承電流信號時域波形

圖3 軸承振動信號時域波形
對電流信號和振動信號分別按照表1和表2進行特征提取,并計算各特征參數的信息增益,結果如表5所示。選擇閾值大于0.2的特征作為敏感特征,即敏感特征集為[A9,p2,p3,p5,p6,p8,p11,p12,p16,p17,p21,p23,p25,p26]。

表5 各特征信息增益
由于部分特征參數之間存在關聯性,導致特征信息存在冗余,增加了模型計算成本。因此,利用PCA算法對特征參數進行降維,根據貢獻度將15維特征信息保留至3維。敏感特征集經過PCA降維后3種健康狀態的特征數據分布如圖4所示,可以看出,每種健康狀態的分布點相對集中,可以較好的進行區分識別。

圖4 PCA算法降維后狀態空間圖
為了驗證選擇所選擇敏感特征集的有效性,將經過PCA降維的電流信號特征參數、振動信號時域特征參數、振動信號頻域特征參數作為特征分類器的輸入進行故障診斷,結果如表6所示。
由表6可以看出,利用敏感特征集、電流特征參數、振動信號時域特征參數、振動信號頻率特征參數作為PSO-SVM分類器輸入時識別準確率分別為98.6%、83.3%、97.5%、95.6%,可以看出在分類模型一致的情況下,以敏感特征集作為模型輸入相對單一評價指標具有更高的準確率。

表6 不同特征集診斷準確度
將降維后的特征集作為輸入向量進行狀態識別,將訓練集特征向量輸入到PSO-SVM分類器中進行參數尋優和模型訓練,然后將測試集數據輸入到訓練好的分類器模型中進行故障識別,得到的識別結果如圖5所示。可以看出,在360個測試樣本中僅5個樣本被錯分,準確率達到了98.6%,證明PSO-SVM分類器在軸承故障診斷方面具有較好的效果。

圖5 PSO-SVM識別結果
為了進一步驗證PSO-SVM分類器的有效性,使用隨機森林、網格搜索支持向量機(GS-SVM)等常用方法進行故障故障模式識別,結果如表7所示。由表7可以看出PSO-SVM、隨機森林、GS-SVM的識別準確率分別為98.6%、97.5%和93.1%。在樣本數據一致和數量相同的條件下PSO-SVM分類器相對隨機森林、網格搜索支持向量機分類方法具有更高的準確率,說明PSO-SVM能夠更有效的區分滾動軸承的故障類型。

表7 不同故障診斷方法的準確率
針對旋轉部件故障診斷,綜合考慮電流信號特征和振動信號特征提出了混合特征與PSO-SVM的旋轉部件故障診斷方法,利用德國帕德伯恩大學軸承加速疲勞試驗數據集進行驗證。通過對比以不同特征提取方式作為特征輸入對故障診斷模型識別精度的影響,證實了以混合特征參數作為模型輸入可以提高診斷模型的識別精度。通過與常用的故障模型進行對比,證實了識別精度高于其他常見的故障診斷模型。說明基于混合特征的PSO-SVM故障診斷方法具有較高的故障識別準確率,可用于各類軸承的故障診斷中,具有一定的現實意義。