王玉承 李 亞 王海瑞 肖 楊
(昆明理工大學信息工程與自動化學院)
旋轉機械在化工、電力、冶金及機械制造等領域有著廣泛的應用,旋轉機械設備故障可能會造成局部損壞、 巨大的經濟損失甚至人員傷亡,大量研究表明,軸承故障占旋轉機械故障的30%[1]。 因此,深入研究軸承的狀態監測和故障診斷對設備維護和降低維修成本具有重要意義。
軸承振動信號是一種非平穩、非線性的隨機信號,其去噪方法主要有小波分解技術和經驗模態分解(EMD)技術[2]。 小波分解技術的特點是多分辨率分析和良好的時頻局部化能力。 根據小波系數的不同特性, 可以分離出真實的信號和噪聲。 鞠晨等提出一種基于小波包分解和粒子群優化BP神經網絡的滾動軸承故障診斷方法,在信號特征提取部分,對采集的滾動軸承振動信號進行小波包分解, 得到各子頻帶能量和信號總能量,經歸一化處理后獲得表征滾動軸承狀態的特征向量[3]。 孔令剛等提出一種改進型灰狼優化算法(GWO)與支持向量機(SVM)相結合的故障診斷方法, 在8種故障模式和正常模式所對應的功率曲線實施5層Mallat小波分解,得到各層近似系數和細節系數,并計算各層系數的平方和得到特征向量集[4]。 然而,小波去噪方法必須選擇基函數,這就不可避免地會產生傅里葉變換等缺陷。 EMD具有多分辨率和對非平穩信號適應性強的特點,被廣泛應用于振動信號的處理中。 陳俊柏等提出一種基于EMD和SVM的機載燃油泵故障診斷方法,利用EMD提取振動信號不同頻段的能量值作為特征參量,并結合壓力信號均值構造故障特征向量[5]。 劉柯欣等提出一種基于時變濾波經驗模態分解(TVF-EMD)和Teager能量算子(TEO)相結合的故障特征提取方法,利用TVF-EMD方法自適應地分解軸承振動信號,獲得了一組固有模態分量(Intrinsic Mode Functions,IMFs),其 次 對 分 解結果進行峭度計算,并根據峭度最大準則選出峰度值最高的敏感分量[6]。 上述方法用的EMD雖然是自適應的,不需要選擇基函數,但在處理異常噪聲信號時存在模態混疊。
為了更好地對軸承故障沖擊信號進行去噪處理,避免模態混疊現象,并對原始信號進行重構,以去除虛假分量,筆者提出具有自適應噪聲的完全集成經驗模態分解 (Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMD-AN)方法,并進行實驗。
Torres等為解決集合平均時IMF分量對齊問題, 同時改進EEMD 的噪聲去除性能, 提出CEEMDAN[7]方法,該方法在每次經驗模態分解過程中,加入一些自適應白噪聲,在有限的積分次數下,使重構誤差無限接近于零,也就是說,重建的信號幾乎與原始信號相同。
CEEMDAN自適應完備噪聲經驗模態分解,若要達到一個自適應的效果,需每次添加不同的白噪聲,具體如下:

其中,εk為第k次添加的白噪聲幅值;std (·)為每次分解后計算剩余分量的標準差,K為IMF的總個數。 因此,式(1)可以達到一個動態變化效果,即可以依據每次分解結果來自適應地調整白噪聲添加值。
設原始信號為X,定義Ek為EMD得到的第k個IMF的產生算子;w(i)為零平均單位方差白噪聲的實現。 CEEMDAN的主要步驟如下:

b. 計算第1個殘差r1=X-IMF1。

f. 重復步驟d、e, 直到得到的殘差為單調函數,不能被繼續分解。

SVM是一種有監督的學習方法,它基于VC維統計學習理論和結構風險最小化原理[8],引入了一個內核函數線性不可分的點在低維空間映射到高維特征空間的非線性,找到一個最優分類超平面,在這個空間可以滿足分類要求,在解決小樣本、非線性和高維模式識別問題中效果顯著[9]。由于機械運行背景環境的復雜性,導致數據收集困難,使得樣本數據量較少,同時振動數據具有明顯的非線性特征,因此運用SVM可以較好地解決上述問題。
SVM學習的主要目的是找到一個滿足分類要求的最優分類超平面, 使超平面在保證分類精度的同時最大限度地增加超平面兩側的空白區域。
首先, 以兩類線性分類問題為例進行分析。給定一組訓練樣本(xi′,yi′),i′=1,2,…,n,xi′∈Rn,yi′∈{±1}可以被一個超平面ω·x+b=0(ω和b分別為超平面的法向量和截距)隔開,且離該平面最近的向量距離最長,那么最優分類超平面的實現就要解決以下問題:

其中,φ(xi′)為非線性映射方程,將樣本點從低維空間映射到高維空間,在該空間中尋找最優分類超平面, 以滿足分類要求;ξ是松弛變量,是一個數據點的誤差度量;C為懲罰因子,是錯誤樣本對懲罰的控制程度, 懲罰越大分類效果越好,但其泛化能力也會降低;L(ω)是一個二次函數,具有唯一的極小值點。
引入拉格朗日函數將最優超平面的構造問題轉化為更容易理解的對偶形式:


其中,K(xi′,xj)=φ(xi′)·φ(xj)為核函數;α為拉格朗日乘子。
由于故障信號數據通常是非線性、 不可分割的,對于此問題,研究者利用適當的核函數將輸入空間映射到高維空間,實現高維空間的線性可分,將非線性問題轉化為線性問題來解決[10]。 核函數的選擇決定了SVM的應用性能, 常見的核函數有多項式核函數、徑向基核函數和sigmoid核函數。一般情況下, 可以根據研究人員的經驗選擇合適的SVM核函數,也可以通過實驗方法逐一嘗試。
針對小樣本和非線性數據條件下要實現高效分類,并解決模態混疊和噪聲抑制效果較差的問題, 結合CEEMDAN良好的分解效果以及SVM擅長處理小樣本和非線性數據的特點, 提出CEEMDAN-SVM模型進行故障診斷,具體步驟(圖1)如下:

圖1 CEEMDAN-SVM診斷流程
a. 首先將滾動軸承原始信號用CEEMDAN分解為一系列固有模態分量(IMFs),信號包含高頻特征和低頻特征;
b. 根據波形圖和包絡譜分析故障信號中包含的主要各種成分信息;
c. 依據倍頻特征以及高低頻分量的特征將虛假分量和噪聲分量剔除;
d. 將剩余分量進行重構,得到降噪后的數據;
e. 提取重構信號的時域特征,構建小樣本滾動軸承故障診斷數據時域特征集;
f. 將時域特征集輸入SVM進行故障分類。
本次實驗所采用的原始振動數據集來自美國凱斯西儲大學的開放數據, 在電機驅動端SKF6205上進行故障診斷。
對實驗數據分別提取正常狀態(故障深度0 mm)、內圈單點故障(故障深度0.177 8 mm)、滾動體單點故障(故障深度0.177 8 mm)、外圈單點故障(故障深度0.177 8 mm)4種類型,標簽分別為1、2、3、4。采樣頻率12 kHz,轉速1 797 r/min。將采集到的原始振動信號進行分割,每個樣本包含1 024個采樣點。每種狀態下的樣本數量為115個,4類共460個數據集。 從4類數據中每類隨機抽取70個作為訓練集, 將剩下的45個數據作為測試集, 兩個互斥數據集作為本次實驗的數據來源。先對原始信號進行CEEMDAN分解得到固有模態分量(IMFs),分解波形和包絡譜圖如圖2、3所示。

圖2 4種狀態的CEEMDAN分解波形
由圖2可以看出,正常狀態、內圈單點故障、外圈單點故障、滾動體單點故障4種狀態的第1個分量信號振動頻率較快,因此可以斷定該分量為隨機噪聲。 第2~5個分量波動較慢,時域波形大部分由高次諧波組成,頻譜能量較為集中,且大部分時域波形接近正弦波,是理想的信號分析時間序列。 剩余分量含有的故障沖擊信號特征較小,與原始信號相關性也較小,沒有實際的信號分析價值,屬于虛假分量,因此將之丟棄。
由圖3可以看出,第1個分量雖然含有故障沖擊信號,但信號較微弱,大部分被強背景噪聲“淹沒”。 而第2~5個分量含有的故障沖擊信號較為明顯,同時基頻(30.03 Hz)、2倍頻(60.10 Hz)、3倍頻(90.12 Hz)和多倍頻成分振動特征突出,其中以內圈單點故障和外圈單點故障的故障沖擊信號最為明顯,其倍頻成分較為清晰,有較好的信號分析價值, 因此第2~5個分量為信號分解的最優分量,但由于故障沖擊信號僅為軸承原始信號的較少部分,其能量特征較為微弱,因此將最優分量進行重構,提取10個時域特征進行進一步的故障診斷。

圖3 4種狀態的包絡譜圖
由于本次實驗數據有限, 樣本數量較少,不利于故障識別。 傳統神經網絡需要大量樣本完成模型的構建, 應用于本次實驗具有較大的局限性,而SVM作為一種分類器,對于小樣本具有較大優勢。 因此,用SVM對模型進行分類,核函數采用線性核函數, 并對實驗進行10次交叉驗證,以提升模型的泛化性能和擬合效果,同時直接對原始信號提取時域特征并輸入SVM中進行對比實驗,方法1為CEEMDAN分解后的實驗結果,方法2為原始時域特征實驗結果,將診斷結果準確率匯總于表1。 可以看出,原始時域信號提取的特征相較于CEEMDAN分解后的特征準確率低了近2%,主要原因是噪聲信號的干擾等導致提取的特征出現一定的誤差, 方法1經CEEMDAN分解后,去除了噪聲和虛假分量,能夠較好地表現出故障沖擊信號的特點,使得提取的時域特征向量包含了較多的故障信息,因此使得分類效果較原始時域特征有較好的優勢,最高準確率可達100%。

表1 診斷結果準確率 %
實際類別與預測類別的分類準確率如圖4所示,可以看出,故障分類錯誤主要集中在第4個類別(滾動體單點故障),其原因是滾動體的工況環境相較于其他類別更為復雜,導致故障沖擊信號損失較為嚴重,使得分類出現誤差,但其他故障都正確分類,平均準確率達98.23%。

圖4 實際分類和預測分類結果對比
針對滾動軸承原始信號包含較多的噪聲、提取的時域特征不能較好地反映故障沖擊信號的規律的問題, 提出基于CEEMDAN-SVM的滾動軸承故障診斷方法。 實驗結果表明,CEEMDAN能將原始信號進行充分分解,噪聲和虛假信息分解效果良好,突出了故障沖擊信號的倍頻特征,同時在有限的非線性數據條件下,運用SVM進行故障診斷,最高準確率可達100%。因此,該方法具有較高的工程應用價值。