劉 強,趙榮珍,楊澤本
(蘭州理工大學 機電工程學院,蘭州 730050)
滾動軸承的振動信號往往是非平穩、非線性的復雜信號。如何從振動信號中提取有效特征并準確辨識故障類別是滾動軸承故障診斷研究的熱點與難點[1]。
針對這種復雜信號提取特征問題,常采用自適應信號分解方法。經驗模態分解(Empircical Mode Decomposition,EMD)一經提出便被廣泛應用于故障信號特征提取[2-3]。但是,Flandrin等[4]學者研究發現,EMD 本質上是一個二進制的濾波器組,其頻域分割特性使得它在處理信號時常常會出現模態混疊和端點效應。為此Wu和Huang[5]對原始信號添加高斯白噪聲并進行EMD分解后,提出集合經驗模態分解 (Ensemble Empirical Mode Decomposition,EEMD)。此方法雖然在一定程度上避免了EMD分解過程中出現的弊端,但增加了計算量,且容易產生虛假分量。
為改善在遞歸框架內對信號進行分解而引起的模態混疊現象,Dragomiretskiy 等[6]獨辟蹊徑地提出在變分框架內對信號進行分解的思想,用完全非遞歸替代循環遞歸篩選模態分量,有效避免了模態混疊和端點效應,并首次提出變分模態分解(Variational Mode Decomposition,VMD)。陳東寧等[7]將VMD應用到故障診斷中,取得了良好的效果。然而,周福成等[8]指出VMD 的分解精度很大程度上受到分解層數K的影響,K值選取是否合適,會直接影響特征提取結果的可信度。馬增強等[9]通過觀察不同分解層數下各個模態分量對應的中心頻率,選擇出K值。Lahmiri[10]利用EMD分解后的分量自適應確定K值。很明顯上述所提方法雖然可以完成K值的估計,但是人工觀察法有很強的主觀性,會對VMD的K值選擇精度有影響;而利用EMD估計K值因其處理信號時所產生的模態混疊與端點效應,也會影響到層數選取精度。
原始振動信號經過VMD分解后,在篩選出最優模態的同時如何有效提取隱藏在各模態的敏感特征量是故障辨識的關鍵。包絡熵是對信號進行希爾伯特解調得到包絡信號后,結合信息熵所提出的一種可靠方法。由于信號在傳輸過程中頻率分布的變化、不同狀態下軸承包絡信號變化程度不同,導致包絡信號作為特征時會因特征復雜而不易辨識故障類別。結合信息熵對軸承故障信號復雜度的度量上具有較大的優勢。在計算信號包絡的基礎上進一步提取包絡熵特征,則更易于表征滾動軸承的不同運行狀態。孫潔娣等[11]將包絡熵運用到天然氣微小泄漏孔徑識別上,并取得了良好的診斷效果。
在有效提取故障特征后,設計合適的分類器是實現故障準確辨識的關鍵。常見的方法有聚類分析[12]、神經網絡和支持向量機[13]等。聚類分析能夠將同類故障聚集到一起,但不同簇間的故障類別不易被分辨。神經網絡具有很強的學習能力和自組織性,但是若想要達到較高的識別精度,則需要大量的故障訓練樣本。在工程實踐中,雖已積累了大量工業數據,但是能夠用于神經網絡訓練的樣本極其稀少,由此限制了神經網絡在小樣本故障識別領域的應用與發展。而SVM(Support Vector Machine,SVM)對非線性映射和有限樣本統計問題具有獨特的優勢,相較于傳統的神經網絡經常能夠獲得理想的精度。
基于以上分析,擬采用能量占比優化VMD,同時融合包絡熵與SVM,提出針對滾動軸承故障辨識方法,并通過實驗證明所提方法的有效性。
VMD 本質上就是一個變分問題構造與求解的過程,它可以把原始信號分解成若干個具有特定稀疏性的子模態uk(t)。通過該算法使uk(t)在頻域內的帶寬分布在預估中心頻率附近。時域中的uk(t)被定義為若干個調幅-調頻(AM-FM)信號:

在頻域中各個子模態帶寬采用梯度L2的范數來進行估計,要求各個子模態的估計帶寬之和最小,構造出約束的變分模型如下:

式中:f(t)為原始信號;ωk為各子模態的頻率中心;K為分解層數;δ(t)為脈沖函數。
求解該模型時,引入保證信號重構精度的二次懲罰因子α和保證約束精確執行的拉格朗日算子λ(t)后構造增廣拉格朗日函數L,將約束變分問題轉化為非約束變分問題。增廣拉格朗日函數可表示為:

尋找式(3)中的極值,以此來完成式(2)中約束變分的求解,各更新變量的表達式可表示為:

式中:n表示迭代次數;τ表示噪聲容忍度,滿足信號分解的保真度要求;^表示傅里葉變換。
最后,利用交替方向乘子算法(Alternate Direction Method of Multipliers,ADMM)對、和λn+1不斷更新,直至滿足迭代停止條件:

當滿足式(7)時,便結束了整個循環,然后將進行傅里葉逆變換得出各個子模態的時域信號uk(t)。
通過以上分析VMD 分解需要以下參數事先進行設定,分解層數K、懲罰因子α、保真系數τ、以及預先設定的收斂誤差ε。其中,根據文獻[6]懲罰因子α分析建議取2 000、τ取0以及ε取1×10-6時對VMD分解影響較小。
包絡熵的基本思路是對希爾伯特變換后得到包絡信號,結合信息熵,提取信號特征的過程[14]。當信號利用希爾伯特解調后,會將原始信號序列轉化成一個概率分布序列,其包絡熵Ep數學定義為:

式中:a(j)表示為信號x(j)(j=1,2,···,m)通過希爾伯特解調后所得的包絡信號序列;H表示信號的Hilbert變換;pj是a(j)的歸一化形式。
VMD本質上是一種維納濾波,致使遠離中心頻率分量的頻段能量會產生衰減,這造成對不同的分解層數計算的總能量與原始信號能量的比值總是小于1。
現進行如下定義,原始信號的總能量數學表達式為:

式中:E(f)為原始信號的能量值,f(i)為信號的各采樣點對應的幅值,S為總采樣點數。
不同分解層下對應的子模態總能量定義為:

式中:Eu為K層下對應的各子模態能量和,uk(t)對應原始信號經VMD分解第k個子模態信號。
故能量比η定義為:

由于η總是小于1,當分解層數K取值過小或過大時,會出現以下兩種情況:
(1)當K值過大時,可能同一模態的信號,被硬劃分為兩個頻率中心,此時的信號會產生能量損失,致使能量占比小于最佳分解層能量占比。但在此后也可能會出現能量占比緩慢上升的狀態,因為本該作為噪聲的分量會被當成有效分量而獨立分解出來。由于分解時來自噪聲分量的能量一般很小,此時能量占比η會出現緩慢上升的現象。
(2)當K值過小時,原始振動中的有效信息沒有被分解完全,從而產生欠分解。致使在該分解層下的總能量減少。此時能量比值小于最佳模態分解層數的比值。
通過以上分析,當能量占比曲線達到最優分解層后,此后上升幅度的變化率會逐漸減小,取能量占比首次達到極值所對應的分解層為最佳分解層。
本文所提出的基于K-VMD、包絡譜熵與SVM組合的故障辨識方法,充分利用VMD在變分框架內處理信號的優勢。在此基礎上設計一種通過能量占比的方法,準確高效地確定最優分解層數K,實現對VMD 分解層數的自適應分解。同時使用峭度準則篩選出有效的模態分量,計算各有效分量的包絡熵作為特征向量。最后將特征向量輸入到SVM 中進行故障辨識,故障辨識方法的具體流程見圖1。

圖1 滾動軸承故障辨識方法流程圖
本研究采用的故障數據集來源于圖2 所示的HZXT-DS-001 型雙跨轉子綜合實驗臺。該實驗臺安裝了2個電渦流傳感器和1個加速度傳感器(共5個通道)。對NSK公司型號為6308的軸承進行人為故障模擬,即正常、內圈故障、外圈故障和滾動體故障。在采樣頻率為8 000 Hz、轉速為2 600 r/min 的情況下,取每種軸承運行狀態各50 組樣本,每組樣本數據長度為2 048。

圖2 試驗臺和故障軸承
圖3 是ch1 通道四種不同狀態的時域信號。對比分析可以發現,外圈故障與滾動體故障在時域信號中波形雜亂難以看出兩種狀態之間的區別;而內圈時域信號中雖然出現了周期性沖擊,但是沖擊幅度變化不均、時間間隔不等。以內圈故障信號為例,根據式(14)計算理論故障特征頻率為208.2 Hz。同時對內圈信號進行頻譜分析,圖4 中理論故障特征頻率及其倍頻不明顯。

圖3 軸承四種狀態下的時域信號

圖4 內圈故障的頻譜圖

式中:Z為滾動體的個數,d為滾動體的直徑,D為節圓直徑,α為接觸角,N為轉速。
根據Zhang 等[15]研究分析設置的K值范圍為2~7,為了避免信號產生欠分解的發生,本研究設置分解層數為2~10。通過計算能量占比,尋找VMD中的最優分解層。由圖5知當分解層數為6時,能量占比首次達到最大;當K>6 時由于分解層數較大而導致其余的IMF 能量向一個中心頻率收斂,促使能量占比下降,故內圈最佳分解層為6。

圖5 不同的分解層對應的能量占比
圖6 表示當分解層數設置為6 時,經VMD 分解后內圈的頻譜圖。圖7 為故障信號通過EMD 分解前6個子模態的頻譜圖。對比發現,VMD將各個子模態都集中在中心頻率附近,有效地改善了模態混疊;而通過EMD 處理的振動信號,發現各模態譜圖交疊嚴重。通過本文提出的能量法確定VMD 最佳分解層,如表1所示。

圖6 采用VMD分解的頻譜圖

圖7 采用EMD分解的頻譜

表1 軸承各狀態的最佳分解層
為挖掘經VMD 分解后各模態信號中的有效信息,本研究通過峭度準則篩選各模態分量。由于峭度值在各子模態中分布不均,故先根據表1 中的最佳分解層對信號進行分解,計算出各子模態的峭度值。隨后將峭度值歸一化至(0,1)區間內,并按降序進行排列,由于各分量峭度分布不均的原因,故表2給出的歸一化峭度值僅為依照本征模態函數(Intrinsic Mode Function,IMF)順序依次排列。

表2 VMD分解后的各IMF分量歸一化的峭度值
從表中可知,外圈故障中IMF1、IMF2與IMF5分量的峭度值與IMF3及IMF4兩個模態的峭度值相差較大。考慮為了融合更多模態的有效信息,同時也便于對所提出的特征進行可視化處理。所以,本研究將選取經排序后前三個較大的峭度值所對應的子模態分量,作為篩選出的有效IMF分量。
為證明最優層數分解出的各子模態中所含有信息的有效性,對篩選出的三個子模態分量進行包絡熵計算。作為比較,對EMD分解后的振動信號用上述同樣方法求其包絡熵,限于篇幅僅列舉振動信號經VMD處理后部分包絡熵特征向量,如表3所示。

表3 VMD分解后部分軸承包絡熵特征向量
經過VMD 與EMD 處理后的樣本,共提取出200×3 的狀態特征矩陣,現對每種狀態中的50 組樣本隨機抽取30 組進行訓練,剩余20 組作為測試樣本。賦予數字標簽1~4對應軸承的正常狀態、外圈故障、內圈故障、滾動體故障。參照文獻[16]對SVM的各個參數進行設定。最后將特征矩陣輸入至SVM中進行故障識別,結果如圖8、圖9所示。

圖8 EMD-SVM測試結果

圖9 本文方法測試結果
分析可知,在80個測試樣本中,EMD-SVM共有18 個樣本被錯誤分類,而KVMD-SVM 僅8 個樣本被錯誤分類。相比于EMD 在測試樣本中的精度有了明顯的提升。為進一步說明所提方法的有效性,參照文獻[17]固定K=4 對原始數據集進行分解,而后利用PCA屬性約減至三維,輸入到SVM中進行故障識別,結果如圖10 所示。對比這三種方法,對測試樣本與訓練樣本的精度做總體統計,如表4所示。

表4 不同實驗方法軸承故障診斷精度

圖10 VMD-SVM測試結果
通過對比發現,使用本文提出的方法對故障進行判別時測試集的正確率可達到90.00%,相較于其他兩種方法具有明顯的優勢。
針對滾動軸承故障振動信號非平穩、非線性導致的故障特征難以提取和類別難以辨識問題。本研究提出一種能量占比優化VMD,并融合包絡熵與SVM 的滾動軸承故障診斷方法。通過對故障軸承模擬實驗信號進行驗證,得出的主要結論如下:
(1)通過能量占比的方法確定VMD 的最佳分解層數,解決了VMD 分解層難以確定的問題,避免了主觀人為因素的影響,對K值的科學選取有一定的理論指導依據。
(2)利用峭度準則篩選出有效IMF 分量,通過提取包絡熵特征并結合SVM 方法對故障軸承進行有效的辨識。
(3)提出的方法可以有效地對軸承故障進行辨識,相比于EMD 與固定VMD 中K值的方法具有更高的應用價值。