李 怡,李煥鋒,劉自然
(河南工業大學 機電工程學院,河南 鄭州 450001)
滾動軸承作為旋轉機械的重要組成部分,一旦發生故障時,旋轉機械就會受到很大的影響。因此,對滾動軸承故障診斷研究是十分必要的[1]。
在故障特征提取方面,自適應白噪聲完整經驗模態分解(CEEMDAN)是Torres等人在集合經驗模態分解(EEMD)算法的基礎上,提出來的一種信號處理算法[2]。該算法對EEMD算法進行了優化處理。與EEMD算法相比,CEEMDAN算法改善了分解的完整性,降低了重構的誤差,還提高了分解的效率。
在故障分類方面,支持向量機(SVM)被廣泛應用于機械故障診斷方面[3]。它在解決非線性、小樣本以及高維模式識別的問題中有很好的表現[4]。但在SVM中,懲罰因子C以及核函數參數σ的取值對故障診斷的準確性起決定性的作用[5]。為了提高SVM故障識別的準確率,張小龍等人[6]提出了一種基于ITD復雜度和PSO-SVM的滾動軸承故障診斷。趙蕾等人[7]提出了一種基于FOA-WPT降噪和PSO-SVM的滾動軸承故障診斷方法。時培明等人[8]提出了一種基于分形維數和GA-SVM的軸承故障診斷方法。然而傳統的智能算法在優化SVM參數時,存在尋優速度慢、調節參數多,以及容易陷入局部最優值等問題,從而導致其故障分類的準確率較低。
本文引入一種麻雀搜索算法優化支持向量機(SSA-SVM),提出一種基于CEEMDAN多尺度熵與SSA-SVM相結合的故障診斷方法,用于軸承故障診斷,并通過實驗來證明該方法能夠準確地獲得故障信息,且故障識別效果更好。
設x(t)為實驗數據,則CEEMDAN算法對信號分解過程具體如下:
(1)IMF1分量與EEMD算法分解得到的IMF1分量相同;
(1)
從x(t)中去除IMF1(t)得殘余分量r1(t):
r1(t)=x(t)-IMF1(t)
(2)
(2)采用EMD算法將N次高斯白噪聲分解,獲得IMF和殘余分量r1(t)相加,再通過EMD算法,取均值得到的第一個IMF,將其作為IMF2(t):
(3)
式中:E1(.)—通過EMD算法提取的第1個IMF;vi—單位方差均值為0的高斯白噪聲;ε1—幅值。
則第二個殘余分量為:
r2(t)=r1(t)-IMF2(t)
(4)
(3)重復上面步驟,可求得第j個IMFj(t)和殘余分量rj(t);
(5)
rj(t)=rj-1(t)-IMFj-1(t)
(6)
若殘余分量不能在被分解,則中斷上述過程,此時信號x(t)為:
(7)
多尺度熵是計算不同時間尺度下信號的復雜程度[9]。它具有良好的抗干擾和抗噪效果[10]。當一個信號越復雜,波動越大,多尺度熵就越大;同樣,信號越規則,波動越小,多尺度熵就越小。
該算法詳細步驟如下所示:
(1)粗粒化處理。粗粒化處理時間序列就表示為對不同數量的連續點取平均值,來創建不同尺度的信號,即:
(8)
式中:xi—時間序列;τ—時間尺度。
(2)求各時間尺度下,經過粗粒化處理過的信號的樣本熵記MSE,即:
MSE(X,τ,m,r)=SampEn(y(τ),m,r)
(9)
式中:m—嵌入維數;r—相似容量。
SVM自身理論比較復雜,難于理解,所以研究人員自己實現該算法有難度。但是通過多年的摸索與研究,現在已經有許多研究人員研究出了相關的軟件包,故直接安裝運行即可。該實驗采用的SVM是Libsvm軟件包中的一個部分。
在采用SVM進行故障分類時,確定適合的核函數、懲罰因子C以及核函數參數σ是SVM的核心[11]。
基于徑向基核函數(RBF)有很強的局部性能以及抗干擾等特點,在軸承故障診斷中SVM常選擇RBF核函數。因此,懲罰因子C以及核函數參數σ的取值對SVM故障識別的準確性至關重要。
麻雀搜索算法(sparrow search algorithm, SSA)是薛建凱等人[12]于2020年基于麻雀的覓食行為和反捕食行為提出的一種新的群智能優化算法。該算法具有全局搜索能力強、尋優速度快、收斂速度快等優點。
SSA的社會行為可以通過以下列數學模型來描述:
假設麻雀種群表示為:
(10)
式中:n—麻雀的數量;d—要優化的變量的維數。
則所有麻雀的適應度值可以用以下向量來表示:
(11)
式中:FX中每一行的值—個體的適應度值。
在搜索過程中,適應度較高的麻雀會先得到食物。探索者作為麻雀種群的領導者負責搜索食物,且提供搜索食物的方向,故探索者的搜索食物范圍最大。
當麻雀種群周圍存在沒有捕食者時,探索者可以隨意進行食物搜索;一旦發現了周圍存在捕食者,探索者會帶著追隨者向安全地方移動。
探索者的位置如下:
(12)
式中:t—當前迭代次數;itermax—最大迭代次數;Xij—第i個麻雀在第j維的位置信息;α—隨機數,α∈(0,1];R2—預警值,R2∈(0,1];ST—安全值,ST∈(0.5,1];Q—服從正態分布的隨機數;L—1×d的矩陣,其中該矩陣內每個元素全部為1。
當R2 在整個麻雀種群中,探索者與追隨者的比重是不變的,只要能夠找到好的食物,就能成為探索者,反之就是追隨者。麻雀種群中追隨者的覓食環境與范圍很差,因此,它們就會隨時注意探索者的情況并與探索者爭搶食物,若搶奪成功,它們就會獲得探索者的食物代替去更遠的地方搜索食物。 則追隨者的位置為: (13) 式中:Xworst—全局最差位置;Xp—當前發現者中最優位置;A—代表一個1×d的矩陣,其中該矩陣內每個元素為1或-1,并且A+=AT(AAT)-1。 當i>2/n時,表示此時追隨者沒有獲得食物,需要去更遠的地方搜索食物。 在整個麻雀種群中,假設警惕者占總數量的10%~20%,且警惕者的初始位置是在種群中隨機分布的,當警惕者意識到周圍存在捕食者時,外圍的麻雀將快速地向安全的地方飛行,來獲取優越的搜索環境;內部的麻雀將在安全區域內一直走動,減少被捕食概率。 警惕者的數學模型為: (14) 式中:Xbest—當前的全局最優位置;β—步長且服從標準正態分布;K—代表一個隨機數,K∈[-1,1];fi—當前麻雀個體的適應度值;fg—當前全局最佳適應度;fw—當前全局最差的適應度值;ε—常數,以避免分母出現0。 當fi>fg時,表示外圍麻雀發現捕食者;反之,中間麻雀發現捕食者。 SSA-SVM的具體優化步驟如下: (1)設置SSA算法中的麻雀群總數n,最大迭代次數itermax,發現者的比例、追隨者的比例以及C、σ的取值范圍,隨機初始化麻雀種群; (2)計算每個麻雀的適應度,并進行排序,定義每只麻雀所屬于的種群; (3)根據式(12~14)更新每種麻雀種群的位置; (4)對更新位置后的每只麻雀重新進行適應度計算,對更新前后的適應度進行對比,保留更優的適應度繼續進行更新; (5)判斷迭代次數是否為itermax。若不是itermax,跳到(2)繼續進行,直到為itermax為止,終止運行; (6)得到的最優的適應度Xbest的位置就為SVM的參數C和σ。 基于CEEMDAN多尺度熵-SSA-SVM故障診斷流程如下: (1)將振動信號隨機分為訓練樣本和測試樣本,利用CEEMDAN算法對其分解得到若干IMF; (2)提取敏感IMF并進行信號重組和多尺度熵的計算,然后進行歸一化處理作為提取的特征向量; (3)將得到的故障特征向量經SSA-SVM進行故障診斷。 其總體流程示意圖如圖1所示。 圖1 流程示意圖 為了檢驗上述過程的真實性,筆者采用美國西儲大學公開的電機軸承數據進行研究[13-15]。 被測軸承為6205-2RSJEMSK,采用的數據為驅動端數據;其采樣頻率是12 kHz,轉速為1 797 r/min。 此處分別取軸承正常狀態、內圈故障、外圈故障和滾動體故障4種狀態下的振動信號各60組,訓練與測試樣本各30組,每組樣本的采樣長度為2 048個點。 其中,多尺度熵中τ=10,r=0.15S(S—樣本的標準差),m=2。滾動軸承4種狀態的標簽為1~4。 實驗所采用的4種狀態的時域圖如圖2所示。 圖2 4種狀態的時域圖 該實驗將4種狀態下的數據通過CEEMDAN算法進行分解,共獲得12個IMF。 因為篇幅關系,此處只給出內圈故障狀態下通過CEEMDAN算法提取的前5個IMF,如圖3所示。 圖3 內圈故障信號CEEMDAN處理結果 由于若干IMF中存在一些沒用信息,則選取相關系數超過0.1的IMF作為有用信息保留。 各個IMF相關系數大小如表1所示。 表1 各個IMFS的相關系數值 根據表1可得,超過0.1的為IMF1、IMF2、IMF3,并對IMF1、IMF2、IMF3進行信號重組。 對重組信號求取尺度熵,并作為特征向量分別輸入到PSO-SVM、GA-SVM以及SSA-SVM中,進行對比試驗。 其中:每種SVM模型迭代次數為100次,種群數量為20。 SSA-SVM模型的單次分類準確率如圖4所示。 圖4 SSA-SVM模型的單次分類準確率 PSO-SVM模型的單次分類準確率如圖5所示。 圖5 PSO-SVM模型的單次分類準確率 GA-SVM模型的單次分類準確率如圖6所示。 圖6 GA-SVM模型的單次分類準確率 通過圖(4~6)可知: GA-SVM模型與PSO-SVM模型對正常狀態分類與外圈故障準確,但將內圈故障與滾動體故障不同程度的識別成了外圈故障。而SSA-SVM模型對正常狀態、內圈故障與外圈故障均識別正確,僅在滾動體故障識別出現略微錯誤。 為了使該實驗的實驗結果更有說服力,筆者將GA-SVM、PSO-SVM以及SSA-SVM模型均進行50次實驗。 實驗環境為在2.40 Hz的英特爾i5-9300H處理器和8 GB內存電腦上的Matlab2016a中進行的。 此處筆者選用平均準確率和3種優化算法對SVM參數C與σ尋優的50次平均時間作為指標,對3種SVM模型的分類性能進行分析比較,可以很清楚地得出3種模型的差異。 GA-SVM、PSO-SVM以及SSA-SVM模型的50次尋優時間如圖7所示。 圖7 3種模型50次尋優時間 3種模型的比較結果如表2所示。 表2 3種模型的比較結果 通過對圖7與表2分析可得: GA-SVM模型的平均尋優時間4.47 s且尋優時間略不穩定,平均分類準確率為96.67%,該模型的故障診斷效果最差;PSO-SVM模型的尋優時間高于GA-SVM且尋優時間極差較大,但平均分類準確率略提高了0.83%。SSA-SVM模型與其他兩種模型相比,其平均尋優時間最短,每次的尋優時間較為穩定以及平均分類準確率最高。 綜上所述,SSA-SVM模型的分類準確度高,尋優速度快,在軸承故障診斷中表現出了更好的故障診斷性能。 針對支持向量機(SVM)應用在軸承故障分類時,傳統的智能算法優化SVM的參數容易存在尋優速度慢、調節參數多,以及容易陷入局部最優值等問題,本文提出了一種基于CEEMDAN多尺度熵與SSA-SVM相結合的故障診斷方法。 該故障診斷方法利用CEEMDAN多尺度熵對數據進行了故障特征提取,再利用SSA-SVM對提取的故障特征進行了分類;并對美國西儲大學公開軸承故障數據進行了PSO-SVM、GA-SVM以及SSA-SVM模型對比實驗。 實驗結果表明:相比于PSO-SVM與GA-SVM模型,SSA-SVM模型具有更快的收斂速度、更好的分類效果以及更短的尋優時間等優點,對研究其他方向有一定的參考價值。2.3 SSA-SVM的優化步驟
3 基于CEEMDAN多尺度熵-SSA-SVM故障診斷流程

4 實驗及結果分析
4.1 實驗數據準備

4.2 實驗結果分析







5 結束語