王振亞,姚立綱,蔡永武,張 俊
(福州大學 機械工程及自動化學院,福州 350116)
旋轉機械設備故障診斷的關鍵在于從非線性、非平穩振動信號中提取故障特征信息,近年來,熵值特征提取方法被廣泛應用于故障特征提取過程,如近似熵、樣本熵、排列熵(permutation entropy,PE),多尺度熵和模糊熵等[1-2]。其中,排列熵具有計算速度快,抗噪能力強,適合在線監測等優點,因此在故障診斷領域應用較廣,如Yan等[3]將PE作為旋轉機械設備的狀態特征值,取得良好實驗效果;劉永斌等[4]利用PE有效監測滾動軸承狀態變化。盡管PE在分析非線性時間序列的隨機性和動力學突變等方面具有一定優勢,但它忽略了非線性時間序列的振幅信息。針對這一問題,Fadlallah等[5]提出了保留時間序列振幅信息的加權排列熵(weightied permutation entropy,WPE)算法,在Shannon熵的計算過程以重構向量方差作為權值,提高算法魯棒性和穩定性。Yin等[6]將WPE與多尺度熵相結合,提出多尺度加權排列熵(multiscale weightied permutation entropy,MWPE)算法,從多個尺度提取時間序列特征信息,以此克服WPE單一尺度分析的不足。但MWPE粗粒化方式定義的多尺度計算過程依賴于時間序列長度,導致熵值誤差會隨尺度因子增大而增加。針對這一問題,本文提出一種改進多尺度加權排列熵(improved multiscale weighted permutation entropy,IMWPE)算法,通過考慮同一尺度下多個粗粒化時間序列的加權排列熵值,彌補MWPE這一缺陷。
論文將IMWPE應用于旋轉機械設備故障特征提取過程,考慮到提取的熵值故障特征具有高維、非線性、冗余等特性,因此,將流形學習算法應用于特征維數約簡過程[7]。經典流形學習包括等度規映射(isometric mapping,Isomap)[8],局部切空間排列(local tangent space alignment,LTSA)[9],局部線性嵌入(locally linear embedding,LLE)[10]以及線性局部切空間排列(linear local tangent space alignment,LLTSA)[11]等。但上述方法均為無監督降維方法,維數約簡過程沒有利用樣本標簽信息,不適用于旋轉機械設備故障信號此類具有諸多奇異數據點的情況[12]。故本文采用一種監督Isomap(supervised Isomap,S-Isomap)[13]流形學習算法對IMWPE特征集進行維數約簡,提取出易于區分的低維、敏感IMWPE+S-Isomap熵-流特征集。
旋轉機械設備故障診斷的本質在于模式識別,支持向量機(support vector machine,SVM)[14]具有較好的泛化性,并且能夠有效避免局部極值,故在機械設備故障診斷過程有著較好的推廣。但SVM在故障模式識別過程中,如何選取合適的參數成為了需要解決的一個重大問題。本文引入一種全新的元啟發式優化算法——樽海鞘群優化算法(salp swarm optimization,SSO)[15-16]對SVM參數進行優化,提出一種基于樽海鞘群優化支持向量機(SSO-SVM)新算法。
依據上述分析,建立一種IMWPE+S-Isomap熵-流特征和SSO-SVM的故障診斷模型。將所提方法應用于行星齒輪箱故障診斷實驗數據分析過程,結果表明該方法可有效、精準判別出各工況類型。
1.1.1 多尺度加權排列熵算法
多尺度加權排列熵能夠有效衡量非線性時間序列復雜性和動力學突變。當旋轉機械設備出現故障時,非線性動態復雜性也發生相應變化,因此可將其應用于故障特征提取過程。對于時間序列X{x1,x2,…,xN},MWPE的具體步驟如下:
步驟1利用式(1)對原始時間序列進行粗粒化重構,得到粗粒化序列Ys={ys(j)}。
(1)
式中,s為尺度因子。
步驟2計算不同尺度因子下,粗粒化序列Ys的加權排列熵值,表達式為
EM(X,m,τ,s)=EW(Ys,m,τ)
(2)
式中:m為嵌入維數;τ為時延;EW(·)為加權排列熵值,WPE具體過程參見Fadlallah等的研究。
1.1.2 改進多尺度加權排列熵算法
MWPE克服WPE單一尺度分析的不足,但該算法粗粒化過程中WPE熵值誤差會隨尺度因子增大而增加。因此,本文通過平均同一尺度因子下多個粗粒化序列的WPE熵值,從而避免因粗粒化時間序列變短而導致WPE熵值突變情況的發生,使計算結果更加精準。
對于時間序列X={x1,x2,…,xN},改進多尺度加權排列熵的具體過程如下:

(3)
當尺度因子為s,即可得到s個不同的粗粒化序列。

(4)
IMWPE計算結果與嵌入維數m,尺度因子s和時延τ有關。嵌入維數m設定過小,重構向量變短,算法將不能有效檢測時間序列的動力學突變;反之,嵌入維數m設定過大,不僅增加計算量,而且無法有效反映時間序列的微弱變化,因此通常設定嵌入維數的取值范圍為[4,7],本文設定為6。尺度因子s的選取沒有固定標準,一般設定為s≥10,本文設定s=25。時延τ對IMWPE的影響較小,本文設定τ=1。
IMWPE提取的故障特征存在信息冗余和高維等特性,會影響最終識別結果。因此,本文采用監督等度規映射流形學習對該高維故障特征進行維數約簡。對于輸入樣本集U=[u1,u2,…,uN]T而言,S-Isomap具體過程如下:
步驟1定義一個包含所有樣本的鄰域圖G,構建監督型距離矩陣Ds={ds(ui,uj)}。若樣本點ui是uj的K近鄰點,則ui與uj有邊連接,且邊長為ds(ui,uj);否則無邊連接
(5)
式中:d(ui,uj)為樣本點ui和uj之間的歐氏距離;Lui為ui的標簽信息;β用來抑制類間距離過快增長,定義為所有樣本點歐氏距離的平均值;α用以調節不同標簽樣本點間的相似度。
步驟2利用Dijkstra方法計算最短路徑,并將圖G上任意兩點之間的最短路徑定義為兩點之間的測地距離。
步驟3應用多維標度分析(multidimensional scaling,MDS)算法對測地距離矩陣進行低維映射,得到低維嵌入結果Y。
根據上述理論基礎,提出一種基于IMWPE+ S-Isomap的熵-流特征提取方法,具體步驟如下:
步驟1利用改進多尺度加權排列熵算法從多尺度全面提取旋轉機械設備不同工況下振動信號的IMWPE熵值特征信息,合并成原始高維故障特征集。
步驟2采用監督等度規映射流形學習算法對原始高維特征集進行特征壓縮,得到低維、敏感和易于區分故障類型的特征向量集。
與傳統群優化算法(如灰狼群、蝙蝠群、人工蜂群等)相比,樽海鞘群具有嚴格的等級制度,能有效避免“群”結構模式中由于領導者前期搜索不充分而陷入局部極值情況的發生。樽海鞘群優化算法的具體過程如下:
步驟1樽海鞘群體初始化——設捕食空間為M×B維歐式空間,其中M為樽海鞘種群規模,B為維數。食物位于F=[F1,F2,…,FB]T,樽海鞘位于Sn=[Sn1,Sn2,…,SnB]T,n=1,2,…,M。搜索上界為ub=[ub1,ub2,…,ubb]T,搜索下界為lb=[lb1,lb2,…,lbB]T。采用式(6)隨機初始化樽海鞘種群
SM×B=rand(M,B)×(ub-lb)+lb
(6)
步驟2領導者位置更新
(7)

c1=2e-(4l/lmax)2
(8)
式中:l為當前迭代次數;lmax為最大迭代次數;c1為2~0的遞減函數。
步驟3追隨者位置更新
(9)
鑒于樽海鞘群優化算法的優勢,將其應用于SVM懲罰因子c和核函數參數g的優化過程,其中SVM的具體過程見Tong等的研究,本文設定SVM的內核函數為徑向基核函數。樽海鞘群優化支持向量機的流程圖如圖1所示,具體步驟如下:

圖1 SSO-SVM流程Fig.1 Flowchart of SSO-SVM
步驟1將訓練集和測試集樣本輸入至SVM。
步驟2確定SSO算法參數,為全面搜索最優解,設定樽海鞘種群規模為20,迭代次數為100,搜索上界為[100,100],搜索下界為[0.01,0.01],根據式(6)隨機初始化樽海鞘種群。
步驟3計算每個樽海鞘個體的適應度值,其中以訓練樣本三折交叉驗證(即將訓練數據均分成三個子集,然后依次對每個子集使用其余兩個子集訓練得到的分類器進行測試)所得平均識別率定為適應度值。
步驟4根據適應度值對樽海鞘個體進行降序排列,選出適應度最大值為領導者,其余為追隨者,并定義領導者所處的空間位置為當前食物方向。
步驟5根據式(7)更新領導者位置,再根據式(9)更新追隨者位置。
步驟6計算更新后樽海鞘個體的適應度值,并與當前食物的適應度值進行比較,若更新后的樽海鞘適應度值優于食物,則將該樽海鞘的位置定義為食物新位置。
步驟7重復步驟5~步驟6,直到滿足迭代終止條件,輸出食物坐標,即為最佳參數值(cb,gb)。
步驟8建立SVM的預測模型,并對測試集進行預測。
為了驗證SSO-SVM分類器的優越性,將其應用于UCI數據庫中的Iris數據集(數據集描述如表1所示)分類過程。此外,將該分類器與SVM,粒子群優化支持向量機(particle swarm optimization-SVM,PSO-SVM),灰狼群優化支持向量機(gray wolf optimization-SVM,GWO-SVM),人工蜂群優化支持向量機(artificial bee colony optimization-SVM,ABC-SVM)以及蝙蝠群優化支持向量機(bat algorithm optimization-SVM,BA-SVM)等分類器[17-19]進行對比(分類器參數設置如表2所示),各分類器對Iris數據集進行50次重復實驗后的平均適應度值曲線以及平均識別率如圖2所示。

表1 Iris數據集描述Tab.1 Description of Iris dataset

表2 分類器參數設置Tab.2 Parameters of different classifiers
據圖2(a)可知,相較于其他群優化SVM分類器而言,SSO-SVM在較少的迭代次數下就能獲取最佳適應度值,且SSO-SVM的最佳適應度值高于其他群優化SVM,驗證了利用SSO算法進行SVM參數優化是有效可行的。此外,據圖2(b)可知:①優化后的SVM對Iris數據集測試樣本識別效果明顯優于未經優化的SVM,這表明采用優化算法能夠提高識別效果;②相較于其他群優化SVM而言,SSO-SVM對Iris數據集測試樣本有著最高平均識別率,以此驗證SSO-SVM分類器的優越性。

圖2 不同分類器對Iris集的平均適應度值曲線和平均識別率Fig.2 Average fitness curves and average recognition rate of different classifiers on Iris dataset
本文建立一種熵-流特征和SSO-SVM的故障診斷方法,流程如圖3所示,具體步驟如下:

圖3 故障診斷方法流程Fig.3 Flowchart of fault diagnosis method
步驟1在一定采樣頻率fs下,分別采集不同工況下的旋轉機械設備振動加速度信號各Q組;隨機選取每種工況下q組信號作為訓練樣本,剩余Q-q組作為測試樣本。
步驟2利用IMWPE算法分別計算出訓練和測試樣本的IMWPE熵值,合并成原始高維故障特征集F(5×Q)×s,其中,s為尺度因子。
步驟3利用S-Isomap流形學習算法對原始高維特征集進行特征壓縮,得到低維敏感的熵-流特征向量F′(5×Q)×d,其中,d為本征維數。
步驟4將訓練樣本和測試樣本的低維特征集輸入至SSO-SVM多故障分類器(采用一對一的方式)中進行識別與診斷,判斷工況類型。
為驗證所提方法的有效性,將其應用于行星齒輪箱故障分析過程。在Spectra Quest公司開發的動力傳動系統故障診斷綜合實驗臺進行太陽輪正常和具有磨損故障、裂紋故障、斷齒故障、缺齒故障等5種工況(標簽信息分別定義為1,2,3,4,5)實驗數據的采集,實驗平臺及故障位置如圖4所示。本次實驗中,行星齒輪箱基本參數如表3所示,輸入軸轉速為25 Hz,負載電流為0.5 A,采樣頻率設定為7 680 Hz,通過滑動時間窗口(每個滑動窗口包含2 048個采樣點)得到5種工況各100組樣本,共計500組樣本。此外,訓練樣本與測試樣本按2∶8隨機分配,共計100組訓練樣本,400組測試樣本。行星齒輪箱5種工況時域波形如圖5所示。

圖4 行星齒輪箱故障診斷平臺Fig.4 Planetary gearboxes fault diagnosis platform

表3 行星齒輪箱參數Tab.3 Planetary gearbox parameters

圖5 行星齒輪箱5種運行狀態振動信號的時域波形Fig.5 Time domain waveform of five operating states vibration signals of planetary gearboxes
為驗證IMWPE熵值特征提取的有效性,將其與MWPE進行對比,其中,設置兩種算法嵌入維數m=6,時延τ=1,尺度因子s=25。兩種方法對行星齒輪箱5種工況分析結果如圖6所示。據圖6可知,對于同一工況而言,IMWPE與MWPE熵值曲線雖然較為接近;但當尺度因子大于1時,IMWPE熵值誤差均低于MWPE,在高尺度下更為明顯。這驗證了IMWPE算法中采用改進粗粒化序列構造方式,能夠彌補傳統MWPE算法存在的熵值不穩定缺陷。此外,為進一步驗證IMWPE的優越性,將IMWPE和MWPE提取的故障特征分別輸入至SSO-SVM多故障分類器中進行識別與診斷,兩種特征提取方法的識別結果和多類別混淆矩陣如圖7所示。據圖7可知,IMWPE的識別結果中,有37個樣本出現類別誤判現象,平均識別率達到90.75%。而MWPE的識別結果中,有47個樣本出現類別誤判現象,平均識別率為88.25%。上述分析表明IMWPE特征提取的優勢。

圖7 SSO-SVM多故障分類器對兩種特征提取方法的識別結果和多類別混淆矩陣Fig.7 Recognition results and multi-class confusion matrices of two feature extraction methods based on SSO-SVM multi-fault classifier

圖6 IMWPE與MWPE對行星齒輪箱5種工況分析結果Fig.6 Analysis results of five working conditions of planetary gearboxes using IMWPE and MWPE
IMWPE雖能提取出可以區分不同工況下的故障特征,但該特征集不可避免存在部分冗余信息,影響了診斷識別效果。因此,本文利用S-Isomap流形學習算法對IMWPE故障特征集進行維數約簡。為驗證該方法的有效性,將其與Isomap和LLTSA等方法進行對比。通過交叉驗證確定3種算法最佳參數,具體設置如下:Isomap近鄰參數為27;LLTSA近鄰參數為30;S-Isomap近鄰參數為27,α=0.3。3種方法降維后的三維可視化結果如圖8所示。據圖8可知,S-Isomap的可視化結果中,5類樣本聚集性最好,各類樣本可以明顯區分,降維效果最佳;Isomap和LLTSA的可視化結果中,5類樣本分布較為分散,并且存在嚴重混疊現象,降維效果較差,以上驗證S-Isomap的有效性。

圖8 3種算法降維后的三維可視化結果Fig.8 Three-dimensional visualization results of three algorithms after dimensionality reduction
此外,為進一步驗證IMWPE+S-Isomap熵-流特征提取效果的優越性,將其與MPE,MWPE,IMWPE等熵值特征提取方法以及IMWPE+Isomap和IMWPE+ LLTSA等熵-流特征提取方法進行比較。分別將上述6種特征提取結果輸入至SSO-SVM多故障分類器中進行識別與診斷,結果如表4所示。

表4 SSO-SVM多故障分類器對不同特征提取方法的測試樣本診斷結果Tab.4 Test samples diagnosis results of different feature extraction methods based on SSO-SVM multi-fault classifier
據表4可知:① 在熵值特征提取方法中,3種熵值特征提取方法的平均識別率大小關系為:IMWPE>MWPE>MPE;② 與IMWPE特征提取(平均識別率為90.75%)相比,IMWPE+Isomap,IMWPE+LLTSA和IMWPE+S-Isomap等3種熵-流特征提取方法能夠提高平均識別精度(分別提高了1.5%,1.25%和9.25%);③ 在熵-流特征提取方法中,IMWPE+Isomap和IMWPE+LLTSA熵-流特征的平均識別率均低于所提IMWPE+S-Isomap方法。分析上述結果的原因在于:① IMWPE熵值方法,既保留了MWPE考慮振動信號的振幅信息的優勢(MPE未考慮),又克服了MWPE熵值誤差會隨尺度因子增大而增加的缺陷,因此,具有較高的平均診斷精度;② 熵-流特征提取方法,利用流形學習進行二次特征提取,能夠去除冗余信息,因此識別效果優于原始IMWPE熵值特征提取;③ 與IMWPE+S-Isomap熵-流特征提取方法相比,IMWPE+Isomap和IMWPE+LTSA的無監督方式導致其無法在類別標簽信息的指導下進行維數約簡,出現一定數量樣本類別誤判現象的出現。上述分析表明IMWPE+S-Isomap熵-流特征提取方法能夠有效提取出易于區分行星齒輪箱故障類型的特征值。
最后為驗證利用SSO-SVM分類器進行行星齒輪箱故障診斷識別的優勢,將其與現有的PSO-SVM,GWO-SVM,ABC-SVM以及BA-SVM等分類器進行對比。將IMWPE+Isomap,IMWPE+LLTSA和IMWPE+ S-Isomap等熵-流特征提取結果分別輸入至上述5種分類器中進行診斷識別。其中,各分類器參數設置與表2相同,并且均采用一對一的方式建立多故障分類器。5種多故障分類器對3種熵-流特征提取結果的測試樣本平均識別率如圖9所示。
據圖9可知,5種多故障分類器對IMWPE+S-Isomap熵-流特征提取的平均識別率均達到100%,驗證該特征提取方法能夠提取出易于區分故障類型的特征信息。此外,與PSO-SVM,GWO-SVM,ABC-SVM和BA-SVM等多故障分類器相比,SSO-SVM多故障分類器對3種特征提取結果的測試樣本平均識別率均為最高,驗證了SSO-SVM在行星齒輪箱智能故障診斷中具有較好的識別效果。

圖9 5種多故障分類器對3種特征提取結果的測試樣本平均識別率Fig.9 Average recognition rate of test samples for three entropy-manifold feature extraction results using five multi-fault classifiers
(1)提出IMWPE+S-Isomap的熵-流特征提取方法,實驗結果表明,IMWPE算法克服了MWPE粗粒化過程的不足,提取得熵值更為穩定;S-Isomap流形學習算法降維效果優于Isomap和LLTSA;IMWPE+S-Isomap熵-流特征提取方法能夠提取出易于區分行星齒輪箱故障類型的特征信息。
(2)研發樽海鞘群優化支持向量機分類器,將樽海鞘群優化算法應用于SVM的參數尋優過程,仿真實驗和行星齒輪箱故障診斷實驗分析表明,SSO-SVM識別效果優于現有的PSO-SVM,GWO-SVM,ABC-SVM和BA-SVM等分類器。
(3)建立基于IMWPE+S-Isomap熵-流特征和SSO-SVM的故障診斷方法,經由行星齒輪箱故障診斷實驗分析驗證表明,所提出方法能夠有效、精準地診斷出行星齒輪箱的不同工況類型。