莊 敏,李 革,范智軍,孔德成
(1.杭州科技職業技術學院 智能制造學院,浙江 杭州 311402;2.浙江理工大學 機械與自動控制學院,浙江 杭州 310018;3.河南工業大學 機電工程學院,河南 鄭州 450001;4.鄭州機械研究所有限公司,河南 鄭州 450052)
行星齒輪箱是旋轉機械中的重要組成部件,具有承載能力大和工作平穩的優點,因而被大量用于風力發電機組等具有復雜結構的傳動系統中[1]。
由于工作環境惡劣,齒輪箱易發生各種故障,影響整個機組的可靠性。因此,對行星齒輪箱的故障進行可靠的檢測具有十分重要的意義。
行星齒輪箱的故障會導致振動信號中出現周期性的脈沖。因此,通過分析振動信號能夠獲取表征齒輪箱狀態的信息[2-3]。
由于系統受到機械摩擦和噪聲的耦合作用,振動信號呈現非線性特性,線性分析方法無法進行處理[4]。
隨著非線性科學在故障診斷領域的應用,基于熵的指標,如樣本熵、排列熵、散布熵[5]和對應的多尺度熵(multiscale entropy, MSE)等,被廣泛用于信號的特征提取。
李怡等人[6]提出了一種基于自適應噪聲完備集合經驗模態分解-MSE的滾動軸承故障診斷方法。刁寧昆等人[7]開發了一種基于多尺度排列熵的滾動軸承故障檢測模型。曲全鵬等人[8]開發了一種結合變分模態分解和多尺度散布熵(multiscale dispersion entropy,MDE)的柱塞泵故障診斷方法,取得了良好的結果。隨后,錢恩麗等人[9]對MDE的粗粒化方法進行了改進,并在考慮了數據波動性的基礎上,引入了復合多尺度波動散布熵(composite multiscale fluctuation dispersion entropy,CMFDE),用于單向閥的狀態特征提取。GAN Xiong等人[10]將CMFDE用于軸承的故障特征挖掘。ZHOU Fu-ming等人[11]1-13對CMFDE進行了進一步改進,并提出了精細的CMFDE(refined CMFDE,RCMFDE),用于液壓泵的故障診斷。
然而,CMFDE或RCMFDE的粗粒化處理僅基于數據的均值,對于齒輪箱振動信號,基于數據均值的一階矩處理還不足以表征時間序列的復雜性[12]。為此,SONG Mei-ping等人[13]基于均方根的粗粒化處理,實現了信號的多尺度分析,提出了廣義精細復合多尺度散布熵,并與傳統的精細復合多尺度散布熵進行了比較,結果驗證了其優越性。
振動信號通常包含較多的沖擊分量和諧波周期分量,成分比較復雜。單一的特征提取指標無法提取出足夠的故障特征。
針對這個問題,ROSTAGHI M等人[14]提出了一種基于偏斜度、方差和平均值的精細復合廣義多尺度散布熵,采用該方法實現了對滾動軸承較為全面的診斷。隨后,QIN Ai-song[15]在此基礎上,更加詳細地考慮了信號的一階特征和二階特征,提出了集成復合多尺度散布熵,并將其與傳統的精細復合多尺度散布熵進行了對比,驗證了其有效性。
筆者綜合上述方法的優勢,全面地考慮信號的一階、二階和三階特征,并結合波動散布熵,提出混合精細復合多尺度波動散布熵(HRCMFDE)。其主要原理是將粗粒化處理由均值擴展至均方根值、方差值、根振幅值、最大值和偏斜度,從而提取出更多的故障信息。因此,HRCMFDE能夠從一階矩(均值(mean)、最小值(min)),二階矩(均方根(rms)、方根幅值(ra))和三階矩(偏斜度(sk))來實現信號的特征提取。相比于原始的RCMFDE,HRCMFDE能夠從信號中挖掘出更全面和更豐富的故障特征,從而可靠地反映信號的故障狀態。
在挖掘了故障特征后,需要對故障狀態做出檢測。顯然,由HRCMFDE提取的故障特征具有很高的維數,直接利用其進行分類無法獲得可靠的分類效果,且嚴重影響分類效率。
特征選擇是一種通過對特征的重要性進行評估的特征降維方法,典型的特征排序方法如Fisher分數(fishes score,FS)和拉普拉斯分數(Laplace score,LS)。其中,FS專注于含標簽數據的特征,遺漏了已有特征的局部屬性。作為無監督的特征降維方案,LS保留了FS特征的局部保留能力,并采用方差值來表征包含信息的性能。吉哲等人[16]將LS用于柴油機故障特征的選擇和降維,取得了優異的效果。因此,筆者利用LS對初始特征進行維數壓縮,獲得低維的敏感特征[17]1-8。
目前,常見的故障識別分類器模型包括極限學習機(ELM)和支持向量機(SVM)等。其中,SVM是一種用于非線性小樣本的有監督分類器,其性能穩定且泛化性好,但存在著參數選擇的問題。
周付明等人[18]和阮婉瑩等人[19]分別提出了基于遺傳算法和粒子群算法的支持向量機,也取得了不錯的分類效果;但遺傳算法和粒子群算法易陷入局部最優,搜索能力較弱。
為了提高SVM的參數優化精度,筆者引入基于蝙蝠算法的支持向量機(bat algorithm-support vector machine,BA-SVM)分類器,隨后將該故障特征輸入至BA-SVM中,進行故障分類[20]。
綜上所述,筆者提出一種基于HRCMFDE特征提取、LS特征降維優化和BA-SVM故障識別的行星齒輪箱故障診斷方法。
首先,筆者利用HRCMFDE提取行星齒輪箱振動信號的故障特征;然后,采用LS對原始高維特征進行降維和優化,以獲得低維的高分辨率特征;最后,利用基于蝙蝠算法優化的支持向量機,對行星齒輪系不同故障特征向量進行訓練和分類,利用真實故障數據集對故障診斷方法進行驗證。
筆者給定長度為N的序列x=x1,x2,…,xN,波動散布熵(fluctuation dispersion entropy,FDE)方法描述如下:
(1)使用正態累積分布函數將xj(j=1,2,…,N)映射到具有從1到2c-1的整數索引的2c-1類。
分類后的信號為zj;


(4)對于每個散布模式,相對概率為:
(1)

(5)根據定義,FDE計算如下:
(2)
FDE僅對信號開展單一尺度的分析,這會遺漏其他尺度上的模式信息。為此,文獻[21]開發了多尺度波動散布熵(multiscale fluctuation dispersion entropy,MFDE),通過將原始序列分割為多個粗粒度子序列來實現信號的多尺度分析。精細復合多尺度波動散布熵是在MFDE方法的基礎上進一步改進,通過將初始數據基于起始點分別為[1,τ]連續地劃分成長度為τ的片段,并計算其平均值獲得τ個粗粒度子序列來完成RCMFDE的計算。
傳統RCMFDE是基于數據的均值來進行粗粒度序列的采樣,僅考慮了數據的一階特征。而振動信號由于工況和環境復雜且耦合,信號具有多個階次的特征,原始的基于均值的粗粒化處理無法提取信號中的多階特征。因此,筆者提出HRCMFDE方法,從均值、最小值,均方根、方根幅值和偏斜度來實現信號的特征提取。相比于RCMFDE,HRCMFDE考慮信號中的多階特征,采用HRCMFDE特征提取得更加全面。
HRCMFDE的原理如下:
(1)對于信號x={x1,x2,…,xN},基于公式來生成粗粒度序列,其中,1≤k≤τ,1≤j≤[N/τ];
基于均值的粗粒度時間序列為:
(3)
基于均方根值的粗粒度時間序列為:
(4)
基于方根幅值的粗粒度時間序列為:
(5)
基于最小值的粗粒度時間序列為:
(6)
基于偏斜度值的粗粒度時間序列為:
(7)
式中:τ—尺度因子。
(2)對于每個尺度,RCMFDE定義為:
(8)

(3)筆者分別對每種粗粒度時間序列執行固定操作,可以得到τ個熵值,總共可以得到5*τ個熵值。HRCMFDE可以表示如下:
HRCMFDE=RCMFDEmean&rms&ra&min&ske
(9)
HRCMFDE混合多個形式的RCMFDE,特征提取的更加完備,避免信息的遺漏,因此更適合用于振動信號的特征提取。
HRCMFDE的計算流程圖,如圖1所示。

圖1 HRCMFDE的流程圖
在HRCMFDE方法中,有4個參數需要預先設置,分別是數據長度N,嵌入維數m,類別數c和時間延遲d。由于HRCMFDE方法中僅是粗粒度處理存在不同,其他方法均相似,因此,不同形式的RCMFDE保持相同的參數設置。
根據文獻[11]6的建議,RCMFDE在嵌入維數m=2,c=6;d=1和N=4 096時能夠取得較優異的特征提取性能。此外,由于集成了多種類型的RCMFDE,特征維數比較大,尺度因子的選擇影響特征的數量。
為充分提取故障信息,并減小特征數量,筆者設置尺度因子為τ=15。
HRCMFDE由多個RCMFDE組成,這導致HRCMFDE提取的特征具有較高的維數。雖然多個特征能夠提供更加全面和完整的信息,但是會引入較多冗余信息,降低分析效率和精度。
為此,筆者引入基于LS的特征選擇方法,根據各尺度特征的重要性對特征進行重新排序,以獲得低維敏感的特征。LS的原理詳見文獻[16]3,筆者不再贅述。
支持向量機是一種泛化性好,且適用于小樣本的分類器。然而,SVM的核函數σ和懲罰系數C會嚴重影響其性能,人為設置參數難以獲得SVM的最佳性能。因此,筆者采用具有優異全局搜索性能的蝙蝠算法來對SVM的參數進行優化,以實現參數的自適應選擇。
蝙蝠算法是基于蝙蝠利用聲納系統進行追殺目標和躲避障礙物行為的啟發式方法。
利用BA方法對SVM參數進行優化的詳細程序,如圖2所示。

圖2 BA-SVM的流程圖
基于上述理論分析,筆者將HRCMFDE、LS和BA-SVM相結合,用于齒輪箱的故障診斷,其詳細診斷步驟如下:
(1)采集行星齒輪箱G個工況下的振動信號,以長度為2 048的滑動窗口進行采樣,每種工況獲得M個互不重疊樣本。隨機選擇P組樣本用于訓練,余下M-P組樣本用于測試;
(2)計算每個樣本的HRCMFDE,每個樣本得到5τ個熵值,生成初始特征矩陣Op×5×τ;
(3)為了降低特征的維數并減小冗余特征,利用LS方法對訓練樣本和測試樣本的特征進行選擇,得到低維敏感故障特征;
(4)將訓練樣本的敏感特征輸入至BA-SVM進行訓練,隨后將完備的BA-SVM分類器對測試樣本進行故障識別,輸出故障工況。
為了驗證上述故障診斷方案的有效性,筆者利用PHM 2009年數據挑戰賽的行星齒輪箱數據集進行實驗。
實驗平臺由感應電動機、電磁制動器、齒輪箱和變頻控制器組成,如圖3所示。

圖3 IEEE PHM 2009故障實驗平臺
該數據是在實驗室環境下,采集得到的齒輪箱輸入端的振動信號。該數據的詳細信息參照文獻[22],不同的故障包含行星齒輪箱中的軸承,齒輪和軸故障的復合故障。
筆者以斜齒輪嚙合故障進行研究,并基于齒面裂紋(TSC)、齒根斷裂(TRF)、軸承外圈故障(BOF)、軸承內圈故障(BIF)、軸承滾動體故障(BBF)、齒輪不平衡(GI)和輸入軸不平衡(ISI)等故障。
不同故障類型齒輪如圖4所示。

圖4 齒輪不同故障類型
筆者仿真8個斜齒輪嚙合復合故障工況的結果,分別表示為G1、G2、G3、G4、G5、G6、G7、G8,不同故障的具體形式如表1所示。

表1 斜齒輪復合故障的類型
實驗中,振動信號的采樣頻率為66.67 kHz,輸入軸的額定轉速為3 000 r/min,采樣時間為4 s。每個工況的振動信號長度為266 600點,實驗中將每個工況振動信號分割為50個長度為4 096的樣本。其中30組樣本作為訓練集,20組樣本作為測試集。
實驗數據的詳細信息如表2所示。

表2 實驗數據的詳細信息
在不同工況下,齒輪振動信號的時域波形如圖5所示。

圖5 齒輪箱不同工況振動信號的時域波形
3.2.1 HRCMFDE特征提取
筆者利用HRCMFDE方法提取振動信號中的特征組成初始的特征矩陣。每個工況都由75個熵值特征進行描述,即特征矩陣由5個不同類型的RCMFDE組成。
不同故障狀態振動信號的基于均值、均方根值、方根幅值、最小值和偏斜度粗粒度處理的RCMFDE,如圖6所示。

圖6 5種RCMFDE熵值
從圖6可以發現:不同形式的RCMFDE對不同工況具有不同的區分度,如RCMFDE_ske無法有效地區分各個工況,即特征的區分度較低;而RCMFDE_rms能夠較好地區分各個工況。
類似地,其他類型的RCMFDE具有比較明顯的區分度,即不同類型的RCMFDE能夠區分不同類型的齒輪箱故障。
通過混合多個形式的RCMFDE,能夠增強特征的提取性能,提供更多有效的信息,避免單一特征提取模型的缺陷。總體來說,基于HRCMFDE的方法能夠提取出豐富的故障特征。
3.2.2 LS特征降維優化
隨后,筆者利用LS對初始高維特征進行選擇,以獲得高價值故障特征。該處,筆者將新特征的數量為設置為20。
初始的75維特征的LS排序結果如圖7所示。

圖7 經過LS排序后的新特征分布
筆者發現:新特征在不同尺度上分布的更加合理,區分度更加明顯。可見,通過對原始特征進行合理的特征選擇能夠增強特征的質量。
3.2.3 BA-SVM故障識別
筆者選擇前7個新特征,輸入至BA-SVM分類器進行故障識別[23,24]。
測試樣本的分類結果如圖8所示。

圖8 筆者所提方法識別結果的混淆矩陣
從識別結果可以發現:1個G4樣本被誤分類為G5樣本,2個G6樣本被錯誤分類為G7,總的故障識別準確率為98.13%,G4樣本的識別準確率為95%,G6樣本為90%。
雖然G4和G6樣本出現了樣本識別錯誤的情況,但總體上證明該方法是有效的。
3.3.1 HRCMFDE
為了證明HRCMFDE方法的優越性,筆者將其與典型的基于均值和均方根的RCMFDE、精細復合多尺度排列熵(RCMPE)(嵌入維數m=5,時間延遲d=1)、精細復合多尺度散布熵(RCMDE)和精細復合多尺度熵(RCMSE)(嵌入維數m=2,相似容限r=0.2,時間延遲d=1)進行對比。
筆者將由上述6種特征提取方法提取的故障特征經過LS處理,然后輸入至BA-SVM進行訓練和識別。此外,為了避免隨機性和微小的擾動因素對對比結果的干擾,每種方法都重復實驗15次。
實驗結果如圖9所示。

圖9 6種特征提取方法的15次分類結果
筆者發現:基于HRCMFDE的方法具有最高的平均分類準確率,且曲線的波動也較小。這表明該方法獲得的識別結果非常穩定;其他方法的準確率均明顯低于筆者所提方法,并且具有較明顯的波動,這說明獲得的準確率不穩定,容易出現大量失真的分類結果。
筆者對所提方法與現有方法進行多次實驗,結果表明:單一的特征提取指標無法全面地反映振動信號的故障屬性,刻畫不夠細致;筆者所提出的HRCMFDE方法通過混合多個基礎特征提取模型,具有更加全面和可靠的特征提取能力,優于其他方法。
3.3.2 LS
隨后,筆者對特征進行LS排序的重要性作研究,將經過LS排序后的特征與原始特征的不同數量的特征,輸入至BA-SVM進行故障分類。
由于特征數量較多,因此,筆者僅對特征數量在40個以內的準確率進行計算,其結果如圖10所示。

圖10 不同特征數量與識別準確率之間的關系
從圖10可以發現:對特征進行LS排序后的表現優于未經LS排序的。當經過LS排序后,特征數量為20時,準確率達到了97.5%;當特征數量較多或者較少都無法取得較佳的分類準確率(這是因為特征數量較少無法提供足夠的信息,導致分類器未獲得足夠的有效信息來區分不同工況;特征數量較多會產生冗余特征,影響識別的精度)。
因此,通過對特征數量與識別精度關系的研究,可以看出:對特征進行LS排序,能夠提升故障識別的精度,并且減少所需特征的數量。
3.3.3 BA-SVM
為了驗證BA-SVM的優勢,筆者利用粒子群優化(particle swarm optimization, PSO)優化的SVM(PSO-SVM),遺傳算法(genetic algorithm, GA)優化的SVM(GA-SVM)和未優化的SVM進行對比。
筆者將由HRCMFDE和LS提取的故障特征輸入至4種分類器進行故障分類,其結果如表3所示。

表3 4種分類器的性能對比
從表3可以發現:筆者所使用的BA-SVM具有最高的分類準確率,另外3種分類器的識別準確率均低于BA-SVM,表明BA-SVM具有優越性。雖然,BA-SVM的分類效率較低,但是能夠通過識別準確率進行彌補。
針對行星齒輪箱的特征提取以及故障識別問題,筆者提出了一種基于HRCMFDE特征提取、LS特征降維優化和BA-SVM故障識別的行星齒輪箱故障診斷方法;通過齒輪箱故障實驗數據,對基于HRCMFDE、LS、BA-SVM的方法的有效性進行了驗證。
研究結論如下:
(1)HRCMFDE通過混合多階次的粗粒化處理,避免了原始的基于單一粗粒化形式的RCMFDE容易遺漏數據中關鍵信息的缺點,可以可靠地從齒輪箱中提取出豐富和高分辨率的故障特征;
(2)利用LS對特征進行了處理能夠降低特征的維數,保留主要特征,并且故障識別準確率和效率也優于原始特征;
(3)采用BA方法對SVM的核心參數進行了尋優,能夠顯著地提高故障識別準確率,優于未優化的SVM,GA-SVM和PSO-SVM分類器模型。
由于混合多個特征提取方法,基于HRCMFDE、LS、BA-SVM方法的效率比較低下,需要耗費較多時間。
在后續的研究中,筆者將就特征提取效率提高、模型通用性拓展等方面,開展進一步的相關研究工作。