馬曉娜,周海超
(1.鄭州信息工程職業學院 藝術與教育學院,河南 鄭州 450000;2.武漢科技大學 機械自動化學院,湖北 武漢 430081)
齒輪箱是各種工程機械中的關鍵設備,一般用于傳遞扭矩或者改變轉矩方向。由于負載大、轉速高和潤滑條件惡劣,導致齒輪箱經常出現點蝕、斷齒和磨損等故障[1-2]。而隨著故障的持續演化,齒輪箱振動信號中會出現大量的諧波分量,加劇振動噪聲并造成嚴重的安全事故。因此,需要建立針對齒輪箱的故障診斷模型。
目前,齒輪箱的故障診斷模型一般基于振動信號進行開發[3]。隨著各種特征提取指標的陸續提出,以樣本熵、排列熵等非線性數據復雜度測量指標為代表的故障特征提取方法被廣泛應用于齒輪箱的故障診斷[4-6]領域。例如,高素杰等人[7]將排列熵與局部均值分解相結合,用于提取齒輪箱的故障特征,診斷結果驗證了該方法的有效性;然而排列熵只能開展信號的單一尺度分析且忽略了信號中的振幅信息。
針對信號的多尺度分析,研究人員進行了大量的研究。YUAN Xu-yi等人[8]基于粗粒化處理和加權排列熵,提出了多尺度加權排列熵,并將其用于提取高壓隔膜泵的故障特征,診斷結果表明,該方法提取的故障特征實現了故障的精準識別目的;然而傳統粗粒化處理會造成大量的有效信息被忽略,降低特征的質量。隨后,DONG Zhi-lin等人[9]基于時移粗粒化處理,提出了時移多尺度加權排列熵算法,并用于滾動軸承的故障診斷,結果表明,時移粗粒化處理性能優于傳統的粗粒化處理;然而無論是多尺度加權排列熵還是時移多尺度加權排列熵,均無法提取信號的高頻故障特征。為此,KE Yun等人[10]構造了平均算子和差分算子,提出了層次加權排列熵,并用于提取共軌噴油器的故障特征,該方法準確表征了不同故障的特性;然而傳統的層次分析由于層次處理較為粗糙,導致兩種算子遺漏了大量有效信息。
為了提高傳統層次處理的分析精度,LI Yong-bo等人[11]提出了一種改進層次排列熵算法,對層次處理進行了修正,提高了層次序列包含的信息量;然而改進的層次排列熵忽略了信號中的振幅信息,特征提取不足。ZHOU Fu-ming等人[12]提出了增強層次振幅感知排列熵算法,用于提取液壓泵振動信號的故障特征,隨機森林的診斷結果驗證了該方法的有效性;然而,該算法對信號的長度要求較高,在樣本長度較短時,分析精度較低,而當樣本長度較長時,特征提取時間較長。為此,WANG Xian-zhi等人[13]提出了一種新的復雜性測量方法,稱之為多尺度多樣性熵(multiscale diversity entropy,MDE),相較于其他指標,MDE的效率非常高,且魯棒性非常強;然而MDE的粗粒化處理存在不足。為此,YU Guang-wei等人[14]提出了復合多尺度多樣性熵(composite multiscale diversity entropy,CMDE),并將其用于旋轉機械的故障診斷,結果驗證了該方法的有效性;然而CMDE無法提取信號的高頻特征。隨后,WANG Xian-zhi等人[15]1450-1451提出了層次多樣性熵(hierarchical diversity entropy,HDE),將其用于軸承的故障診斷,結果表明,HDE性能要優于MDE;然而HDE的層次處理不夠精細,造成特征提取得不夠充分。
針對HDE特征提取不充分、不全面的缺陷,筆者借鑒增強層次分析的概念,對HDE進行改進,提出增強層次多樣性熵;在此基礎上,結合野馬算法優化的支持向量機,提出一種基于EHDE和WHO-SVM的齒輪箱故障診斷方法。
首先,筆者利用EHDE提取齒輪箱振動信號的故障特征;隨后,將故障特征輸入至WHO-SVM分類器進行訓練和測試;最后,根據分類器的輸出完成樣本的故障識別;利用齒輪箱實驗數據,對EHDE方法在不同數據長度樣本下的故障識別問題進行實驗和研究。
對于序列X={x1,x2,…,xi,…,xN},X的多樣性熵計算過程描述如下[16]:
1)基于給定的嵌入維數m,將時間序列X重構為一系列向量,如下所示:

(1)
2)構造相似集D(m),而D(m)可以通過計算相鄰向量之間的余弦相似度來生成,具體如下所示:

(2)

(3)

4)多樣性熵(diversity entropy,DE)可以定義如下:
(4)
對于時間序列X,當其DE值較大時,則代表X的復雜性較大;而當DE值較小時,證明其復雜性較小。因此,在[0,1]范圍內,DE的熵值隨著時間序列動態復雜度的增加而增加。
多樣性熵只是在單一尺度對時間序列進行了分析,而振動信號的狀態信息分布在多個尺度上,這導致DE無法全面地描述信號的動態特性。為此,學者們陸續提出了MDE和HDE。
HDE避免了MDE只能分析信號低頻特征的缺陷,但HDE的層次處理也不夠精細,導致層次序列所包含的特性信息不夠全面,進而導致特征質量不佳[17]。
為此,筆者對HDE進行了改進,提出了增強層次多樣性熵,理論如下:
1)對于時間序列{X(i),i=1,2,…,N},定義時間序列的兩個算子Q0和Q1如下:
(5)
(6)
式中:Q0為反映時間序列低頻信息的算子;Q1為反映時間序列高頻信息的算子。

(7)
3)定義向量{λ1,λ2,…,λk},則整數e可以表示為:
{λm,m=1,…,k}∈{0,1}
(8)
式中:λm為第m層的算子。
4)根據向量{λ1,λ2,…,λk},時間序列X的層次序列可以表示如下:
(9)
5)計算每個層次序列的多樣性熵,則EHDE可以表示為:
EHDE(X,m,ε,k)=DE(Xk,e,m,ε)
(10)
在EHDE方法中,需要預先設置嵌入維數m、符號數ε、時間序列的長度N和層次分解的層數k這4個參數。
對于嵌入維數m,過小會導致重構向量Y(m)的長度過短,無法準確表征信號的動態特性;過大則造成重構向量的長度過長,造成DE無法提取信號中的細微變化,筆者將嵌入維數設置為m=4。
對于符號數ε,根據WANG Xian-zhi等人[15]1455的建議,筆者將其設置為ε=30。
對于時間序列的長度N,其取值對于算法性能的影響有限,但數據長度不能過短,否則會造成信號中包含的特征信息無法準確描述信號的動態特性,即分析得不夠全面;其次數據長度不要過長,否則會嚴重降低信號分析的效率,同時分析精度也難以得到明顯的提升[18]。
為獲得較高計算效率的同時得到精確的計算結果,筆者將時間序列的長度設置為N=512。
對于層次分解的層數,一般設置為k≥3,該參數與特征的數量強相關,當k=3時,能夠獲得8個特征;而k=4時,能夠獲得16個特征。隨著特征數量的增加,樣本能夠得到更加全面的表征,但同時會降低特征提取的效率。
綜合考慮特征提取的效率以及特征表征的全面性,筆者將k設置為3。
1.3.1 參數分析
為了評估EHDE方法對數據長度的敏感性,筆者利用10組長度為128,256,512,1 024,2 048,4 096的高斯白噪聲(white gaussian noise,WGN)和1/f噪聲,對該算法進行分析。
不同長度噪聲的EHDE分析結果如圖1所示。

圖1 不同數據長度的WGN和1/f噪聲的EHDE
從圖1可發現:在數據長度較小時(N≤256),兩種噪聲的EHDE熵值都出現了偏離,即復雜度測量得不夠準確;而當數據長度N≥512時,兩種噪聲的熵值曲線基本重合,這證明在該數據長度下算法已經能夠獲得相對準確的復雜度測量結果。
此外,為了說明數據長度對計算效率的影響,筆者統計了不同數據長度下兩種噪聲的EHDE計算時間,如圖2所示。

圖2 不同數據長度下兩種噪聲的EHDE計算時間
由圖2可知:隨著數據長度的增加,EHDE的計算時間也隨之增加,在數據長度N≤512時,計算時間沒有顯著增加;而當數據長度N=1 024時,此時算法的計算時間幾乎是N=512時的兩倍,但根據圖1的結果,N=1 024和N=512獲得的復雜度測量結果是基本一致的。
因此,從復雜度測量性能與計算效率兩個方面考慮,筆者將長度設置為N=512是合理的。
1.3.2 性能對比分析
為了驗證EHDE方法相對于其他方法的有效性,筆者利用被證明具有優異性能的精細復合多尺度樣本熵(refined composite multiscale sample entropy,RCMSE)、精細復合多尺度模糊熵(refined composite multiscale fuzzy entropy,RCMFE)、精細復合多尺度排列熵(refined composite multiscale permutation entropy,RCMPE)、精細復合多尺度散布熵(refined composite multiscale dispersion,RCMDE)、精細復合多尺度波動散布熵(refined composite multiscale fluctuation dispersion entropy,RCMFDE)進行對比。其中尺度因子均設置為8。
每種方法的其他參數設置如表1所示。

表1 參數設置
隨后,筆者利用10組長度為N=512的WGN和1/f噪聲進行分析,利用EHDE和上述5種對比方法計算兩種噪聲的熵值,生成變異系數曲線,如圖3所示。

圖3 兩種噪聲的變異系數
由圖3可知:隨著分量的增加,6種方法的變異系數隨之增加,這是因為隨著層次分量和尺度因子的增加,層次序列和粗粒化序列的長度也顯著減小,從而導致熵值測量的誤差增大。
此外,RCMPE的變異系數最小,其次是EHDE,而變異系數反映了數據沿著平均值波動的幅度比例,數值越大意味著波動性越大,因此RCMPE的性能穩定性最好,而EHDE次之。
RCMSE的性能弱于RCMFE方法,而RCMFE是在RCMSE的基礎上進行改進得到的,這說明變異系數能夠評估算法的有效性。
野馬優化(WHO)算法是2021年提出的一種新的啟發式優化算法,該算法主要通過模擬野馬種群的各種生活行為來模擬尋優的過程[19-20]。
WHO的尋優過程包含三種行為,分別是放牧行為、交配行為、團隊領導行為。在該算法中,野馬個體的類型分為公馬、母馬和小馬駒,公馬職責在于領導種群中的其他個體。
在大多數時間里母馬和小馬駒處于放牧的過程中,其位置更新公式如下:
(11)
(12)
IDX=(P==0)
(13)
(14)
(15)

當小馬駒長大后,會遠離種群并開始交配行為,此時的位置更新方式為:
(16)

最后,領導者引領種群去往適宜的生存區域,對于已被占領的區域將進行爭奪,若失敗則會去往別的生存區域,領導者的位置更新方式為:

(17)

在種群的各種行為中,若出現了優于領導者適應度的個體,兩者會互換身份,定義如下:

(18)
式中:cost為適應度函數;StallionGi為種群領導者的位置;XG,i為種群個體的位置。
支持向量機因為泛化性強,適用于小樣本而被廣泛用于模式識別領域。但廣泛的研究表明,SVM中的懲罰系數C和核函數參數g對性能的影響非常大,如果設置不當可能會造成過擬合或欠擬合,進而影響模式識別的準確率[21]。
為此,筆者采用野馬算法對SVM的參數進行優化,具體的優化步驟如下:
1)初始化野馬算法的參數,分別是種群規模、最大迭代次數、領導者的比例和交配的概率等;
2)求解野馬種群個體的適應度值,生成野馬種群以及相應的領導者;
3)對野馬種群的位置進行更新,同時對野馬種群中領導者的位置進行更新;
4)更新野馬種群的適應度值,若野馬種群存在適應度值優于領導者適應度的個體,則按照式(18)替換領導者;
5)判斷當前是否達到了最大的迭代次數,如果是則結束循環,否則跳轉至步驟2);
6)輸出領導者的坐標,即為SVM分類器的參數組合。
在上述內容中,EHDE被證明具有優異的信號復雜度測量性能,能夠穩定和有效地分析非線性時間序列。為此,筆者將其用于齒輪箱故障振動信號故障特征的提取,結合野馬算法優化的支持向量機,提出了一種基于EHDE和WHO-SVM的齒輪箱故障診斷方法。
齒輪箱故障診斷具體流程如下:
1)假定齒輪箱有著K類工況,每類工況的樣本數量分別為M1,M2,…,MK,振動信號的長度為512;
2)計算每類每個樣本振動信號的EHDE值,得到K個故障特征集;
3)將K個故障特征集的每個故障特征集分為MK/2個訓練樣本和MK/2個測試樣本;
4)將訓練樣本輸入到WHO-SVM中進行訓練,建立參數最優的SVM分類器;
5)通過測試樣本對WHO-SVM分類器進行測試,根據分類器的輸出結果來判斷齒輪箱的故障工況。
實驗數據采用QPZZ-II齒輪箱振動數據集。該實驗平臺由一個0.75 kW變轉速的驅動電機、齒輪箱、配重盤、磁粉制動器和調速裝置組成;通過調整配重、磁粉制動器的負載電流和調速裝置的轉速,來快速模擬齒輪箱的不同故障和不同工況。
該齒輪箱實驗平臺如圖4所示。

圖4 齒輪箱實驗平臺
圖4中,齒輪箱包含1個模數為2,齒數為75的大齒輪以及1個模數為2,齒數為55的小齒輪,兩個齒輪的材料均為S45C,采用油潤滑,滾動軸承的型號為N205。電機的轉速為880 r/min,負載電流為0.05 A,傳感器的采樣頻率為5 120 Hz,傳感器的布置位置為輸出軸電機側軸承的Y方向。
筆者利用電火花技術在齒輪上加工出不同的故障,收集了齒輪箱在正常、點蝕、斷齒、磨損和點蝕磨損5種工況的振動信號,每種工況振動信號取100組樣本,樣本的點數為512。
5種信號的波形,如圖5所示。

圖5 齒輪箱振動信號的波形及頻譜
首先,筆者計算齒輪箱振動信號的EHDE,結果如圖6所示。

圖6 齒輪箱振動信號的EHDE值
由圖6可以發現:在不同的層次節點上,EHDE能夠較好地區分齒輪箱樣本,如在節點為1和2時,5種樣本的EHDE熵值具有非常大的差異。此外,在節點為1時,正常樣本的熵值小于故障樣本的熵值,這是因為在齒輪箱未發生故障時,振動信號中的成分主要是環境噪聲等成分已知的分量;而當齒輪箱發生故障后,振動信號中將出現各種頻率及其倍頻的成分,導致故障振動信號變得復雜,進而產生較大的熵值。
因此,可以證明EHDE可以較好地測量振動信號的復雜度,同時還可以區分正常和故障樣本。
隨后,為了進一步地識別齒輪箱的故障類型,筆者將故障特征輸入至WHO-SVM模型中進行故障的識別;同時,為了驗證EHDE方法的優越性,將由RCMSE、RCMFE、RCMPE、RCMDE和RCMFDE提取的故障特征輸入至WHO-SVM中進行故障識別。
故障識別結果如圖7所示。

圖7 6種故障診斷方法的故障識別結果
由圖7可以發現:EHDE-WHO-SVM方法在識別時,有3個樣本被錯誤地識別為其他類型的樣本,識別的準確率為98.8%,而其他故障診斷方法的準確率均低于該方法。這證明了EHDE方法的優越性,同時也證明其在數據長度較小時也能夠獲得準確的故障識別結果。
隨后,為了進一步對比特征提取的效率,筆者統計了6種方法的特征提取時間以及相應的識別準確率,如表2所示。

表2 6種方法的故障識別結果
由表2可知:EHDE方法的準確率最高,RCMDE方法的準確率次之,而EHDE的特征提取時間僅少于RCMPE方法,為37.54 s。
綜合來看,EHDE方法的準確率比RCMDE方法的準確率提高了4.8%,而特征提取時間多了23.56 s,但該時間成本能夠接受。
其次,為了進一步評估EHDE等6種方法的診斷穩定性,筆者將特征輸入至WHO-SVM中進行20次實驗,統計每次實驗的分類結果,如表3所示。

表3 多次實驗下不同算法的故障識別結果
由表3可知:EHDE的最大準確率、最小準確率、平均準確率均優于其他5種對比方法,證明了EHDE方法具有優異的診斷性能,能夠保證每次實驗都可以準確地識別齒輪箱的故障類型。
RCMPE的診斷性能僅次于EHDE方法,但其特征提取時間遠多于EHDE方法,因此EHDE的綜合性能遠優于RCMPE方法。
同樣的,RCMSE方法的平均識別準確率最低,這證明了RCMSE在提取短時間序列的故障特征時存在較大缺陷,而RCMFE方法的準確率高于RCMSE,更加證明了此次分析的正確性。
為了驗證數據長度對算法性能的影響,筆者對不同數據長度下6種方法的故障識別結果進行了分析,診斷準確率取20次實驗的平均結果,如表4所示。

表4 不同數據長度下6種方法的診斷結果
從表4可以發現:在不同數據長度下,EHDE方法的準確率都高于其他5種方法,即使數據長度僅為128,EHDE方法的平均識別準確率也達到了80%以上;當數據長度為256時,EHDE方法的平均準確率已經能夠達到90%以上,這證明了EHDE方法對數據長度的變化不敏感,即使數據長度較短,依然能夠獲得較為可靠的故障識別結果;當數據長度為1 024時,EHDE方法已經可以取得100%的識別結果,證明了EHDE方法的有效性。
此外,當數據長度為128時,RCMPE方法的準確率非常低,僅為66.16%;當數據長度為256時,平均識別準確率為76.4%;而當數據長度為512時,平均識別準確率已經高達97.8%,比前者提高了21.4%,這證明RCMPE方法對數據長度非常敏感。
最后,筆者對不同特征數量下的6種方法的識別準確率進行了對比分析,結果如圖8所示。

圖8 不同特征數量下6種方法的故障識別結果
由圖8可以發現:隨著用于分類的特征數量的增加:6種方法的故障識別準確率也隨之顯著增加,而EHDE方法在特征數量為4后,準確率曲線也在其他方法的上方,這證明EHDE方法僅需較少的特征即可以表征齒輪箱的故障特征;當輸入的特征數量達到5個時,EHDE方法的準確率達到最大,此后準確率反而降低,這是因為部分特征存在冗余,特征之間互相干擾,進而影響了故障識別的準確率。
綜上,EHDE方法在診斷穩定性、診斷精度和診斷效率方面都具有較強的性能,綜合指標優于其他5種特征提取方法。
為了對EHDE方法的泛化性進行分析,筆者對齒輪箱的轉速和負載電流進行了更換,當轉速為880 r/min時,負載電流分別為0 A、0.05 A、0.1 A和0.2 A;當轉速為1 470 r/min時,負載電流為0 A,上述5種工況依次稱為工況1、工況2、工況3、工況4和工況5;同時,考慮了傳感器的安裝位置對故障識別結果的影響。
傳感器的不同安裝位置如表5所示。

表5 傳感器的不同安裝位置
筆者采用EHDE方法對不同工況下不同來源的振動信號進行分析,并進行故障特征提取和故障識別,結果如表6所示。

表6 齒輪箱不同工況下不同傳感器的故障識別結果
從表6可以發現:傳感器1的故障識別準確率比較低,而其他傳感器的故障識別結果隨著工況的變化而變化,無法具體評估有效性,但總的來說除傳感器1外,其他傳感器都可以獲得較可靠的故障識別結果。此外,有負載工況的識別準確率要高于未受到負載的識別準確率,這是因為受到負載后,齒輪箱的振動信號會加劇,信號中的各種故障成分較多,因而故障屬性得到了加強。
筆者使用由傳感器2采集的振動信號進行了實驗,根據故障識別結果可以發現,該傳感器所取得的故障識別結果較為優異。
總之,EHDE方法可有效地識別不同工況和不同位置的齒輪箱故障。
為了進一步驗證EHDE和WHO-SVM故障診斷方法的泛化性,筆者利用東南大學提供的行星齒輪箱數據集進行實驗,實驗平臺如圖9所示。

圖9 齒輪箱故障模擬實驗裝置
在該實驗平臺中,電機的轉速為1 200 r/min和1 800 r/min兩種,對應的負載分別為0 Nm和7.68 Nm,筆者選擇1 800 r/min和7.68 Nm工況下的數據進行分析;通過布置在行星齒輪箱表面的加速度計以5 120 Hz的頻率,采集正常、齒輪裂紋、齒輪磨損、齒根裂紋和齒面磨損5種狀態下的振動信號。
每種工況振動信號取100組樣本,樣本的點數為2 048,5種信號的波形,如圖10所示。

圖10 齒輪箱振動信號的波形及頻譜
首先,筆者計算齒輪箱振動信號的EHDE,結果如圖11所示。

圖11 齒輪箱振動信號的EHDE值
由圖11可知:僅憑熵值曲線無法定量判斷齒輪箱的故障狀態,需要結合分類模型做進一步的評估。
隨后,筆者將故障特征輸入至WHO-SVM分類器進行故障識別,結果如圖12所示。

圖12 EHDE-WHO-SVM故障診斷結果
由圖12可知:有5個樣本被錯誤地識別了,識別準確率為98%,證明了該方法可以有效診斷齒輪箱的不同故障。
針對齒輪箱的故障識別對數據長度的要求較高、以及識別準確率不夠穩定的問題,筆者提出了一種基于EHDE和WHO-SVM的齒輪箱故障診斷方法,利用齒輪箱故障數據集,就該方法在診斷性能、診斷穩定性和診斷效率等方面的表現進行了實驗研究。
研究結論如下:
1)EHDE采用改進的層次化處理,可以有效地提取信號中的低頻和高頻特征,且具有較高的穩定性和較低的數據長度敏感性。WGN和1/f噪聲的仿真結果表明EHDE在數據長度為512時即可以獲得準確的復雜度測量結果,同時變異系數也小于RCMSE、RCMFE等4種方法,僅大于RCMPE方法;
2)EHDE可以有效地提取齒輪箱振動信號中的故障特征,故障識別準確率也達到了98.8%,20次實驗的平均識別準確率達到了99.1%,均高于其他5種方法;特征提取時間為37.54 s,僅少于RCMPE方法,具有相對優異的綜合性能;在另一個齒輪箱的故障診斷實驗中,EHDE取得了98%的準確率;
3)EHDE方法對數據長度的敏感性較低,在數據長度為256時,EHDE已經能夠取得90%以上的識別準確率;而當特征數量為5個時,EHDE方法的準確率最高,因EHDE優于其他5種方法;
4)EHDE-WHO-SVM的故障診斷方法可以有效地識別齒輪箱不同工況和不同來源的故障信號,特別是在受到負載時,各個傳感器的故障識別準確率都能夠達到90%以上,證明了該方法的通用性。
EHDE方法在識別中存在特征冗余,當輸入5個特征時即可以獲得最高的準確率。因此,后續筆者將結合降維算法對特征進行降維,以減小特征的冗余。