候雙珊, 鄭近德, 潘海洋, 童靳于, 劉慶運
(安徽工業大學 機械工程學院,安徽 馬鞍山 243032)
行星齒輪箱作為旋轉機械重要的部件之一,由于質量小、傳動比大、工作平穩等獨特優點,在直升機、卡車和風力渦輪機等許多機器的傳動系統中得到了廣泛應用。行星齒輪箱在實際運行過程中由于工作環境惡劣且承受動態重載,導致齒輪經常發生斷齒、點蝕、裂紋、磨損等故障。這些故障不僅威脅到設備的安全性和可靠性,嚴重時會造成重大經濟損失、甚至人員傷亡。因此,深入研究行星齒輪箱故障診斷方法對于保證設備的穩定安全運行具有重要意義。
當齒輪發生故障時,振動信號的非線性動態特征不可避免地會發生變化,傳統的線性分析方法受其固有特性的限制,不能有效地處理這類信號。隨著非線性動力學理論的發展,許多非線性動力學分析方法,如分形維數[1]、近似熵(appropriate entropy,ApEn)[2]、樣本熵(sample entropy,SampEn)[3]等被應用于故障診斷中。但ApEn和SampEn都只對單個序列進行復雜性測量,忽略了兩個不同時間序列間模式的同步性、相似性與互預測性,且近似熵定義中為了避免ln(0)的出現,存在自身數據段的比較,導致出現自匹配的問題,存在偏差[4]。針對ApEn這一缺陷,文獻[5]引入了交叉近似熵(cross appropriate entropy,CAE)來分析兩個相關時間序列之間的異步程度。CAE在設計思路上與ApEn非常相似,其不同之處僅在于它比較了兩個不同的時間序列,因此不會產生自匹配的偏差。Richman等[6]提出交叉樣本熵(cross sample entropy,CSE)的概念,用于解決CAE對數據長度十分敏感和相對一致性差的問題。然而CSE會由于時間序列變短產生熵值突變,文獻[7]選擇適用于較短數據集的模糊熵(fuzzy entropy,FuzzyEn)代替SampEn,提出了交叉模糊熵(cross fuzzy entropy,CFE),結果表明CFE具有更好的穩定性和相對一致性。
研究表明,這些單一尺度的非線性動力學分析方法很難揭示真正的動態耦合。為了反映不同尺度上的動力學特性,Costa等提出了多尺度熵(multi-scale entropy,MSE)[8],用于心律變異性研究,文獻[9-11]將MSE用于旋轉機械的故障診斷。Yan等[12]結合粗粒化的多尺度方式將CSE擴展到多尺度,提出了多尺度交叉樣本熵(multi-scale cross sample entropy,MCSE),MCSE解決了耦合系統的多尺度特征,提供了多個時間尺度上異步的非線性指數。受此啟發,本文將CFE擴展到多尺度,同時文獻[13]表明傳統粗粒化過程縮短了時間序列的長度,可能會產生不精確的熵估計,針對傳統粗粒化的缺陷,本文采用復合粗粒化的方式對時間序列進行多尺度分析,提出了復合多尺度交叉模糊熵(composite multi-scale cross fuzzy entropy,CMCFE),用來衡量兩個時間序列的同步性、相似性和互預測性。
基于CMCFE在特征提取上的優勢,同時采用螢火蟲算法優化支持向量機(firefly algorithm optimization support vector machine,FA-SVM)[14]對故障類型進行識別,在此基礎上,提出了一種基于CMCFE和FA-SVM的行星齒輪箱故障診斷方法。最后,通過試驗數據驗證了所提方法的有效性,結果表明,與基于MSE,多尺度模糊熵(multi-scale fuzzy entropy,MFE)和復合多尺度交叉樣本熵(composite multi-scale cross sample entropy,CMCSE)的故障診斷方法相比,論文所提故障診斷方法具有較強的故障特征提取能力和較高的故障類型識別精度。
交叉模糊熵是由交叉樣本熵推廣而來,可以衡量時間序列之間的同步性。兩時間序列越同步,其交叉模糊熵具有越小的取值[15],具體算法如下:

(1)
其中,
(2)
(3)
(4)
(5)

(6)
(7)
式中,r和n分別為指數函數邊界的寬度和梯度。
(3) 定義函數
(8)
再將嵌入維數m擴展到m+1,得到
(9)
(4) 定義交叉模糊熵為
(10)
實際上,數據點的數量N是有限的,并且當數據長度為N的情況下,通過上述步驟得到的結果是CFE的估計值,可以記為
CFE(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)
(11)
復合多尺度交叉模糊熵的計算方式如下:
將歸一化時間序列復合粗粒化。對長度為N的歸一化時間序列ui={u1,u2,…,uN}和vi={v1,v2,…,vN},預先給定嵌入維數m和相似容限r,依據歸一化序列建立新的粗粒向量
(12)
(13)


(14)
在同一尺度下,計算粗粒化后的兩個序列xk,j(τ)、yk,j(τ)的交叉模糊熵,再對τ個熵值求平均,即該尺度因子下的CMCFE,并將其視為尺度因子的函數,稱之為CMCFE分析。其中在計算每兩個粗粒序列的交叉模糊熵時,相似容限r不變,為0.1SD~0.25SD。(SD是原歸一化數據的標準差)。
CMCFE是對兩個不同時間序列之間同步性或相似性的量度,同時也是對相互交叉的兩個時間序列自身復雜性的衡量,從幾何的角度解釋為:① 如果在大部分尺度上,兩個時間序列X和Y的交叉模糊熵比X和V的交叉模糊熵小,那么就認為X和Y的同步性或相似性更高;② 對于互相交叉的兩個時間序列而言,如果其CMCFE曲線隨著尺度因子增大而減小,這意味著兩者中至少存在一個時間序列僅在最小尺度上包含較多有用信息,如隨機白噪聲。
CMCFE計算有三個參數,包括嵌入維數m、指數函數邊界的寬度r及梯度n。參考文獻[16]中對每個參數選擇進行了詳細探討,本文取m= 2,n= 2,r= 0.15SD。
在單個時間序列分析方法中,白噪聲的MSE曲線隨著尺度因子增大而減小,而1/f噪聲的MSE曲線隨著尺度因子的變化而趨于平穩,且大部分尺度上熵值高于白噪聲,這說明白噪聲相較于1/f噪聲所包含的信息較少,結構簡單。因此,對于兩個時間序列而言,白噪聲序列與1/f噪聲序列的同步性要低于兩個白噪聲序列之間的同步性,高于1/f噪聲序列與1/f噪聲序列的同步性,且CMCFE、CMCSE值的仿真結果與同步性成反比。為此仍采用常見隨機白噪聲和1/f噪聲為模擬信號將CMCFE與CMCSE對比分析,來進行驗證并解釋兩種方法的差異。根據交叉的兩個噪聲序列的不同組合情況分為三組:(a)白噪聲與白噪聲交叉;(b)白噪聲與1/f噪聲交叉;(c)1/f噪聲與1/f噪聲交叉。每種情況的仿真數據各采用40組樣本進行交叉,每組樣本中兩序列長度均為2 048點。分別求其CMCSE和CMCFE的均值和標準差并繪制相應曲線。結果如圖1所示。

圖1 兩個噪聲序列的CMCSE和CMCFE
從圖1可以看出,無論是CMCSE還是CMCFE,在大部分尺度上都有:(a)<(b)<(c),這與理論結果相符。這說明,CMCSE和CMCFE能有效的反映兩個時間序列的同步性和復雜性。同時,兩種方法對比還可以發現:圖1(b)中三條CMCFE曲線相較于圖1(a)中對應的三條CMCSE曲線有更小的標準差;圖1(a)中白噪聲序列與1/f噪聲序列、兩個1/f噪聲序列的CMCSE曲線存在一定波動且有部分重疊。因此,CMCFE對于三種不同組合的區分效果要優于CMCSE。
在獲得特征向量后,需要一種計算效率高、泛化性能優越的分類器,定量區分不同工作狀態下的故障特征。本文采用支持向量機對行星齒輪箱狀態進行智能分類。然而SVM的性能在很大程度上取決于懲罰因子c和核函數g的選擇,因此需要采用優化算法搜尋最優參數組合以實現最優的分類性能。螢火蟲算法(firefly algorithm,FA)模擬了自然界中在夜間發光、傳遞信息、相互吸引的螢火蟲,每只螢火蟲在其鄰域結構內根據同伴的亮度和吸引力進行移動更新,從而實現位置優化[17]。與遺傳算法(genetic algorithm,GA)[18]、粒子群優化算法(particle swarm optimization,PSO)[19]等傳統優化算法相比,FA在處理多模態函數以及尋找全局最優解方面具有更高的效率和成功率[20]。FA-SVM的整體流程如下:
步驟1初始化算法的基本參數,如螢火蟲的數目、光吸收系數、最大吸引力、最大迭代次數和步長因子;
步驟2隨機初始化螢火蟲的位置,計算每個螢火蟲所在位置處的目標函數值,確定其絕對亮度;
步驟3計算螢火蟲之間的相對亮度和相對吸引力,根據相對吸引力確定螢火蟲的運動方向;
步驟4更新螢火蟲的空間位置;
步驟5更新目標函數值及螢火蟲的絕對亮度;
步驟6若滿足終止條件,則停止搜索;否則返回步驟3繼續執行;
步驟7將最優位置的坐標分別賦值給懲罰因子c和核函數g,建立優化SVM模型。
基于此,提出一種基于復合多尺度交叉模糊熵和FA-SVM的行星齒輪箱故障診斷方法,診斷流程如圖2所示。具體步驟如下:

圖2 診斷流程圖
步驟1針對行星齒輪箱不同工作狀態下的振動信號,在每種狀態下取長度為L的M個樣本,計算各種狀態與正常狀態下振動信號的CMCFE,將20個尺度的特征值作為故障特征向量;
步驟2從每種狀態計算出的CMCFE值中隨機選取N組數據作為訓練樣本,剩余的M-N組數據作為測試樣本;
步驟3將訓練樣本的故障特征向量輸入到基于FA-SVM的多故障分類器進行訓練;
步驟4利用測試樣本驗證上述經過訓練的多分類器的分類精度,依據分類器輸出結果實現行星齒輪箱的故障診斷。
為了檢驗所提故障診斷方法的實用性,將其應用于試驗數據進行分析,同時,為了突出所提出方法的優越性,進行了一系列對比試驗。試驗采用的低速重載軸和輪系故障與全周期壽命預測模擬試驗臺結構如圖3(a)所示。行星齒輪箱中,太陽輪,行星輪和齒圈齒數分別為21,31和84,行星輪數3,模數1.5。圖3(b) ~ 圖3(e)模擬了太陽輪斷齒、點蝕、裂紋和磨損4種故障。振動信號通過安裝在行星齒輪箱外殼上的加速度傳感器進行采集。在采樣頻率為10 kHz,電機轉速為900 r/min,負載為0的工作條件下,試驗采集了太陽輪正常和四種故障狀態下的振動加速度信號。五種狀態對應的時域波形如圖4所示。對于齒輪每種狀態,選擇長度為1 024的40個樣本,共200個樣本。

圖3 低速重載軸和輪系故障與全周期壽命預測 模擬試驗臺及太陽輪故障類型

圖4 時域波形
為了說明CMCFE分析方法的優越性,將其同MSE,MFE和CMCSE對齒輪正常、斷齒、點蝕、裂紋和磨損五種狀態的振動信號進行對比分析,由于MSE和MFE只對單個時間序列進行復雜性測量,因此僅采用單一狀態的振動信號進行分析,而衡量兩時間序列相似性的CMCSE和CMCFE方法均采用每種狀態振動信號與正常狀態振動信號進行交叉熵分析。MSE,MFE,CMCSE和CMCFE分析方法在齒輪不同狀態下(每種狀態40個樣本)的熵均值與標準差曲線如圖5所示,四種方法的參數選擇均與上述1.3節中一致。

圖5 不同狀態齒輪的MSE,MFE,CMCSE和CMCFE
由圖5可以看出:① 在大部分尺度上五種狀態齒輪對應的熵均值從大到小排列依次為點蝕,磨損,斷齒,裂紋和正常。這是因為:齒輪發生點蝕故障時,會以成塊的形式發生剝落,造成齒面凹坑,嚴重地破壞了齒型的正確性,此時齒輪振動信號與正常齒輪振動信號的相似性大幅降低,熵值最高;正常齒輪振動信號主要成分以嚙合頻率及其高次諧波為主,當發生磨損故障時,齒輪振動信號主要成分仍以嚙合頻率及其高次諧波為主,各成分在頻譜的幅值增強[21],但復雜性高,仍表現為較強的隨機性,與正常齒輪振動信號的相似性不高;而當齒輪發生斷齒和裂紋故障時,振動信號的周期性明顯增強,復雜性降低,與正常齒輪振動信號的相似性高,熵值較低;最后,顯然正常齒輪振動信號與正常齒輪振動信號的相似性最高,熵值最低;② MSE和CMCSE分析方法中太陽輪斷齒與裂紋故障的熵均值曲線非常接近,難以區分,且CMCSE曲線中點蝕故障在尺度因子τ=20時出現由于樣本長度過短導致熵值未定義的情況;③ MFE曲線中小尺度下的熵值交叉重疊嚴重,大尺度下斷齒與裂紋故障熵值標準差也存在較大重疊,區分效果均不理想;④ CMCFE中五組曲線在大部分尺度上標準差重疊較小且曲線平滑,相較于其他三種方法,CMCFE的區分效果更好。
為了更精準地對行星齒輪箱的故障模式進行自動識別,構建了一種基于CMCFE和FA-SVM的新型多分類器,以提高決策效率。具體步驟如下:
步驟1對每種齒輪狀態各取40個樣本,每個樣本長度為1 024,共得到200個樣本。將每個樣本數據進行歸一化處理后,分別計算五種狀態與正常狀態下振動信號的CMCFE值,將20個尺度的熵值作為故障特征向量;
步驟2從每種狀態計算出的CMCFE值中隨機選取20個樣本作為訓練樣本,剩余20個作為測試樣本,五種狀態共計訓練樣本和測試樣本各100個;
步驟3將100個訓練樣本的故障特征向量輸入到基于FA-SVM的多分類器中進行訓練,為了方便,令1,2,3,4,5分別表示斷齒、點蝕、裂紋、磨損故障和正常狀態;
步驟4利用測試樣本驗證上述經過訓練的多分類器的分類精度,最終輸出故障診斷結果。
將上述步驟1、步驟2中的CMCFE分別換成CMCSE,MFE和MSE進行對比分析,圖6顯示了基于不同故障特征提取方法和FA-SVM的識別結果,由圖中可以看出,基于CMCFE+FA-SVM方法的識別效果最好,齒輪五種狀態的識別準確率高達100%,其中FA-SVM的參數c和g最優組合為34.19和3.14;而基于CMCSE+FA-SVM的方法識別準確率為97%,與本文所提方法對比驗證了模糊熵的優越性;基于MFE+FA-SVM和MSE+FA-SVM的方法識別準確率分別為98%和97%,與本文所提方法對比驗證了交叉熵的優越性。上述分析結果進一步說明了基于CMCFE和FA-SVM的方法在故障特征提取和故障類型診斷方面具有一定的優越性。

圖6 基于不同故障特征提取方法和FA-SVM的識別結果
本文提出了CMCFE來衡量兩個時間序列的同步性、相似性和互預測性。通過仿真信號與CMCSE進行對比,并將其應用于行星齒輪箱故障診斷,得到如下結論:
(1) CMCFE能有效的反映兩個時間序列的同步性和復雜性,且表現出優于CMCSE的穩定性和可靠性。
(2) 提出了一種基于CMCFE和FA-SVM的行星齒輪箱故障診斷方法,通過分析處理行星齒輪箱試驗數據,與MSE,MFE以及CMCSE進行對比,結果表明論文所提方法的故障特征提取能力更強,故障類型識別精度更高。