戚曉利, 崔創創, 楊 艷, 程主梓, 陳 旭
(安徽工業大學 機械工程學院, 安徽 馬鞍山 243032)
行星齒輪箱具有質量輕、體積小、傳動比大、承載能力強、傳動效率高等諸多優點,因此廣泛應用于風力發電、航空、船舶、冶金、石化、礦山、起重運輸等行業的機械傳動系統中[1-2]。由于行星齒輪箱大多工作于工況復雜、環境惡劣的條件下,因此常常會導致太陽輪、行星輪和齒圈等關鍵部件發生嚴重磨損和疲勞裂紋等故障[3]。如果行星齒輪箱發生故障,而未及時采取措施,可能導致傳動系統失效,甚至會造成更嚴重的后果。因此,有必要提出一種方法對行星齒輪箱故障進行有效的識別和診斷。
行星齒輪箱故障診斷的關鍵在于從非平穩、非線性振動信號中提取出反映其運動狀態的故障特征信息[4],而采用時域、頻域、時頻域分析等線性方法處理非線性信號時難免會存在一定的缺陷[5]。近年來,隨著非線性技術的發展,基于熵的特征提取方法得到了快速發展,如樣本熵(sample entropy, SE)[6]、排列熵(permutation entropy, PE)[7]、模糊熵(fuzzy entropy, FE)[8]等。但是,SE,PE,FE等方法在提取故障信號特征時,都是在單個尺度上進行分析,僅度量單一時間序列的復雜度,可能會導致忽略其他尺度下的有用信息,從而影響后續的診斷準確性[9]。鄭近德等[10]在此基礎上,將時間序列進行粗粒化重構,提出了多尺度模糊熵(multiscale fuzzy entropy, MFE),通過對時間序列在不同尺度因子下復雜性的量度,克服了單一尺度熵值算法的不足,并成功將其應用于滾動軸承故障診斷中,取得了較好的效果。然而MFE在粗粒化過程中將原時間序列按照等間隔取樣進行重構,只生成了一組新序列,忽略了一部分隱藏在時間序列中的模式信息,因而降低了原始時間序列所蘊含信息的豐富程度。針對此問題,將時移方法與粗粒化重構相結合,Zhu等[11]提出了時移多尺度模糊熵(time-shift multiscale fuzzy entropy, TSMFE),通過在時間序列進行不同間隔的時間滑移,同時生成多組新的時間序列,這種粗粒化方式獲得的多組新時間序列可以保留更多原始時間序列模式信息,解決了MFE粗粒化過程中降低了原始時間序列信息豐富程度的問題,能深入挖掘原始序列所蘊含的信息,并將其成功應用于滾動軸承故障診斷中。雖然TSMFE相較于MFE能夠提取更加豐富的信息,較為完整的保留原始數據中的更多特征,但TSMFE仍然對時間序列的長度存在一定程度的依賴,若時間序列長度較短,仍可能會出現無效熵值的情況。為此,本文提出一種精細時移多尺度模糊熵(refined time-shift multiscale fuzzy entropy, RTSMFE),并將其應用于行星齒輪箱故障診斷中,用來提取行星齒輪箱的故障特征。
經過RTSMFE提取的故障特征維數較高,其中不僅包含故障信息,還可能夾雜一部分噪聲冗余信息,這些無關信息會影響故障診斷的準確度,因此需要進行維數約簡進而提取出便于識別、敏感的數據[12]。維數約簡分為線性降維和非線性降維,相對于線性降維方法,后者在處理具有非線性結構的數據時更具優勢。而流形學習作為一類經典的降維方法,能夠探測高維空間中蘊含的非線性結構,并在低維空間中進行重構,挖掘出高維數據的內在屬性,實現數據約簡及可視化[13]。經典的流形學習算法包括局部保持投影(local preserving projection, LPP)、拉普拉斯特征映射(laplacian eigenmaps, LE)、多維尺度變換(multi-dimensional scaling, MDS)、等距特征映射(isometric mapping, Isomap)、局部切空間規整(local tangent space alignment, LTSA)、監督等距特征映射(supervised-isomap, S-Isomap)等[14-19]。但上述方法并沒有考慮降維后樣本之間的類內共面緊湊性和類間共面可分性,可能會出現分類器識別精度不高,無法達到更好的降維效果。Huang等[20]提出了一種新的降維算法——正則化共面判別分析(regularized coplanar discriminant analysis, RCDA)充分考慮了這一點,通過提出一種歸一化矩陣來平衡共面投影和平均約束投影模型,使得樣本在線性變換之后的類內共面緊湊性最小化和類間共面可分性最大化,并成功用于人臉數據庫的識別。但是,RCDA在鄰域圖構建過程中僅僅考慮了樣本對之間的歐氏距離,而歐氏距離只能反映樣本點之間的空間位置關系,并不能全面衡量樣本之間的相關性。相比之下,馬氏距離既考慮了各種特征之間的關系,又可以消除變量之間相關性的干擾,非常適合測量樣本間的相對位置;另外RCDA作為一種線性降維方法在處理具有非線性結構的數據時具有一定局限性,而引入核函數可實現對具有非線性結構的數據進行降維。為此,本文提出基于馬氏距離的核正則化共面判別分析(Mahalanobis-kernel regularized coplanar discrimi nant analysis, M-KRCDA)方法來解決上述問題,并將其應用于行星齒輪箱故障診斷中。
經過M-KRCDA降維之后的低維故障特征可能無法定量從降維可視三維圖中判定樣本分類效果,降維結果中仍可能會出現各種故障類型樣本之間不同程度的重疊和混淆。為了更加直觀地描述行星齒輪箱低維故障特征的識別分類效果,需要對其進行模式識別。支持向量機(support vector machine, SVM)在小樣本、非線性等問題上具有一定的優勢,因此被廣泛應用于模式識別、故障診斷等領域[21]。支持向量機的分類性能易受到懲罰因子c和核參數g的取值影響,懲罰因子c選取不當,可能會出現“欠學習”、“過學習”現象,從而影響回歸模型魯棒性;而核函數g的取值過大或過小會導致樣本的劃分精細程度不同,進而出現“過擬合”、“欠擬合”。基于上述原因,本文將一種新提出且具有較好尋優效果的生物元啟發式算法——郊狼優化算法(coyote optimization algorithm, COA)[22]應用于SVM的參數優化中。
基于以上分析,本文提出了一種基于RTSMFE,M-KRCDA和COA-SVM相結合的行星齒輪箱故障診斷方法。試驗結果分析表明,該方法融合了RTSMFE方法在特征提取、M-KRCDA方法在維數約簡和COA-SVM方法在模式識別上的優勢,能夠有效、準確地診斷出行星齒輪箱的各種故障類型。
考慮到行星齒輪箱振動信號的非平穩、非線性的特點,本文將RTSMFE算法應用于行星齒輪箱的故障特征提取中,該算法提高了MFE與TSMFE的穩定性,解決了由于粗粒化不足導致的熵值不確定的問題,能夠更加有效地降低直接平均同一尺度下多個粗粒化模糊熵值導致出現無效熵值的概率。
MFE的具體的計算過程如下。
(1)
式中:τ為尺度因子;N為時間序列長度。
(2) 分別計算每一個粗粒化序列的模糊熵,并刻畫成尺度因子的函數,即
MFE(X,τ,m,n,r)=FuzzyEn(y(τ),m,n,r)
(2)
式中:m為嵌入維數;n為模糊函數梯度;r為相似容限。
由于MFE在粗粒化過程中會出現其粗粒化序列隨尺度因子不斷增大而減小的情況,從而導致熵值的可靠性和穩定性減弱。針對這個問題,Zhu等的研究結合時移方法的思想,提出了時移多尺度模糊熵(TSMFE)算法。其具體步驟如下。
步驟1給定的原始時間序列X={x(1),…,x(N)},通過式(3)對其進行粗粒化重構
yk,β=(xk,xβ+k,x2β+k,…,xΔ(β,k)β+k)
(3)
式中:k(1≤k≤τ)和β(β=τ)為正整數,分別表示時間序列的起點和采樣間隔;Δ(β,k)=(N-β)/k為上邊界個數。
步驟2當尺度因子為τ時,計算τ個時移粗粒化序列的模糊熵并求均值。
(4)
由于MFE存在粗粒化不足的缺點,計算出來的特征值可能會造成樣本數據的部分關鍵信息缺失,TSMFE雖然相較于MFE改進了粗粒化不足的缺點,提取的特征值能夠保留更多的樣本數據信息,但仍然會受到原始序列信息完整度的影響,對時間序列的長度存在依賴。如果時間序列的長度較短,導致可能出現無效熵值的情況。

步驟1對時間序列X={x(i),i=1,2,3,…,N},參照TSMFE計算過程,進行粗粒化重構得到新序列
yk,β=(xk,xβ+k,x2β+k,…,xΔ(β,k)β+k)
(5)
步驟2定義向量yk,β(i)和yk,β(j)之間的距離d[yk,β(i),yk,β(j)]為兩者對應元素中最大差值的絕對值。即

yk,β(j+h)]
(6)
步驟3將指數函數作為模糊函數
(7)

(8)
步驟4分別計算出尺度因子τ下每個粗粒化序列yk,β的m維以及m+1維空間向量個數,即
(9)
(10)

(11)

由于RTSMFE算法是以模糊熵算法為基礎算法, 參考Zhu等的研究,參數設定如下:① 尺度因子τ設置為25;②m一般設定為2;③ 相似容限r對算法影響較小,本文取0.15DS;④ 為了獲取較多的有用信息,n一般取較小的整數,本文取2;⑤ 時間序列長度N對熵值穩定性存在一定影響,接下來通過試驗選取。
為了研究時間序列長度N對RTSMFE的影響,分別使用數據長度為128,256,512,1 024,2 048,4 096的高斯白噪聲、粉紅噪聲以及藍噪聲作為原始數據進行分析,3種噪聲的不同數據長度仿真信號熵值曲線圖,如圖3所示。

(a) 白噪聲

(b) 粉紅噪聲

(c) 藍噪聲圖1 不同數據長度仿真信號RTSMFE熵值曲線圖Fig.1 RTSMFE entropy curves of simulation signals with different data lengths

(a) MFE

(b) TSMFE

(c) RTSMFE圖2 不同仿真信號計算結果Fig.2 Analysis results of different simulation signals

圖3 COA-SVM流程圖Fig.3 Flow chart of COA-SVM
從圖1中可以看出,RTSMFE在對3種噪聲數據進行分析時,當處理數據長度低于512,計算出來的熵值曲線波動比較明顯,顯得極不穩定。數據長度達到1 024時,RTSMFE對3種噪聲計算出來的熵值趨于穩定。因此在后續對行星齒輪箱數據進行分析時,為了能夠更加準確的描述行星齒輪箱故障狀態,采用時間序列長度N=2 048進行相關試驗。
為了驗證RTSMFE方法的有效性,分別使用RTSMFE,TSMFE,MFE對有色噪聲數據的白噪聲、粉紅噪聲、藍噪聲以及紅噪聲進行分析。時間序列長度為2 048,試驗結果如圖2所示。
從圖2可以看出:MFE計算出來的白噪聲的熵值與其他幾種噪聲的熵值存在一定的交叉,而且藍噪聲和粉紅噪聲的熵值出現了一定程度的混疊;相較于MFE,TSMFE的計算結果更好一些,基本上實現了4類噪聲的分離,但是其白噪聲和粉紅噪聲的熵值還存在著一些交叉;RTSMFE則完全實現了4類噪聲的分離,各類噪聲的熵值之間未出現任何交叉,驗證了本文所提的RTSMFE的有效性。
由RTSMFE得到的特征向量所構造的樣本集可能存在高維度和無法可視化的問題,導致識別準確率不高,為了更好地實現數據挖掘和模式識別,本文采用提出的M-KRCDA算法實現維數約簡及數據可視化。
該算法首先建立共面投影和平均約束投影模型,但這兩個投影模型無法同時優化。為了解決該問題,Huang等提出一種歸一化投影矩陣平衡這兩個模型,使得樣本在線性變換之后的類內共面緊湊性最小化和類間共面可分性最大化,由此建立RCDA模型。其基本原理如下。
(1) 建立共面投影和平均約束投影模型,即

(12)

(2) 提出以下模型尋找歸一化投影矩陣W∈Rm×d來平衡式(12)的模型,使得在線性變換之后具有平均l2正則化的類內以及類間線性表示的誤差最小化,并將該模型改寫成緊湊表示的矩陣形式,稱為類內、類間共面緊湊性


(13)

(14)


(15)

RCDA方法在計算樣本對之間的平均距離時僅考慮樣本對之間的歐氏距離,但歐氏距離只能反映樣本點之間的空間位置關系,對于強相關的故障特征集,如果仍使用歐氏距離來度量,可能會無法準確測量出故障樣本之間的相對位置。與歐氏距離不同,馬氏距離既考慮了各種特征之間的關系,保持特征之間的尺度不變(即獨立于測量尺度),又考慮了維度的影響,消除了變量間相關性的干擾,十分適合測量樣本間的相對距離。因此本文將馬氏距離引入RCDA算法進行度量。馬氏距離的定義如下
(1) 分別定義兩個變量:A={Ai|i=1,…,n},B={Bi|i=1,…,n},然后計算A和B的協方差矩陣
(16)

(2) 向量A和向量B的馬氏距離的計算如下
(17)
由于RCDA是一種線性降維方法,在處理非線性、非平穩振動信號上具有局限性。而核方法能夠通過一個非線性映射將數據中的所有樣本映射到一個高維甚至是無窮維的空間,使其線性可分。正是由于核方法具有該特點,線性降維算法能夠借助核函數來實現對原始空間中具有非線性結構的數據降維。核方法的原理如下。
設高維空間中的兩個向量x,y∈X,X屬于R(n)空間,非線性函數Φ實現輸入空間X到特征空間F的映射,其中F屬于R(m),n?m,則

(18)
式中:〈·〉為內積;K(x,y)為拉普拉斯核函數。
對于高維空間樣本集X={x1,…,xi,…,xN},xi∈RD,M-KRCDA方法的流程如下。
步驟1確定輸入的高維空間樣本訓練集和對應的類標簽集,以及迭代次數T。
步驟2數據預處理,計算出核矩陣K,然后中心化核矩陣得到Kp。
步驟3初始化,使W=E,迭代次數t=0。

(19)



步驟7如果t≥T,轉步驟9。
步驟8設置t=t+1,返回步驟3。
步驟9得到W。
郊狼優化算法(COA)是一種新的全局優化元啟發式算法,該算法受北美郊狼的社會組織結構和環境適應能力的啟發,主要考慮了郊狼之間的社會結構以及經驗交流,通過計算郊狼的出生、死亡以及環境適應能力,從而得到更能適應社會結構和環境的郊狼個體。該算法的具體步驟如下。
步驟1參數初始化。初始化總體郊狼數量;初始郊狼社會條件、評估郊狼在當前社會條件下的適應性,該算法使用訓練樣本三折交叉驗證后的平均識別率作為適應度函數;所謂三折交叉驗證,就是訓練樣本數據隨機的分成3份,每次隨時的選擇2份來訓練樣本,然后選擇損失函數評估最優的模型和參數。接著定義每一個種群的阿爾法狼

(20)

步驟2計算種群的社會文化傾向

(21)
式中,Op,t為[1,D]內每個j時間內種群所有郊狼的等級社會條件。
步驟3對每只郊狼進行社會條件的更新,評估新的社會條件,然后判斷新的社會條件是否比舊的社會條件更能適合郊狼種群生存

(22)

(23)

步驟4計算郊狼出生和死亡以及狼群之間的變換概率Pe
(24)
(25)
式中:r1和r2為來自狼群的隨機郊狼;j1和j2為出生和死亡這個問題的隨機維度;Ps為分散概率,定義為Ps=1/D;Pa為關聯概率,定義為Pa=(1-Ps)/2;Rj為決策變量界限內的隨機數;rndj為以均勻概率生成的[0,1]內的隨機數;Nc為每個郊狼群中郊狼的個數。
步驟5更新郊狼的年齡,然后重復步驟2~步驟4,直到滿足迭代終止條件,輸出最能適應新環境的郊狼。
支持向量機是一種針對樣本預測的機器學習方法,具有泛化能力強、收斂全局最優等特點,但其性能易受懲罰因子c和核函數參數g的影響,c,g的選取不當會使得數據分類過程出現“過擬合”、“欠擬合”,進而影響分類的時間和準確度[23]。本文將郊狼優化算法(COA)應用于SVM的參數尋優中去,提出了一種郊狼優化支持向量機算法(COA-SVM)。該算法使用訓練樣本三折交叉驗證后的平均識別率作為適應度函數。COA-SVM流程如圖3所示。具體步驟如下。
步驟1輸入訓練集與測試集樣本,并對訓練集和測試集樣本進行歸一化處理。
步驟2初始化SVM和COA參數。
步驟3初始化狼群,然后評估郊狼的適應能力。
步驟4進行迭代尋優,尋找適應新環境的郊狼的社會條件,計算出適應新環境的郊狼。
步驟5判斷是否滿足迭代條件,確定計算是否繼續,若繼續則重復進行迭代尋優;否則計算終止。
步驟6輸出全局最優參數組合(即最優參數c和g),并將其用于SVM預測模型的構建,然后利用訓練好的預測模型對測試集進行測試。
為了驗證COA-SVM分類器能夠對分類樣本進行準確識別和分類,將其應用于UCI數據庫中的6種數據集(數據集描述如表1所示)分類過程,并與粒子群優化支持向量機(particle swarm optimization-SVM, PSO-SVM)、核極限學習機(kernel based extreme learning machine, KELM)、遺傳優化算法優化支持向量機(genetic algorithm-SVM, GA-SVM)、蝙蝠優化支持向量機(bat algorithm-SVM, BA-SVM)以及K最近鄰分類器(K-nearest neighbor, KNN)的分類效果進行了對比(各分類器參數設置如表2所示)。為了避免分類器識別數據的準確率出現偶然性,本文使用6種分類器分別進行了50次重復試驗,取50次重復試驗的平均識別準確率和平均用時進行對比,計算結果如表3和圖4所示。

表1 6種數據集描述Tab.1 Description of six data sets

表2 分類器參數設置Tab.2 Classifier parameter Settings

表3 不同分類器對6種數據集分類用時Tab.3 Different classifiers take time to classify six data sets

圖4 不同分類器對6種數據集識別率Fig.4 Recognition rate of different classifiers on six data sets
根據表3和圖4可知:① COA-SVM對6種數據集的識別率相較于PSO-SVM,KELM,GA-SVM,BA-SVM和KNN均有不同程度的提高;② COA-SVM對6種數據集的平均識別用時相比于PSO-SVM,KELM,GA-SVM,BA-SVM和KNN均大幅度縮短。由此驗證了COA-SVM能夠對樣本進行快速準確、有效的識別和分類。
在1.3節、2.2節、3.2節理論分析的基礎上,本文提出一種基于精細時移多尺度模糊熵(RTSMFE)和馬氏距離的核正則化共面判別分析(M-KRCDA)以及郊狼優化算法優化支持向量機(COA-SVM)的行星齒輪箱故障診斷模型,流程圖如圖5所示,該模型具體步驟如下。

圖5 故障診斷方法流程Fig.5 Fault diagnosis method flow
步驟1在一定轉速下以采樣頻率fs采集行星齒輪箱在不同狀態下的加速度振動信號。
步驟2使用RTSMFE方法,提取每組振動信號的特征值,構建原始高維故障診斷集。
步驟3采用M-KRCDA算法對高維故障特征集進行降維,去除原始高維特征集中的冗余信息,進一步提取低維、敏感特征子集。
步驟4利用COA-SVM多故障分類器對低維故障特征集進行訓練與測試,判斷故障類型。
采用美國Spectra Quest公司開發的動力傳動系統故障診斷綜合試驗臺進行原始振動信號的采集。該試驗機固定在工作臺上,由變速驅動電機提供動力,經過2級行星齒輪箱將動力傳輸至2級平行齒輪箱,裝置最終由磁粉制動器提供負載。驅動電動機和磁粉制動器由相應調節器來控制,以模擬不同轉速和負載等工況環境,試驗平臺如圖6所示。本次試驗中,行星齒輪箱基本參數,如表4所示。其中,輸入軸轉速為2 083r/min,負載扭矩為14 N·m,利用2號加速度傳感器分別采集第一級太陽輪正常和具有缺齒、磨損、裂紋等故障的振動加速度信號,采樣頻率為5 120 Hz,通過滑動時間窗口得到各組樣本,其中滑動窗口包含2 048個采樣點,滑動步長為一個窗口。通過加窗分別提取太陽輪4種運行狀態振動信號各50組,共計200組樣本。4種狀態的加速度振動信號時域波形,如圖7所示。

(a)

(b)圖6 行星齒輪箱故障診斷平臺Fig.6 Planetary gearbox fault diagnosis platform

表4 行星齒輪箱基本參數Tab.4 Basic parameters of planetary gearbox

圖7 行星齒輪箱4種運行狀態振動信號的時域波形圖Fig.7 The domain waveform of vibration signals in four operating states of planetary gearbox
本文采用RTSMFE算法提取行星齒輪箱振動信號的特征值,從而構建出高維故障診斷集,RTSMFE的參數設置如1.4節所述。通過對原始信號運行RTSMFE算法可以得到一個200×25的高維故障特征矩陣,200代表4類狀態下行星齒輪箱故障樣本各50組,25代表高維故障特征維數為25。與MFE,TSMFE方法進行對比,MFE,TSMFE的參數設置如下:① 設置MFE尺度因子τ=25,嵌入維數m=2,相似容限r=0.15DS,指數函數梯度n=2,時間序列長度N=2 048;② 設置TSMFE尺度因子τ=25,嵌入維數m=2,相似容限r=0.15DS,指數函數梯度n=2,時間序列長度N=2 048。4種狀態的MFE,TSMFE和RTSMFE熵值曲線,如圖8所示。
從圖8可知:由MFE所計算出來的熵值在尺度因子較大時已經出現了一定程度的重合和混淆;TSMFE相較于MFE來說,優化了MFE的缺陷,但是仍出現部分的重疊;而RTSMFE沒有出現重疊和交叉,熵值曲線基本穩定。為了量化RTSMFE方法的特征提取效果以及驗證本文所提COA-SVM方法分類的有效性,分別應用COA-SVM,PSO-SVM,KELM,KNN,BA-SVM和GA-SVM方法對經過RTSMFE算法提取的故障特征進行分類。為了和后續試驗保持一致,仍采用200組樣本進行試驗。在這200組樣本中,隨機選取每類樣本10組信號作為訓練樣本,剩余40組信號作為測試樣本。6種分類器的參數設置參照表2。不同分類器對未降維故障樣本識別率和用時結果,如圖9、圖10所示。

(a) MFE

(b) TSMFE

(c) RTSMFE圖8 行星齒輪箱不同狀態下的3種熵值曲線Fig.8 Three kinds of entropy curve in different states of planetary gearbox

圖9 不同分類器對未降維測試樣本識別準確率Fig.9 Recognition accuracy of different classifiers for test samples without dimensionality reduction

圖10 不同分類器對未降維測試樣本識別時間Fig.10 Recognition time of test samples without dimensionality reduction by different classifiers
由圖9和圖10可知,COA-SVM相較于PSO-SVM,KELM,GA-SVM,BA-SVM和KNN在識別率上有了一定程度的提高,并且在分類用時上也明顯少于上述5種方法。從對數據集不同類型樣本識別率和樣本分類用時上,COA-SVM均優于所對比方法,驗證了本文所提方法的有效性。
從圖9可知,由于高維故障特征中存在冗余信息,導致分類器對個別樣本數據產生誤判,為了達到更好的識別效果,因此有必要消除高維故障特征集中的冗余信息的影響。本文將M-KRCDA應用于行星齒輪箱高維故障特征集的維數約減過程中,將其與RCDA、Isomap、深度置信網絡(deep belief network, DBN)[24]、LPP、LE、LTSA、MDS、S-Isomap等方法進行對比。在參數設置過程中,對比算法的參數是在多次試驗之后確定的最優值。以上9種算法降維映射目標維數均為3,Isomap,S-Isomap,LPP,LE,LTSA的近鄰點參數分別設置為100,43,45,53,80;DBN的層數設置為4層,為[200, 50, 20, 3],迭代次數為100,學習速率為0.1。9種方法降維后的三維可視化結果,如圖11所示。

圖11 9種方法降維結果Fig.11 Dimension reduction results of nine methods
從圖11可知: Isomap,LE,LPP,MDS降維后都出現了不同程度的混疊;S-Isomap,RCDA,DBN,LTSA雖然基本上將4類樣本進行了分類,但存在聚集性不高的缺陷;M-KRCDA算法則實現了4類樣本的有效分離。上述試驗證明了M-KRCDA算法在對行星齒輪箱高維故障特征集進行維數約減的有效性。
為了量化上述9種方法的降維效果,計算降維后的4類樣本間的類間散度Sb與類內散度Sw的比值作為衡量降維性能的指標來衡量降維性能,比值越大則說明降維效果越好。表5為經過9種方法計算得到的4類樣本間的類間散度Sb與類內散度Sw及其比值。由表5可知,相比較于其他8種算法,M-KRCDA算法降維后4類樣本類間散度與樣本類內散度之比最大,驗證了M-KRCDA算法相較于其他算法有一定優勢。

表5 9種算法降維性能對比Tab.5 Comparison of dimensionality reduction performance of the nine algorithms
為了更加直觀地描述上述9種算法的降維效果,將經過不同降維方法得到的低維故障樣本分別輸入到COA-SVM中進行故障模式識別,COA-SVM參數設置與表2相同,故障識別率如表6所示。與LE,MDS,DBN,LPP,S-Isomap,LTSA,RCDA,Iso-map 等方法相比,經M-KRCDA算法降維后的低維故障樣本在COA-SVM中具有最佳的識別效果,驗證了該算法的有效性。為了排除由于應用單一分類器而出現的偶然性,將經過不同降維算法得到的低維故障樣本分別輸入到PSO-SVM, KELM,GA-SVM,BA-SVM,KNN和COA-SVM中進行故障模式識別,參數設置與表2相同。6種分類器對不同降維算法得到的低維故障樣本識別率,如圖12所示。

表6 不同算法降維后COA-SVM對測試樣本的識別率Tab.6 Recognition rate of COA-SVM for test samples after dimension reduction by different algorithms
從圖12可知,與S-Isomap,LTSA,LPP,LE,DBN,MDS,Isomap和RCDA等方法相比,M-KRCDA方法特征壓縮結果在不同分類器下均具有最高的樣本識別準確率,其中,M-KRCDA+COA-SVM方法對行星齒輪箱故障識別率達到了100%,驗證了本文所提方法的有效性。

圖12 不同分類器下測試樣本準確識別率Fig.12 Accurate recognition rate of test samples under different classifiers
(1) 提出一種衡量時間序列復雜性的方法——精細時移多尺度模糊熵(RTSMFE),該方法在一定程度上解決了MFE,TSMFE粗粒化過程的不足。試驗結果表明,相比于MFE和TSMFE方法,RTSMFE方法更能有效提取表征行星齒輪箱不同故障類型的特征信息。
(2) 提出一種M-KRCDA降維方法。該方法一方面將馬氏距離與RCDA相結合,應用于距離矩陣的構建,另一方面將核方法思想引入到RCDA中,實現對具有非線性結構的數據的降維映射。行星齒輪箱高維故障特征集降維試驗結果表明,該方法降維效果優于S-Isomap, Isomap,DBN,LTSA,MDS,LE,LPP,RCDA等方法。
(3) 將郊狼優化算法應用于支持向量機的優化(COA-SVM),該方法能夠自適應的選取參數對數據樣本進行模式識別,行星齒輪箱低維故障類型識別試驗結果表明,COA-SVM分類準確率優于PSO-SVM,KELM,GA-SVM,BA-SVM,KNN等方法,且分類用時最短。
(4) 建立一種基于精細時移多尺度模糊熵(RTSMFE)、基于馬氏距離的核正則化共面判別分析(M-KRCDA)和郊狼優化算法優化支持向量機(COA-SVM)的行星齒輪箱故障診斷模型。通過試驗結果分析表明,本方法對故障樣本的識別率達到了100%,能夠準確、有效的診斷出行星齒輪箱的不同故障類型。
盡管如此,本文所提方法仍存在不足之處,如M-KRCDA算法中的部分參數還需要人工選定,以及變轉速情況下行星齒輪箱的混合故障該如何準確識別分類,目前正對這些問題進行研究和完善。