安 煌,趙榮珍
(蘭州理工大學 機電工程學院,蘭州 730050)
在借助于海量數據驅動實施智能決策技術中,初期遇到的首要問題之一是通過各種特征提取手段剔除無用冗余數據,提取有效特征子集[1]。在轉子故障診斷過程中,如何在故障數據集中有效地提取出有利于分類的特征子集,一直是以數據驅動的轉子機械故障診斷研究領域面臨的挑戰。因此,探討消除冗余信息、降低故障數據集維數的有效方法,對于全面挖掘出敏感且本質的故障特征信息矢量、降低故障分類的復雜度、提高故障識別準確率尤為關鍵[2]。
流形學習的顯著特征是利用局部幾何學習獲得高維數據蘊含的潛在低維結構,具有良好的非線性信息處理能力[3]。流形結構可分為局部流形結構和多流形判別結構兩大類,其中從局部流形結構學習的典型方法如:拉普拉斯特征映射(Laplacian eigenmapas,LE)[4],局部線性嵌入(locally linear embedding,LLE)[5],局部結構保持(locality preserving projections,LPP)[6],核局部保持投影(kernel locality preserving projection,KLPP)[7]等。KLPP是在LPP基礎上通過引入核函數,解決了LPP難以提取非線性數據近鄰結構的問題,其在保持局部近鄰結構的同時實現線性計算。但是KLPP本質上是一種線性無監督算法,在面對各類流形相近的情況時難以獲得具有強辨識能力的低維矢量。而面向分類的多流形學習成為當前流形學習發展的一個主流方向,典型的如邊緣判別分析(marginal Fisher analysis,MFA)[8],最大間距標準(maximum marginal criterion,MMC)[9],非參判別多流形學習(nonparametic discriminant multi-manifold learning,NDML)[10]等。其中,NDML從多流形學習的角度構造了一種基于異類近鄰的判別結構,使獲得的潛在低維嵌入具有較好的分類識別性能,但是它對非線性數據難以得到較好的分類效果。
傳統的流形學習方法多數采用歐氏距離,當處理非線性或存在離群點數據時容易導致近鄰誤判,嚴重限制了它在轉子故障數據分類中的應用,相關熵作為一種相似性度量方式,能很好地拒絕離群點,對處理非線性數據具有較好的魯棒性[11-12]。
受核局部保持投影算法(KLPP)和非參判別多流形學習算法(NDML)的啟發,本文提出了相關熵測度核局部保持多流形判別投影算法(correntropy kernel locality preserving multi-manifold discriminant projection,CKLPMDP)。CKLPMDP主要從兩個方面來提高原始KLPP算法的降維效果:一是采用相關熵測度度量樣本間的相似性,使樣本近鄰關系判斷更準確,提高算法的降維效果;二是尋求原始高維數據集的低維映射時,通過將原始空間統一映射到更高維的核空間,在保持數據局部流形結構的同時,融入多流形判別結構信息,最大化各流形間的距離,使嵌入在高維的低維流形具有更多的分類信息。預期目標是通過將該算法應用于轉子故障數據集的降維,為降低故障診斷難度提供理論參考依據。
給定兩個樣本x=(x1,…,xn)和y=(y1,…,yn)。相關熵測度可以表示為
D(x,y)=E[Kσ(x-y)]
(1)
式中:Kσ(·)是一個核函數;E是一個求期望運算。它利用核方法將輸入空間向高維空間做非線性映射,不同于傳統的核方法,它只與樣本對有關。實際應用中,樣本x和y的聯合概率密度函數通常是未知的,只有有限的數據可以使用。因此,相關熵被估算為
(2)
Kσ(·)可以取滿足MERCER理論的函數。本文取高斯核函數
(3)
傳統的歐氏距離在度量高維非線性樣本距離時,對不同屬性同等對待,當某一屬性值有噪聲時,樣本距離也會隨之突增。而相關熵距離度量更注重局部相似的屬性,它的值主要由與x=y呈正相關的核函數決定[13],比歐氏距離度量樣本相似性更穩定。
相關熵測度局部保持多流形判別投影算法采用相關熵測度度量樣本的相似性,避免了流形學習對含有噪聲特征敏感的缺點,并借鑒了核局部保持投影算法可以保持局部非線性流形結構的優點和非參判別多流形學習中構建的異類近鄰判別結構可以拉大不同流形間距離的思想。其基本思想:設原始空間中的樣本集X=(x1,x2,…,xN),定義從原始空間到高維核空間的非線性映射φ,相關熵測度核局部保持多流形判別投影算法的目標就是在核空間中尋求投影矢量W∈RD×d(d 借鑒核局部保持投影算法的思想,并針對該算法容易受含有噪聲特征的影響,導致局部鄰圖失真的缺點,本研究采用相關熵測度度量樣本的相似性,監督樣本近鄰圖的構建。該算法通過保持核空間中樣本的近鄰關系,實現數據的低維映射,使局部非線性流形結構得以保持。目標函數定義如下:當φ(xi)與φ(xj)為近鄰,則yi=WTφ(xi)與yj=WTφ(xj)也是近鄰關系,從而實現近鄰結構的保持。相關熵測度核局部保持算法的目標函數為 (4) 特征空間φ(X)=(φ(x1)φ(x2)…φ(xN)),并根據核再生理論,存在一組系數A=(α1,α2,…αN)T滿足W=φ(X)A,Si,j作為近鄰圖中的權重系數,其大小表示兩點的相近程度。空間中樣本點越相近相關熵取值越大,因此定義Si,j取值為 (5) 引入核矩陣K=(K(i,j))=φ(xi)Tφ(xj),則局部結構保持投影目標函數表示為 (6) KLPP通過保持核空間中數據點的近鄰關系實現對原始數據集局部結構的提取,但是KLPP對于相近流形的低維投影仍然會出現混疊問題,導致算法的分類性能較差。 2WTφ(xi)φ(xik)TW) (7) 引入核矩陣K=(K(i,j))=φ(xi)Tφ(xj),且存在一組系數A=(α1,α2,…,αN)T滿足W=φ(X)A,則改進的核化多流形判別投影目標函數表示為 (8) 改進的核化多流形判別投影目標函數的求解能夠使非線性數據集經過投影后,不同流形之間的距離拉大,但是對于局部流形結構難以得到保持。 結合本文相關熵測度核局部保持算法和改進的核化多流形判別投影算法的優缺點,構造相關熵核局部保持多流形判別投影目標函數,使得到的特征空間中,局部近鄰結構得到保持,不同流形之間的距離拉大,其目標函數定義如下 (9) 將目標函數轉化為廣義特征值的問題求解。采用拉格朗日乘子法,令分母為非零常數,即ATKLKA=C≠0,定義朗格朗日函數為 L(A,λ)=AT(KK+K′K′-2KK′)A-λ(KLKA-C) (10) 式中,λ為拉格朗日乘子。 將式(7)對A求偏導得 (11) 令偏導為零,即 (KK+K′K′-2KK′)A=λKLKA (12) 通過求解該廣義特征方程的前r個最大的特征值對應的特征向量得到最佳投影矩陣A=(α1,α2,…,αr)。 結合本文改進的相關熵測度核局部保持算法和核化多流形判別投影算法的優缺點,設計融合的CKLPMDP降維算法,其具體實現步驟如下。 步驟1數據集X∈Rd通過核函數映射到高維核空間H(X)∈Rh(h≥d),并采用式(1)為距離度量構建局部近鄰圖和異類近鄰圖。 步驟2根據式(6)構造相關熵測度核局部保持目標函數Jl(α),其中權重系數Si,j作為近鄰圖中兩點的相近程度。 步驟3根據式(8)構造核化多流形判別投影目標函數Jg(α)。 步驟4由式(9)計算整體目標函數J(α),并根據式(12)計算得到低維特征空間的r個基矢量A=(α1,α2,…,αr)T,并按照Y=AK計算數據集的r維投影。 步驟5對于新樣本,計算其與訓練樣本的核函數Kt,并按Y=AKt計算新樣本的低維投影。 相關熵測度核局部保持多流形判別投影算法的流程設計如圖1所示。具體實施步驟如下。 圖1 CKLPMDP的故障診斷流程圖Fig.1 The flow chart of the fault diagnosis of CKLPMDP 步驟1對機械振動信號進行采集,并對其進行小波消噪處理。 步驟2對消噪后的振動信號進行時域、頻域的特征提取,組成訓練集和測試集 步驟3將訓練集輸入CKLPMDP進行訓練,得到低維映射矩陣A。 步驟4通過得到的映射矩陣A對訓練集及測試集進行維數約簡,再將得到的低維敏感特征子集Y輸入KNN,進行故障模式辨識。 使用的原始數據來源于文獻[14]中的雙跨度轉子試驗臺,實驗振動信號通過布置在轉子實驗臺上的12個電渦流傳感器進行采集,在主軸轉速為2 800 r/min、采樣頻率為5 000 Hz的情況下,對該轉子實驗平臺分別進行了正常轉動、質量不平衡、軸系不對中、動靜碰摩及軸承松動實驗,分別得到以上五種狀態振動信號各80組,數據樣本長度為2 048,選取每類狀態中的50組作為訓練樣本,剩余的30組作為測試樣本。提取樣本集每個通道(共12個通道)的6個時域特征和10個頻域特征組成初始訓練特征集和測試集,其中時域特征包括均值,峰值,方根幅值,偏度指標,峭度指標和方差,頻域特征包括反映頻域振動能量大小的均值頻率,反映頻帶位置變化的頻譜二階矩和中心頻率等,反映頻譜分或集中程度的特征矢量等,各參數的計算公式參考文獻[15]。 為了驗證本文所提方法的特征提取效果,對本文所提方法進行仿真實驗,將特征壓縮提取出的前三維特征量,分別與KPCA、KLPP、MFA及采用歐氏距離度量方法的局部保持多流形判別投影降維方法(EKLPMDP)進行對比,如圖2所示(圖中符號“*”,“□”,“◇”,“Δ”,“○”,分別代表正常、不平衡、不對中、碰摩、松動),并將上述算法降維后得到的特征子集輸入到KNN中,得到的辨識準確率如表1所示。 (a) KPCA 表1 各降維算法及其KNN辨識準確率Tab.1 Classification indentification method and the KNN recognition accuracy 為了更好地說明本文所提CKLPMDP算法的可行性,本文引入文獻[15]中的評價指標Je來定量描述類間與類內散度。Je越大,則說明維數約減后類間樣本距離越大,類內樣本越聚集。類間散度Sb和類內散度Swi及兩者的比值Je計算公式如下 (13) (14) (15) 從圖2和表1、2中可知KPCA降維效果最差,因為全局方差最大化的結構保持方法應用到非線性分布數據時存在局限性;KLPP通過在核空間保持局部近鄰關系的方法對非線性數據得到較好的降維和識別效果,其中質量不平衡,軸系不對中,動靜碰摩樣本聚類效果很好,但軸系不對中和質量不平衡的類間距較小,軸承松動和正常轉動的樣本交叉耦合,沒有有效地分離;MFA同樣對軸承松動和正常轉動的樣本沒有有效分離,其它三種狀態分離效果較好;本文方法由于綜合考慮了局部流形結構和多流形判別結構信息,采用歐氏距離度量方法和相關熵測度的降維效果都優于其他降維算法,而且采用相關熵測度時,很好地將正常轉動、質量不平衡、軸系不對中、動靜碰摩及軸承松動五種狀態有效分離,且類內聚類效果最好,類間距離進一步拉開,評價指標Je達到了16.978,因此本文方法具有一定優勢,為轉子故障診斷提供依據。 表2 各個算法降維后的類間類內評價指標Tab.2 Each dimension reduction algorithm using the evaluation index in the classes 為進一步對比特征提取的效果,在不同轉速下采集五種狀態的振動數據,分別利用上述五種方法提取特征,采用KNN辨識準確率。各轉速的識別結果如表3所示。 表3 不同算法在不同轉速下的KNN辨識準確率Tab.3 KNN identification accuracy of different algorithms at different speeds 從表3可以看出,在不同轉速下,CKLPMDP降維方法的平均診斷準確率都明顯優于其他四種降維方法,說明本文方法具有良好的適用性。 為了進一步說明本文方法的通用性、有效性,在圖3所示的雙跨雙轉子實驗臺進行研究分析。12個加速度傳感器通過布置在每個軸承座的兩個徑向方向(X,Y)和一個軸向方向(Z)測取振動信號,2個非接觸式的電渦流傳感器測取轉軸的徑向振動信號。在該實驗臺上模擬轉速為2 800 r/min,采樣頻率為20 000 Hz的五種不同程度的不平衡狀態,圖3從左起第一個質量盤命名為負載盤1,第二個質量盤命名為負載盤2,在盤上添加若干質量為12 g的不平衡質量塊模擬不同程度的不平衡狀態,各狀態所加質量塊數量如表4所示。采集每種狀態的數據樣本80組,其中50組作為訓練樣本,30組作為測試樣本。針對每個通道的傳感器采集的振動信號分別提取時域、頻域共16個特征。 表4 不平衡狀態Tab.4 Unbalanced state 圖3 雙跨雙轉子綜合故障模擬平臺Fig.3 The double-span double-rotor integrated fault simulation platform 通過本文方法對轉子故障特征集進行降維,將特征壓縮后的前三維特征矢量三維可視化,如圖4(圖中符號“*”,“□”,“◇”,“Δ”,“○”,分別代表不平衡1,不平衡2、不平衡3、不平衡4、不平衡5),與其他降維算法對比KNN故障辨識準確率如表5(表中符號“b1”,“b2”,“b3”,“b4”,“b5”,分別代表不平衡1,不平衡2、不平衡3、不平衡4、不平衡5)。 圖4 測試樣本的降維效果Fig.4 Test sample reduction method result 從圖4可以看出,采用本文方法降維后的不平衡1與不平衡3故障樣本存在較小范圍的交叉混疊,其他不平衡故障分離狀態較好。從表5可知本文算法在不同程度的不平衡故障辨識過程中,傳統的降維算法故障辨識準確率較低,而本文CKLPMDP算法只有在第三種不平衡故障辨識率為96.7%,其余故障辨識準確率都是100%,說明本文算法具有較強的通用性和有效性。 表5 各降維算法及其KNN辨識準確率Tab.5 Classification indentification method and the KNN recognition accuracy 為實現高維非線性數據集的局部流形結構和多流形判別結構信息的全面提取,提出了一種CKLPMDP新算法,在傳統KLPP局部流形保持的基礎上融合了核化多流形判別結構信息,使降維后的特征空間包含更多分類信息。引入相關熵測度,樣本近鄰關系判斷更準確,使算法聚類效果更好。通過雙跨轉子實驗臺模擬數據集的實驗驗證表明,與其他方法相比,本文提出的相關熵測度核局部保持多流形判別投影算法(CKLPMDP)具有更強的降維能力和更高的故障辨識精度,為轉子故障診斷提供了新的解決思路。2.1 改進的相關熵測度核局部保持算法



2.2 改進的核化多流形判別投影算法



2.3 目標函數


2.4 CKLPMDP算法的具體實現步驟
3 CKLPMDP算法故障診斷流程

4 實驗與分析
4.1 實驗數據
4.2 改進算法的參數設定情況

4.3 降維效果的可視化對比與結果





4.4 算法的通用性實驗




5 結 論