黃日進
(廣西英華國際職業學院,廣西 欽州 530213)
數控機床軸承是一種常用的易損部件,其在生產制造及應用環節對軸承故障類型的診斷分析均有重要的實際意義和經濟價值。軸承的振動信號是由機床設備的加速度計傳感器等采集的反映軸承部位運行狀態的時間序列,是軸承這一動力學系統的運動軌跡表征。軸承故障類型的診斷關鍵在于不改變信號刻畫的動力學系統特性的情況下,強化不同類型故障信號之間的特征差異,從而提高診斷判別的準確性。
在復雜的生產環境干擾及數控機床各部件的振動調制疊加影響下,軸承故障信號包含著大量的高低頻和沖擊噪聲。傳統的故障信號分析方法多以在頻域、時頻域中展開的方式進行,如能量譜[1]、快速譜峭度[2]等,此類方式存在頻譜成分的耦合度高、信號的非平穩特征難以表達、原始信號的變換流程長等不足。而且信號故障類型診斷過程需從多域指標篩選出能反映主要差異的維度,這與流形學習理論關注尋找低維流形在高維空間中相同拓撲的嵌入這一目標高度契合。因此,為提升故障類型信息密度、提高判別分類準確度,引入這一種新的路線。Su等[3]將流形學習應用于信號特征融合,構建了基于線性局部切空間排列算法的特征重建方法,用于故障類型識別。Liu等[4]將振動信號的小波分析分解結果作為高維特征集的尺度指標,經線性局部切空間排列算法約減為區分度更好的低維特征集,提升了故障分類的準確率。然而,現階段在以多域指標構建高維特征集的研究過程中,存在對專家知識和原始數據特性依賴度高的問題。
筆者針對信號的時域振動形態特征,從故障類型診斷主要關注的差異性信息入手,提出一種基于流形學習理論的特征增強方法。首先,將信號時間序列進行相空間重構,在子相空間的集合中計算信息熵,構建出原始信號在高維特征空間中的表征。然后,通過等距特征映射(Isometric Feature Mapping, ISOMAP)算法,基于保持樣本集的流形距離,尋找特征空間中同胚的低維流形,來進行故障類型的分類診斷。最后使用德國帕德博恩大學開放的軸承運行數據集[5]對所提方法的有效性進行驗證分析。
在存在環境和系統噪聲的情況下,軸承振動信號可以看作一個非線性、非平穩動力系統的時域運動軌跡。不同故障類型引起的動力系統變化,會刻畫出不同的運動軌跡,即通過研究振動信號的軌跡特征便可建立與故障的聯系。
利用相空間重構方法,先將采集信號的時間序列重建至高維相空間內。對于一個給定的長度為N的振動信號時間序列x(t)=[x1,x2,…,xN],其嵌入相點表達為:
Xi=[xi,xi+τ,…,xi+(m-1)τ],i=1,2,…,N-(m-1)τ
(1)
式中:m為子相空間維數,m的值應當保證相點內存在有統計學意義的相對變化;τ為延遲時間,τ>0,對于低頻信號或振動軌跡變化慢的信號,可以增大取值或通過自相關函數法[6]來定量確定。
對Xi進行原地排序,對排序結果的坐標序列k進行如下變換:
(2)
式中:1是與k等長的全為1的序列;k′刻畫了對應子相空間Xi中點的相對變換趨勢。此時定義集合K為:
K={k′|i=1,2,…,N-(m-1)τ}
(3)
K中元素的去重數量為m!,計算K的信息熵分量:
E(kl′)=-p(kl′)logp(kl′),l=1,2,…,m!
(4)
式(1)中m的取值若過大,會使子相空間序列均勻化,也增加了運算的復雜度;若過小,則丟失了運動軌跡趨勢特征的意義;因此,m取值以3~7為適宜。
以式(4)構造初始振動信號x(t)的特征空間表征x:
x=[E(k1′)E(k2′)…E(km!′)],x∈Rm!
(5)
包含p個信號的樣本集D為:
D={x1,x2,…,xp}
(6)
構造集合D內樣本的距離矩陣G,其中xij是指樣本xi到xj的歐氏距離:
(7)
若樣本集包含q類故障,樣本數量p可表示為不同類型故障數量之和:
p=p1+p2+…+pq
(8)
根據樣本集不同類型故障數量,定義樣本的鄰域:
(9)
根據鄰域δ大小更新距離矩陣G,集合D內每一樣本與其他元素前δ小的距離保持為歐式距離,其余更新為+∞。
將更新后的距離矩陣G作為ISOMAP算法[7]輸入,可得樣本集D在低維特征空間中的同胚流形Z:
Z={z1,z2,…,zp}
(10)
在實際的軸承故障診斷場景中,還需要將經過特征增強的故障類型數據構造的單故障或復合故障進行多類型標簽,以訓練故障分類器,流程如下:①收集數控機床軸承信號的待測數據及在相同工況下擁有已知故障類型的訓練數據;②所有數據以相同子相空間維數m和延遲時間τ的相空間重構法展開;③在展開的子相空間中,計算各部分信息熵,構建m!維特征向量;④以訓練數據集在特征空間中的高維流形為基礎,通過ISOMAP算法計算同胚的低維流形表達;⑤對訓練集數據的低維流形映射以多標簽模式標記故障類型,訓練分類器;⑥計算待測數據在步驟④中得到的低維流形表示;⑦代入步驟⑤中的故障類型分類器,獲得待測數據的故障類型標簽。
最終完整的數控機床軸承故障診斷框架示意圖,如圖1所示。
采用德國帕德博恩大學開放的軸承運行數據集對文中方法進行驗證,數據集的采集條件在文獻[5]中給出。從該數據集中選取一組健康軸承、三組擁有單一故障的軸承和一組擁有復合故障的軸承振動數據,如表1所列。

表1 實驗涉及的數據集故障信息描述表
數據集中除健康軸承外,出現故障的位置包括內圈和外圈,故障類型有疲勞點蝕和塑性形變,每個代碼對應的子數據集包含不同工作負載下80個采樣信號,采樣頻率64 kHz,采樣時間4 s。以3∶ 2的數量比在每個子集中抽取訓練集和測試集,即48個訓練信號,32個測試信號,確保兩個集合擁有相似的故障類型分布。用一個有序二元組標記故障的位置及類型,其中疲勞點蝕為1,塑性形變為2。
從每個類型的訓練信號中抽取一個樣本,繪制其0.1 s的時域波形,如圖2所示。

圖2 五種類型的信號樣本時域波形
將訓練集信號以延遲時間τ為1,嵌入維數m為3進行相空間重構。計算子相空間的信息熵分量,并在維數為3!=6的特征空間里找到一個表征。相同類型的訓練集信號在特征空間中有著鄰近的分布。通過ISOMAP算法計算6維特征空間中的低維時域流形,算法的鄰域大小定義為每類故障的訓練集數量,即為48,最終得到如圖3所示的低維分布圖。

圖3 五種類型訓練數據的低維流形分布
結合圖3展示的分布數據與表1中的標簽訓練分類器,文中選取了三類工程常用的分類器作為對比:隨機森林分類器、決策樹分類器和支持向量機分類器。160組測試信號數據經過與訓練數據相同的處理后,代入訓練完成的故障分類器進行驗證,測試結果如表2所列。

表2 三種分類器對測試數據的分類結果 /%
表中復合故障的部分正確識別了外圈或內圈的一種故障,同時另一處被識別為健康;完全正確指準確識別了外圈和內圈的所有故障。實驗結果表明,隨機森林分類器對文中的軸承故障數據特征強化方法配合度最好,常見分類器對單故障尤其是健康狀況軸承的識別有較好的成功率。
將流形學習理論應用于數控機床軸承信號故障診斷領域,提出一種基于ISOMAP的時域流形特征強化方法。軸承振動信號的時域流形刻畫了部件的動力學運動軌跡,能反映故障發生帶來的系統動力學變化。以時域流形特征為標的能避免在其他域的變換流程過長及信息損失問題。ISOMAP將流形距離作為集合內樣本間的距離度量,相同類型的樣本在變換過程中被保持在較小的鄰域,而異類信號間通過流形距離度量會展現出更大的差異性,契合了信號故障分類診斷所關注的數據特性。
從德國帕德博恩大學軸承故障實驗的開放數據集中,選取了包含單一故障和復合故障的五組數據,對文中方法進行驗證。驗證結果表明,所提方法能夠強化數控機床軸承信號的故障類型特征,尤其對健康和故障部件類型數據之間有較明顯的區分,對復合故障類型也具有一定的識別能力。