周建民 黃熙亮 熊文豪 王云慶 夏曉楓
(①華東交通大學載運工具與裝備教育部重點實驗室,江西 南昌 330013;②軌道交通基礎設施性能監測與保障國家重點實驗室,江西 南昌 330013)
滾動軸承作為工業設備中核心部件,倘若在運行中出現故障,將會帶來難以估計的損失[1-2]。故對其故障診斷必不可少。其中對軸承振動信號特征提取是故障診斷的核心步驟[3]。近年來,有關滾動軸承傳統的故障特征提取方法從時域、頻域和時頻域等中提取相關特征指標[4]。但由于滾動軸承的故障信號存在非平穩性,在時域、頻域中難以提取簡單有效的故障表征特征[5-6]。因此,針對滾動軸承故障特征提取方法還需不斷加深研究。
近年來隨著圖信號不斷快速發展,傳統信號處理方法開始擴展圖信號處理,使得圖信號處理[7](graph signal processing,GSP)成為信號分析處理中重要的分支。目前,圖信號處理方法已經廣泛應用于氣候變化及圖像處理等領域[8-9],然而該方法在滾動軸承故障診斷領域應用較少。
相較于傳統振動信號處理方法,圖信號方法是研究振動信號關系的圖結構。復雜網絡是一種特殊的圖結構,對于非平穩性信號,能夠很好地捕獲特征。可視圖算法(visibility graph, VG)[10-13]是一種能將時間離散序列轉變成復雜網絡的算法。由于機械振動信號也屬于一維時間序列,因此將振動信號轉換成可視圖復雜網絡。近年來,已有部分學者開始初步進行研究。高藝源等[14]將圖譜指標直接應用在滾動軸承故障特征提取中,將振動一維信號轉換成圖的形式,與傳統時域和頻域方法對比,體現出該方法的優越性。陳芒等[15]通過改進圖結構數據,提出了可視圖圖譜幅值熵的概念,將振動信號轉換成可視圖信號,并由此計算得到故障特征參數,最后采用馬氏距離識別滾動軸承故障類型。
將圖信號處理方法應用于滾動軸承故障診斷領域,提出一種可視圖圖譜信號特征提取的故障診斷方法。通過將滾動軸承振動信號轉變可視圖信號,計算鄰接矩陣和拉普拉斯矩陣的特征值與特征向量,得到相應的圖譜指標,結合支持向量機分類算法實現滾動軸承故障診斷分類。通過實驗驗證分析,與傳統的故障特征提取方法相比,能有效對不同類型的滾動軸承進行識別,更能有效地區分不同程度外圈故障,突出該方法的優勢。
為了充分獲取軸承振動信號的故障信息,需要將一維離散時間序列轉化成圖結構數據。圖主要由節點及節點間的連邊組成,而鄰接矩陣可以表示圖中節點與節點之間關系的度量,是一個二維數組存放頂點間關系的矩陣。其圖結構如圖1所示。圖中橫坐標n1-n5為振動數據序列號,縱坐標表示每個時間節點的信號值大小xi。虛線表示圖數據中的2個頂點有邊連接,邊的距離加權方法可參考歐式距離式(1)。

式中:鄰接矩陣w分別是由節點vi值 與節點vj值通過歐式距離公式得到,這種歐式距離計算所得出的鄰接矩陣彌補了等權加值的缺陷,可以描述節點vi與節點vj之間的差異性,并且節點之間差異性的大小可以通過歐式距離來定量體現,更加客觀地表示出軸承采樣信號的差異性。
可視圖數據的構建是基于路圖構建思想[7]而來,其可視圖的可視性可參考式(2)。

式中:取兩個相鄰頂點 (n1,x1)與 (n2,x2),那么對于下一個頂點 (n3,x3),其中n1<n2<n3,通過可視圖準則可以發現,若頂點 (n3,x3)與頂點 (n1,x1)計算得到的斜率大于頂點 (n2,x2)與頂點 (n1,x1)計算得到的斜率,則頂點(n3,x3)與頂點(n1,x1)可視。通過可視圖的可視準則計算后,可將可視圖信號圖譜化,如圖2所示,將圖1的可視圖信號相應可視圖譜化。通常的路圖只考慮了相鄰兩個點之間的聯系,如圖3所示,而可視圖[15]既保持了原有的路圖結構形式,且從圖2中可以看出,同時又考慮了頂點與其他頂點的關聯,擴大了其視野范圍,相比于通常的路圖形式,可以揭示出振動信號中更多的隱藏信息。

圖1 可視圖信號

圖2 可視圖圖譜

圖3 路圖
將采集的軸承振動信號通過可視圖構建后,計算各訓練樣本的鄰接矩陣和拉普拉斯矩陣的特征值與特征向量,并基于此計算相應的圖譜指標,具體公式見表1所示,表中 λi與μi分別為鄰接矩陣特征值和拉普拉斯矩陣特征值。最后,計算每個訓練樣本的9個圖譜指標組成特征向量空間,作為滾動軸承的初始特征指標。

表1 可視圖圖譜指標
為更好地比較出各個特征指標的優劣,本文采用雙樣本Z值[16]來評估樣本特征之間的差異。當特征值的Z值越大時,就能表明區分樣本的能力越強,選擇其區分能力強作為軸承優選特征。雙樣本Z值定義如下。

式中:i、j分別表示第i類和第j類;p表示第p個故障特征;Xi和Xj分別表示第i類的第p個特征值集合和第j類的第p個特征值集合;、和、分別為上述特征值集合的標準差和均值;ni和nj為對應的樣本數量。
支持向量機(support vector machine,SVM)可以用于解決模式識別中的二分類及多分類問題。SVM算法的具體步驟如下所示。
首先,假設只考慮兩類故障樣本特征集合

式中:xi代表故障特征向量,有n維;yi代表標簽類別,共有兩類。在這兩類樣本中,可以通過核函數形成超平面,這里以線性核函數為例,得到的分類超平面為式(5),由式(5)可以計算點x到超平面的距離,如公式(6)所示。

因此,對于最優超平面問題可以用拉格朗日乘數法可以解決,對于不能用線性超平面分類的數據,可以利用非線性核函數將其映射到高維特征空間,從而建立最優分類超平面。此時,通過拉格朗日乘法將最優問題變成

約束條件為

式中:K(xi,xj)是將訓練樣本映射到高維特征空間中的核函數,在轉換高維空間后得到最優分類超平面結果如下

式(9)表示通過核函數K(xi,x)將訓練樣本映射到高維特征空間;式(10)表示在高維空間后建立的最優超平面。因此,超平面分類問題可以表示成式(11)。

上述推導是通過SVM算法實現二分類問題,對于滾動軸承故障種類有多種,可以選擇多個二分類SVM算法作為分類器,從而對滾動軸承的故障進行分類。
基于圖譜指標特征提取的滾動軸承故障診斷流程如圖4所示,具體可以分為以下幾個步驟:

圖4 故障診斷流程圖
(1)將滾動軸承振動信號轉換成可視圖,分別計算每個訓練樣本的鄰接矩陣和拉普拉斯矩陣,并得到相對應的特征值與特征向量。
(2)分別計算每個訓練樣本的圖譜指標,通過雙樣本Z值選出前3個最大值,并由此選取對應的特征向量構成數據的故障特征向量。
(3)采用支持向量機算法,通過訓練樣本訓練好超平面。
(4)在經過訓練的 SVM模型中輸入測試樣本,從而實現滾動軸承的故障診斷分類。
通過對滾動軸承的外圈、內圈和滾動體的特征提取,對所提出的方法進行了驗證,采用美國(case western reserve university,CWRU)電氣工程實驗室的實驗數據[17],其提供球軸承實驗的正常和有故障數據(包括輕度和重度故障,通過故障直徑和深度來區分)。該實驗臺測試軸承型號為6205-2RS JEM SKF 深溝球軸承,軸承轉速為 1 750 r/min,采樣頻率f=12 kHz,每次采樣的長度N=2 048。電機軸承故障使用電火花加工來接種,軸承的內圈、外圈以及滾動體的故障直徑為0.177 8 mm,深度為0.279 4 mm。
利用安裝在滾動軸承驅動端基座上的加速度傳感器來采集不同軸承在運行時產生的振動數據,對滾動軸承內圈故障、外圈故障、滾動體故障和正常軸承的振動數據采集,分別在其4種狀態下取一個樣本,其時域波形如圖5所示。

圖5 滾動軸承不同類型故障振動信號時域波形圖
分別從上述4種狀態下的數據各采集20個樣本,每個樣本長度為2 048,共有80個數據樣本。將80個數據樣本分成測試樣本和訓練樣本兩部分,訓練樣本取每種狀態下的5個數據樣本,測試樣本取剩余的15個數據樣本。準備好訓練樣本和測試樣本后,其故障診斷流程如圖4所示。首先,將20個樣本數據全部進行0-1標準化,然后通過式(2)將振動數據轉換成可視圖結構數據,得到相應的可視圖結構數據后,計算其鄰接矩陣和拉普拉斯矩陣,再分別計算得到鄰接矩陣特征值和拉普拉斯矩陣特征值。通過計算出的特征值得到表1的9個圖譜指標,之后計算每類樣本間的雙樣本Z值,選擇雙樣本Z值前3個最大值作為故障特征輸入向量,最后采用樣本為 1~5、20~25、40~45、60~65序列號數據作為訓練樣本訓練模型,其余數據作為測試樣本。
將其滾動軸承振動信號轉換成可視圖之后的得到9個圖譜指標,通過分別計算選取特征向量的雙樣本Z值,并將得到的雙樣本Z值大小通過折線圖方式展示,如圖6所示。
圖6中,a~f分別表示4種狀態下兩兩之間的雙樣本Z值。通過計算上述每種情況的雙樣本Z值分析可得:第一個特征指標與第8個和第9個特征指標區分能力相同,將以上6種情況對應的雙樣本Z值相加,計算得到前3個最大雙樣本Z值作為本次的故障特征向量輸入。最后選擇圖能量指標、類拉普拉斯矩陣不變量指標以及圖拉普拉斯能量指標作為本次的故障特征向量。對選取后的故障特征指標進行三維可視分析,得到圖7。可以看出經過圖譜特征提取后,內圈故障、滾動體故障、外圈故障和正常軸承的特征值有一個比較顯著的區分,具有良好的聚集性,而且不同類型之間的故障基本上無重疊現象。總體上來看,通過該方法提取得到的特征展現出較高的類內相似度和較低的類間相似度,更有利于后期的滾動軸承模式識別。

圖6 滾動軸承不同故障類型的雙樣本Z值

圖7 各類軸承的圖譜指標特征值
將處理好的訓練樣本數據作為SVM算法的特征向量輸入,由于每一個特征向量大小差異很大,為了消除這種差距,對每一個輸入特征采用0-1標準化來減少每一個輸入特征之間的差異,將其輸入到SVM算法模型中,訓練得到最優超平面。將測試樣本數據輸入到已經訓練好的SVM模型中,輸出滾動軸承故障類別,最后將測試樣本得到的類別與訓練樣本的已知的類別作為比較,分別如圖8和9所示。

圖8 訓練樣本

圖9 測試樣本
可以看出,在少樣本的訓練情況下,通過基于圖譜信號的特征提取,依舊可以將每種故障模式區分開,在最后測試樣本下的滾動軸承故障識別,依舊和訓練樣本保持高度的一致性,有較高故障識別率。
為了進一步說明該方法的優越性,選擇8個時域特征指標,分別為均值指標、均方根指標、峰峰值指標、偏度指標、峰度指標、波形因子指標、峰值因子指標以及裕度因子指標。
依舊計算每兩類的雙樣本Z值,按照同樣的方法選擇本次故障特征輸入向量,通過計算得到,最終選取均方根值指標、峰度指標以及裕度因子指標作為本次的故障特征輸入向量。將該故障向量輸入到SVM診斷模型中,得到的結果與圖譜指標計算得到的結果見表2。

表2 基于不同方法特征提取結果
由表2可以看出,在識別正常軸承和滾動軸承時,根據時域指標進行的特征提取方法存在著一定的識別數目,然而采用基于圖譜指標的特征提取方法,在正常軸承和滾動體故障情況下均只有1個識別錯誤。通過計算得到,采用基于圖譜指標的特征提取方法識別正確率為96.67%,而在時域特征提取下的故障識別正確率僅為88.33%,進一步表明基于圖譜信號進行特征提取能夠準確的捕捉不同滾動軸承故障信息,其特征提取效果優于傳統的時域特征提取方法。
為了橫向驗證本文方法的有效性,對滾動軸承的外圈不同故障深度進行故障識別,依舊采用,CWRU電氣工程實驗室的實驗數據[17],電機軸承故障使用電火花加工來接種,軸承的外圈故障直徑分別為 0.177 8 mm、0.355 6 mm 以及 0.533 4 mm。對外圈不同故障直徑的滾動軸承和正常軸承的數據進行采集,并分別在4種狀態下選取1個樣本,其時域波形如圖10所示。

圖10 滾動軸承外圈不同故障振動信號時域波形圖
首先,將80個樣本數據全部進行0-1標準化,然后通過公式(1)將振動數據轉換成可視圖結構數據,得到相應的可視圖結構數據后,計算其鄰接矩陣和拉普拉斯矩陣,再分別計算得到鄰接矩陣特征值和拉普拉斯矩陣特征值。通過計算出的特征值得到表1的9個圖譜指標,之后計算每類樣本間的雙樣本Z值,最后選擇雙樣本Z值最大前3個,將其作為故障特征輸入向量,最后采用樣本為1~5,20~25,40~45,60~65 序列號數據作為訓練樣本,其余數據作為測試樣本。
分別從上述4種狀態下的數據各采集20個樣本,每個樣本長度為2 048,共有80個數據樣本。該80個數據樣本分成測試樣本和訓練樣本兩部分,訓練樣本取每種狀態下的5個數據樣本,測試樣本取剩余的15個數據樣本。準備好訓練樣本和測試樣本后,其故障診斷流程如圖4所示。
將滾動軸承振動信號轉換成可視圖之后,算其鄰接矩陣和拉普拉斯矩陣,再分別計算得到鄰接矩陣特征值和拉普拉斯矩陣特征值。通過表1中求出相對應的9個圖譜指標,分別計算選取特征向量的雙樣本Z值,如圖11所示。
圖11 中,a~f分別表示 0.177 8 mm 外圈故障與0.355 6 mm 外圈故障數據的雙樣本Z值、0.177 8 mm外圈故障與0.533 4 mm外圈故障數據的雙樣本Z值、0.177 8 mm外圈故障與正常軸承數據的雙樣本Z值、0.355 6 mm 外圈故障與 0.533 4 mm 外圈故障數據的雙樣本Z值、0.355 6 mm外圈故障與正常軸承數據的雙樣本Z值、0.533 4 mm外圈故障與正常軸承數據的雙樣本Z值。按照上述選擇方法,同樣選取雙樣本Z值的最大前3個作為本次的故障特征向量輸入。最后選擇圖能量指標、特征值的平均絕對值偏差指標以及特征值絕對值偏差指標作為本次的故障特征向量。對選取后的特征指標進行三維可視分析,得到圖12。

圖11 外圈故障不同直徑深度的雙樣本Z值

圖12 外圈不同故障直徑的圖譜指標特征值
可以看出,經過圖譜特征提取后,0.177 8 mm、0.355 6 mm、0.533 4 mm 外圈故障直徑以及正常軸承的特征值有一個比較明顯的區分,具有良好的聚集性,而且不同故障直徑基本上無重疊現象。總體上來看,通過該方法提取得到的特征展現出較高的類內相似度和較低的類間相似度,更有利于后期的滾動軸承故障識別。
將處理好的訓練樣本數據作為SVM算法的特征向量輸入,由于每一個特征向量大小差異很大,為了消除這種差距,對每一個輸入特征采用0-1標準化來減少每一個輸入特征之間的差異,將其輸入到SVM算法模型中,訓練得到最優超平面。將測試樣本數據輸入到已經訓練好的SVM模型中,輸出滾動軸承故障類別,最后將測試樣本得到的類別與訓練樣本的已知的類別作為比較,分別如圖13和14所示。可以看出,在少樣本的訓練情況下,通過基于圖譜信號的特征提取,依舊可以將每種故障模式區分開,在最后測試樣本下的滾動軸承故障識別,依舊和訓練樣本保持高度的一致性,有較高故障識別率。

圖13 訓練樣本

圖14 測試樣本
為了進一步說明該方法的優越性,選擇8個時域特征指標,分別為均值指標、均方根指標、峰峰值指標、偏度指標、峰度指標、波形因子指標、峰值因子指標以及裕度因子指標。
通過采用雙樣本Z值選擇本次的故障特征輸入向量,通過結果分析,最終選擇選取裕度因子指標、峰度指標以及波形因子指標作為本次的故障特征輸入向量。將該故障向量輸入到故障診斷模型中,與圖譜指標得到的結果見表3。

表3 基于不同方法特征提取結果
由表3可以看出,基于時域指標的特征提取方法在識別正常軸承的情況下有較多錯誤,同時,在識別0.177 8 mm外圈故障下也會產生一定的錯誤,然而采用基于圖譜指標的特征提取方法,只在正常軸承情況下有3個識別錯誤。通過計算得到,采用基于圖譜指標的特征提取方法識別正確率為95.00%,而在時域特征提取下的故障識別正確率僅為78.33%,進一步表明基于圖譜信號的特征提取能夠準確地捕捉滾動軸承外圈不同直徑故障信息,其特征提取效果優于傳統的時域特征提取方法。
針對滾動軸承傳統的故障特征提取方法易受外界的噪聲干擾問題,提出一種可視圖譜信號特征提取和支持向量機分類的滾動軸承故障診斷方法。主要結論如下:
(1)提出了一種基于可視圖圖譜特征提取的故障診斷方法,利用支持向量機對特征空間劃分最優超平面,并具有較好魯棒性的優點,精確實現滾動軸承的故障分類。
(2)采用雙樣本Z值評估特征之間的差異的方法。當特征值的Z值越大時,就能表明區分樣本的能力越強,更好地選擇出合適的滾動軸承故障特征圖譜指標。
(3)將可視圖圖譜特征提取的方法與傳統的時域特征提取方法進行對比,在識別軸承不同故障類型以及軸承外圈不同故障直徑正確率分別為96.67%和95.00%,進一步表明基于可視圖譜信號特征提取的優越性。