謝雨潔,肖友剛,王田天,謝勁松
(1.中南大學交通運輸工程學院,湖南長沙,410083;2.湖南大學機械與運載工程學院,湖南長沙,410082)
軸承是高速列車傳動系統中的關鍵組成部分,其性能表現對高速列車運行的安全性、穩定性和舒適性產生重要影響[1]。為了避免軸承突然失效對列車造成的損壞,有必要對軸承進行剩余使用壽命預測(RUL)。剩余使用壽命的準確預測也是制定合理的性能檢查和維護計劃的前提[2]。軸承的全壽命周期通常可劃分為正常階段和不可逆的退化階段[3]。在正常運行階段,軸承處于健康狀態,狀態監測數據在小范圍內隨機波動,監測的振動信號中難以觀察到顯著的變化;在不可逆的退化階段,軸承因發生早期故障而開始退化,并且隨著運行時間的推移,故障越來越嚴重。但是,不同軸承所處的工作環境和損傷的機理不同,因此,退化特征也各不相同。若不區分軸承全壽命周期內的正常階段和退化階段,將軸承開始運行的時刻選為預測起始點,則可能對軸承的剩余使用壽命預測造成較大的誤差。因此,為了對軸承進行早期狀態監測并準確估計其退化水平,分析退化過程各階段至關重要。
然而,退化階段的準確識別難度大、復雜性高[4-5]。在軸承性能退化評估和剩余使用壽命的預測中,學者們常采用3σ法識別軸承退化過程中的不同階段,如LI 等[6]認為當軸承健康指標超過3σ時進入退化階段。基于假設檢驗理論,LI等[7]采用均方根(RMS)或峰值作為退化指數實現壽命預測階段的選擇。WANG 等[8]基于3σ法設置退化閾值,并建立軸承退化趨勢預測的兩階段策略。在實際工作中,軸承正常運行階段的振動信號會被噪聲和隨機發生的異常沖擊所覆蓋[9],從而影響退化預警區間的設置,難以準確地識別退化階段。因此,一些降噪的方法常用于振動信號的預處理中,PEI等[10]為了減少噪聲對剩余使用壽命預測的影響,采用經驗模態分解(EDM)方法進行噪聲平滑處理。紀俊卿等[11]提出了一種自適應的小波閾值函數對滾動軸承的故障振動信號實現降噪處理。賈晉軍等[12]采用分數階傅里葉變換濾波和最小均方算法(LMS)對變轉速工況下軸承振動信號進行降噪。上述降噪研究為退化階段的準確識別提供多種途徑和方法,但均會削弱原始信號,或者將一些關鍵的信號一并去除。振動信號的質量反映了信號數據與軸承健康狀態之間的相關程度,不精準、不確定、不完整的低質量數據導致不準確的性能退化評估和不可靠的剩余使用壽命預測。與正常運行階段中大量的穩定信號相比,噪聲信號和隨機出現的異常沖擊顯示出巨大的差異。基于密度的異常值檢測方法能夠通過將數據點周圍的密度與其局部鄰近的密度進行比較,有效地檢測異常值。BREUNIG 等[13]提出了局部離群因子(LOF)檢測方法,LOF 法作為一種經典的基于密度的異常值檢測方法,能夠在無監督的情況下給出異常值偏離正常值的程度,并且能夠檢測其他異常值檢測方法可能無法識別的異常值。因此,LOF 法檢測異常值的研究已經引起了廣泛的關注。
綜上所述,針對軸承正常運行過程中隨機出現的異常而導致退化階段識別不準確的問題,本文作者對傳統3σ法確定退化點的方法[14]進行改進,提出一種基于多尺度局部核回歸異常值檢測的退化階段識別方法,并將所提出的方法應用于真實的旋轉機械數據集,分析退化階段的識別結果,并與現有的方法進行對比,驗證該方法的有效性。
3σ法根據軸承的健康指標自適應地設置退化預警區間,以實現早期退化點的準確識別,該方法的基本理論為切比雪夫不等式[15]:

式中:P為概率;X為隨機變量;K為任一正實數;μ為均值;σ為標準差。
由式(1)可得,當K=3 時,任一樣本落在3σ區間(即[μ-3σ,μ+3σ])之外的概率小于等于1/9。通過選取軸承正常運行階段的健康指標,設置預警區間的閾值。圖1所示為漸進退化軸承退化階段傳統3σ法識別結果。當健康指標超出3σ預警區間時,則認為軸承發生故障而開始退化,并將該位置作為退化點以劃分退化階段。

圖1 漸進退化軸承退化階段傳統3σ法識別結果Fig.1 Degradation stage recognition results of progressive degradation bearings by traditional 3σ method
但是,對于真實的軸承振動信號,由于運行過程中隨機發生的異常沖擊和噪聲,在軸承的正常階段監測信號中仍然存在一些異常值。圖2所示為突變退化軸承退化階段傳統3σ法識別結果。圖2(b)中,真實的退化點應該在退化點2 附近,而軸承正常運行階段出現的異常值超出預警區間,導致了退化點判定在退化點1處,這是由于正常階段中出現的異常值造成了退化點誤判的情況。

圖2 突變退化軸承退化階段傳統3σ法識別結果Fig.2 Degradation stage recognition results of mutational degradation bearings by traditional 3σ method
在軸承運行過程中,正常階段出現的異常值會影響預警區間的設置,從而導致退化階段識別不準確。但是,在軸承正常運行階段,隨機發生的異常沖擊和噪聲引起的異常狀態幾乎不可能連續出現,只有當退化健康指標持續超出預警區間時,才意味著軸承發生了故障而開始退化。因此,提出一種改進的3σ策略,它可以限制退化階段識別過程中隨機異常造成的干擾,即退化點滿足以下條件:

式中:ti為退化起始時刻。
根據文獻[16],當連續5 個數據點落在[μ-3σ,μ+3σ]區間外,則確定ti為退化起始時刻。改進后的退化階段識別的結果如圖3所示。可見,改進的3σ法較準確地識別了軸承的退化階段,解決了采用傳統3σ法時退化點誤判的問題(圖2)。

圖3 突變退化軸承退化階段改進3σ法識別結果Fig.3 Degradation stage recognition results of mutational degradation bearings by improved 3σ method
不同工況下的軸承表現出不同的退化狀態,有時采用改進的3σ策略也不能避免軸承正常運行階段隨機異常的干擾。圖4 所示為采用改進3σ法識別軸承1 和軸承2 退化階段的結果,軸承1 和軸承2 數據來自PHM 2012 挑戰數據集。由圖4(a)和圖4(c)可見,軸承1正常階段的異常值導致退化預警區間的范圍設置過大,造成退化點判定延遲的情況,退化點后的退化階段忽略了一部分有用的退化信息。由圖4(b)和圖4(d)可見,軸承2 正常階段的異常值在峭度特征中表現出比退化階段更大的沖擊,在不準確的退化預警區間內,健康指標都沒有持續超出此區間的上閾值,因此,無法識別出退化階段。

圖4 采用改進的3σ法識別軸承1和軸承2退化階段的結果Fig.4 Degradation stage recognition results of bearing 1 and bearing 2 by improved 3σ method
針對上述問題,本文提出一種基于異常值檢測的退化階段識別方法。首先,對軸承的振動信號進行異常值檢測。采用LOF 法并結合多尺度鄰域的信息構建異常指標,通過循環迭代影響異常指標的參數檢測異常值;然后,進行異常值迭代去除。檢測到異常值后,在迭代過程中基于最佳參數去除軸承振動信號中的異常數據;最后,確定退化過程的退化點。在異常處理后的信號上利用改進的3σ法設置預警區間的上下閾值,從而實現退化階段的識別。
2.2.1 數據預處理
采用滑動窗口將原始振動數據分割為多個片段,并從每個片段中提取出時域特征。廣泛用于機械狀態檢測的時域特征通常有均值、最大值、最小值、峰峰值、波峰因子、方差、均方根、平均振幅、方根幅值、波形因子、脈沖因子、裕度因子、峰度、峰值和偏度[17]。為了獲得良好的檢測性能,應選擇合適的特征,構成計算局部離群因子的數據集。
2.2.2 局部離群因子
局部離群因子主要是通過比較數據集中每個樣本的密度與其領域樣本點的密度來檢測異常,計算數據集中某點p的LOF表達式[18]如下:

式中:L(p)為p點的局部離群因子;o為點p第k距離鄰域的點;Nk(p)為點p的第k距離鄰域;wk(·)為第k局部可達密度。
2.2.3 基于多尺度核回歸的LOF法
LOF 法檢測異常值是基于局部密度的估計,這表明良好的檢測性能需要精確的密度估計。LOF法通過計算給定對象與其鄰域點之間的平均可達距離的倒數來粗略地估計局部密度,可能無法檢測到真正的異常值。并且LOF是在第k距離鄰域中計算的,因此LOF法對參數k十分敏感。當異常值隨機分布在不同密度下的幾個簇中時,由于參數k不能滿足對所有異常值的檢測要求,LOF 法可能會獲得較差的異常檢測效果。為了克服上述缺點,通過Nadaraya-Watson 核回歸計算第k距離鄰域內的回歸估計量構造更具魯棒性的LOF[18],以構建最終進行異常度評判的指標。基于Nadaraya-Watson核回歸計算某點p的LOF表達式如下:

式中:s為迭代的步數;γ為靈敏度,一般為2;d(p,o)為點p與o點之間的距離;dk(·)為第k距離;Lk(o)為o點的局部離群因子;K(·)為核函數,
參數x的核函數如下:

式中:β為常數,設置為1。
基于多尺度核回歸函數構建的異常指標表示與正常樣本的偏離程度,在軸承正常運行階段,大部分信號數據都為正常樣本并且屬于同一個簇。異常數據的指標值遠遠大于正常數據。為了更準確地檢測異常值,當異常指標大于設定異常閾值T時,則被判定為異常值。

異常值的檢測效果依賴于構建異常指標構所需的參數,即滑動窗口長度和LOF的k值。本研究通過迭代不斷更新窗長與k值,獲得最佳參數。在大數據下機械狀態監測中,采集的數據量巨大,若迭代過程中采用較小的步長或參數的增值過小都會降低計算效率,大大增加異常檢測的時間。為了能夠更快、更有效地處理異常值,本研究將迭代步長設為滑動窗口長度,每次迭代窗長的增量為上一步迭代參數的20%。基于每次迭代的最佳參數檢測異常值,并根據最佳滑動窗口的長度去除原始振動信號中的異常片段。然后,再對上述異常值檢測及去除的步驟進行迭代以達到更好的異常值處理效果。
軸承運行過程中監測到的振動信號會被噪聲等因素干擾,造成不準確的退化階段識別結果。常用的降噪方法在一定程度上會改變原始振動信號,導致在軸承性能退化評估和剩余使用壽命的預測中產生較大的誤差。因此,本文提出一種基于異常檢測的退化階段識別方法,其流程圖如圖5所示,具體的方法步驟如下。

圖5 基于異常值檢測的退化階段識別流程圖Fig.5 Flow chart of degradation stage recognition based on outlier detection
Step 1:數據預處理。以初始滑動窗長w1將軸承振動信號的數據分割為多個片段,步長為窗長長度。并從所有分割的片段中提取統計的時域特征,構成LOF所需的數據集。
Step 2:構建異常指標。根據上述異常指標的構建方法,以初始值k1計算數據集中每個樣本的LOF 值,然后采用核函數計算回歸估計量構造異常指標。若未達到k1≥kmax的條件,則令k1=k1+1 重新執行Step 2。若k1≥kmax,但未達到w1≥w2的條件,為了提高迭代過程計算的效率,則令w1=w1+0.2w1轉到Step 1。
Step 3:異常檢測。從Step 2 得到的異常指標中找到LOF 的最大值,認為最大LOF 值所在的窗口長度w和k值為最佳參數值,通過設定的異常閾值T判斷最佳參數下,超出異常閾值的指標判定為異常值。
Step 4:異常迭代去除。以Step 3 中獲得的最佳滑動窗長,去除異常處對應的振動信號窗口長度片段。為了進一步去除異常,迭代步驟s初始值設為1,若未達到s≥smax的條件,令s=s+1 轉到Step 1。
Step 5:退化點識別。由于峭度對機械部件的早期故障極其敏感,通常認為早期故障一發生,機械部件就開始退化[19]。因此,本文采用峭度特征作為軸承狀態監測的健康指標,根據[μ-3σ,μ+3σ]區間選取健康階段的指標,并設置預警區間,實現退化階段的識別。
采用從滾動軸承退化實驗中獲得的2個真實振動信號數據集驗證所提出的基于異常檢測退化階段識別方法的有效性。
3.1.1 XJTU-SY數據集
XJTU-SY 數據集由西安交通大學和長興昇陽科技公司提供[20]。在3種工況下測試LDK UER204滾動軸承,從運行到故障失效的振動加速度數據是由軸承外殼上的加速度傳感器獲得的。試驗中的采樣頻率為25.6 kHz,每間隔1 min 采樣時長1.28 s,每次采集32 768 個數據點。本次研究中僅采用水平方向的振動數據,為安全起見,當振動幅值超過10Ah(Ah為振動信號正常階段最大幅值)時,加速退化軸承試驗停止,此時刻被視為軸承的失效時間。
3.1.2 PHM 2012數據集
PHM 2012 數據集在加速軸承退化的PRONOSTIA平臺上收集,采用電機、軸承、變速箱和2個滑輪組件用于改變滾動軸承的速度。加速度傳感器固定在軸承外圈上,分別在水平和垂直方向采集振動信號。同樣,本次研究中也只采用水平方向的振動數據。基于PRONOSTIA 平臺的PHM 2012 挑戰數據集[21]中,包含不同工況下17個運行至失效的軸承故障數據,采樣頻率為25.6 kHz,每間隔10 s 采樣0.1 s,每次采集2 560 個數據點。為安全起見,當振動數據的振幅超過20g時,試驗停止。
為了說明滑動窗口長度對所提出的異常值檢測方法的影響,將窗口長度分別設為200 和20 000,并基于核回歸的LOF 構建異常評判指標進行異常檢測。截取軸承1全壽命周期的某段,異常值檢測結果如圖6所示。從圖6可見,使用不合適的窗口長度檢測到很多本屬于健康狀態的數據片段,這是由于振動信號被滑動窗口分割成多個過小或者過大的片段,它們與大部分正常數據片段的差異較大,不屬于相同的簇。因此,這些大于設定的異常閾值的異常數據片段則被判定為異常值。

圖6 基于隨機滑動窗長的異常值檢測結果Fig.6 Outlier detection results with a random length of sliding window
本實驗選取來自PHM 2012 數據集的軸承1、軸承2 和XJTU-SY 數據集的軸承3、軸承4 進行分析。首先對4個軸承退化過程中的振動信號進行異常值檢測,滑動窗口初始長度w1設為500,初始k值k1設為5,迭代步驟最大值smax為2。循環迭代后異常值的檢測結果如圖7所示,從圖7可見:本文提出的方法可以較準確地檢測出軸承運行過程中的異常值。

圖7 異常值檢測結果Fig.7 Outlier detection results
提取經異常值處理后的軸承振動信號峭度特征構建進行退化狀態分析的健康指標。將本文所提出的方法與基于隨機參數的異常檢測和原始振動信號的退化階段識別結果進行對比。圖8~11 所示分別為軸承1~4 經過不同方法識別退化階段的結果。

圖8 軸承1的退化階段識別Fig.8 Degradation stage recognition of bearing 1

圖9 軸承2的退化階段識別Fig.9 Degradation stage recognition of bearing 2

圖10 軸承3的退化階段識別Fig.10 Degradation stage recognition of bearing 3
從圖8~11 可以看出,本文選取的健康指標非常適合監測軸承的健康狀況。在軸承未發生故障的正常運行階段,退化健康指標一般保持在較低水平,振幅在較小的范圍內波動。當出現異常值或者軸承開始退化時,隨著振動越來越劇烈,健康指標的振幅也會顯著增加,并且健康指標的單調性趨勢經異常值檢測后得到了顯著的改善。
在未經異常檢測和基于隨機參數異常檢測的情況下,使用改進策略的3σ法無法準確識別退化階段。此時,軸承1所設置的退化預警區間范圍大于本文方法設置的區間范圍,判定的退化點有明顯的延遲,忽略了一部分有用的退化信息。這是由于選取的健康階段包含了一些正常運行階段中的隨機異常數據,從而導致退化預警區間的范圍設置過大。同樣由于正常階段隨機異常的干擾,軸承2、3 和4 在全壽命周期內的健康指標都沒有連續5個以上的點超出預警區間,識別的退化點停留在初始時刻。

圖11 軸承4的退化階段識別Fig.11 Degradation stage recognition of bearing 4
本文所提出的異常檢測方法能有效地處理軸承運行過程中的異常干擾。采用不同方法識別軸承的退化點時刻如表1所示。可見,本文所提出的基于異常檢測的退化階段識別方法能夠準確地識別到退化點,更好地區分軸承的正常階段與退化階段。

表1 退化點的識別時刻Table 1 Recognition time of degradation point s
1)提出了一種基于多尺度局部核回歸異常檢測的軸承退化階段識別方法,將離群值檢測的方法應用到旋轉機械異常狀態監測中,通過循環迭代自適應地選擇最優參數并去除異常振動信號。該方法在完全保留原始有用信號的情況下,能更好地抑制隨機異常造成的干擾,準確地實現軸承退化階段的識別。
2)采用真實的旋轉機械數據集將所提出的方法進行實驗驗證,并與未經異常值處理的數據對比,驗證了該方法的有效性。
3)所提出的退化階段識別方法能夠準確地估計軸承的退化水平并確定退化點,該方法不僅適用于旋轉機械性能退化評估,還能為剩余使用壽命的預測開拓思路、提供指導。