李海浪, 鄒益勝, 曾大懿, 劉永志, 趙市教, 宋小欣
(西南交通大學 機械工程學院,成都 610031)
滾動軸承作為一種機械標準件,被廣泛應用于各類機器中。軸承故障會引起整個機械系統發生故障,在實際的工業生產中容易引發安全事故,不僅影響生產,而且嚴重者會危及人員安全[1]。因此,研究軸承剩余使用壽命十分有意義。軸承剩余壽命的研究方向有兩種:基于數據驅動的方法和基于模型的方法[2]。近年來隨著人工智能和深度學習的快速發展,基于數據驅動的軸承壽命預測方法逐漸成為主流[3]。
軸承剩余使用壽命的預測包括3個步驟,即信息獲取、特征提取和建立模型預測,能否有效提取特征是準確預測軸承剩余壽命的關鍵之一[4]。提取的特征常會出現一種不理想的狀況:特征子集中存在與預測目標無關的特征量,此類特征對于后續模型的預測無用。針對這種狀況,可以采用特征選擇方法剔除這類特征。按照是否獨立于后續的學習算法,特征選擇方法可以分成兩類框架:過濾式(Filter)特征選擇方法和封裝式(Wrapper)特征選擇方法[5]。Filter方法與后續學習算法無關,一般使用檢驗準則對特征進行篩選,作為特征預處理步驟。特征評價是常用的Filter方法之一,納入相關性指標進行選擇,以此來移除那些與目標函數不相關的特征。Wrapper方法結合后續的學習算法,尋找所有特征中能使后續學習算法達到較高性能的子集。但是對于大型或中型數據集,Wrapper方法計算復雜度是指數型的,執行時間更長[6]。特征評價獨立于后續的學習算法,因而適合大規模數據集,可以快速移除大量不相關特征,通用性較強。同時特征評價可解釋性更強,所選出的優良特征可以為軸承設備的檢查、維修提供一定的指導,在實際工程應用中更具價值。
目前已有眾多學者在特征評價中將相關性作為特征的評價標準之一,在設備壽命預測上取得了不錯的成果:谷廣宇等[7]在特征評價中納入相關性指標,選取與運行狀態相關的特征,實現了對發動機使用壽命的預測;劉勝蘭等[8]在特征評價中考慮相關性的基礎上,提出了一種自適應順序的特征選取方法,并有效預測了軸承的剩余使用壽命。盡管通過特征評價選出的特征和剩余壽命的相關性比較高,但對所選特征之間的相關性高低考慮不足。一些高相關性特征會造成特征冗余,繼而影響后續模型的預測精度。通過分析不同特征之間的相關性并進行特征聚類,可以把高度相關的特征聚在同一類中。在聚類之后,從每一個特征簇中挑選出具有高相關、代表性的子集,最終剔除冗余特征達到降低所選特征之間相關性的目的。因此提出了Corr-Kmeans聚類算法,同時為了避免Corr-Kmeans隨機初始聚類中心導致聚類結果不穩定,對初始聚類中心確定方法進行了優化。Corr-Kmeans聚類算法和特征評價結合的方法使提取的特征和軸承剩余壽命保持高相關性同時,降低特征之間的相關性。
綜上,先用卷積自編碼對頻域信息提取初始特征;然后利用Corr-Kmeans算法按照相關性將初始特征分為K個類;再基于相關性、單調性和魯棒性構成的綜合評價指標,按照篩選閾值分別在每類中選出優良特征,組成特征子集;最后采用LSTM網絡對軸承剩余壽命進行預測。
一個良好的特征子集應該滿足兩點條件[9]:① 所選特征和目標函數之間高相關;② 子集中特征之間的關聯性很低。這樣的特征子集在預測模型上會取得比較好的預測效果。對于軸承壽命預測特征提取,目前常用的特征評價方法在選取特征時,只考慮了特征子集和剩余壽命之間的高相關性,卻忽略了特征之間高相關性帶來的影響,所以容易出現以下問題:某些特征它們之間的相關性很高,但是和剩余壽命之間相關性也很高,于是這些特征都被選入最優特征子集中,導致最優特征子集中存在大量冗余特征[10]。這些冗余特征包含的信息量相當,對于后續模型的預測效果沒有增益,甚至會降低預測性能[11],因此降低所選特之間的相關性也是很有必要的。
特征評價只考慮了前者,為了同時滿足這兩個條件,采取以下方式:依照相關性聚類可以將具有較大相關性的特征聚在一起,將初始特征聚為類間相關度低、類內相關度高的幾個類;隨后對每類特征使用納入相關性的特征評價來進行特征選擇,挑選出各類中的優良特征組成特征子集。其處理過程如圖1所示。

圖1 聚類和特征評價
為了實現將特征按照相關性的高低進行分類的思路,借鑒聚類方法中的Kmeans算法,用皮爾遜相關系數代替歐式距離對特征之間的相關性進行度量,以此提出Corr-Kmeans聚類算法。將特征聚類后,結合特征評價方法,使用相關性、單調性和魯棒性3個評價指標構成的綜合指標來對特征評價,并按照篩選閾值分別在每類特征中篩選出優良特征組成特征子集。提出的Corr-Kmeans算法和特征評價方法相結合的方法,綜合考慮了特征之間的相關性以及評價指標下特征的優良程度,旨在有效識別并移除特征集中的冗余特征,挑選出有利于后續預測的特征子集。
傳統的Kmeans算法使用歐式距離來度量數據間的相似性[12],將數據劃分為類內相似度盡可能高、類間相似度盡可能低的K類。為了將特征按照相關性進行聚類,啟發式地基于Kmeans聚類的原理,以皮爾遜相關系數取代歐氏距離,來度量特征之間的相關性,由此產生了Corr-Kmeans算法。Corr-Kmeans算法能將特征分為類間特征相關性低、類內特征相關性高的K類。
Corr-Kmeans算法的輸入是需要聚類的特征和聚類數目K,具體步驟為:首先在特征中確定K個特征作為初始聚類中心(類心);然后計算其余特征與每個類心的皮爾遜相關系數絕對值,將其分配給相關系數最大的類心代表的類;隨后按照每類中的特征取平均值更新類心,重復前兩個步驟直至每類包含的特征不再變化或者達到迭代次數為止。皮爾遜相關系數絕對值計算方式如式(1),其值在[0,1]之間,越接近1表示二者相關性越高。整個算法流程具體如表1所示。
(1)

表1 Corr-Kmeans算法
式中:Cov(X,Y)表示X、Y之間的協方差;σX、σY分別表示X、Y的標準差。
Kmeans算法是一種應用廣泛的經典聚類算法,但其存在缺陷,即對初始聚類中心敏感。通常情況下Kmeans算法的聚類中心是隨機選取,而隨機的初始化聚類中心會導致聚類結果不穩定[13],極度容易陷入局部最優解。選擇相互距離最遠的K個處于高密度區域的點作為初始聚類中心,能有效地降低這種敏感性[14],獲得更穩定的聚類結果。基于此思路,在已有Corr-Kmeans算法的基礎上提出了一種改進的初始中心確定方法,描述如下:
步驟1從輸入的數據中隨機選取一個點作為第一個聚類中心;
步驟2對于數據集中的每一個點,計算它與相關性最高的聚類中心的皮爾遜相關性絕對值,并與1作差:D(xi)=1-|ρx,Oi|,其中Oi表示與之相關性最高的聚類中心;
步驟3選擇一個新的數據點作為第二個聚類中心,選擇的原則是:D(x)較大的點,被選作聚類中心的概率較大;
步驟4重復(2)和(3)直至K個聚類中心被選出來。
軸承剩余壽命預測屬于回歸預測,軸承的退化過程本質上是一個連續變化的隨機過程,一個優良的軸承特征應該滿足下列條件:
(1) 特征隨著軸承的運作退化而發生變化,即特征和軸承的剩余使用壽命有一定的相關性;
(2) 軸承退化是一個不可逆的單調過程,因此特征的變化也應該具有一定的單調性;
(3) 采集的軸承數據含有噪聲,所提特征應該具有一定的抗干擾能力,即魯棒性。
本文采用文獻[15]提出的3個軸承特征評價指標:相關性、單調性和魯棒性,以此對特征進行評價。首先使用平滑方法將特征分為趨勢項和殘差項,如式(2)所示
X(tK)=XT(tK)+XR(tK)
(2)
式中:X(tK)表示在時刻tK的特征;XT(tK)是趨勢項;XR(tK)是殘差項。
特征的相關性(Corr)、單調性(Mon)和魯棒性(Rob)分別按照式(3)~(5)計算。單獨的指標只能片面地評價特征在某一方面的優異性,為了綜合利用3個評價指標選擇出最優特征子集,將3個指標線性加權作為最終的特征篩選依據。計算如式(6)所示。
Corr(X,T)=
(3)
(4)
(5)
Score=w1Corr(X,T)+w2Mon(X)+w3Rob(X)
(6)
式中:K是總采集時間;δ(·)是階躍函數。
在線性加權融合之后對特征綜合指標根據Min-Max法歸一化到[0,1]之間,然后將所有特征按照綜合評價指標的大小排序,并按照設定的閾值選取特征。
試驗數據為滾動軸承加速壽命臺架試驗采集的振動加速度數據,來源于電氣和電子工程師協會(IEEE)2012年舉辦的PHM數據挑戰賽[16],該數據集共包含3種工況下的17個滾動軸承的全生命周期振動數據,其中第1、2種工況各7個軸承,第3種工況3個軸承,它們分別命名為Bearing1-1~Bearing1-7,Bearing2-1~Bearing2-7和Bearing3-1~Bearing3-3。數據采樣頻率為25.6 kHz,每間隔10 s采集一次,采集時間長度為0.1 s,一次采集的振動數據為2 560個振動加速度,直到滿足數據說明中的振動加速度達到設定閾值軸承失效條件就停止采集。軸承數據采集試驗平臺如圖2所示。

圖2 軸承數據采集試驗平臺
在進行模型訓練時,從數據集中選取一個軸承作為測試集,其余16個軸承作為訓練集。隨機取軸承Bearing1-3和Bearing2-4依次作為測試集,其余的16個軸承作為訓練集訓練模型,來驗證所提方法的有效性。每個軸承樣本按照{(xi,yi)}的方式構建數據集,xi為某軸承第某次采集的振動加速度,yi為該次采集時所對應的剩余壽命,該剩余壽命的定義為當前時刻距離失效時刻間時長占起始時刻到失效時刻時長的比例。按照行數等于采集的次數n,列數等于采集一次的數據的長度2 560,將每個軸承數據集整理為n行,每行長度為2 560的矩陣。第i行的2 560個振動加速度數據表示為xi,對應的yi計算公式如下所示
(7)
式中:i代表該行的行數;n代表總行數。
Bearing1-3一共采集了2 375次,每次采集2 560個振動加速度,其壽命為23 750 s;Bearing2-4一共采集了751次,每次采集2 560個振動加速度,其壽命為7 510秒。按照上述介紹,若樣本Bearing1-3第500次采集數據,其剩余壽命為18 750 s,對應的標簽yi=0.789 8。這樣的標簽劃分方式客觀上也是對預測標簽進行了歸一化,能夠降低預測模型的學習難度,更好地擬合輸入和標簽之間的關系。
軸承振動信號往往是多維數據而且含有噪聲,預測模型會面臨特征維數災難和提取特征不佳的問題。考慮到頻域信號是按照頻率大小進行排列,相比于原始振動信號的分布更為規律,因此對原始軸承振動時域信號作快速傅里葉變換,轉化為頻域信號[17]。卷積自編碼網絡作為常用的無監督學習方法,具有強大的特征自提取能力,利用卷積自編碼來提取初始特征,其網絡結構如圖3所示。

圖3 卷積自編碼網絡結構
其中,卷積自編碼的輸入是1 280×1的頻域信號,編碼器包括三層卷積層,卷積核的數目分別為8、16和32,卷積核的大小分別為11×1、9×1和9×1,卷積的步幅為(8,1)、(4,1)和(4,1)。解碼器包括三層反卷積層,其中卷積核的數目分別為32、8和1,卷積核的大小分別為9×1、9×1和11×1,卷積的步幅為(4,1)、(4,1)和(8,1),與解碼過程相對應。模型訓練時,訓練步數為20 000,并使用衰減學習率保證前期訓練速度的同時防止后期難以收斂。
將卷積自編碼提取的320維特征作為初始特征,使用Corr-Kmeans算法對初始特征按照特征之間的相關性聚類,截止迭代次數為150次。本文以K=3為例進行試驗,按照相關性把初始特征劃分為3個類,其中ntrain表示訓練集的樣本總數。示意圖如圖4所示。

圖4 Corr-Kmeans聚類
對每類特征進行特征評價時,為了保證所選特征和標簽之間的高相關性,給予相關性較大的權重,剩下的權重兩個評價指標平均分配,因此3個評價指標的權重設定為[18]:w1=0.6,w2=0.2,w3=0.2。計算出綜合得分后,將每類中所有特征得分歸一化到[0,1]之間。由于綜合得分是線性的,和每個指標正相關,所以綜合得分越大,表明此特征對軸承剩余壽命預測越有效,應該保留。按照閾值為0.5的標準,挑選出大于閾值的特征組成特征子集。需要注意的是,在聚類和特征評價兩個階段,應當保留所選優良特征子集包含的特征在初始特征中所對應的列序號,作為測試集選擇特征子集的準則。
LSTM單元為三層LSTM加一層全連接。三層LSTM隱藏神經元數目分別設置為:170,40,10,步長選擇為5。全連接層的神經元數量為1,激活函數采用relu函數。模型訓練時,采用的優化器為adam,訓練步數為11 000,初始學習率為0.005,并且采用衰減學習率的方式,學習率衰減因子設置為0.95。最后采用加權平均的方法對預測結果進行平滑處理。
整個軸承壽命預測流程圖如圖5所示。

圖5 總流程圖
為了有效避免Corr-Kmeans聚類算法隨機選取初始中心導致聚類結果不穩定的問題,本文設計了一種新的初始聚類中心選擇算法。為了證明其有效性,按照文獻[19]計算方法計算聚類結果不穩定性,計算結果用lnstab值表示,其值越低表示該算法聚類結果越穩定,計算方法如式(8)和(9)所示。對兩組訓練集以本文方法和隨機確定初始聚類中心方法分別聚類20次,兩種方法的lnstab值計算結果如表2所示。
(8)
(9)

表2 聚類結果穩定性
式中:b表示聚類次數,b=20;Ci表示第i次聚類結果;d(Ci,Cj)表示兩個聚類結果之間的距離;n表示樣本數目,n=320;Ci(Xk)表示Ci聚類結果中樣本Xk所對應的標簽。
從表2可以看出,在兩個測試軸承上,本文所提的聚類中心初始算法的lnstab值均比隨機初始化聚類中心的lnstab值低,說明了本文所提方法能夠獲得更加穩定的聚類效果。
卷積自編碼提取特征后,得到320維初始特征。經過Corr-Kmeans算法按照相關性劃分成3類,對每類特征進行特征評價,挑選出優良特征組成組成最終的特征子集。特征評價挑選出的3類優良特征為A、B和C。為了驗證Corr-Kmeans算法按照相關性聚類的有效性,計算類內每維特征與其他特征的皮爾遜相關系數絕對值,得到相關系數三角矩陣[20],如式(10)所示,并取矩陣中的平均值作為類內特征相關性系數;依次計算某類特征中的每維特征跟另一類特征中的每維特征的皮爾遜相關系數絕對值,得到相關性系數矩陣,取矩陣的平均值作為類間特征相關性系數。以Bearing1-3和Bearing2-4測試時,得到各自的類內特征相關性系數和類間特征相關性系數,如表3所示。
(10)
式中:n代表此類中的特征數量;|ρ12|是此類中的第一維特征跟第二維特征之間的皮爾遜相關性系數絕對值,以此類推。
表3中A表示A類的類內特征相關性系數,A-B表示A類和B類的類間特征相關性系數,以此類推。從表3中可以看出,類間特征相關性系數均低于相對應的類內特征相關性系數,表明Corr-Kmeans算法在將特征按照相關性劃分是有效的,能將特征劃分為類內相關性高、類間相關性低的3個類。Corr-Kmeans算法結合特征評價,目的在于使所選特征子集和時間序列保持高相關的同時,降低特征子集內部之間的相關性。為了進一步驗證其在降低特征子集內部之間的相關性上的有效性,與初始特征只經過特征評價的方法作對比。在Bearing1-3和Bearing2-4上,分別計算最終特征子集的類內特征相關性系數,得到的結果如表4所示。

表3 類內和類間特征相關性系數

表4 特征子集相關性系數
從表4中可以得知,Corr-Kmeans算法在一定程度上能夠降低最終所選特征子集的相關性,表明此方法是可行的。
本文對于初始特征的進一步篩選主要由Corr-Kmeans算法和特征評價兩部分組成。為了驗證該方法相比特征評價的優勢性,將其與初始特征只經過特征評價的方法對比,同時與主流的基于相關性評價方法進行比較[21];為了驗證Corr-Kmeans算法改進的有效性,也設置了一組傳統Kmeans結合特征評價的對比試驗;最后設置了一組僅用初始特征做預測的對比試驗,用于驗證整個特征篩選環節的優勢性。預測模型均采用同一參數的LSTM網絡。
以軸承Bearing1-3和Bearing2-4依次作為測試集進行試驗,采用上述5種方法提取的特征分別對軸承進行剩余壽命預測。Bearing1-3的預測結果如表5所示,Bearing2-4的預測結果如表6所示。圖中橫坐標表示數據序號,實則代表的是使用時間,縱坐標為當前時間點對應的剩余壽命占總壽命的百分比,實線為預測的壽命值,虛線為實際的壽命值。
從表5和表6中可以看出,無論對于測試集Bearing1-3還是Bearing2-4,對初始特征使用了特征評價后,預測效果在整體上都有一定的提升,在軸承的壽命晚期表現得更加明顯,單一的相關性評價方法反而使得預測精度不佳。在特征評價的基礎上,配合Corr-Kmeans聚類算法,預測效果又有了進一步的提升,在軸承的壽命晚期預測值也向真實值貼緊得更密切,可以證明Corr-Kmeans算法結合特征評價相比單一的特征評價是有優勢的。同時傳統的Kmeans結合特征評價并沒有顯著的提升,由此證明了Corr-Kmeans的有效性。整個現象說明Corr-Kmeans算法結合特征評價的方法是有效的,對于軸承剩余壽命預測精度有提升。為了更加精確地描述種方法的預測結果,按照式(11)和(12)對兩種方法預測結果的平均誤差emean和最大誤差emax進行了計算,計算結果如表7所示。

表6 Bearing2-4不同方法的預測結果對比
(13)
通過對表7的分析,按照式(13)計算誤差相對下降百分比。對于Bearing1-3,本文方法相比于其余4種方法預測精度的平均誤差分別降低了53.2%、78.6%、44.1%和46.9%,最大誤差分別降低了46.7%、77.8%、33.5%和43.7%;對于Bearing2-4,平均誤差分別降低了65.5%、78.6%、31.9%和46.4%,最大誤差分別降低了31.1%、39.2%、1.8%和3.1%。

表7 不同方法的預測誤差
上述結果表明,本文方法預測精度優于單一特征評價方法,同時誤差是5種方法中最低的,證明了本文所提方法提取的特征更有利于軸承的剩余壽命預測,有更好的預測效果。
上述5種方法所需的訓練時長與預測時長如表8所示。其中訓練時長包括數據的讀取與預處理,以及模型訓練;預測時長指的是加載預訓練模型對某一時刻采集的信號進行軸承剩余壽命預測。

表8 訓練時長與預測時長
由于Corr-Kmeans聚類算法用皮爾遜相關系數來度量兩個樣本之間的相關性,計算量較大,所以在數據預處理階段所耗時間長于其他4種方法,但后續的模型訓練與預測時間是基本相同的。盡管本文方法前期的數據預處理花費時間較長,而在線預測時間還是遠小于信號獲取過程中的時間間隔的,因此較長的離線訓練并不會影響模型的實時性。同時在實際應用中,往往更加注重模型的預測時間與預測精度,因此還是具有一定的優勢性的。
為了更全面地驗證該方法的有效性和適用性,采用留一法進行預測試驗。留一法即每次只采用一個軸承作為測試集,其余軸承作為訓練集,模型訓練完畢后,利用測試集進行測試。3種方法的平均誤差emean和最大誤差emax如表9所示。

表9 留一法試驗結果


表10 綜合試驗誤差統計
進一步分析表10的結果,可以看出本文方法的預測精度是優于單一特征評價方法的,相比其余幾種方法,綜合平均誤差和綜合最大誤差也都是最低的,說明本方法是有效的。
為了進一步探究不同的Corr-Kmeans聚類數目K對預測精度的影響,分別進行了K值為2,4和5時的試驗,綜合誤差結果如表11所示。

表11 不同K值綜合誤差統計
分析表11和表10中的結果,可見K=3或者K=4時,其預測效果是優于其他幾種方法的,綜合誤差和平均誤差均低于所對比的方法。
在預測軸承剩余壽命時,針對單一的特征評價方法在對軸承特征進行選擇時,僅考慮了所選特征與時間序列的高相關性,對特征之間高相關性的考慮不足的問題,提出了一種基于特征聚類和評價的軸承壽命預測新方法,并得到了以下結論:
(1) 提出了一種Corr-Kmeans聚類算法,該算法能夠將特征按照相關性進行聚類;提出了一種改進的Corr-Kmeans初始聚類中心確定方法,相比于隨機初始聚類中心,聚類結果更加穩定。
(2) Corr-Kmeans聚類算法和特征評價相結合的方法,能使特征與時間序列保持高相關性的同時,降低特征之間的相關性,最終所選的特征子集更有利于軸承剩余壽命預測。
(3) 該方法相比單一的特征評價方法和用初始特征直接預測等方法精度均有一定的提升,同時在不同的工況下也表現出了較好的適用性。