摘要:
為預測列車滾動軸承壽命,結合狀態監測與可靠性數據,提出了一種基于小波包分解、可拓K中值聚類(KMediods)和比例風險模型(PHM)的列車滾動軸承剩余壽命預測方法。基于小波包分解原理提取特定頻段內特征值,構建有效特征數據集,提高KMediods算法刻畫軸承性能退化過程的精確度,將軸承的性能退化與剩余壽命關聯,提高二參數比例風險模型對軸承剩余壽命預測的準確度。利用全壽命周期滾動軸承實驗數據驗證所提方法,結果表明,模型輸出與目標輸出的一致性超過09。
關鍵詞:
比例風險模型;遺傳算法;軸承壽命
中圖分類號:TH115
文獻標志碼:A
隨著軌道交通技術的不斷發展與進步,列車的運行速度也在不斷的提高,對軸承的性能提出了更高的要求。旋轉機械故障中約有30%是由軸承失效引起[1],為保障列車安全穩定的運行,預測滾動軸承的剩余壽命非常重要[23]。壽命預測是保障設備安全性和可靠性的一項關鍵技術[46],現有三種方法:數據驅動、基于模型和混合方法[7]。基于模型和混合方法具有可解釋性強、數據效率利用高和泛化能力強等優點,但存在復雜性高和噪聲難以處理等問題。隨著傳感器技術的發展,數據的采集與保存更加方便。數據驅動的方法能夠直接利用大量的實際數據進行分析和預測,是當前剩余壽命預測的主流方法[8],分為基于機器學習[9]、深度學習[10]和統計數據驅動[11]。統計數據驅動的優勢是基于實際數據和統計分析從而提高決策的精準性與預見性。基于統計分析提出的比例風險模型(Proportional Hazard Model,PHM)將設備的狀態數據與時間等實際監測的數據相結合[12],有效地將多種復雜的狀態信息用于設備可靠性分析,并利用剩余壽命預測公式實現對軸承剩余壽命的預測[13]。PHM模型的基底失效率函數有多種,其中威布爾(Weibull)函數能有效地刻畫機械旋轉設備的壽命數據,通常選用二參數威布爾函數為比例風險模型的基底失效率函數[14]。軸承性能退化的狀態可以有效反應軸承的剩余壽命,為評估軸承性能退化程度,需構建退化定量評估模型[15],包括概率模型和距離模型。KMeans算法屬于聚類分析方法,將KMeans算法與隨機森林算法或深度學習相結合分析軸承壽命[1617],通過可拓距與可拓關聯度函數的概念,計算樣本與聚類中心的距離來獲得關聯度從而定量計算軸承的性能退化程度[18]。本文使用小波包分解、KMedoids算法、可拓學理論和比例風險模型,將性能退化與壽命預測相關聯,建立KMediodsPHM軸承壽命預測模型,以小波包分解算法提取的特征作為輸入,計算軸承的剩余壽命,并利用軸承全壽命疲勞試驗數據進行驗證。
1 研究方法
本文基于可拓KMediods和比例風險模型(PHM)搭建軸承壽命預測模型(即KMediodsPHM網絡結構),包括可拓KMediods、遺傳算法和比例風險模型三部分。以軸承水平振動信號為基礎,基于小波包分解算法提取樣本中特定頻段內的均方根特征,對軸承正常狀態樣本進行KMedoids聚類得到聚類中心,計算正常狀態樣本和全部樣本與聚類中心之間的歐式距離以確定經典域和節域,通過待測樣本到聚類中心的距離,計算其與軸承正常狀態距離區間的關聯度實現軸承性能退化的定量評估,最后通過遺傳算法求解比例風險模型的最優參數,通過剩余壽命預測公式獲得軸承的剩余壽命。可拓KMediodsPHM網絡結構如圖1所示。
1.1 可拓KMediods網絡
優化KMeans算法中質點的選取規則得到KMedoids算法,對集合A中的元素依據KMedoids算法劃分為k個簇O={O1, O2, …, Ok}。為闡明單個元素與簇之間的關系,引入可拓距與可拓關聯函數的概念。每一個簇均有相對應的取值區間M1=[a, b],對于集合內的任一點x,與區間M1之間的可拓距表示為
ρx,M1=x-a+b2-b-a2(1)
可拓距能定量表達點與區間的關系,在此基礎上利用關聯度函數k(x)對點與區間關系的強弱進行定量劃分。假設關聯度函數值達到最大的點為x0,且不位于M1的中心位置,則初等關聯度函數k(x)
kx=ρ(x,x0,M1)ρx,M2-ρ(x,M1)xM1
ρ(x,x0,M1)ρx,M2-ρx,M1+a-bx0∈M1(2)
其中,M1=(a, b)是經典域,M2=(c, d)是節點域,x0在取值區間M1左端點取得,所以ρ(x,x0,M1)稱為左邊距
ρx,x0,M1=a-xx≤a
b-x0a-x0x-ax∈〈a,x0〉x-bx≥x0(3)
1.2 比例風險模型
比例風險模型(PHM)是一種統計分析框架,將統計回歸原理作為壽命預測的工具,本文所用PHM基本形式為
λt,X=[γη×tμγ-1]×exp(Xβ)(4)
其中,γ為形狀參數,γ>0;η為尺度參數,ηgt;0,X為時間t影響系統失效概率的協變量,β是回歸參數。
模型的極大值似然函數為
Lγ,η,β=∏Ni=1{λiti, Xiδi×Ri(ti,Xi)}(5)
其中,N為樣本數據量,[λi(ti, Xi)]為失效率函數,Ri(ti, Xi)為可靠度函數,δi事件指示性變量。
軸承在t時刻的剩余壽命預測
LRt,kx=∫∞0exp-∫x+τt(γ︿×xγ︿-1η︿γ︿)×exp[Xtβ︿]dvdτ(6)
其中,γ︿、η︿和β︿分別為γ、η和β參數的估計值。
2 可拓KMediodsPHM軸承壽命預測模型
小波包分解算法將數據多次分解,提取特定頻段內的特征,組成軸承特征數據集,基于KMediods算法構建軸承性能退化評估模型,獲取最優中心點,根據可拓矩與關聯度函數的概念獲得描述軸承性能退化的狀態信息,作為壽命預測模型的協變量并綜合時間等信息,訓練壽命預測模型,從而實現軸承的可靠性分析及剩余壽命的預測。
2.1 WPD_KMediods軸承性能退化評估模型
劃分正常狀態樣本與故障樣本,利用小波包將樣本數據分解8次,在第8層上得到256個頻段的數據S={S1, S2, …, Si}(i=1, …, 256),分別提取每個頻段中的均方根,組成特征數據集。軸承數據集的樣本劃分為正常與故障狀態兩部分,為獲得正常狀態的最優聚類中心Cn,使用KMediods算法進行聚類,聚類數據集僅由正常狀態樣本組成,聚類的種數目設置為1。根據可拓矩概念分別計算正常狀態的樣本和全部樣本與Cn的歐式距離,確定經典域M1和節域M2,并通過關聯度函數計算樣本的關聯度。M1和M2的確定過程如圖2所示,計算所有正常樣本與Cn之間的歐式距離,設b和a是歐式距離的最大值點與最小值點,作為經典域邊界的參考值,即M1=(a, b)。同理計算全部樣本與Cn的歐式距離得到節域邊界的參考值,即M2=(c, d)。本文中樣本與Cn的距離由a到d代表軸承屬于正常狀態的強弱程度,由式(2)計算關聯度,獲得描述軸承退化的狀態信息。
2.2 比例風險模型
比例風險模型中的協變量應準確刻畫軸承狀態的變化。軸承的壽命與性能息息相關,性能退化中的均方根特征關聯度值可以準確描述軸承狀態變化的過程,因此將其作為PHM的協變量。PHM確定γ、η和β的值時涉及軸承從開始運行到失效所經歷的時間、協變量和時間指示性變量,δ=0代表軸承正常運行,δ=1代表軸承失效。極大似然函數是求解模型中未知參數經常使用的方法,通過遺傳算法求解極大似然函數的最大值,獲得未知參數估計值γ︿、η︿和β︿的最優解。通過樣本的狀態特征量X(t)和3個參數估計值完善剩余壽命計算公式(6),從而計算樣本的剩余壽命。
3 軸承全壽命疲勞試驗分析
使用FEMTOST數據集驗證KMediodsPHM壽命預測模型的準確性。在預處理階段,利用可拓KMediods算法構建性能退化的特征,使用二參數Weibull分布作為PHM的基底失效率函數,用PHM輸出與目標輸出相關性的分析結果作為標準。
3.1 FEMTOST數據集
PHM挑戰數據集由FEMTOST研究所提供[19]。實驗在PRONOSTIA實驗平臺上進行,該平臺可在線收集轉速、載荷力、溫度和振動等健康監測數據,實現軸承性能的加速退化。采用的數據包含1 800 rpm和4 000 N時的水平和垂直振動信號,采樣頻率為256 kHz,以及以10 Hz采樣的溫度信號。訓練集選用文件Bearing1_1,包含2 803個樣本數據,Bearing1_3作為測試集,包含2 375個樣本數據,水平振動信號如圖3所示。可以看出,振動信號幅值在45×106附近逐漸增大,表明軸承狀態逐漸惡化,直至達到報廢狀態。采樣頻率為256 kHz時,計算后將初始1 800個樣本歸類為正常狀態樣本,其余樣本歸類為異常狀態樣本。
3.2 剩余壽命預測分析
在開發壽命預測模型時,首先將訓練集劃分為正常狀態樣本與故障狀態的樣本。樣本數據經小波包8次分解后,在第8層上得到256個頻段的數據,將每個頻段中的均方根組成特征數據集。計算關聯度時,精確定義經典域的范圍和節域的范圍至關重要。首先,對訓練集中正常狀態的樣本數據進行聚類,獲得穩定的Cn,分別計算距離Cn最近和最遠的正常樣本與Cn之間的歐氏距離,并依此作為經典域的邊界。同理,計算正常與故障狀態的特征樣本與Cn之間的歐氏距離確定節域的邊界。經典域與節域邊界值:a=0079 9,b=0478 3,c=0079 9,d=6345 2。
基于可拓矩與關聯度函數的概念,計算測試集到Cn的歐氏距離,并計算關聯度函數值,通過關聯度的數值變化描述軸承性能退化的過程,如圖4所示。軸承振動信號的采集受制于傳感器技術、環境等多種因素,導致軸承振動信號中存在無用信號并使關聯度值出現波動(圖中黑色散點)。為使軸承性能退化趨勢更加直觀,對散點圖進行擬合處理(圖中紅線)。
可以看出,實驗開始到10 000 s,相關值超過05且波動較為平穩,說明測試樣本接近最優中心點,軸承處于良好的運行狀態。從10 000 s到16 310 s,相關值保持在0以上且擬合曲線呈減小趨勢,樣本逐漸遠離最優中心點,表明軸承仍處于正常運行狀態。16 310 s后,相關系數降至0以下時,表明測試樣本與最優中心點之間的歐氏距離已經達到經典域的上限,這是軸承性能退化的早期。21 590 s后,相關值降至-03以下并急劇下降,說明軸承性能已經惡化并超出正常的工作范圍。軸承從開始正常運行到故障過程中,關聯度曲線穩定地追蹤了軸承性能的退化過程,可以較好地描述軸承的壽命狀態。
PHM采用雙參數威布爾分布函數作為基底失效率函數,將均方根特征的關聯度值作為影響系統失效概率的協變量,并基于失效率函數和可靠度函數構造似然函數,用極大似然法估計模型中β、γ和η未知參數的近似值。采用遺傳算法求解極大似然函數,進化代數設為1 000代,交叉類型為2點交叉、變異為單點變異算法,建立的種群個體數量為50。極大似然函數值隨著遺傳算法迭代次數的增長變化如圖5所示,經過400次迭代優化后,適應度函數值保持穩定且為最大值,此時得到PHM中3個未知參數值γ︿、η︿和β︿的最優解為:β︿=0958 8,γ︿=13228 8,η︿=6851 0。
將參數值代入剩余壽命公式,建立壽命預測模型。為更有效地說明剩余壽命預測結果,隨機選取25個樣本進行壽命預測,將預測結果與實際壽命對比,結果如圖6所示。PHM輸出的預測結果與實際壽命較為接近,兩者的相關系數為0999,均方誤差為0010 3,因此,KMediodsPHM軸承壽命預測模型能夠準確預測軸承的剩余壽命。
為測試KMediodsPHM軸承壽命預測模型的性能,搭建Bilstm與CNN_Bilstm網絡模型進行比較。由于實際工況中存在噪聲,因此在原測試集Bearing1_3中加入高斯噪聲與極值噪聲數據以測試模型的魯棒性,并使用全新數據集Bearing2_6測試KMediodsPHM軸承壽命預測模型的泛化性能。隨機選取25個樣本進行壽命預測,結果見表1。
KMediodsPHM軸承壽命預測模型在面對噪聲數據干擾與全新測試集時,表現出較強的穩定性與準確性,具有良好的泛化性與魯棒性,實現了軸承剩余壽命的準確預測。Bilstm和CNN_Bilstm模型在相同的測試條件下,對軸承剩余壽命的預測能力弱于KMediodsPHM軸承壽命預測模型。
4 結論
本文利用小波包分解,提取特定頻帶內的均方根特征,組成有效特征數據集,將軸承性能退化與壽命預測相捆綁,以性能退化曲線刻畫軸承狀態變化的過程,從而建立KMediodsPHM軸承壽命預測模型。結果顯示,基于小波包分解提取特征和可拓KMediods算法有效克服了噪聲的干擾,準確刻畫了軸承性能退化的過程,以均方根特征關聯度為協變量的PHM模型輸出與目標輸出比較一致,表明KMediodsPHM軸承壽命預測模型擁有較高的準確度,面對噪聲數據與未知數據集表現出良好的魯棒性與泛化性。
參考文獻
[1]張文哲, 張為民, 林文波. 基于經驗模態分解、多尺度熵算法和支持向量機的滾動軸承故障診斷方法[J]. 機械制造, 2018, 56(4): 7883.
[2]王婧, 許志偉, 劉文靜, 等. 滾動軸承健康智能監測和故障診斷機制研究綜述[J]. 計算機科學與探索, 2024, 18(4): 878898.
[3]MOUSSA H, JOON J H, JUNGHO P, et al. A comprehensive review of artificial intelligencebased approaches forrolling element bearing PHM: Shallow and deep learning[J]. JMST Advances, 2019, 1(12): 125151.
[4]LAU D, FONG B. Special issue on prognostics and health management[J]. Microelectronics Reliability, 2011, 51(2): 253254.
[5]ZHAO Z Y, QUAN Q, CAI K Y. A profust reliability based approach to prognostics and health management[J]. IEEE Transactions on Reliability, 2014, 63(1): 2641.
[6]季云, 王恒, 朱龍彪, 等. 基于HMM的機械設備運行狀態評估與故障預測研究綜述[J]. 機械強度, 2017, 39(3): 511517.
[7]HENG A, ZHANG S, TAN A C C, et al. Rotating machinery prognostics: State of the art, challenges and opportunities[J]. Mechanical Systems and Signal Processing, 2008, 23(3): 724739.
[8]MA G J, ZHANG Y, CHENG C, et al. Remaining useful life prediction of lithiumion batteries based on 1 nearest neighbors and a hybrid neural network[J]. Applied Energy, 2019, 113626.
[9]白亮, 張銀, 梁武科, 等. 優化變分模態分解與集成機器學習的風力機滾動軸承故障分類研究[J]. 機械設計與研究, 2023, 39(3): 101108.
[10] 汪立雄, 王志剛, 徐增丙, 等. 基于深度遷移學習的滾動軸承剩余使用壽命預測[J]. 制造技術與機床, 2020(12): 130134+137.
[11] 趙廣社, 吳思思, 榮海軍. 多源統計數據驅動的航空發動機剩余壽命預測方法[J]. 西安交通大學學報, 2017, 51(11): 150155+172.
[12] 陸航, 董威, 董光磊. 國內外軌道交通PHM應用現狀綜述[J]. 中國鐵路, 2023(4): 8293.
[13] ZHOU Q, SON J B, ZHOU S Y, et al. Remaining useful life prediction of individual units subject to hard failure[J]. Iie Transactions, 2014, 46(10): 10171030.
[14] 張媛, 秦勇, 杜艷平, 等. 基于比例風險模型的列車滾動軸承剩余壽命預測[J]. 濟南大學學報(自然科學版), 2016, 30(5): 347352.
[15] 易彩. 高速列車輪對軸承狀態表征與故障診斷方法研究[D]. 成都: 西南交通大學, 2015.
[16] 白曉平, 劉雨杭. 基于Kmeans退化識別和隨機森林的滾動軸承壽命分析[J]. 組合機床與自動化加工技術, 2024, (7): 150155+160.
[17] 孟洪顏, 胡玉坤, 馮雙, 等. 基于改進的Kmeans聚類和深度神經網絡的軸承故障診斷算法研究[J]. 黑龍江大學工程學報(中英俄文), 2023, 14(4): 5563.
[18] 趙聰聰, 劉玉梅, 趙穎慧, 等. 基于MMFE和可拓kmedoids聚類的軸承性能退化評估[J]. 振動與沖擊, 2022, 41(17): 123130.
[19] XIAO Y C, LIU D D, CUI L L, et al. Heterogeneous graph representationdriven multiplex aggregation graph neural network for remaining useful life prediction of bearings[J]. Mechanical Systems and Signal Processing, 2024, 220: 111679.