楊 樂, 王景霖, 李勝男, 邵辰彤, 封錦琦
(1.故障診斷與健康管理技術航空科技重點實驗室,上海 201601;2.航空工業上海航空測控技術研究所,上海 201601; 3.航空工業北京長城航空測控技術研究所,北京 101111)
滾動軸承是機械裝備中保持運動精度和提高機械效率的重要零部件之一,在實際工程應用中,滾動軸承的工作環境相對比較惡劣,由于裝備長時間、高強度運轉,加之安裝使用不當、維護不及時和潤滑不良以及自身缺陷,使得滾動軸承成為機械設備中最容易損壞的零件之一[1-3]。這就對裝備零部件的可靠性、維修性、保障性、安全性和測試性提出了更高的要求。因此,對滾動軸承進行退化趨勢分析和剩余壽命預測既能避免處于工作狀態的裝備突然失效造成事故,又可以為設備后期維修提供決策支持。由此可見,故障預測在裝備健康使用中起著重要作用。國內外學者已經對故障預測進行了大量的攻關研究。
目前,學術界與工程應用中關于故障預測研究與應用已經取得了一些成果,主要有基于模型的故障預測方法和基于數據的故障預測方法,其中基于數據的故障預測方法獲得了廣泛關注[4-5]。基于數據的故障預測方法的一般思路是根據被預測對象的歷史數據,對歷史數據進行分析;采取合適的特征提取方法對原始數據進行處理,目的是得到能表征被預測對象剩余壽命的性能指標;利用合適的預測算法,建立關于性能指標的故障預測模型,通過調節參數,對性能指標進行預測;通過結果分析,得到設備退化趨勢分析結果,從而實現對設備的故障預測。常用的基于數據的故障預測方法主要是利用神經網絡和支持向量機進行故障預測[6]。Widodo等[7]提出了生存分析與支持向量機相結合的壽命預測模型,使用相關分析法確定軸承特征指標,作為輸入參數預測滾動軸承剩余壽命;邱曉梅[6]利用粒子群算法優化BP神經網絡參數,進行基于軸承退化狀態的剩余壽命預測;曾慶凱[8]利用經驗模態分解結合Kriging方法的預測模型,并將軸承剩余壽命表示為剩余壽命百分比進行壽命預測;Ren等[9]在提取軸承振動信號時域、頻域信號的基礎上,提出一種基于深度神經網絡模型的算法進行壽命預測;燕晨耀[10]在提取滾動軸承振動信號時域、頻域特征指標基礎上,分別利用局部均值分解理論對原始信號降噪和主成分分析法對特征信號降維處理,同時采用支持向量機和相關向量機理論進行滾動軸承壽命預測。本文在BP神經網絡的基礎上,利用遺傳算法(Genetic Algorithm,GA)對BP神經網絡的各項參數進行尋優計算,并將軸承時域指標融合為特征矩陣作為輸入參數,將頻域特征指標作為輸出參數,在對軸承退化狀態劃分的基礎上進行軸承衰退期的退化趨勢預測,根據神經網絡原理建立時域輸入特征集與頻域輸出指標之間的相關關系,通過預測頻域指標的變化趨勢反映出軸承的退化趨勢。
BP神經網絡是一種多層前饋神經網絡,BP神經網絡的優點是信號前向傳遞,誤差反向傳遞[11]。BP神經網絡的數據處理過程為:信號首先經過輸入層進入神經網絡,然后通過隱含層進行迭代計算,最后通過輸出層輸出。當神經網絡具有多個隱含層時,每一層的神經元狀態只受上一層神經元影響,如果輸出層得不到預期結果,則誤差進行反向傳播,BP神經網絡根據預測誤差不斷調整網絡權值和閾值,直到BP神經網絡的輸出值逼近預期值。BP神經網絡的三層拓撲結構如圖1所示。
圖1 BP神經網絡網絡拓撲圖
圖1中,x1,x2,…,xn為BP神經網絡的輸入參數;y1,y2,…,ym為BP神經網絡的輸出值;i,j,k分別為輸出層、隱含層、輸出層的神經元數量;ωij為輸入層到隱含層的神經元網絡權值;ωjk為隱含層到輸出層的神經元網絡權值。
BP神經網絡進行預測時,首先要對網絡進行訓練,使網絡具有記憶和預測能力,訓練過程包括以下7個步驟。
① 初始化網絡:根據輸入層參數x和輸出層參數y的個數確定輸入層節點數n、輸出層節點數m和隱含層節點數l,初始化網絡權值ωij、ωjk,設置隱含層閾值a的初始值、輸出層閾值b的初值,初始化其他參數。
② 隱含層輸出計算:隱含層輸出值H的計算公式為
(1)
式中,f為隱含層神經元激勵函數,該函數的表達式為
(2)
③ 輸出層輸出計算:輸出層的輸出值計算與隱含層的輸出Hi有關,計算公式為
(3)
④ 誤差計算:根據輸出層的輸出Ok和預期輸出Yk來計算預測誤差ek,計算公式為
ek=Yk-Ok,k=1,2,…,m
(4)
⑤ 更新權值:根據誤差ek更新網絡權值ωij、ωjk,計算公式為
(5)
ωjk=ωjk+ηHjek,j=1,2,…,l,k=1,2,…,m
(6)
式中,η為學習速率。
⑥ 閾值更新:根據誤差e更新隱含層閾值a、輸出層閾值b,計算公式為
(7)
⑦ 判斷算法是否結束:當誤差e達到精度要求或者迭代次數達到最大時,算法結束,否則,返回步驟②繼續進行預測。
GA是依據自然界遺傳機制和生物進化理論形成的一種隨機尋優方法。GA的基本操作如下。
① 選擇操作:是指從舊群體中以一定的概率選擇個體到新群體中,個體被選中的概率由個體適應度決定,個體適應度越好,被選中的概率就越大。
② 交叉操作:是指從個體中隨機選擇兩個個體,隨機選取一點或多點染色體進行位置交換,產生新的優秀個體,交叉操作如圖2所示。
圖2 交叉操作
③ 變異操作:是指從群體中隨機選取一個個體,選擇染色體中的一個點進行變異以獲取更優秀的個體,變異操作如圖3所示。
圖3 變異操作
GA的基本要素包括:染色體編碼方法、適應度函數、遺傳操作和運行參數。染色體編碼方法主要有二進制編碼、實數編碼等;適應度函數是指根據進化目標編寫的計算個體適應度值的函數,每個個體的適應度值由適應度函數求得并提供給選擇算子進行選擇;遺傳操作包括指選操作、交叉操作和變異操作。
GA優化的思路是通過優化BP神經網絡的初始權值和閾值,使優化后的神經網絡能夠更好地預測函數輸出,優化的要素包括:種群初始化、適應度函數,以及選擇、交叉、變異操作。GA網絡實現的步驟分為以下幾個部分。
(1) 種群初始化。
每個個體均為一個實數串,每個個體包含了連接了輸入層與輸出層的權值、連接隱含層與輸出層的權值、輸出層閾值和隱含層閾值共4個部分。因此,在網絡已知的情況下,就可以構成一個結構、權值、閾值確定的神經網絡。
(2) 選擇適應度函數。
由個體得到的BP神經網絡的初始值和閾值,用訓練數據訓練網絡后預測系統輸出,個體適應度值F由預測輸出值與期望輸出值之間的誤差絕對值計算得到,計算公式為
(8)
式中,n為網絡輸出節點數;yi為網絡中第i個節點的期望輸出值;oi為網絡中第i個節點預測輸出值;k為系數。
(3) 執行選擇操作。
GA常用的選擇操作有輪盤賭法、錦標賽法等,本文選用輪盤賭法。輪盤賭法的原理是基于適應度比例的選擇策略,每個個體i的選擇概率pi的計算公式為
(9)
式中,Fi為個體適應度值;k為系數;N為種群個體數目。
(4) 執行交叉操作。
GA中,由于個體采用實數編碼,所以交叉操作方法采用實數交叉法,第k個染色體ak和第l個染色體al在j位的交叉操作公式為
(10)
式中,b為區間[0,1]內的隨機數。
(5) 執行變異操作。
在執行變異操作時是選擇第i個個體的第j個基因aij進行變異,變異操作的公式為
(11)
本文對滾動軸承的壽命預測主要通過以下步驟實現。
① 特征參數提取:首先從軸承全壽命周期振動數據中提取時域、頻域特征參數,然后計算特征參數與軸承剩余壽命的相關系數,確定閾值以選取合適的特征指標構成預測參數集。
② 軸承退化階段劃分:根據軸承全壽命周期的振動信號特性,劃分軸承的退化狀態。
③ 定義網絡訓練標簽:以軸承退化起始時刻為預測起點,預測軸承從退化開始時刻至完全失效時間段內的退化趨勢。
④ BP神經網絡訓練:確定網絡訓練參數,以軸承時域特征指標組成的特征參數集為輸入,以頻域特征向量為輸出,建立輸入集于輸出標簽之間的關系模型,對網絡進行訓練。
⑤ 退化趨勢預測:利用訓練好的模型對軸承退化趨勢進行預測,進而達到預測剩余壽命的目的,驗證模型準確性,并將GA優化后的神經網絡與初始BP網絡進行比較,分析其結果。
本文采用的滾動軸承全壽命周期數據由西安交通大學雷亞國團隊提供(XJTU-SY軸承數據集),試驗臺如圖4所示[12]。試驗臺采取了兩個PCB352C33單向加速度傳感器分別通過磁座固定于測試軸承的水平與豎直方向上。試驗中使用DT9837便攜式動態信號采集器采集振動信號。采樣參數設置如圖5所示,試驗中設置的采樣頻率為25.6 kHz,采樣間隔為1 min,每次采樣時長為1.28 s。
XJTU-SY軸承數據集分別做了3種工況下5個軸承的加速退化試驗,表1給出了測試軸承的詳細信息,包括其對應的工況、數據樣本總數、基本額定壽命L10、實際壽命和失效位置。如表1所示,以工況軸承1-1為例,工況1的轉速為2100 r/min,徑向力為12 kN,每隔1 min采集一次數據,每次采集數據的時間為1.25 s,采集的數據放在CSV文件中,軸承1-1的全壽命周期一共采集123次,樣本總數為123個CSV文件,每個CSV文件中有32768行、2列數據,第1列為水平方向信號,第2列為垂直方向信號,L10為軸承的基本額定壽命,在加速度實驗中,軸承1-1實際壽命為2 h 3 min,故障類型為外圈故障。本文選擇軸承1-1水平方向振動信號進行故障數據訓練與預測。
圖4 軸承加速壽命試驗臺
表1 XJTU-SY軸承數據集
3.2.1 振動數據降噪處理
在試驗采集到的軸承原始振動信號中含有較多的噪聲,噪聲信號會覆蓋振動信號本身所攜帶的狀態信息,導致信號波形發生變化甚至淹沒故障特征頻率。因此,原始信號繪制的曲線會產生不規則的凸起,為了減弱噪聲對信號的干擾,需要采取一定的降噪方法對原始信號進行處理。本文采用五點滑移平均法進行降噪,計算公式為
(12)
式中,i=3,4,…,m-2。
以軸承1-1的均方根為例,用五點滑移平均法[13]降噪前后的對比圖如圖6所示,可以看出,降噪后的特征指標去除了數據的毛刺,曲線比原始信號的曲線更加光滑。
圖6 降噪前后均方根值對比
3.2.2 特征數據集構造
在振動信號的時域、頻域的眾多信號中,如何選取合適的特征值來表示軸承的退化趨勢是軸承退化趨勢預測前期需要解決的問題,本文采用的方法是:首先計算軸承的剩余壽命百分比,計算當前采樣點時刻軸承剩余壽命與全壽命周期的比值得出剩余壽命百分比,將剩余壽命百分比限定在[0,1]之間。然后計算時域、頻域特征指標與剩余壽命百分比之間的相關系數[14]。相關系數是表征兩個變量之間線性相關程度的量,若有兩個向量x=[x1,x2,…,xn],y=[y1,y2,…,yn],則x、y之間的相關系數計算公式為
(13)
本文提取的時域指標有均方根、峰峰值、方差、峭度、偏度、波形因子、脈沖指標、裕度和方根幅值,頻域指標有平均頻率、中心頻率和頻率標準差。由于特征指標差別較大,計算相關系數時會造成較大誤差,因此,需要將特征指標歸一化到[-1,1],計算公式為
(14)
式中,x為特征指標;xnor為歸一化后的結果;ymax=1;ymin=-1;xmax為特征指標序列中的最大值;xmin為特征指標序列中的最小值。利用式(14)計算軸承1-1水平方向振動信號特征指標歸一化后與剩余壽命百分比,結果見表2。
根據表2計算出的相關系數,應選出符合軸承退化趨勢的特征指標,即選擇與剩余壽命相關性強的特征指標作為輸入輸出矩陣。本文采用設定閾值的方法來確定選取的特征指標,相關系數絕對值大于閾值時,將對應的特征指標構造成輸入輸出矩陣,閾值取各相關系數絕對值的平均值,計算得到閾值為0.6444,經過篩選后,選取相關系數絕對值大于閾值的特征指標。本文選取6個時域指標作為輸入矩陣,一個頻域指標作為輸出矩陣,通過神經網絡模型,建立兩者之間的函數關系,預測頻域指標的變化趨勢來反映軸承的退化趨,構建的特征指標集如表3所示。均方根值、峰峰值、方差、峭度、波形因子、方根幅值為輸入矩陣,平均頻率為輸出矩陣。
表2 特征指標與剩余壽命百分比之間的相關系數
表3 特征指標集
圖7為軸承1-1的全壽命周期振幅圖,由圖7可以看出,軸承先是經過一定時間的穩定運行階段,此時振幅維持在-2~2之間,到達第2.5×106個采樣點時,振幅突然增大,隨后逐漸上升,此階段,振幅在-15~15之間,最后在第3.9×106個采樣點時,振幅又一次上升,此時振幅超過20,因此軸承運行階段可分為3個階段:穩定運行期、衰退期和失效期。
穩定運行期中,加速度幅值變化較小,長時間保持在穩定狀態,相應的特征指標變化也不明顯,此時期內軸承沒有明顯的退化趨勢,因此該時期內對軸承做退化趨勢預測沒有實際意義。在衰退期,軸承加速度幅值逐漸增大,變化趨勢明顯但不迅速,相應的特征指標變化趨勢也逐漸增大。在失效期,軸承加速度幅值激增,且在短時間內振幅增加明顯。由于軸承衰退期和失效期的數據量差別明顯,失效期的數據樣本較之衰退期的樣本量極少,為選擇有代表性的數據進行趨勢預測,本文選擇軸承衰退期的振動信號進行軸承退化趨勢預測。
圖7 軸承1-1全壽命周期振幅圖
用BP神經網絡進行預測時,可以分為3個步驟:BP網絡搭建、BP網絡訓練和BP網絡預測。搭建BP神經網絡時,由于本文設置的輸入為6個參數,輸出為1個參數,所以構建的BP神經網絡輸入層節點數為6,輸出層節點數為1,分別設置隱含層為單隱含層和多隱含層。BP神經網絡的訓練用輸入輸出參數進行網絡訓練,使訓練好的網絡能夠實現預測功能。選擇輸入輸出數據的90%作為訓練數據集,10%作為測試集用于測試網絡的預測功能。圖8為單隱含層BP神經網絡的預測結果,圖9為雙隱含層的預測結果,可以看出預測結果與期望輸出間誤差較小,經計算可知單隱含層BP網絡的預測結果與期望輸出間的均方誤差為0.0081,雙隱含層BP網絡的預測結果與期望輸出間的均方誤差為0.0058。
GA優化BP神經網絡預測模型分為3個步驟:確定BP網絡結構、GA優化參數和網絡預測。網絡結構由擬合函數的輸入輸出參數個數來確定,同時,GA個體長度也由擬合函數的輸入輸出參數個數確定。因為種群中的每個個體都包含了一個網絡中所有的權值和閾值,因此使用GA優化BP神經網絡的權值和閾值時,個體通過適應度函數計算個體適應度值,GA通過選擇、交叉、變異操作找到最優個體。當種群中最優個體被找到后,用最優個體對網絡的初始閾值和權值賦值,訓練網絡用于預測。
圖8 單隱含層BP神經網絡預測結果
本文中,由于輸入輸出參數分別為6和1,所以設置BP神經網絡輸入層節點數為6,輸出層節點數為1,設置隱含層節點數為5,因此共有權值個數為35個,共有閾值個數為6個,GA個體編碼長度為41。同樣選擇輸入輸出數據的90%作為訓練數據集,10%作為測試集用于測試網絡的預測功能。圖10為GA優化BP神經網絡后的預測結果,由圖10可知,其優于期望結果,經計算可得預測結果與期望輸出間的均方誤差為0.0041。
圖10 GA-BP算法預測結果
本文分別使用單、雙隱含層BP神經網絡和GA-BP神經網絡進行軸承退化趨勢預測,并與使用粒子群優化后的BP神經網絡預測結果進行對比,圖11為4個網絡預測結果與期望輸出之間的誤差的對比圖。從圖11中可以看出,本文所提出的基于GA優化BP神經網絡的參數算法預測誤差最小。表4列出了4種方法的預測誤差的均方根誤差值、平均值誤差,可以看出經過GA優化后的算法誤差在4種模型中的預測誤差最小,GA優化后的預測誤差的均方根值為0.0041,平均誤差為0.0033。
圖11 預測結果誤差對比
表4 預測誤差對比