謝中敏,沈?qū)殗?超
(江蘇航空職業(yè)技術(shù)學院航空工程學院,江蘇鎮(zhèn)江 212134)
軸承作為旋轉(zhuǎn)機械的核心部件,其故障信息經(jīng)常被反映在振動信號中。但受制備材料、工作環(huán)境等影響,致使軸承壽命離散度較大,且其振動信號常受到其他部件的影響,導致對軸承故障狀態(tài)識別的難度較大[1]。
軸承故障振動信號是典型的非平穩(wěn)信號,部分振動信號處理方法難以描述非平穩(wěn)信號的局部信號特征,但經(jīng)驗?zāi)B(tài)分解法(Empirical Mode Decomposi‐tion,EMD)能夠?qū)⒄駝有盘柗纸鉃槿舾蓚€本征模態(tài)(Intrinsic Mode Function,IMF)分量[2-3],從而凸顯出信號的局部特征。且針對單通道混疊信號的另一種處理方式是利用獨立分量(Independent Component Analysis,ICA)有效地分離振動信號中的故障特征信息,剔除噪聲信號的干擾,從而進行頻譜分析[4]。王志等[3]對軸承振動信號進行EMD 分解,將IMF 作為故障特征樣本,采用融合和算法對滾動軸承故障樣本進行診斷并取得較好的診斷結(jié)果;張健等[5]同樣采用EMD 對滾動軸承振動信號進行分解并采用變量預(yù)測模型對軸承故障進行診斷。但EMD 分解會產(chǎn)生欠包絡(luò)、端點效應(yīng)等問題[6],而使用ICA需要構(gòu)建有效的信號輸入矩陣。
由于振動信號分析帶來的諸多因素,許多學者對振動信號進行處理后,基于部分神經(jīng)網(wǎng)絡(luò)具備的模糊診斷性能實現(xiàn)軸承故障特征識別。皮駿等[7-8]基于軸承振動信號時域特征參數(shù),結(jié)合遺傳算法[7]、量子遺傳算法[8]、極限學習機[7-8]等對軸承故障進行診斷并取得較好的結(jié)果;陳超宇等[9]利用全矢深度學習網(wǎng)絡(luò)對軸承故障樣本進行診斷;殷鍇等[10]將BP 神經(jīng)網(wǎng)絡(luò)用于故障診斷;馬圣[11]基于試驗室軸承故障信號,利用經(jīng)驗?zāi)B(tài)分解法對軸承故障振動信號進行處理,并結(jié)合優(yōu)化算法優(yōu)化的極限學習機實現(xiàn)軸承故障診斷;鄭蒙福等[12]基于滾動軸承信號的集總經(jīng)驗?zāi)B(tài)分解的能量特征,結(jié)合單純進化算法優(yōu)化的支持向量機實現(xiàn)軸承故障診斷。但不少學者直接對采集的振動信號進行時域特征處理[6],導致得到的特征信息中也存在干擾信息。為了避免由于振動信息摻雜帶來的干擾,本文采用EMD 對振動信號進行分解,利用能量貢獻度篩選IMF 分量進行信號重構(gòu),通過ICA 實現(xiàn)振動信號的分離;對處理后的信號進行特征參量提取,考慮到提取特征參量之間的耦合性、高維性,采用遺傳算法進行最優(yōu)特征選擇,并用遺傳算法優(yōu)化的極限學習機實現(xiàn)軸承故障診斷。
軸承通常被包裹在旋轉(zhuǎn)機械的內(nèi)部,通過振動加速度采集到的振動信號較弱,且包含各種復(fù)雜的機械噪聲信號與部分由試驗設(shè)備等造成的干擾信號。對此,采用最小二乘法擬合法消除由于采集系統(tǒng)或者振動信號本身原因所導致的信號漂移現(xiàn)象。
采集到的振動信號中通常包含著多種微弱振動信號,極有可能淹沒由軸承故障引起的高頻沖擊信號。EMD 是一種非常適用于處理非平穩(wěn)信號的時頻處理方法[2],其主要思想是將振動信號x(t)進行分解,直到不滿足前提假設(shè)條件時為止,分解得到的一系列獨立分量從不同角度反映著振動信號。
振動信號x(t)極有可能由不同振動源組合疊加而成,因此在處理振動信號時如果能夠準確識別振源,對于故障識別頗受裨益。快速ICA 能夠從復(fù)雜混疊信號中提取相互獨立的信號源[2]。
基于上述分析,本文在對振動信號進行后續(xù)處理時,采用“最小二乘法+EMD+ICA”的模式對采集到的振動信號進行降噪處理,剔除信號x(t)中的干擾項,其降噪流程如圖1所示。
降噪方法的基本步驟如下:
(1)對軸承振動信號x(t)進行最小二乘法趨勢消除分析,并對振動信號數(shù)據(jù)進行指數(shù)平滑法處理;
(2)對步驟(1)處理得到的振動信號進行EMD 分解,得到1組不同尺度的IMF分量;
(3)計算IMF分量的信息熵增益比,計算方法如下:
a.對IMF分量進行歸一化處理

式中:λi'為處理后的IMF 分量;λi為IMF 分量降序排列后的第i個分量;d為IMF分量的數(shù)量。
b.計算第i個分量的熵值pi

c.計算第i個分量熵值pi的增益比gi

(4)對篩選信息增益比大于0.1 的前幾個分量進行重構(gòu)得到信號x(t)';
(5)將x(t)與x(t)’作為ICA 的輸入矩陣,令其均值0 進行去中心化和白化處理,隨機選擇初始權(quán)值wp;
(6)通過一系列迭代計算,當wp收斂時可得到分離矩陣和分離信號。
文中所采用的滾動軸承故障振動數(shù)據(jù)源自美國西儲大學的軸承數(shù)據(jù)中心[13]。軸承故障模擬試驗臺如圖2 所示。試驗臺主要包括:1500 W 的電機、扭矩頻編碼器、功率計、加速度傳感器、控制電子裝置等(圖中未給出);軸承類型為6205-2RS-JEM-SKF,其基本尺寸參數(shù)見表1。在試驗中,電機轉(zhuǎn)動頻率為1730 r/min,采用頻率為48 kHz。采用整周期采樣,獲取到內(nèi)環(huán)故障、外環(huán)故障以及滾動體故障的振動信號,其中某個整周期的時域振動信號如圖3所示。

圖2 軸承振動分析試驗臺和采集裝置

表1 6205-2RS-JEM-SKF型軸承參數(shù)

圖3 滾動軸承振動信號的時域波形
采用第1 章中提到的方法對滾動軸承振動信號進行降噪處理,內(nèi)環(huán)故障的振動信號經(jīng)過最小二乘法和指數(shù)平滑法處理后的效果如圖4 所示。從圖中可見,軸承振動信號的采集確實存在一定的微弱漂移現(xiàn)象;并且經(jīng)過平滑處理后,振動信號的趨勢變化更為直觀可見。

圖4 最小二乘法消除趨勢項
對振動信號進行EMD 分解,外環(huán)故障振動信號的EMD 分解如圖5 所示;計算內(nèi)、外環(huán)故障以及滾動體故障振動信號的IMF 分量的信息熵增益比,如圖6所示。從圖中可見,不同故障類型的振動信號被分解成的IMF 分量數(shù)量不一,且其所包含的信息量不同,選擇信息增益比大于0.1 的IMF 分量實現(xiàn)信號重構(gòu),得到x(t)'。將x(t)與x(t)'作為ICA 的輸入矩陣,對振動信號進行分解,軸承內(nèi)環(huán)故障信號分解如圖7所示。

圖5 外環(huán)故障信號的EMD分解

圖6 IMF分量的信息熵增益比

圖7 軸承內(nèi)環(huán)故障
從圖中可見,IC2分量相比于IC1分量沖擊特性更加明顯,且其頻域變換后IC2的特征頻譜相比更易突出。因此,后續(xù)特征參量提取基于ICA 分離后得到的IC2分量。
但通過頻譜對故障特征進行識別,尤其是針對軸承而言,需要先根據(jù)待檢測物體尺寸計算故障特征頻率,隨后從頻譜中尋找是否存在相關(guān)故障特征頻率的倍頻存在,從而判斷故障。在識別過程中為降低人工干預(yù),采用遺傳算法優(yōu)化的極限學習機對軸承健康狀態(tài)進行診斷。
在時域分析中,通常使用能夠反映振動信號在時域上的幅值和能量的指標[2,7]:平均值、絕對平均值、峰峰值、均方根值;能夠反映振動信號在時域上分布的指標:標準差、偏度、峭度、脈沖因子、波形因子、波峰因子、變異系數(shù)、方差。這些指標的部分值見表2。
工程項目質(zhì)量,由于其影響因素多,波動大、變異大、隱蔽性以及終檢局限大等特點,造成工程項目質(zhì)量管理中往往會不可避免地出現(xiàn)一些問題,工程項目質(zhì)量管理不是一個單一的短期的過程,而應(yīng)該是一個長期的系統(tǒng)的過程。施工項目質(zhì)量控制的系統(tǒng)過程主要分為事前質(zhì)量控制,事中質(zhì)量控制和事后質(zhì)量控制。

表2 時域特征參量
考慮到時域特征中部分特征之間的耦合性和特征指標數(shù)量的高維性,如果直接進行故障診斷不僅造成診斷時間延長,同時還會造成診斷效果較差。因此,利用遺傳算法對輸入變量進行降維操作。
利用遺傳算法對自變量降維時,需要將解空間映射到編碼空間中,而每個編碼則表示一種解。在變量篩選過程中,變量要么被選中要么被舍棄,選中的變量對應(yīng)的基因值賦值為“1”,否則賦值為“0”。采用遺傳算法在降維過程中,通過計算檢驗集樣本的誤差值判斷變量的舍棄,如果變量的加入使得誤差值減小,則選擇,否則舍棄。
由于每類故障有960 組樣本集,3 類軸承故障共計2880 組數(shù)據(jù),隨機選擇2000 組數(shù)據(jù)集作為訓練樣本集,另隨機不重復(fù)選擇300 組數(shù)據(jù)集作為校驗集數(shù)據(jù),剩下的580 組數(shù)據(jù)作為測試集樣本數(shù)據(jù)。由于神經(jīng)網(wǎng)絡(luò)隨機初始值導致的不可復(fù)現(xiàn)問題,篩選變量時需在相同條件下重復(fù)試驗100 次,記錄每次試驗的校驗集誤差值,求得的平均誤差變化如圖8 所示;選擇出現(xiàn)頻率大于50次的特征參量作為最優(yōu)特征,在100次試驗下各特征被選中的次數(shù)如圖9 所示。因此,最優(yōu)特征參數(shù)為:平均值、絕對值、峰峰值、均方根值、偏度、峭度、脈沖因子、波峰因子,其部分數(shù)值結(jié)果呈現(xiàn)見表3。

表3 最優(yōu)的時域特征參量

圖8 自變量降維過程的適應(yīng)度函數(shù)進化過程

圖9 100次試驗下各變量被選中的頻率
Huang 等[14]提出極限學習機(Extreme Learning Machine,ELM)算法,用于克服單隱層前饋神經(jīng)網(wǎng)絡(luò)訓練速度慢、容易陷入局部極小點而難以達到全局最優(yōu)等缺點。且ELM 算法隨機產(chǎn)生輸入層與隱含層連接權(quán)值和隱含層閾值,便能逼近任意非線性分段函數(shù)[15]。但極限學習機相比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需要更多的隱含層神經(jīng)元,且由于隨機賦予輸入權(quán)值和閾值,可能會導致病態(tài)問題出現(xiàn)[16]。針對這一問題,本文利用遺傳算法優(yōu)化ELM,并用于故障診斷中。
3.2.1 遺傳算法
遺傳算法是一種生物種群優(yōu)化算法,其基本思想是通過對種群中的個體進行交叉、變異等操作實現(xiàn)最優(yōu)種群的選擇,其詳細理論可參考文獻[11]。遺傳算法具有實用、高效、魯棒性強的優(yōu)點,但在求解非線性問題時容易出現(xiàn)早熟現(xiàn)象,從而使算法不能跳出局部極值。為避免這種情況的出現(xiàn),文中采用自適應(yīng)變異概率,即:對高于種群平均適應(yīng)度的個體采用較低的變異概率,而對低于種群平均適應(yīng)度的個體采用較高的變異概率。
3.2.2 遺傳算法優(yōu)化的極限學習機
診斷模型的基本步驟如下:
(1)根據(jù)提取的時域特征參數(shù)量,設(shè)置降維模型中遺傳算法的參數(shù)并初始化種群;
(2)經(jīng)過選擇、交叉、變異操作,產(chǎn)生新的種群,并計算校驗集樣本的誤差;
(3)根據(jù)誤差選擇特征變量,重復(fù)進化種群直至滿足終止條件時輸出最優(yōu)特征變量;
(4)對最優(yōu)特征參量數(shù)據(jù)集進行非重復(fù)劃分,并設(shè)置優(yōu)化模型中的遺傳算法相關(guān)參數(shù);
(5)經(jīng)過選擇、交叉、變異操作,產(chǎn)生新的種群,并計算種群適應(yīng)度值;
(6)根據(jù)適應(yīng)度值選擇最優(yōu)個體;
(7)重復(fù)步驟(5)并實時更新最優(yōu)個體,直至滿足終止條件為止;
(8)輸出ELM 網(wǎng)絡(luò)的最優(yōu)參數(shù)值,并根據(jù)Moore-Penrose計算ELM輸出矩陣。
文中涉及到遺傳算法優(yōu)化極限學習機診斷模型為一整體,是指診斷方法主要包括如下過程:信號的處理、特征提取、降維和診斷,其診斷過程如圖10 所示,圖中紅色虛線表示誤分類。

圖10 EMD-FASTICA 與遺傳算法降維的極限學習機診斷方法
為了驗證文中提出的故障診斷方法,從是否去噪、是否降維并結(jié)合常見的BP神經(jīng)網(wǎng)絡(luò)、支持向量機出發(fā),分析本文方法的可行性。
對算法中涉及的參數(shù)進行如下說明:遺傳算法種群數(shù)量為30,最大進化代數(shù)為100,交叉概率為0.6,變異概率為0.05,初始基因值為[-0.5,0.5];極限學習機網(wǎng)絡(luò)輸入神經(jīng)元數(shù)量等于輸入變量維度,隱含層神經(jīng)元數(shù)量為30,激活函數(shù)采用sigmoid(),輸出神經(jīng)元數(shù)量為3;BP 神經(jīng)網(wǎng)絡(luò)采用3-7-1 的網(wǎng)絡(luò)結(jié)構(gòu);支持向量機隨機初始化罰參數(shù)和核參數(shù);在遺傳算法優(yōu)化的極限學習機中,從數(shù)據(jù)樣本集中隨機不重復(fù)地選擇1660 組數(shù)據(jù)作為訓練集數(shù)據(jù)、隨機不重復(fù)地選擇500組數(shù)據(jù)作為校驗集數(shù)據(jù),剩下的720 組數(shù)據(jù)作為測試集數(shù)據(jù);在未優(yōu)化的極限學習機中,隨機不重復(fù)地選擇2160組數(shù)據(jù)作為訓練集數(shù)據(jù)、剩下720組數(shù)據(jù)作為測試集數(shù)據(jù)。
利用本文提出的方法及對比方法對軸承故障樣本數(shù)據(jù)實施診斷,其診斷結(jié)果見表4。為了方便分析,對結(jié)果進行分類整理,如圖11、12所示。
從表4 中可見,故障樣本數(shù)據(jù)經(jīng)過降噪、降維處理后的診斷效果與未降噪、未降維的效果存在差異,其規(guī)律很好地被展示在圖11、12中。從圖11中可見,振動信號經(jīng)過降噪處理并對振動特征參數(shù)進行降維處理后,診斷效果均存在明顯改善;從圖12 中可見,振動信號經(jīng)過降噪處理后相比未降噪,其診斷結(jié)果也存在明顯差異;通過對表4 的診斷結(jié)果數(shù)據(jù)進行分析發(fā)現(xiàn),經(jīng)過降噪并降維處理后,診斷效果最好;且相比于ELM、SVM和BP,GA-ELM 的診斷效果最優(yōu),其對3種故障的平均診斷正確率達到90.67%,而其它3種分別為87.36%、81.35%和81.56%。

表4 故障診斷結(jié)果

圖11 軸承故障樣本數(shù)據(jù)診斷結(jié)果(降維)

圖12 軸承故障樣本數(shù)據(jù)診斷結(jié)果(未降維)
通過試驗仿真發(fā)現(xiàn):(1)ICA 能對混疊信號進行有效分離,實現(xiàn)更具故障特征信息的提取;(2)特征變量的降維不僅能夠降低計算維度,同時也能提升診斷方法的準確率;(3)經(jīng)過優(yōu)化后的診斷網(wǎng)絡(luò),其故障識別率相對提升;(4)文中提出的軸承故障診斷方法能夠有效地實現(xiàn)故障診斷,其準確率能超過90%,具有明顯優(yōu)勢,而ELM、SVM 和BP 3 種診斷模型正確率分別為87.36%、81.35%和81.56%。