李力,王紅梅
(三峽大學 水電機械設備設計與維護湖北省重點實驗室, 湖北 宜昌 443002)
軸承故障是一個動態演變發展的過程,只有當故障發展到一定程度才會影響設備的正常運行[1],所以軸承故障程度的狀態監測與診斷技術在了解軸承的性能狀態和及早發現潛在故障等方面起著至關重要的作用,而且還可以有效提高機械設備的運行管理水平及維修效能,具有顯著的經濟效益。
故障診斷的關鍵問題就是模式識別,也就是分類器的建立。神經網絡識別需要大量的訓練樣本,而訓練樣本的獲取比較困難,優化過程有可能陷入局部極值;大部分神經網絡用于處理靜態模式分類問題,而正常的故障行為是一個動態演變過程[2]。支持向量機(SVM)則是基于統計學理論基礎和小樣本學習方法,可以克服神經網絡難以避免的問題。SVM算法基于核函數,存在泛化能力與核函數選擇密切相關,但對大規模訓練樣本難以實施[3]。隱Markov模型(Hidden Markov Models,HMM)由于具有豐富的數學模型結構及堅實的理論基礎,實踐中有很多成功的應用模式,被廣泛應用于語音識別中[4-5]。
機械故障識別與語音識別中的孤立詞識別類似,故障信號就如某個單詞一樣,HMM在語音識別的成功應用表明,通過對故障信號進行適當的特征提取,必定可以應用于故障模式識別[6-7]。由于具有較強的時間序列建模和信號模式處理能力,因此針對軸承滾動體不同程度的故障,提取其時頻域特征參數,建立對應的HMM模型,對滾動軸承不同程度的故障進行診斷分類。
隨機過程是一連串隨機事件動態關系的定量描述。Markov過程是一個隨機過程,其特性為:由一個狀態向另一個狀態的轉換過程中,存在著轉移概率,并且轉移概率可以依據前一種狀態推算出來,與該系統的原始狀態和此次轉移前的Markov過程無關。Markov模型是一種基于Markov過程的統計模型。HMM是Markov模型的進一步發展,其狀態不能直接觀測,這種隱狀態的存在及特性可通過觀測值及隨機過程間接感知。每個觀測值是通過某種概率密度分布表現為相應狀態,而每個觀測向量由一個具有相應概率密度分布的狀態序列產生。與傳統模式識別方法相比,HMM是基于參數模型的統計識別方法,適用于動態過程時序建模,有強大的時序模式分類能力,適合于對非平穩、重復再現性差的信號分析[8]。
一個HMM由下列基本參數組成[9]。
N:模型中Markov鏈狀態數目。設N個狀態為θ1,…,θN,t時刻Markov鏈所處的狀態為qt,qt∈(θ1,…,θN)。
M:每個狀態對應的可能觀測值數目。設M個狀態為V1,…,VM,t時刻觀測到的觀測值為Ot,Ot∈(V1,…,VM)。
π:初始狀態概率矢量,π=(π1,…,πN),其中
πi=P(q1=θi),1≤i≤N。
(1)
A:狀態轉移矩陣,A=(aij)N×N,其中aij=P(qt+1=θj/qt=θi),
(2)
B:觀測值概率矩陣,B=(bjk)N×M,bjk=P(Ot=Vk/qt=θj),1≤k≤M且
(3)
此時模型為離散HMM;當B不是一個矩陣,而是一組觀測值概率密度,即B={bj(X),j=1,…,N},這種模型稱為連續HMM。
因此,一個HMM可以記為:
λ=(N,M,π,A,B),或簡記為λ=(π,A,B)。
下文在模型訓練及驗證中涉及2個基本算法[9]:
(1)Forward-Backward算法。該算法對于給定的HMM,λ=(π,A,B)中各參數已知,將給定的觀測值序列Ot∈(V1,…,VM)輸入模型中,計算產生該觀測值序列的概率P(O|λ)。由于概率值較小,為了防止下溢,對該概率取對數,稱為對數似然概率,用此算法對故障程度進行分類識別。
(2)Baum-Welch算法。是建立HMM的算法,即HMM參數估計問題,給定模型的狀態數N及觀測值數M,提供一個觀測值序列Ot∈(V1,…,VM),該算法能確定一個λ=(π,A,B),并估計模型的最優參數,使得P(O|λ)最大。
HMM識別故障程度的基本思路為特征提取、特征矢量量化、HMM的訓練和未知狀態觀測序列的識別問題。
(1)分別從正常及各種不同程度損傷的滾針軸承故障信號提取能表征軸承故障程度的特征指標;
(2)將特征指標歸一化后量化編碼。建立HMM時,觀測值序列應為有限的離散數值,經量化處理后的離散數值才能作為模型訓練特征值;
(3)HMM訓練。設置初始模型的參數,量化編碼的離散特征值作為觀測值序列輸入,采用Baum-Welch算法對觀測值序列訓練,調整并優化模型參數,使觀測值序列在該模型下觀測值序列的似然概率最大;
(4)HMM狀態識別。不同故障程度狀態建立與之對應的HMM,將未知故障狀態的數據依次輸入各個模型中,計算并比較似然概率,輸出似然概率最大的模型即為未知信號的故障類型。診斷流程如圖1所示。

圖1 基于HMM的診斷示意圖
為了驗證HMM方法在滾動軸承故障程度診斷中的可行性,進行了試驗分析。監測與診斷對象是6308軸承,模擬故障試驗臺主要由電動機、傳動軸、滾動軸承及加載電動機等部分組成,軸承振動信號由加速度傳感器拾取。設置電動機轉速為1 200 r/min,采樣頻率20 480 Hz,數據長度2 048點。
使用滾動體損傷面積分別約為1,3,7 mm2不同故障程度的滾動軸承進行試驗,分別采集正常軸承、滾動體不同故障程度的振動信號,4種狀態的時域波形如圖2所示。從圖可見,正常狀態軸承的振動時域波形比較平穩;當出現剝落故障后,振動幅度增加,波形出現沖擊及毛刺。但是不同程度的故障振動幅度增加規律性不強,通過常規時域、頻域方法不易識別。

圖2 軸承不同狀態的時域波形
HMM進行模式識別的前提是提取足量有效的特征信息。在此選擇常用時域指標(均方值、有效值、方差、修正樣本方差及標準差)以及時頻域指標(頻域中心、帶寬)作為監測特征,由這7個指標組成7維特征矢量,即模型的觀測序列是7維特征矢量。從不同的故障程度及正常狀態的軸承中提取振動信號用于試驗。正常、剝落1 mm2、剝落3 mm2、剝落7 mm2故障狀態分別對應模型λ1,λ2,λ3和λ4。
為了使各特征值均在某一限定的區間內,將所有信號時頻域特征值分別除以各個指標的最大值進行歸一化。用Matlab中的lloyds和quantiz函數一起對原始特征矢量x進行矢量量化,量化是根據歸一化幅值,將信號分為N-1個區間,N個區域對應N個離散的訓練碼本。信號經量化后得到分布函數partition,得到各個信號對應的索引值Index(x),作為模型的輸入[10]。

(4)
式中:x為原始特征矢量;i為自然數;Index(x)可作為原始信號的量化碼本。文中量化的最大碼本設為100,經矢量量化后得到4種狀態對應的量化編碼序列。
HMM中的Markov鏈由π,A描述,不同的π,A決定其形狀。左右型Markov鏈的特點為:必定從初始狀態出發,沿狀態序列增加的方向轉移,停在最終狀態。該模型更能描述以連續的方式隨時間改變的信號。機械設備狀態運行是隨時間遞增的,因此對軸承故障程度建立HMM時選用左右型。
由于有4種故障狀態,選用4狀態的HMM,即模型參數N選用4。初始概率π=[1 0 0 0],狀態轉移矩陣A=[0.5 0.5 0 0;0 0.5 0.5 0;0 0 0.5 0.5;0 0 0 1];每種狀態取60組作為訓練樣本,用于生成4個狀態下的HMM;剩余各組特征向量作為測試樣本(其中,正常,剝落1 mm2,3mm2和7 mm2樣本數量分別為95,91,84和60組)。訓練所使用的算法為Baum-Welcm算法,設置迭代次數為50,收斂誤差為0.000 01。在模型的訓練中,最大似然估計值隨著迭代次數的增加而不斷增加,直至滿足收斂誤差條件時訓練結束。訓練一般循環10次即可收斂。訓練曲線如圖3所示。

圖3 軸承故障程度訓練曲線
4種狀態的HMM訓練完成后,就建立了一個狀態分類器,即狀態識別的模型庫。對于剩余的4種狀態待測樣本的特征值序列,由Forward-Backward算法計算在λ1,λ2,λ3和λ4模型下,產生此觀測序列的對數似然概率P(O|λ)。對數似然概率值P(O|λ)反映特征向量與HMM的相似程度,其值越大,觀測值特征序列就越接近該狀態的HMM,而特征序列對應于使輸出對數似然概率值最大的模型所對應的故障狀態。據分類識別原則,將待測部分樣本分別輸入到4個已訓練模型庫中,識別結果見表1。

表1 待測樣本部分識別結果
從表1能夠看出,對于正常狀態軸承,模型λ1對應的似然概率值最大,識別出軸承處于正常狀態。同理,HMM也能準確識別其他程度的軸承故障。由此可見,HMM能對不同的故障程度建模并進行模式識別。
將所有待測樣本的觀測值序列,分別導入4個模型中計算產生此觀測值序列樣本的似然概率值,統計各組樣本的狀態識別率,其結果見表2。由表可知,在有限次的測試試驗中,雖然識別過程中存在誤判,但整體識別率已經超過了90%,平均識別率達到95%。說明該模型分類效果良好,達到了診斷的目的。

表2 不同損傷程度軸承識別結果
通過軸承振動信號對軸承進行故障程度診斷時,利用各種時頻域指標,結合HMM理論,提出一種軸承故障程度狀態識別的新方法。該方法通過軸承模擬故障試驗臺獲取滾動體不同剝落程度時的振動信號,提取不同時頻域指標作為有效特征向量序列,并作為HMM的輸入,建立了4種不同的故障程度HMM,基于HMM的狀態分類器能成功地應用到滾動軸承的故障程度識別中。