(國防科學技術大學 信息系統與管理學院, 長沙 410073)
摘要:提出了一種基于離散HSMM的故障預測模型,根據部分觀測矢量預測系統下一時刻處于各個狀態的概率。結合HSMM的前向—后向(FB)算法,給出了部分觀測下HSMM的狀態預測算法。將提出的模型應用于減速箱故障預測中,結果表明該方法可以有效地進行故障預測。
關鍵詞:隱半馬欠可夫模型; 故障預測; 狀態持續建模; 前向—后向算法
中圖分類號:TP301.6文獻標志碼:A
文章編號:1001-3695(2008)11-3320-03
Discrete hidden semi-Markov model based on prognosis model
GUI Lin, WU Xiao-yue
(School of Information System Management, National University of Defense Technology, Changsha 410073, China)
Abstract:This paper proposed a prognosis model based on HSMM and predicted given the probability of a machine operates in some states the past partial observations. Proposed the prognosis algorithm given the past partial observations based on forward-backward algorithm. The model is applied in prognosis of the gearbox, the result indicates the model is effective.
Key words:hidden semi-Markov model(HSMM); prognosis; state duration modeling; forward-backward algorithm
近年來,視情維修(condition-based maintenance,CBM)技術逐步成為維修領域關注的重點。CBM在保證系統可用性的條件下,僅當需要時才對設備進行維修,因而可以提高維修活動的有效性,節省維修成本。CBM根據監控信息對設備狀態進行診斷和預測,并在此基礎上,制定有效的維修策略。診斷指當故障發生時進行故障檢測、隔離和辨識。預測指在故障發生前預測故障的發生,確定某一故障是否正在形成以及多久后此故障會發生或多大可能此故障會發生。目前對于機械故障診斷模型研究很多,故障預測模型研究卻很少。
在設備狀態檢測中,一個重要的步驟就是在提取的特征基礎上建立可靠有效的故障分類系統。在理想的情況下,如果設備的所有動力學特征和測量過程均可建立準確的模型描述,那么根據系統狀態估計和殘差信號的統計分析,可以采用各種方案實現故障分類。然而,事實情況是,尤其對于大型復雜系統,幾乎很難找到這樣一個可靠的系統模型,大部分分類系統面對的觀察量均包含了隨機因素的影響。在過去10年中,隱Markov模型(hidden Markov model,HMM)在設備狀態檢測的應用中非常活躍。HMM作為一種動態時間序列的統計模型,非常適合于對包含隨機因素的信號進行建模,并且適用于樣本量小的情況。此外,模型物理意義明確,相對于一些黑箱建模方法易于理解。因此HMM在故障預測中得到了廣泛應用[1~4]。
HMM的一個重要缺陷是它不能對狀態的持續時間建模,其狀態持續時間默認服從指數分布,這顯然與實際情況不符。為了對狀態的持續時間進行建模,已提出了各種擴展的HMM模型[5,6]。隱半Markov模型(HSMM)[7],又稱為連續可變持續時間的(continuously-variable duration)HMM[8]、分段模型(segment model)[9],提供了這種建模能力。Ljolie等人[10]使用HSMM進行語音識別,與HMM相比,識別率提高了50%。Dong等人[11]使用HSMM進行機械故障診斷和故障預測,結果表明其故障識別率比HMM提高了29.3%,基于HSMM的剩余壽命(remaining useful life,RUL)預測模型效果也較好。
不同于基于HSMM的RUL預測模型[11],本文提出一種基于HSMM的故障預測模型,它預測系統在下一時刻發生故障的概率,并將模型應用于減速箱故障預測中驗證模型的有效性。
1HMM模型
11HMM的基本元素
隱馬爾可夫模型是在Markov鏈的基礎之上發展起來的,它是一個雙重隨機過程,不僅狀態到狀態之間的轉移是隨機的,而且每個狀態的觀測值也是隨機的。模型中真實的狀態不能直接觀測,只能通過觀測矢量感知它的存在,因此這樣的模型稱為隱Markov模型。
一個HMM可以由下列參數描述[5]:
a)N——模型中馬爾可夫鏈的狀態數目。記N個狀態為s1,s2,…,sN,記t時刻Markov鏈所處的狀態為qt,顯然qt∈(s1,s2,…,sN)。
b)M——每個狀態對應的可能的觀測值數目。記M個觀測值為θ1,θ2,…,θM,記t時刻的觀測值為Ot。其中Ot=(θ1,θ2,…,θM)。
c)π——初始概率分布矢量,π=(π1,π2,…,πN)。其中:
πi=P(q1=θi),1≤i≤N
式中q1表示初始時刻1的狀態。
d)A——狀態轉移概率矩陣,A={aij}N×N。其中:aij=P(qt+1=sj|qt=si);1≤i,j≤N。
e)B——觀察值概率矩陣,B=(bjk)N×M。其中:bjk=P(Ot=Vk|qt=θj);1≤j≤N,1≤k≤M。對于連續HMM,B是一組觀察值概率函數,即B={bj(X),j=1,…,N}。
這樣,可以記HMM 為λ=(N,M,π,A,B)或簡寫為λ=(π,A,B)。
12HMM的狀態持續時間
設HMM的狀態持續時間分布使用概率密度函數pi(d)表示,它指系統在狀態i的持續時間為d的概率。對于HMM,系統在狀態i的持續時間為d的概率,即系統轉移到狀態i后,依概率aii(從狀態轉i移到狀態i的概率)留在狀態的i時間為(d-1),然后依概率(1-aii)轉移到其他狀態。因此有
pi(d)=a1-dii(1-aii)
2HSMM模型
21HSMM的基本元素
HSMM是一種擴展的HMM,不同于HMM,其狀態產生的是一個觀測序列。如圖1所示,假設系統的狀態序列為(q1,q2,…,qL),狀態對應的觀測序列分別為((o1,…,ol1),…,(olL-1+1,…,olL))。其中第t個狀態qt對應的觀測序列為(olt-1+1,olt-1+2,…,olt),狀態持續時間為lt-lt-1。
模型假設對于給定的觀測序列長度,各個觀測是獨立同分布的。模型參數除了初始狀態分布π、狀態轉移概率矩陣A和觀察值概率矩陣B外,增加了狀態持續分布D:假設狀態的最大持續時間為H,則D=(djl)N×H。其中:djl=P(lt-lt-1=l|qt=j);1≤j≤N,1≤l≤H。因此其參數可以表示為λ=(π,A,B,D)。
觀測序列(olt-1+1,olt-1+2,…,olt)的分布為
P(o(lt-1+1,lt)|qt,lt-lt-1)=D(lt-lt-1|qt)∏lti=lt-1+1bqt(oi)
22部分觀測下的HSMM狀態預測算法
機械運行壽命非常長,很多時候不可能記錄設備從開始運行直至當前的整個過程的觀測數據,通常只能獲取一段時間的觀測信息,即部分觀測信息。但HSMM的現有算法中要求已知所有觀測記錄才能進行狀態預測,因此需要開發只有部分觀測下的HSMM狀態預測算法。
即假設已知t-1時刻之前一段時間的信號,預測系統t時刻處于某一狀態的概率,計算
P(qt=sm|ot-1t-d)(1)
其中:d是常數,表示記錄的觀測時間長度,通常可知機械已經運行的時間,因此式(1)中t是已知的。
1)改進的FB算法
下面首先給出Yu等人[12]提出的一個HSMM的改進前向—后向(forward-backward,FB)算法,并以其為基礎說明式(1)的計算方法。
由于HSMM不存在和HMM類似的尺度算法來防止溢出,Yu等人提出了一個改進的FB算法,通過使用后驗概率進行迭代從而防止溢出。下面給出算法中定義的一些變量。
定義變量:
αt|x(m,d)=defP(qt=sm,τt=d|ox1)
其中:x的取值可以為t-1或t,分別表示給定觀測ot-11或ot1,預測或估計系統t時刻處于狀態sm,狀態持續時間為d的概率。
定義變量:
b*m(ot)=defαt|t(m,d)/αt|t-1(m,d)=
[P(qt=sm,τt=d,ot-11,ot)P(ot-11)]/
[P(qt=sm,τt=d,ot-11)P(ot-11,ot)]=
P(ot|qt=sm,τt=d,ot-11)/P(ot|ot-11)=
bm(ot)/P(ot|ot-11)(2)
其中:對任何d,由于Markov屬性,都有
P(ot|qt=sm,τt=d,ot-11)=bm(ot)
P(ot|ot-11)可以通過下式求解:
P(ot|ot-11)=∑m,dαt|t-1(m,d)bm(ot)=∑mγt|t-1(m)bm(ot)
下面定義給定觀測ot1,某一個狀態結束于時間t的條件概率,以及給定觀測ot1;某一個狀態開始于時間t+1的概率,分別使用εt(m)和St(m)標記:
εt(m)=defP(qt=sm,τt=1|ot1)=αt|t-1(m,1)b*m(ot)
St(m)=defP(τt=1,qt+1=sm|ot1)=∑nεt(n)anm
由于狀態(qt,τt)=(sm,d)可能從其他任何狀態(包括同樣的狀態)轉移過來或繼續之前的狀態,如(qt-1,τt-1)=(sm,d+1),可以得到如下的前向遞推公式:
αt|t-1(m,d)=St-1(m)pm(d)+b*m(ot-1)αt-1|t-2(m,d+1)(3)
初始值為
α1|0(m,d)=πmpm(d)(4)
2)部分觀測下的HSMM預測算法
αt|t=1對d求和得到qt的邊緣分布
γt|t-1(m)=def∑dαt|t-1(m,d)(5)
由式(5)即可根據觀測ot-11,預測t時刻的狀態qt。
需要求解的式(1)P(qt=sm|ot-1t-d)與γt|t-1(m)的不同在于,對于t=1,…,t-d-1這段時間的觀測信號是未知的。為了解決這個問題,一種方法是考慮o(t)所有可能的取值,對其所有的可能取值求概率的結果得到:
b(ot)=1,where t=1,…,t-d-1
因此,得到t=1,…,t-d-1,…,t-1的所有觀測。根據γt|t-1(m)的求解方法,即可得到需要求解式(1)的計算方法。
3基于HSMM的故障預測模型
31小波包故障特征提取[13]
機械發生故障時,由于各零件結構不同,產生的信號往往含有大量的非平穩成分。輸出信號在各頻率波段中的表現也不同,而小波包分析方法可自動將不同頻率的信號分解到不同的頻帶中,提高時頻分辨率,實現故障特征的提取。使用小波包進行故障提取的具體算法如下:
a)首先對振動信號進行V層小波包分解,分別提取第V層從低頻到高頻2V個頻段的系數Xj(j=1,2,…,2V)。
b)對小波包分解系數重構,提取各頻段信號Sj(j=1,2,…,2V)。
c)求各頻段信號的總能量:
Ej=∫|Sj(t)|2 dt=∑nk=1|xjk|2
其中:xjk(j=1,2,…,2V;k=1,2,…,n)表示重構信號離散點的幅值。
d)構造特征矢量,并作歸一化處理,令E=∑2Vj=1|Ej|21/2。于是特征矢量為F=[E1,E2,…,E2V]/E。
32SOM矢量量化編碼
以小波包故障特征作為特征矢量輸入到離散HSMM中進行訓練必須經過矢量量化(vector quantization,VQ),即將連續的故障特征信號轉換為可以輸入離散HSMM的離散信號,采用自組織特征映射網絡(self-organizing feature map , SOM ) 實現矢量量化。SOM是由芬蘭赫爾辛基大學神經網絡專家Kohonen教授在1981 年提出的。這種神經網絡模擬大腦神經系統自組織特征映射的功能,它是一種競爭學習網絡,學習的過程可以無監督、自組織地進行。詳細介紹見文獻[14]。
33基于HSMM的故障預測模型
基于HSMM的故障預測模型如圖2所示。
具體步驟如下:
a)對全壽命周期訓練數據使用小波包特征提取,并進行SOM矢量量化編碼,得到觀測向量;
b)訓練HSMM模型,得到HSMM的模型參數;
c)對未知傳感器信號進行小波包特征提取和SOM矢量量化編碼;
d)根據2.2節介紹的部分觀測下HSMM狀態預測方法預測系統下一時刻處于各個狀態的概率。
4實例
下面以某減速箱實驗臺的振動信號為例,驗證本文提出的基于HSMM的故障預測模型。減速箱額定輸入轉速為1 750 r/min,減速比為3.333,小齒輪的齒數為21,大齒輪的齒數為70。實驗過程分為兩個階段:a)將一對新齒輪裝入,輸入轉速為1 788 r/min,輸出轉矩為其最大輸出轉矩,運行96 h;b)保持輸入轉速不變,增大輸出轉矩為最大輸出轉矩的三倍,運行至大齒輪有兩個連續的齒發生斷裂(66,67),實驗停止,運行時間10.46 h。
實驗臺上安裝了10個加速度傳感器用來測量振動,選擇2個加速度傳感器信號進行分析,標號分別為#1、#2。減速箱及傳感器位置如圖3所示。傳感器#1安裝在輸出軸側的上面,方向垂直于外表面;傳感器#2安裝在前側,方向朝前。
從實驗開始到結束共記錄了155組連續采集的數據,最開始7組數據的采樣時間間隔為4 h,接下來的一組數據的采樣時間間隔為3 h, 9~29組數據的采樣時間間隔為1 h,30~145組數據的采樣時間間隔為30 min,剩下的10組數據的采樣時間間隔不規律,分別為1998/02/24,146(06:27:55),147(06:28:47),148(06:30:18),149(06:59:39),150(07:00:24),151(07:02:35),152(07:14:37), 153(07:28:27),154(07:30:17),155(07:46:58)。每次連續采集的時間為10 s,采樣頻率為20 kHz。以數據組數為橫坐標,時間為縱坐標,以30 min為時間單元,則整個實驗時間的取值為0~216,數據的采樣時間起點分布如圖4所示。每次連續采集的時間為10 s,采樣頻率為20 kHz。
實驗中選擇時間單位為30 min,即每隔30 min記錄觀測值。由于開始運行時信號相對較平穩,對于開始時缺失的信號可以在已采樣的信號中截取一段作為觀測值。觀測值的獲取方法如下:根據齒輪箱的輸入速度和減速比,可以得知大齒輪旋轉一周需要的時間為0.118 5 s,根據采樣頻率可知如果齒輪發生故障,連續采集2 370個數據中將包含故障信息。因此一次選擇2 400個樣本點,使用db10小波按照3.1節的算法進行五層分解得到特征矢量,然后利用SOM網絡,這里設置為10 ×10 的拓撲結構進行自組織編碼,即形成編碼的是1~100的整數。最后得到一個1~100的整數觀測值。
實驗中選取的系統狀態為正常和故障兩種。采用Yu[12]的改進FB算法使用全壽命周期數據訓練HSMM模型。算法使用迭代次數50,收斂閾值0.0001,圖5為logf的迭代結果,迭代20次收斂。表1為訓練的HSMM模型的狀態轉移概率矩陣。
選擇不同的記錄觀測長度d,對每個d,分別選擇不同的運行時間t,以及不同的訓練數據,進行100次實驗,得到預測的正確率如表2所示。可以看出,對于傳感器#1和#2,模型預測的正確率達到95%以上,預測效果較好。并且當觀測記錄長度d從5增加到10時,預測率均有不同程度的提高,但當d從10繼續增加到20時,預測率卻保持不變,說明這時預測錯誤主要是由其他一些因素造成,如信號的隨機干擾、模型的選擇等,實驗中模型的主要預測錯誤是在剛剛增加轉矩的一段時間。
5結束語
由于記錄整個機械運行過程數據比較困難,提出的基于離散HSMM的故障預測模型根據部分觀測矢量預測系統下一時刻處于各個狀態的概率。結合HSMM的前向—后向算法,給出了部分觀測下HSMM的狀態預測算法。將其應用于減速箱故障預測中,得到了較好的預測效果。實驗結果表明,由于HSMM可以對狀態的持續時間進行建模,非常適合于機械故障預測。
參考文獻:
[1]RAMMOHAN R,TAHA M R. Exploratory investigations for intelligent damage prognosis using hidden Markov models[C]//Proc of IEEE International Conference on Systems, Man and Cybernetics. 2005:1524-1529.
[2]CAMCI F,CHINNAM R B. Hierarchical HMMs for autonomous diagnostics and prognostics[C]//Proc of International Joint Conference on Neural Networks. Vancouver:[s.n.], 2006:2445-2452.
[3]KWAN C, ZHANG X, XU R,et al. A novel approach to fault diagnostics and prognostics[C]//Proc of IEEE International Conference on Robotics Automation. Taipei:[s.n.], 2003:604-609.
[4]CHINNAM R B, BARUAH P. Autonomous diagnostics and prognostics through competitive learning driven HMM-based clustering[C]//Proc of International Joint Conference on Neural Networks. New York:[s.n.], 2003:604-609.
[5]RABINER L R. A tutorial on hidden Markov models and selected applications in speech recognition[J].Proc of the IEEE,1989,77(2):257-286.
[6]OSTENDORF M, DIGALAKIS V V, KIMBALL O A. From HMM’s to segment models: a unified view of stochastic modeling for speech recognition[J].IEEE Trans on Speech and Audio Processing, 1996,4(5):360-378.
[7]RUSSELL M, MOORE R. Explicit modeling of state occupancy in hidden Markov models for automatic speech recognition[C]//Proc of International Conference Acoustic Speech Signal Processing. 1985:2376-2379.
[8]LEVINSON S. Continuously variable duration hidden Markov models for automatic speech recognition[J]. Computer Speech Language,1986,1:29-45.
[9]GISH H, NG K, ROHLICEK J R. Secondary processing using speech segments for an HMM word spotting system[C]//Proc of International Conferencon Spoken Language. 1992:17-20.
[10]LJOLIE A, LEVINSON S E. Development of an acoustic-phonetic hidden Markov model for continuous speech recognition[J]. IEEE Trans on Signal Processing,1991,39:29-39.
[11]DONG Ming, HE D. A segmental hidden semi-Markov model (HSMM)-based diagnostics and prognostics framework and methodo-logy[J].Mechanical Systems and Signal Processing, 2007, 21(5):2248-2266.
[12]YU Shun-zheng, KOBAYASHI H. Practical implementation of an efficient forward-backward algorithm for an explicit-duration hidden Markov model[J]. IEEE Trans on Signal Processing, 2006,54(5):1947-1951.
[13]胡昌華, 張軍波, 夏軍, 等. 基于MATLAB 的系統分析與設計——小波分析[M]. 西安: 西安電子科技大學出版社, 1999.
[14]楊建剛.人工神經網絡實用教程[M].杭州:浙江大學出版社,2001.