王維剛, 劉占生
(1.哈爾濱工業大學 能源科學與工程學院,哈爾濱 150001;2.東北石油大學 機械科學與工程學院,黑龍江 大慶 163318)
?
基于改進判別字典學習的故障診斷方法
王維剛1, 2, 劉占生1
(1.哈爾濱工業大學 能源科學與工程學院,哈爾濱150001;2.東北石油大學 機械科學與工程學院,黑龍江 大慶163318)
摘要:近年來,基于稀疏表示的分類技術在模式識別中取得一定的成功。該框架中,字典的學習和分類器的訓練通常是兩個獨立的模塊,降低了方法的識別精度。針對以上問題,提出了一種特征提取和模式識別相融合的改進判別字典學習模型,將重構誤差項、稀疏編碼判別項及分類誤差項進行了整合,并用K奇異值分解算法對目標函數進行優化,實現了字典和分類器的同步學習。該方法先對原始信號進行經驗模態分解,并從分解的本征模態函數中提取時、頻特征,形成故障樣本;然后將訓練樣本輸入改進模型用K奇異值分解優化;最后用習得字典及分類器權重對測試樣本進行識別。實驗結果表明:該算法不但適用于小樣本故障問題,而且魯棒性和分類性能都明顯高于其它算法。
關鍵詞:稀疏編碼;字典學習;經驗模態分解;故障診斷
對于機械設備而言,不同的故障呈現不同的特征頻率。頻譜分析比時域分析更能清晰地揭示信號的本質。有經驗的維修工人僅憑工作聲音就能確定機器是否正常,其原因是機器有故障時頻譜不同于正常時頻譜,而且人能靠耳朵感覺其不同。聲學模型被認為是稀疏表示模型[1],證明頻譜的稀疏表示對于故障診斷具有理論支撐。
基于稀疏表示的分類技術已經成功用于故障診斷[2-3]、人臉識別[4-5]及圖像分類[6]等領域。該技術主要由字典的學習、稀疏編碼及分類三個環節組成。其中,字典的質量對稀疏編碼的性能有非常大的影響。目前字典的學習算法包含無監督和有監督兩類:前者僅考慮重構項,沒有利用訓練集的類別信息;而后者既包含重構項又包括類別信息,其分類性能優于前者。有監督字典學習方法大致分成三類:第一類是學習多個子字典或特定類的字典,以提高類間判別性。Liu等[2]先從每類軸承數據中學習得到子字典,然后將所有子字典組合成完備字典。盡管分類準確率有了一定的提高,但移不變稀疏編碼的訓練時間非常長,而且模式識別還需要另外的分類器,均增加了實際應用的難度。第二類是從初始大字典中合并或選擇基函數以形成緊湊的字典。為了平衡類內緊致性和類間分離性,Winn等[7]將字典中的基函數進行了合并。為了保證習得緊湊字典的判別性,該類方法起初要求具有較大尺寸的字典。最后一類方法為訓練過程中直接將判別項引入到目標函數中。常用的判別準則包括線性預測分類誤差[5]、Fisher判別準則[8]、Hinge損失函數[9]等。Zhang等[5]將分類誤差項引入目標函數,但在小規模字典時不能保證稀疏編碼的判別性。Yang等[8]引入Fisher判別準則,用類別標簽學習結構字典。
針對上述方法存在的不足,本文提出一種基于有監督判別字典學習的故障診斷方法,該方法將判別稀疏編碼誤差和分類性能準則同時引入目標函數,并且用K-SVD[10]算法進行優化,實現了字典和分類器的同步學習。習得字典不僅能適應訓練故障樣本的潛在結構,又能使稀疏編碼具有較強的判別力,因此該方法能獲得較好的分類性能。該方法首先對原始信號進行經驗模態分解,并從分解的本征模態函數中提取故障特征,然后從故障樣本中利用提出算法學習字典,最后用習得字典和分類器權重進行故障識別。
1基本理論
1.1字典學習模型
根據輸入特征的稀疏編碼判斷其隸屬于哪一類故障,要求字典具有以下性質:① 重構性:利用字典能較好地表示和重構各個故障信號;② 判別性:基于習得字典的稀疏編碼可分性較好;③ 可解釋性:字典中的原子與某類故障有明確的對應關系。
盡管利用K-SVD學習得到的字典重構性較好,但習得字典不具備判別性和可解釋性,不能滿足故障識別的要求。為此本文采用改進算法學習字典,該算法將重構誤差項、稀疏編碼判別項和簡單線性分類誤差項一起整合至目標函數中。因此習得字典不但能反映訓練樣本的數據流形,而且由習得字典得到的稀疏表示也具有較強的判別能力。本文字典學習的目標函數定義如下:
s.t. ?i,‖si‖0≤T
(1)

1.2模型求解
根據矩陣范數性質,將式(1)轉換為下式:
s.t.?i,‖si‖0≤T
(2)


圖1 測試樣本稀疏表示在各個子字典上的響應Fig.1 Response of sparse representations about testing samples in all sub-dictionary
1.3分類方法

(3)
對于某一個測試樣本yi,首先利用正交匹配追蹤(OMP)[11]算法通過求解以下優化問題計算其稀疏表示xi:
s.t. ‖xi‖0≤T
(4)
(5)
式中:l∈Rm為類別標簽向量。
2基于判別字典學習的故障診斷框架
先從機械振動信號中提取特征并產生高維故障樣本,要求提取的特征能很好地表示機械運行狀況。故障診斷信號通常是非靜態且非線性的,而且包含組分非常復雜。而經驗模態分解[12]是一種基于信號局部特征時間尺度的時-頻域信號分析方法,能將振動信號分解為一系列的本征模態函數,是分析非線性信號常用工具。本文應用經驗模特分解對原始信號進行預處理,相比從原始信號提取的故障特征,從本征模態函數提取故障特征更加顯著。經驗模態分解將原始信號o(n)分解為:
(6)
式中,ci(n)為分解的一個本征模態函數,c1(n),…,cP(n)包含從高頻到低頻不同頻段;rP(n)為分解后的殘差信號,表示信號集中趨勢。
基于改進判別字典學習的故障診斷方法應用過程如圖2所示。該方法主要包括以下幾個步驟:
(1) 先用經驗模態分解技術分解原始信號o(n),得到若干本征模態函數c1(n),...,cP(n)及余項rP(n)。
(2) 求取本征模態函數與原始信號的互相關系數。將某階本征模態函數ci(n)看作行向量,原始信號o(n)看作列向量,則這兩組數據的互相關系數[13]為:
式中,m為原始信號的長度。
(3) 依據互相關系數大小與相關程度關系原則,選擇互相關系數排在前4位的本征模態函數作為特征提取的對象。
(4) 從選擇的每個本征模態函數中提取24個故障特征,包括11個時域特征和13個頻域特征,具體公式參考文獻[14]。于是,從每個原始信號獲得4×24=96個特征,生成高維故障樣本。
(5) 將高維故障樣本降維,再把降維后的低維訓練故障樣本輸入到判別字典學習模型中,輸出習得字典及分類器權重。
(6) 對測試樣本,經稀疏編碼后得到對應稀疏表示,再采用線性分類器即可識別其類別標簽。

圖2 基于改進判別字典學習的故障診斷流程Fig.2 Fault diagnosis process based on improved discriminative dictionary learning
3實例分析
在Bently RK 4轉子試驗臺模擬旋轉機械的7種運行狀態,即不平衡、地腳松動、預載荷、電機擾動、徑向碰磨-不平衡、徑向碰磨-地腳松動、徑向碰磨-油膜渦動,其中后三種為復合故障狀態。轉子試驗臺如圖3所示,包括一套基本轉子試驗臺和電機調速器、用于油膜渦動/油膜振蕩試驗的裝置、用于擾動試驗的裝置、電渦流位移傳感器及東方所的采集系統。實驗過程中,采樣頻率為2 048 Hz。每種狀態采集了100個樣本,每個樣本的長度為2 048。圖4顯示了七種工作狀態的時域波形圖及頻譜圖,通過肉眼很難區分不同工作狀態。

圖3 Bently轉子試驗臺Fig.3 Bently rotor experimental rig

圖4 七種工作狀態的時域波形圖及頻譜圖Fig.4 Time domain waveforms and frequency domain spectrums of 7 working states
為防止過度擬合的產生,本算法所有系數的選取均采用交叉驗證法自動完成。另外,為了保證結果的客觀性及對比的公正性,所有實驗結果均為運行20次后的平均值。本文算法參數設置如下:α和β的值分別為4.0和2.0;稀疏度閾值T為5;字典的規模,即K值為25。
利用EMD將徑向碰磨-油膜渦動復合故障振動信號分解成本征模態函數(IMFs),結果如圖5所示。經計算,12個本征模態函數與原始信號的互相關系數分別為0.27、0.03、0.09、0.30、0.004、0.001 4、0.01、0.001 5、0.009 5、0.011、0.002、0.004 5。按互相關系值數大小,依次選擇第1、4、3、2個IMFs作為特征提取的對象。從圖也可以看出,這4個IMFs包含了絕大多數故障信息。接著從選擇的4個IMF中分別提取24個時域和頻域特征,這樣對于每個故障樣本得到24×4=96個特征,即高維輸入空間的維數為96。并用LDA將所有樣本的進行降維。最后將低維故障數據輸入改進字典學習模型。

圖5 徑向碰磨-油膜渦動復合故障的EMD分解結果Fig.5 Decomposition results by EMD forsignal with compound fault of radial rub and oil whirl
圖6展示了本文算法與RSC[15]及SVM(Gauss核)選取不同訓練樣本數時分類性能的比較。本文算法的最高識別率可達到99.86%,而SVM的最高識別率為98.8%,RSC的最高識別率僅為93.3%。本文算法為有監督字典學習算法,而RSC為無監督算法。可以看出,本文算法的性能優于上述其它算法,不但識別率高于其它算法,而且魯棒性較高,即便在較少訓練樣本時亦能獲得較高識別率。盡管SVM的識別率也較高,但其屬于非線性分類器,不但計算時間稍高于本文算法,而且對懲罰參數和高斯參數的設置敏感,魯棒性能低于本文算法。RSC在小樣本時識別率明顯低于本文算法和SVM。

圖6 本文算法與SVM及RSC在不同訓練樣本下的識別率對比Fig.6 Recognition rate comparisonamong our algorithm, SVM and RSC under different testing samples
4結論
本文提出一種基于改進判別字典學習的故障診斷方法,通過字典學習和分類器訓練的同步進行,實現了特征提取和模式識別方法的整合。該方法首先提取原始信號的EMD時域及頻域特征,再利用綜合重構誤差、稀疏編碼判別能力及分類誤差字典學習模型對故障進行識別。該算法的優點:
(1) 算法訓練過程簡單、快速;
(2) 算法的魯棒性較好,僅利用少量的訓練樣本就可以得到較高的識別率;
(3) 模型的分類性能較高,相比其它優秀的算法,本算法的識別率都有明顯的提高。
參 考 文 獻
[ 1 ] Smith E C, Lewicki MS. Efficient auditory coding[J]. Nature, 2006, 439(7079): 978-982.
[ 2 ] Liu H, Liu C, Huang Y. Adaptive feature extraction using sparse coding for machinery fault diagnosis[J]. Mechanical Systems and Signal Processing, 2011, 25(2): 558-574.
[ 3 ] Chakraborty S, Chatterjee A, Goswami S K. A sparse representation based approach for recognition of power system transients[J]. Engineering Applications of Artificial Intelligence, 2014,30:137-144.
[ 4 ] Wright J, Yang A Y, Ganesh A, et al. Robust face recognition via sparse representation[J]. Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227.
[ 5 ] Zhang Q, Li B X. Discriminant K-SVD for dictionary learning in face recognition[C]//Proc CVPR, 2010: 2691-2698.
[ 6 ] Yang J C, Yu K, Gong Y, et al. Linear spatial pyramid matching using sparse coding for image classification[C]//Proc CVPR, 2009:1794-1801.
[ 7 ] Winn J, Criminisi A, Minka T. Object categorization by learned universal visual dictionary[C]//Proc IEEE Int’l Conf Computer Vision, 2005.
[ 8 ] Yang M, Zhang L, Feng X, et al. Fisher discrimination dictionary learning for sparse representation[C]//Proc IEEE Int’l Conf Computer Vision, 2011.
[ 9 ] Yang J, Yu K, Huang T. Supervised translation-invariant sparse coding[C]//IEEE Conference on Computer Vision and Pattern Recognition, 2010.
[10] Aharon M, Elad M, Bruckstein A. K-svd: an algorithm for designing overcomplete dictionaries for sparse representation[J]. Signal Processing, 2006, 54(11): 4311-4322.
[11] Tropp J A, Gilbert A C. Signal recovery random measurements via orthogonal matching pursuit[J]. Information Theory, 2007, 53(12): 4655-4666.
[12] Huang N E, Shen Z, Long S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[C]//Proc Roy Soc Lond Ser, 1998:903-995.
[13] 趙協廣. 基于小波變換和經驗模態分解的滾動軸承故障診斷方法研究[D]. 青島:山東科技大學, 2009.
[14] Lei Y G, He Z J, Zi Y Y, A new approach to intelligent fault diagnosis of rotating machinery[J]. Exp Syst Appl, 2008, 35: 1593-1600.
[15] Yang M, Zhang L, Yang J, et al. Robust sparse coding for face recognition[C]//IEEE Conference on Computer Vision and Pattern Recognition, 2011: 625-632.
Fault diagnosis method based on improved discriminative dictionary learning
WANGWei-gang1,2,LIUZhan-sheng1
(1. School of Energy Science and Engineering, Harbin Institute of Technology, Harbin 150001, China;2. College of Mechanical Science and Engineering, Northeast Petroleum University, Daqing 163318, China)
Abstract:In recent years, the sparse representation-based classification method is successfully employed in pattern recognition. The learning of dictionary and the training of classifier in this method are usually two independent modules to reduce the methods identification accuracy. Here, a novel fault diagnosis method based on improved dictionary learning model was proposed, to integrate sparse coding discriminative error, classification error and reconstruction error. And this model was solved with the K-singular value decomposition (K-SVD) algorithm to realize the synchronization learning of dictionary and classifier. With this method, the original signal was decomposed firstly using the empirical mode decomposition, the features of time domain and frequency domain were extracted from the decomposed intrinsic mode functions to form faulty samples. Then, the training samples were input into the improved model optimized with K-SVD. Finally, the testing samples were identified by using the learned dictionary and classification weights. Experimental results showed that the proposed algorithm can not only be applied in small sample fault diagnosis problems, but also its robustness and classification performance are significantly higher than those of other algorithms.
Key words:spare coding; dictionary learning; empirical mode decomposition; fault diagnosis
中圖分類號:TH165.3;TH133.3
文獻標志碼:A
DOI:10.13465/j.cnki.jvs.2016.04.018
通信作者劉占生 男,博士,教授,1962年生
收稿日期:2014-09-24修改稿收到日期:2014-12-03
基金項目:國家自然科學基金資助項目(50875056);黑龍江省教育廳科學技術研究項目(12521058)
第一作者 王維剛 男,碩士,副教授,1976年生