李 勝,張培林
(軍械工程學院 一系,石家莊 050003)
在對振動信號進行特征選擇時,由于其非平穩的特性,導致大量的故障信息淹沒在背景中,利用傳統的時域或頻域方法很難從中提取出有效地故障特征[1-2]。Huang[3-4]提出的一種適用于分析非平穩信號的新方法EMD法,該方法基于信號的局部特征時間尺度,可以把信號分解成若干個固有模態函數(Intrinsic mode function,IMF)之和,分解出的各個IMF分量突出了數據的局部特征,對其分析可以更準確有效地把握原始數據的特征信息。最重要的是分解后的各個IMF分量是經過平穩化處理的。
AR(Auto-regressive)模型是一種時間序列分析方法,該模型參數凝聚了系統狀態的重要信息,準確的AR模型能夠深刻地、集中地表達動態系統的客觀規律。研究表明,AR模型的自回歸參數對狀態變化規律反映最敏感[5-6]。因此采用AR模型的自回歸系數作為特征向量對手動換向閥的工作狀態進行分析是非常有效的。由于AR模型適用于平穩信號,并且各個IMF分量是平穩的,所以就可以對各個IMF分量建立AR模型,提取AR模型的自回歸系數和殘差作為故障特征向量。基于EMD的AR模型已經成功地應用于高壓齒輪泵、往復泵等部件的故障特征提取[7-8]。
Leardi等[9-10]提出了把遺傳算法(GA)與偏最小二乘法(PLS)結合起來發展的一個變量選擇方法(GA-PLS)并將其用于波譜數據中波長的特征選擇,獲得了令人滿意的結果。GA-PLS方法由于結合了GA的全局優化搜索能力和PLS有效地解決變量間多重共線性問題的能力,具有較好的變量選擇及模型優化效果,能篩選出與故障信息更相關的特征向量,并且剔除數據中大量冗余和無關的變量。
本文提出了基于EMD和GA-PLS的特征選擇算法。該算法首先對振動信號進行EMD分解,得到多個IMF分量,然后對各個IMF分量利用AR模型進行建模,用AR模型的自回歸系數和殘差作為初始特征向量,然后,利用GA-PLS對初始特征向量進行進一步的特征篩選,最后,以該特征向量為輸入,采用三種典型的分類器,建立故障分類器,識別手動換向閥的工作狀態和判斷故障類型。通過對實驗信號的分析,驗證了將EMD方法和GA-PLS算法相結合能有效地應用于手動換向閥的故障特征選擇,從而為手動換向閥的故障診斷提供了一種新的特征選擇方法。
EMD方法的目的是通過對非線性、非平穩信號的分解獲得一系列表征信號特征時間尺度的固有模態函數,使得各個 IMF是單分量的幅值或頻率調制信號[6-7]。每個 IMF滿足以下2個條件:
(1)在整個數據段內,極值點的個數和過零點的個數必須相等或最多相差一個;
(2)信號上任意一點,由局部極大值點確定的包絡線和由局部極小值點確定的包絡線的均值均為零,即信號關于時間軸局部對稱。
對任一實信號x(t)進行EMD的具體步驟是:
(1)確定信號x(t)的所有局部極值點,然后用三次樣條插值分別將所有的局部極大值點和局部極小值點連接起來,形成上包絡線和下包絡線,這兩條包絡線包絡了所有的信號數據。m1(t),用x(t)減去m1(t)得:
(2)計算上、下包絡線的平均值,記為 m1(t),求出:

如果h1(t)是一個IMF,那么它就是信號x(t)的第一個IMF。
(3)如果h1(t)不是一個IMF,則將h1(t)作為原始數據,重復步驟(1)、(2)得到上、下包絡線的平均值,記為m11(t),計算h11(t)=h1(t)-m11(t),并判斷是否滿足IMF的條件,如不滿足,則重復循環,計算h1k(t)=h1(k-1)(t)- m1k(t),直到 h1k(t)是一個 IMF。記c1(t)=h1k(t),則c1(t)為信號x(t)的第一個IMF。
(4)將c1(t)從x(t)中分離出來,得到:

將r1(t)作為原始數據,重復步驟(1)-(3),得到第二個IMF c2(t)。重復循環n次,到信號x(t)的n個IMF,于是有:

當rn成為一個單調函數不能再從中提取滿足IMF條件的分量時,循環結束。這樣信號可表示:

其中,rn稱為殘余函數,代表信號的平均趨勢。
GA-PLS算法對變量的選擇過程由以下五個基本步驟組成。
(1)隨機地給每個染色體賦值,確定染色體初始長度,1代表選中相應的變量,0代表變量未被選中。染色體長度的具體數目由需要解決問題的維數決定;
(2)確定每個染色體的個體適應度,由以下的內部預測模型給出評估:

q2是通過留一法得到的交叉驗證值,SSY是變量的平方和,PRESS是留一法交叉驗證后的預測平方和,n是樣本個數,c是被選擇出的變量個數。不但模型的可靠性由q2決定,而且被選擇的變量個數也由適應度函數決定。
(3)具有較高適應度的染色體均選自以任意比例的長度。其他必要的染色體,通過交叉和變異得到,從而彌補下一代的數量,以確保種群的多樣性。
(4)在一個交叉過程中,隨機挑選一對染色體,對其單獨分割,互相交換,并以預先確定的交叉頻率合并。在一個突變過程中,對每一個染色體的二進制模式改變一個小概率。
(5)根據個體適應度,對后代重新進行安置并取代上一代的位置。重復運行以上的四個步驟(步驟2到步驟(5)直到世代的數目達到給定的最大數目的世代[9-10]。圖 1 描述了GA-PLS進行特征選擇的過程。
GA-PLS算法有以下的優點[11-12]。與其他方法相比,在全局搜索能力方面,GA-PLS方法能更精確地找到優化的解決方法。偏最小二乘法能解決多元回歸多重共線性問題。當樣本點個數比變量少時,也對回歸模型進行了分析。因此,GA-PLS算法結合了兩種算法的優點,并大量地成功地應用在不同的數據類型的特征選擇。

圖1 GA-PLS的特征選擇過程Fig.1 Feature selection process by GA-PLS
采用根均方誤差(root-mean-square error,RMSE)作為誤差函數,根據以下的公式計算:

其中,yi是訓練集中的理想輸出,f(xi)是通過留一法交叉驗證得到的實際輸出,N是訓練集中的樣本數目。
在GA-PLS算法中,根據經驗值,影響其性能的參數的設置如下[9-10]:在初始群中每條染色體平均由5個變量組成,種群大小30,迭代次數100,突變概率0.01,交叉概率 0.5,遺傳迭代次數 100。
基于EMD和GA-PLS的特征選擇算法過程如下。
(1)分別在各個工作狀態下,按一定的采樣頻率fs進行N次采樣,得到振動信號。
(2)對每一種狀態下的每一個訓練樣本進行i層EMD 分解,得到 i個 IMF 分量 c1,c2,…,ci。
(3)對每一個IMF分量ci建立AR模型,采用FPE準則確定模型的階數m,由最小二乘法估計自回歸參數 φik,k=1,2,…,m 和模型的殘差 ei,提取 φik和 ei形成初始故障特征向量,因此,得到一個 l×(m+1)的矩陣:Ai={φi1,…,φim,ei}。
(4)GA-PLS算法對 l×(m+1)的矩陣進行特征選擇以減少維數,并得到更有效的特征向量,得到的新的特征向量Bi作為輸入量。
(5)采用分類器對由故障特征向量Bi組成的訓練樣本進行訓練,得到對應的分類器,用測試樣本進行測試,得到輸出結果。基于EMD和GA-PLS的特征選擇算法流程如圖2所示。

圖2 基于EMD和GA-PLS的特征選擇算法流程Fig.2 The flow chart of feature selection
對上述理論分析進行實驗驗證。實驗裝置為液壓系統綜合檢測與試驗設備。采用某型工程車輛的手動換向閥作為實驗器件,圖3為該手動換向閥的結構圖。在手動換向閥進油口、出油口、裝填回路管路和助力回路管路上,安裝壓電加速度傳感器,傳感器型號為CAYD-185。手動換向閥實驗裝置、傳感器測點布置與信號采集裝置如圖4所示。該裝置能模擬正常狀態、裝填故障、助力故障等多種故障狀態,壓電加速度傳感器測量手動換向閥油管管口的振動信號。

在液壓系統綜合檢測與試驗設備上,對手動換向閥三種工作狀態分別采樣。實驗中,電動機轉速為1 000 r/min,采樣頻率為 10 kHz,采樣時間為 0.41 s,分別采集正常狀態、裝填故障和助力故障三種工作狀態下的振動信號各50組數據,其中,20組數據作為訓練樣本,30組數據作為測試樣本。
對振動信號進行EMD分解。由于EMD方法是一種主成分分析方法,其主要的故障信息集中在前幾個IMF分量。因此,本文進行11層EMD分解,并選用了前6個IMF分量。對3種工作狀態信號的前6個IMF分量分別建立AR模型,采用FPE準則確定模型階數m。在本文的實驗中,AR模型的階數設定為8階。因此,手動換向閥的故障信息主要包含8個AR模型系數和殘差作為特征參數。圖5為三種工作狀態的振動信號對比。以裝填故障的振動信號為例,圖6表示了該信號的11個IMF分量。

圖5 三種工作狀態的振動信號Fig.5 The vibration signals of three states
表1給出的是三種狀態下各一個手動換向閥振動信號的初始特征向量(由于篇幅關系,其它特征向量未列出),然后將初始特征向量作為輸入,利用GA-PLS特征選擇方法進行進一步的篩選。
表2給出每個特征向量對應的個體適應度值。從表中可以得出不同故障狀態的特征向量。表3為經GA-PLS方法篩選后的特征向量Bi。將表1和表3進行對比后發現,經過GA-PLS方法篩選后,特征向量數量大大減少,維數大大降低,有利于分類。

圖6 裝填故障的IMF分量Fig.6 The IMFs ofloading fault states

表1 手動換向閥各種狀態下的特征向量Tab.1 The parameters of AR model for IMFs of each fault state

表2 被選擇特征向量對應的個體適應度值Tab.2 Selected features and corresponding fitness values by GA-PLS

表3 經GA-PLS選擇后的特征向量Tab.3 The new parameters selected by GA-PLS

表4 三種分類器對特征向量的分類結果Tab.4 The results by using three classifiers with two methods
為了說明GA-PLS方法的有效性,采用三種典型分類器對未經GA-PLS選擇的特征向量和經GA-PLS選擇的特征向量進行分類,結果如表4所示。從表4可以看出,用經GA-PLS選擇的特征向量能夠對樣本進行正確率為99%的故障分類,分類效果比用未經GA-PLS選擇的特征向量要好很多,而且在分類時間方面,GAPLS方法節省了大量的時間,可對故障進行在線分類。因此,基于EMD和GA-PLS的特征選擇算法對手動換向閥故障診斷是有效的。
EMD方法是一種能把非平穩信號轉變成平穩信號的信號處理方法。AR模型是一個信息的凝聚器,可將手動換向閥振動信號的特性及工作狀態都凝聚其中,因而可依據它對手動換向閥的工作狀態進行識別。EMD方法和AR模型相結合能解決振動信號的非平穩特性和特征向量不能反映故障狀態的問題。同時,GAPLS方法能很好的地克服特征間相關的影響。該方法能得到較好RMSE值,較短的分類時間和較高的分類準確率。與其他特征選擇方法相比,實驗結果清楚地顯示了基于EMD和GA-PLS特征選擇方法能有效地應用于手動換向閥的故障診斷,為手動換向閥的故障診斷提供了一種新的方法。
[1] Mcfadden P D.Window function for the calculation of the time domain averages of the vibration of the individual planet gears and sun gear in an epicyclic gearbox[J].ASME Journal of Vibration and Acoustics.1994,116 179-187.
[2] 林 京,劉紅星,屈梁生,等.信號時域平均處理中的若干問題探討[J].振動工程學報,1997,10(4):446-450.
[3] Huang N E,Shen Z.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proc.R.Soc.Lond.A,1998,454:903-905.
[4] Huang N E,Shen Z,Long S R.A new view of non-linear water waves:the Hilbert spectrum[J].Annu Rev Fluid Mech,1999(31):417-457.
[5] Ljung L.System Identification:Theory for the User(2nd Edition)[M]. Beijing, China:Tsinghua University Press,2002.
[6] 賀湘宇,何清華,鄒湘伏,等.基于RBF網絡和ARX模型的液壓系統故障診斷方法[J].系統仿真學報,2009,21(1):282-285.
[7] 江四厚,陳小虎,王漢功,等.基于Hilbert-Huang變換的振動信號特征提取[J].機床與液壓,2008,36(11):199-201.
[8] 徐長航,劉吉飛,陳國明,等.經驗模態分解和魏格納-維利分布在往復泵泵閥振動信號特征提取中的應用[J].中國石油大學學報(自然科學版),2010,34(3):99-103.
[9] Gonzalez A L.Leardi R.Genetic algorithms applied to feature selection in PLS regression:how and when to use them[J].Chemometr Intell Lab,1998,41(2):195-208.
[10] Leardi R.Application of genetic algorithm-PLS for feature selection in spectral data sets[J].J Chemometr,2000,14(5/6):643.
[11] Azizi A,Niazi A,Leardi R.A comparative study between PLS and OSC-PLS in the simultaneous determination of lead and mercury in water samples:effect of wavelength selection.Canadian Journal of Analytical Sciences and Spectroscopy,2007,52(6):365-374.
[12] Khajehsharifi H,Pourbasheer E.Genetic-algorithm-based Wavelength Selection in Multi-component Spectrophotometric Determination by PLS:Application on Ascorbic Acid and Uric Acid Mixture[J].Journal of the Chinese Chemical Society,2008,55:163-170.