皮駿,馬圣,賀嘉誠,孔慶國,林家泉,劉光才
1. 中國民航大學 通用航空學院,天津 300300 2. 中國民航大學 航空工程學院,天津 300300 3. 中國民航大學 中歐航空工程師學院,天津 300300 4. 中國民航大學 電子信息與自動化學院,天津 300300
航空發動機工作條件十分惡劣,其轉子系統有發生故障的風險,一旦出現故障將會導致航空發動機異常工作,因此需要對發動機故障進行準確快速的識別[1-3]。滾動軸承是航空發動機轉子系統的重要組成部分之一,軸承的性能狀態將會影響到航空發動機能否正常有效的工作[4]。由于軸承壽命離散度較大,加之航空軸承所處位置難以監控,故對其診斷帶來諸多難題,因而引起國內外廣泛的重視。
傳統的油液分析法可用于航空發動機的軸承故障診斷,但人為因素對診斷結果影響較大;隨著對轉子動力學[5]的深入研究,根據物體的振動信號也能診斷故障,且這種方法避免了人為因素的干擾,但卻對診斷方法提出嚴苛的要求。在文獻[6-14]中,學者們利用不同的方法對軸承故障振動信號進行處理,并分別結合支持向量機[6-8]、多核學習機[9]、人工神經網絡[10-12]、Elman[13]和RBF網絡[14]對軸承故障進行診斷,并取得較好的結果。
但部分單隱層前饋神經網絡存在收斂速度慢、易陷于局部最優等缺陷,因此Huang等[15]提出極限學習機概念,極限學習機避免了傳統網絡對學習速率、終止條件、易陷于局部極優等缺陷,因而廣泛用于數據壓縮、特征學習、聚類、診斷等領域。國內外已有部分學者將其應用到航空發動機故障診斷中,如:盧錦玲等[16]利用改進粒子群算法、交叉驗證法去優化極限學習機,并將優化的極限學習機用于軸承故障診斷;徐繼亞等[17]利用鯨魚算法優化極限學習機,并用于軸承故障診斷;Yang等[18]利用量子粒子群算法優化極限學習機,并對航空發動機故障進行診斷;Lu等[19]考慮到航空發動機傳感器故障失效率,對極限學習機進行改進,并用于傳感器的故障診斷和重構。但極限學習機相比傳統神經網絡可能需要更多的隱含層神經元,且由于隨機賦予輸入權值和閾值,可能會導致病態問題的出現[20]。故本文針對極限學習機病態問題以及航空軸承故障診斷難度較大的問題,提出改進的遺傳算法優化極限學習機網絡作為航空軸承故障診斷方法。
遺傳算法是一種借鑒生物進化規律的全局優化搜索算法[21-22],由于其能自動調整搜索空間與搜索方向,其并行尋優能力較強,因而廣泛用于組合優化、機器學習等領域。但由于傳統遺傳算法收斂速度慢、易陷于局部極值等問題,因此基于Lam等[23]的思想,從遺傳算法的交叉、變異操作上對遺傳算法進行改進。用改進的遺傳算法優化極限學機的輸入權值和隱含層閾值,用Moore-Penrose算法計算ELM輸出權值矩陣,并使用優化的極限學習機(Extreme Learning Machine, ELM)網絡對航空發動機軸承故障進行診斷。
由于單隱層前饋神經網絡存在訓練速度慢、容易陷入局部極值而難以達到全局最優等缺陷,Huang等[15]提出ELM算法,該算法隨機產生輸入層與隱含層連接權值和隱含層閾值,便能逼近任意非線性分段函數[24]。
極限學習網絡結構如圖1所示。圖1中,n為輸入變量的個數;h為隱含層神經元個數;xi為輸入變量,i=1,2,…,n;wij為輸入變量i與隱含層神經元j的連接權值;wjo為隱含層神經元j與輸出層的連接權值;bj為隱含層神經元的閾值,j=1,2,…,h;bo為輸出層神經元的閾值;fj(·)為隱含層神經元j的激活函數;g(·)為輸出層神經元的激活函數。
其數學模型[25]為
(1)
式中:vj為輸出層神經元j的輸出。
若存在N個有效樣本,當輸出閾值為0、輸出神經元激活函數為線性激活函數時,則式(1)可改寫為
(2)
(3)
輸出權重向量表達式為
wo=v?ye
(4)
式中:v?為輸出層矩陣v的Moore-Penrose廣義逆;ye=[ye(1)ye(2) …ye(N)]T是期望輸出。若有v∈RN×h、N≥h且rank(v)=h,則v的Moore-Penrose廣義逆v?的表達式為
v?=(vTv)-1vT
(5)
將式(5)代入式(4)可得
wo=(vTv)-1vTye
(6)
所用到的隱含層激活函數為
1) Sigmoid(·)函數:
2) Sin(·)函數:
f(a,b,x)=sin(ax+b)
3) RBF(·)函數:
4) Hardlim(·)函數:
由于極限學習機避免了傳統網絡對學習速率、終止條件、易陷于局部極優等缺陷,因而此方法相比其他前饋神經網絡,更能夠有效的對航空軸承故障進行診斷。但極限學習機相比傳統神經網絡可能需要更多的隱含層神經元,且由于隨機賦予輸入權值和閾值,可能會導致病態問題的出現[20]。針對這一問題,本文利用改進的遺傳算法優化ELM,并應用于航空軸承故障診斷中。
經典遺傳算法通常采用單點交叉、輪盤賭選擇策略、固定的交叉變異概率以及交叉和變異操作完成對種群的進化。由于篇幅限制,只總結經典遺傳算法缺陷,遺傳算法的具體步驟請參看文獻[21-22]。
經典的遺傳算法存在缺陷[26]:①個體的選擇概率是由個體適應度值決定的,當種群中某些個體適應度值遠高于其他個體時,這些個體將會被多次選中,下一代群體將由這些個體決定,種群便失去了競爭力,從而導致種群停滯不前;②交叉概率Pc和變異概率Pm的取值決定遺傳算法全局搜索和局部搜索能力的均衡,不同的交叉變異概率取值很可能導致不同的計算結果;③種群規模影響對遺傳算法的優化性能;④遺傳算法的迭代次數設置較少時,可能導致種群進化不充分,造成未成熟早收斂;迭代次數設置過多時,則導致時間成本的浪費。
因此針對遺傳算法的缺陷,相應的改進遺傳算法應運而生,如:自適應遺傳算法[22]等。但大多數改進遺傳算法僅僅從交叉變異概率對算法進行改進,并不能很好的解決遺傳算法未成熟早收斂、易陷于局部極值、收斂速度慢等問題。因此,從遺傳算法的交叉和變異操作方式對遺傳算法做出改進。
由于改進遺傳算法除了交叉和變異操作方式,其他操作均與經典遺傳算法相同。因此,此部分僅敘述改進的交叉操作和變異操作。
2.2.1 改進的交叉操作
隨機選擇2個需要進行交叉的染色體作為父代和母代,2個染色體經過交叉將產生4個后代,但僅有最優后代存活并替換掉父母代中的劣勢染色體。交叉過程為
(7)
chrom_m={ch1,ch2,ch3,…,chnum}
(8)
(chrom_f+chrom_m)/2
(9)
chrommax(1-β)+max(chrom_f,chrom_m)β
(10)
chrommin(1-β)+min(chrom_f,chrom_m)β
(11)
(12)
式中:chrom_f為父代染色體;chrom_m為母代染色體;chrom_offspring為子代染色體,下腳標1~4僅為子代染色體的序號,無其他特殊含義;β為自定義的權重,其范圍為(0,1);num為染色體中基因的個數,即:需要優化參數的個數;chrommax為染色體中的基因值均為所有染色體基因值的上限;chrommin為染色體中的基因值均為所有染色體基因值的下限;max(chrom_f, chrom_m)和min(chrom_f,chrom_m)分別為獲取父母代染色體中對應基因值的最大值和最小值,如:max([1 -2 3],[4 3 3])=[4 3 3],或min([1 -2 3],[4 3 3])=[1 -2 3]。最佳后代可通過式(13)獲得:
(13)
式中:i=1,2,3,4;fitness(·)為適應度函數;index(·)表示找尋到染色體的位置。獲取最優后代,用最優后代替換父母代中的最劣染色體,即執行:
(14)
式中:j=1,2,其中1表示父代,2表示母代。
到此交叉過程結束,通過上述交叉能夠在較少的迭代步驟下獲取較優的后代,其原因為:交叉方式式(9)和式(12)是圍繞染色體基因值的中心區域進行搜索,即:當β靠近1或0時,交叉方式類似于式(9);而交叉方式式(10)和式(11)則是圍繞著染色體基因值的邊界區域進行搜索。這樣,交叉過程實際上是在整個區域內進行,相比局部交叉更易獲得最優后代。
2.2.2 改進的變異操作
對變異操作執行3種不同的操作,然后執行相應的染色體更新過程。隨機選擇需要變異的基因進行變異操作:
patterni={ch1, ch2, ch3, …, chnum}+
{α1δ1,α2δ2,α3δ3, …,αnumδnum}
(15)
式中:i=1,2,3,表示變異的方式;α僅取值0或者1;δ則是在(-0.1,0.1)內的隨機數。在pattern1中,僅有一個α取值為1,其他全取值為0;在pattern2中,部分的α取值為1,部分取值為0;在pattern3中,所有的α取值為1。
染色體更新步驟為
步驟1 產生隨機數,判斷隨機數與變異概率的大小。
步驟2 如果,隨機數<變異概率,則:計算3種變異方式的適應度值,用三者中適應度值最大的染色體替換種群中適應度值最低的染色體,并轉至步驟6;否則依次判斷并執行步驟3到步驟6。
步驟3 如果變異方式1得到的染色體適應度值大于種群中最小適應度值,則用變異方式1得到的染色體替換掉種群中的最小適應度值對應的染色體,并更新種群的染色體。
步驟4 如果變異方式2得到的染色體適應度值大于更新后的種群中最小適應度值,則用變異方式2得到的染色體替換掉種群中的最小適應度值對應的染色體,并再次更新種群的染色體。
步驟5 如果變異方式3得到的染色體適應度值大于更新后的種群中最小適應度值,則用變異方式3得到的染色體替換掉種群中的最小適應度值對應的染色體,并再次更新種群的染色體。
步驟6 完成此次變異操作的染色體更新過程。
在上述變異操作過程中,變異方式1實際類似于單點變異;變異方式2,類似于多點變異;變異方式3則是整體變異,增大種群搜索區域。當種群中染色體的適應度值較小時,經過變異操作將會極大的改善搜索空間,提高種群的適應度;相反,若種群中染色體的適應值幾乎相同時,改變單個基因值相比改變很多基因值而言,更有可能提高染色體的適應度值[23]。
基于改進遺傳算法伏化極限學習機網絡(IGA-ELM)網絡如圖2所示,主要分為2部分:一是右側的改進遺傳算法優化部分,二是左側ELM網絡部分。利用改進遺傳算法中的種群個體作為ELM網絡的輸入層與隱含層的連接權值和隱含層的閾值,利用訓練集樣本計算得到ELM網絡隱含層與輸出層的連接權值矩陣和隱含層的閾值,將得到的輸出權值矩陣和閾值返回ELM網絡,并對校驗集樣本進行診斷,把診斷后得到的均方根誤差作為改進遺傳算法的適應度函數。對種群反復執行交叉、變異操作,從而得到最優個體。最后將最優個體賦值給ELM網絡的輸入權值、閾值,在訓練集樣本下計算ELM網絡的輸出權值矩陣,并對軸承故障測試集樣本進行診斷。
利用IGA-ELM網絡診斷軸承故障的具體步驟如下:
1) 根據軸承故障特征參量個數以及輸出故障類型確定ELM網絡的結構。
2) 設置改進遺傳算法的迭代步驟、種群大小等參數,并根據軸承故障樣本數據初始化種群,對種群進行實數編碼。
3) 對種群進行選擇、交叉、變異操作,產生新的個體。
4) 根據ELM網絡輸出的均方根誤差,計算種群個體的適應度值,找出最優個體。
5) 判斷是否滿足終止條件,若否,則返回第3步;若是,則輸出ELM網絡最佳輸入層與隱含層的連接權值和閾值,并計算ELM網絡的輸出矩陣。
6) 將得到的最佳權值和閾值返回到ELM網絡,并對軸承故障測試集樣本進行診斷。
由于航空發動機軸承故障數據采集難度較大、成本較高,因此通過實驗模擬的方式獲得。滾動軸承故障診斷實驗裝置如圖3所示。
其中,實驗中所用設備包括:307型滾動軸承、加速傳感器、光電傳感器、電荷、信號調理機、計算機等。軸承座可以拆卸,便于更換不同故障類型的軸承。聯軸器上貼有反光紙作為相位起始標志,光電傳感器提供轉速和鍵相信號;置于故障軸承軸向、徑向垂直和徑向水平方向的加速度傳感器測得軸承振動信號;最后再經過電荷放大器送至設備CAMD-6100型信號調理器處理。
實驗中轉子轉速為988 r/min,每周期傳感器采樣1 024個點,每次實驗采集16個周期。307型滾動軸承幾何參數如表1所,實驗故障類型為:正常、內環故障、外環故障、滾珠故障,故障類型尺寸數據如表2所示,故障類型加工圖如圖4~圖6所示。

表1 307型滾動軸承的幾何參數Table 1 Geometrical parameters of 307 rolling bearing

表2 滾動軸承模擬故障類型
注:表中故障深度均約為1 mm,軸向長度均約為4 mm。
由于時域分析法中峰值和峭度系數均為無量綱特征參數,且時域分析法處理過程不會使信號發生畸變或損失,因此對得到的數據可不做歸一化處理,采用最原始信息資料進行軸承故障診斷。因此文中,對采集到的軸承故障振動信號先進行時域分析;再利用SAS軟件進行因子分析,根據碎石圖因子方差遞減情形選擇累積方差貢獻率達到90%的因子,即:峰值、均值、均方根、方差、偏度、峭度;最后將這6個因子作為307型滾動軸承故障診斷的輸入特征量。由于數據量較大,每種故障類型隨機選取100個樣本作為診斷案例,經過時域分析和因子分析后得到的部分數據樣本展示如表3所示。數據集樣本將分為訓練集樣本、校驗集樣本、測試集樣本3部分,3部分數據隨機選擇,彼此互不重復。每部分樣本集容量如表4所示。
根據第1節介紹的極限學習機理論,網絡結構采用3層,即:輸入層、隱含層和輸出層。輸入層神經元個數為:選取軸承故障振動信號的特征參量個數,即6個;隱含層神經元個數設置將影響到網絡診斷準確率,因此在對神經元個數進行分析后,文中主要呈現神經元個數為20和30時的計算結果;輸出層神經元個數設置為1,對于網絡輸出結果的處理方式如表5所示。
為避免網絡學習過度,因此將校驗集診斷結果的均方根誤差(RMSE)作為適應度函數,其計算式為
(16)
式中:l為ELM網絡校驗集樣本數量;yei為ELM網絡第i個樣本的期望輸出;oi為ELM網絡第i個樣本的預測輸出。
為了驗證IGA-ELM網絡在軸承故障診斷中的有效性以及改進遺傳算法的性能,將ELM網絡、經典遺傳算法優化的ELM網絡(TraditionalGA-ELM)、經典粒子群算法優化的ELM網絡(TraditionalPSO-ELM)、自適應遺傳算法優化的ELM網絡(AdaptGA-ELM)作為比較算法,在同樣的訓練集、校驗集和測試集樣本上,從網絡的診斷準確率、校驗集診斷誤差、運行時間、ELM網絡隱含層激活函數以及神經元個數等方面進行綜合分析。

表3 307型軸承故障特征量Table 3 Fault characteristic quantity of 307 rolling bearing

表4 樣本集容量Table 4 Size of samples
比較研究采用的計算機配置為:AMDA8-5500B APU with Radeon HD Graphics四核處理,金士頓DDR3L 4 G 1 600 MHz內存,文中所有算法均在MATLAB2014a上運行。
對比算法的參數設置說明:遺傳算法共有參數設置如下,種群大小為20,迭代步數100,種群范圍為[-0.5, 0.5];文中改進遺傳算法中β=0.65;傳統遺傳算法、自適應遺傳算法以及文中改進遺傳算法的交叉概率為0.6,變異概率為0.05;經典粒子群算法中,種群粒子數為20,迭代步數為100,粒子最大速度為0.1,最小速度為-0.1,粒子范圍為[-0.5, 0.5]。ELM網絡中的參數設置在此處不進行闡述,因為下文將對其進行詳細分析。

表5 ELM輸出結果的處理方式Table 5 Processing of ELM output
利用提到的幾種診斷算法對軸承故障信號進行診斷,其診斷結果如表6所示(計算結果較多,由于篇幅限制僅呈現部分結果;表6中呈現結果均為30次的平均值)。如表6所示,不同神經元對應的激活函數診斷最優結果已經用黑體加粗標記而出。從表6可以看出,隨著隱含層神經元個數增加,訓練集的診斷準確率均有所增加;單純的極限學習機在任意激活函數和神經元個數下,其訓練時間最少;粒子群算法相比遺傳算法而言,其運行時間較短,但其對測試集樣本診斷結果較差;當網絡隱含層采用Hardlim(·)函數時,幾種算法均能使校驗集樣本誤差達到最低;仔細觀察表6中測試集和訓練集兩列中加粗黑體部分的分布情況,可以發現:文中改進遺傳算法相比其他算法,診斷準確率較高、收斂誤差較低;需要仔細觀察的是:如表6中測試集列表中有邊框的一欄結果,在Sigmoid(·)函數下,幾種算法的診斷準確率均能達到80%以上,相比于其他激活函數,此函數對幾種算法的普適性較好,后面將在此函數的基礎上對幾種算法的性能進行分析。

表6 不同算法的計算結果Table 6 Calculation results of different algorithms

續表
極限學習機隱含層神經元數量不僅影響著網絡的診斷準確率,同時也影響網絡的診斷時間。基于Sigmoid(·)函數為極限學習機網絡的激活函數下,分析神經元數量變化對診斷結果的影響。經過計算,其結果繪制如圖7所示。
由圖7可知,從診斷結果的整體趨勢上來看,ELM、TraditionalPSO-ELM、TraditionalGA-ELM、AdaptGA-ELM、以及IGA-ELM對軸承故障診斷準確率隨神經元數量增多呈現先增大再減小的趨勢;僅當隱含層神經元個數設置為5~40時,幾種診斷方法的診斷準確率大于80%,將這部分區域定義為有效區(有效區是指:診斷方法的診斷結果接近實際結果的區域,文中的衡定值為80%),同樣將診斷準確率小于80%的部分稱為無效區;同時不難看出,IGA-ELM對軸承故障診斷的準確率,整體上均為最優,在部分點處略顯遜色,而這些部分點大多集中在神經元數量大于40的無效區內;在有效區內,IGA-ELM表現出其優勢,且在部分點處,診斷結果大于90%,明顯優于其他方法。需要注意的是,隨著ELM被優化,其計算時間也隨之增加,如表6中呈現的結果一樣,IGA-ELM診斷準確率雖高,但其計算時間相比ELM網絡高出80 s左右,而針對這一缺陷,可采用高性能計算機彌補。
進一步研究IGA-ELM、經典遺傳算法優化的ELM網絡(TraditionalGA-ELM)、經典粒子群算法優化的ELM網絡(TraditionalPSO-ELM)和自適應遺傳算法優化的ELM網絡(AdaptGA-ELM)的性能,根據上文分析,ELM網絡隱含層激活函數采用Sigmoid(·),神經元個數設置為30。研究幾種算法的收斂效果,經計算,其結果如圖8所示。從圖8中可以發現:AdaptGA-ELM的收斂速度均優于TraditionalGA-ELM和TraditionalPSO-ELM,但誤差收斂值卻不如TraditionalPSO-ELM。相比較而言,IGA-ELM收斂速度和收斂誤差均為最優。因此,從收斂速度和誤差角度而言,IGA-ELM的性能相對最優。
1) 為驗證提出的混合診斷模型IGA-ELM的有效性,將ELM、TraditionalGA-ELM、TraditionalPSO-ELM和AdaptGA-ELM作為對比算法。當激活函數采用Sigmoid(·)函數,且在隱含層神經元數量為5~40時,文中幾種診斷方法的診斷效果均較佳;但相比之下,IGA-ELM診斷方法的準確率、校驗集收斂誤差均為最優。
2) 在神經元個數為30,激活函數采用Sigmoid(·)的情況下,對IGA-ELM、TraditionalGA-ELM、TraditionalPSO-ELM和AdaptGA-ELM迭代收斂情況進行分析,結果表明文中改進的遺傳算法收斂速度和收斂值均為最優。因此相比文中其他診斷模型,提出的診斷模型更適用于軸承故障診斷。
致 謝
衷心感謝西北工業大學的廖明夫教授,對文中實驗部分的指導與協助。