鄭坤鵬, 丁云飛
(上海電機學院 電氣學院, 上海 201306)
隨著風電產業的發展,風力發電機組的穩定安全運行日益重要[1]。齒輪箱是風力發電機組的一個重要組成部件,對其進行精確的故障診斷對風力發電機組的穩定運行至關重要[2]。傳統對齒輪箱振動信號處理的方法多為小波分析法[3],經驗模態分解法等。集合經驗模態分解(Ensemble Empirical Mode Decomposition, EEMD)法通過對原信號加入白噪聲的方式,對模態混疊有一定的抑制效果[4-5]。但是由于EEMD算法迭代次數較多,增加了計算量,而且分量未必都能具有物理意義,出現較多無意義的本征模態函數(Intrinsic Mode Function, IMF)分量,不利于后續風機齒輪箱故障的提取。鄭近德等[6]提出了改進的集合經驗模態分解法(Modified EEMD, MEEMD),在一定程度上解決了上述問題。
隨著人工智能技術的發展,利用智能算法實現機械故障診斷是一個趨勢,經典的分類算法有神經網絡、支持向量機、決策樹等。其中,支持向量機由于其算法簡單,所需樣本少等特點應用最為廣泛。支持向量機雖然可以取得較好的分類效果,但是當其處理數據量較大的樣本數據時,其計算效率低,正則化參數和核函數參數選擇也較為困難,很可能會導致分類的效果不佳。本文采用計算效率更高的最小二乘支持向量機(Least Squares Support Vector Machines, LSSVM)和新近提出的鯨魚優化算法(Whale Optimization Algorithm, WOA)相結合,建立WOA-LSSVM齒輪箱故障診斷模型,對上述基于MEEMD和樣本熵的故障特征進行訓練測試,實現故障診斷。通過實驗對比,驗證了該風機齒輪箱故障診斷模型的有效性。
MEEMD引入了信號分析中排列熵這個概念,排列熵具有檢測時間序列隨機性的功能,其大小可以反映信號序列的隨機性[7]。MEEMD的基本原理是,通過計算排列熵對分解信號進行復雜度評價,排列熵的取值范圍為0~1,數值越大,信號復雜度越大,把復雜度過大的信號視為異常信號,把異常信號從原始信號中去除,最后對剩余的信號再進行EMD分解,即得到MEEMD的分解結果。
樣本熵是由Richman等[8]提出的一種時間序列復雜性的度量方法。樣本熵數值越低,時間序列的復雜度就越低;數值越大,時間序列復雜度就越高。樣本熵是對近似熵的改進,與近似熵算法相比具有抗噪聲干擾強、精度高、一致性好等優點,不依賴于數據的長度,可以作為風機齒輪箱的故障特征[9]。
LSSVM分類算法與傳統的支持向量機相比,目標函數由不等式約束變為了等式約束,大大簡化了計算的復雜度[10-11]。實驗證明,LSSVM算法在模型的復雜度和訓練結果精確度之間取得了很好的平衡,更適合數據樣本復雜的情形。LSSVM算法的實現流程如下:
設l個樣本數據(xi,yi)對應的類別yi∈{-1,1},LSSVM回歸函數形式為
y=w·φ(x)+b
(1)
式中:w為超平面的法向量;b為偏置量,是一個常數;xi為輸入量;yi為模型輸出量;φ(x)為映射函數,可以把輸入量從低維映射到高維空間。
LSSVM的優化數學模型為
(2)
式中:ei為誤差;γ為正則化參數。
對式(2)引入拉格朗日乘子ai,建立拉格朗日方程。上述優化問題轉化為最小值問題,有
minL(w,b,e,a)=
(3)
由拉格朗日乘子法取得最值的條件得:
(4)
此時,LSSVM的回歸表達式為
(5)
(6)
式中:K(xi,xj)為選擇的徑向基核函數;σ為徑向基核函數的參數,其數值影響LSSVM模型的核函數的映射能力。
WOA屬于群體智能優化算法,通過模擬鯨魚的捕食過程建立數學模型[12]。鯨魚是一種群居的哺乳動物,在捕獵時它們也會相互合作對獵物進行驅趕和圍捕。當鯨魚在海底發現獵物時,會以螺旋環狀向上的路徑制造出泡泡網,并且通過不斷地收縮泡泡網,漸漸地將魚蝦包圍聚集,最終完成捕食。該鯨魚的捕食過程總結為:包圍獵物、氣泡攻擊、搜尋獵物[13]。
WOA基本步驟如下:

(7)


(8)


(2)氣泡攻擊。鯨魚優化算法中,設置了兩種鯨魚捕食方式,分別為收縮圍捕方式和螺旋泡泡網攻擊方式。
螺旋氣泡網攻擊方式:鯨魚個體以螺旋路徑的方式,對獵物進行捕食。采用的更新位置方程為
(9)

為了模擬鯨魚群體對獵物攻擊時,同時使用收縮包圍和螺旋路徑的方式,WOA設置了一個概率p,p為[0,1]之間的隨機數,假設鯨魚分別采用兩種捕食方式的概率皆為0.5,則鯨魚位置迭代數學模型為
(10)
(11)

WOA的偽代碼如下:
初始化下列參數:
鯨魚種群Xi(i=1,2,…,N)
空間維度——dim
最大迭代次數——Tmax
適應度函數
計算適應度函數最優時對應的鯨魚個體X*
while(t fori=1:N 更新參數a,A,p,C,l if 1(p<0.5) if 2(|A|≥1) 采用式(11)更新鯨魚位置 else if 2(|A|<1) 采用式(7)更新位置 end if 2 else if 1(p≥0.5) 采用式(9)更新鯨魚位置 end if 1 end 檢查鯨魚位置是否越界并修正位置 計算鯨魚適應度值,確定是否更新最優鯨魚位置X* t=t+1 end while 1.2.2觀察組采用方法 本組研究對象采取CTA檢測,檢測方法:選擇64層螺旋CT掃描系統進行檢測,于患者肘正中靜脈將非離子型對比劑注入,劑量為2mg/kg,注入速度為每秒3~4ml,延遲時間為15秒~23秒。掃描參數:300mA、120kV、螺距為3.5、層厚為1mm、重建間隔為0.5mm。 returnX* 由LSSVM算法的基本原理可知,獲取合適的參數對LSSVM模型至關重要。 LSSVM具有兩個參數:正則化參數γ和核函數參數σ,這兩個參數對LSSVM分類模型影響巨大[14]。一些經典的智能優化算法經常用來優化LSSVM模型,如粒子群優化(PSO)算法、遺傳算法(GA)等[15]。雖然上述算法對于LSSVM的分類效果具有一定的提升,但是卻不容易跳出局部極值的陷阱,導致分類精度不高,WOA與這些算法相比具有運算簡單快速、全局搜索能力強等優點,有很大的概率擺脫局部極值。因此,本文采用WOA優化LSSVM的兩個參數,建立了WOA-LSSVM風機齒輪箱故障診斷模型,實現流程如圖1所示。 圖1 WOA-LSSVM故障診斷模型 依據上海電氣集團的故障診斷平臺,設定采樣頻率為2 000×2.56 Hz,通過加速度傳感器采集在轉速880 r/min、加載電流0.05 A情況下的正常、斷齒、磨損、點蝕4種振動信號。對信號進行預處理,得到風機齒輪箱4種狀態下的振動信號各25組,一共100組信號。 以斷齒故障振動信號為例,完成其故障特征向量的構建,如圖2所示,其中縱坐標a為振動信號加速度。 圖2 齒輪箱原始信號 振動信號MEEMD分解結果如圖3所示。 圖3 斷齒信號MEEMD的分解分量 選擇前6個IMF分量計算樣本熵組成特征向量: (12) 按照上述方法提取100組樣本數據的故障特征向量,可組成樣本個數為100的樣本集。 為了驗證WOA-LSSVM風機齒輪箱故障診斷模型的優越性,設置仿真對比實驗流程如下: (1)隨機選取4種狀態下的齒輪箱故障樣本:正常、斷齒、磨損、點蝕各5組,一共20組作為訓練樣本集。剩余的80組樣本作為測試樣本,其中4種故障類型各20組。 (2)基于上述理論與方法,分別建立LSSVM、遺傳算法優化的最小二乘支持向量機(GA-LSSVM)、粒子群優化的最小二乘支持向量機(PSO-LSSVM)、鯨魚算法優化的最小二乘支持向量機(WOA-LSSVM)4種未經訓練的故障診斷模型。 (3)對20組訓練樣本分別輸入4種故障診斷模型,對模型進行訓練,得到訓練后的模型。 (4)對80組測試樣本分別輸入訓練完成的LSSVM、GA-LSSVM、PSO-LSSVM、WOA-LSSVM 4種風機齒輪箱故障診斷模型,得到具體分類結果后,統計各自的故障識別率。 統計基于LSSVM、PSO-LSSVM、GA-LSSVM、WOA-LSSVM 4種算法的風機齒輪箱的故障診斷結果如圖4所示。 圖4 4種故障診斷模型混疊矩陣 由圖4可知,LSSVM的故障診斷模型表現最差,誤分類個數為6個;PSO-LSSVM和GA-LSSVM兩種故障診斷模型由于陷入了局部極值,誤分類個數分別為5和4,均不能取得較好的分類效果;WOA-LSSVM算法的分類表現最好,4種故障全部分類正確。 由此可知,WOA與GA和PSO算法相比,更易跳出局部極值,3種優化模型的適應度曲線如圖5所示。 圖5 3種優化模型適應度曲線 由圖5可知,隨著迭代次數的增加,WOA的全局搜索能力逐漸顯現,不斷跳出局部極值直到適應度取得最大值;與WOA相比,PSO算法與GA的適應度(故障準確率)曲線為一條直線,均不能跳出局部極值。實驗表明,基于WOA-LSSVM算法的風機齒輪箱故障診斷模型,在故障識別方面表現更加優異。 本文將MEEMD分解算法與樣本熵結合提取風機齒輪箱的故障特征,并且采用WOA對LSSVM參數進行選擇,與經典的GA和PSO算法對比,驗證了WOA具有更好的全局搜索能力,建立了WOA-LSSVM風機齒輪箱故障診斷模型。通過實驗對比分析驗證了WOA-LSSVM算法的有效性以及優勢,對風機齒輪箱的故障診斷具有一定的指導意義。2 WOA-LSSVM風機齒輪箱故障診斷模型

3 實驗分析
3.1 實驗數據來源與故障特征提取


3.2 實驗過程及結果分析


4 結 論