金 星,邵珠超,王盛慧
(長春工業大學電氣與電子工程學院,吉林 長春 130012)
基于PCA和IGWO-SVM的水泥回轉窯故障診斷研究
金 星,邵珠超,王盛慧
(長春工業大學電氣與電子工程學院,吉林 長春 130012)
為實現水泥回轉窯故障的精確診斷,提出一種基于主成分分析(PCA)和支持向量機(SVM)的回轉窯故障診斷模型。通過引入差分進化(DE)算法的變異、交叉、選擇操作來維持種群的多樣性,克服灰狼算法易早熟收斂的缺陷,然后采用這種改進的灰狼算法(IGWO)對SVM的懲罰因子c和核函數參數g進行動態的尋優。運用PCA對采集數據進行降維處理,消除非相關因素,降低數據處理難度,然后將特征提取后的數據作為輸入建立故障診斷模型,并與普通的SVM建模方法進行比較。實例表明:在有用信息量損失較小的前提下,分類準確率達到96.1538%,模型構建時間為2.9720s,從而驗證模型的準確性和高效性。
水泥回轉窯;故障診斷;主成分分析;支持向量機;改進的灰狼算法
水泥回轉窯作為新型干法生產線上的核心設備,負責完成水泥生料的煅燒[1]。其工作狀態會直接影響水泥熟料的質量、產量[2],因而對其故障進行快速精確地診斷就顯得尤為重要。通過智能算法建立可靠的故障診斷模型對回轉窯進行及時的故障識別,可以克服人工診斷方法的局限性,避免發生重大隱患,對水泥行業的發展具有促進作用。
目前,國內外很多研究都嘗試用各種智能方法來解決故障診斷的問題。王蘭軍[3]針對水泥生產過程中回轉窯的故障診斷,提出了應用案例分析結合模糊推理的工況識別方法;高緒偉[4]通過核PCA特征提取方法在航空發動機轉子故障診斷中的應用,取得了一定的成果;鐘小鳳等[5]基于PCA-LSSVM的機車走行部滾動軸承故障診斷,相比其他方法而言分類準確率達到100%,模型構建時間為3.642s,滿足機車走行部滾動軸承的診斷要求。另外,Ferat等[6]基于貝葉斯網絡和分布粒子群思想開發了飛機發動機故障診斷模型;Khmais等[7]研究了基于支持向量機理論的電力變壓器故障診斷。
結合以上研究思路,本文提出了基于主成分分析(principle component analysis,PCA)和支持向量機(support vector machine,SVM)的故障診斷模型,并引入改進的灰狼算法(IGWO)對模型的關鍵參數進行動態的尋優。首先采集影響故障診斷的現場數據,利用PCA降維原理對樣本數據進行特征提取,消除冗余特征,然后使用提取的各主成分變量對優化的SVM網絡模型進行訓練,并與普通的SVM診斷模型進行對比,從而驗證本文建立的模型的準確性和高效性。
主成分分析(PCA)主要是在保證原始數據信息盡可能完整的情況下,將高維數據投影到一個新的特征向量彼此正交的投影空間,實現對復雜過程數據的特征抽取,以便消除變量間的關聯特性,從而使得原始過程特性分析的復雜程度得到大幅簡化[8]。基于PCA的特征提取方法描述如下:
設X是一個n×p維隨機變量:

記 V 的特征值滿足 λ1≥λ2≥…≥λk>0,λk+1=λk+2=…=λp=0。 γ1,γ2,…,γp是 V 的特征值對應的標準正交化特征向量。由于V是X的線性函數,滿足COV(yi,yj)=0,yi表示第 i個主成分,i≠j,則 X 的線性函數:

其中:L=(l1,l2,…,lp)′是 Rp中待定的常數向量。事實上對于任意的常數a>0,有:

問題歸結為在條件 LL′=1 下使 maxLL′=1L′VL=L′0VL0,當 L0=γ1就滿足條件,γ′Xy1=γ′X 為 X 的第一主成分。重復以上過程,就可以得到X的k個主成分 yk=γ′kX。
由于 y1,y2,…,yk兩兩不相關,且滿足:

其中 y1存在最大的方差 λ1,yk存在最小方差 λk,這樣y1,y2,…,yk就依次體現了X的各分量的主要部分,據此稱為第i個主成分的貢獻率,而稱為前m個(m<k)主成分的累積貢獻率。一般認為,前m個不相關的主成分累積貢獻率超過95%就可滿足要求。
SVM的基本原理就是找到一個滿足分類標準的最優化分類超平面,在確保其分類準確度的基礎上,使超平面兩側的空白范圍達到最大,其距離定義為分類間隔。最優分類線方程為x·w+b=0,并對其進行歸一化,得出的線性可分數據集(xi,yi),i=1,2,…,l且x∈Rd,y∈{1,-1},滿足:

式中分類間隔為2/||w||,為使其取值最大即要求||w||值最小,這樣所得到的最優分類面就是||w||2最小的分類面[9]。
1)給定M類分類問題的訓練集:

2)令 j=1,2,…,M,若規定其中一類為正類,則把剩余的M-1類當做負類,利用兩類支持向量機解出決策函數:

3)判斷要輸入x是否屬于第J類,這里J是g1(x),g2(x),…,gM(x)內最大值的上標。
GWO最早是由Mirjalili等[10]于2014年提出的一種通過模擬灰狼的社會等級和狩獵行為的新型群體智能優化算法,由于該算法不考慮梯度信息,參數設置少、全局搜索能力強,故被廣泛用于神經網絡的尋優領域[11]。
假設在D維搜索空間內,種群規模X=(X1,X2,…,XN)由N個個體組成,定義第i只灰狼的位置為,其中表示第 i只灰狼在第 D維上的位置。定義種群中的最優解為狼α,目標函數值第2和第3的最優解分別為狼β和狼δ,其余的候選解為ω[12]。在GWO算法中,狩獵行為由狼α、狼β和狼δ引導,狼ω跟隨這3只狼進行狩獵。如下公式描述灰狼包圍獵物的行為

式中:t——當前迭代次數;
C——搖擺因子,C=2r1,r1為[0,1]間的隨機數;
Xp(t)——第t次迭代后獵物的位置;
X(t)——第t次迭代灰狼的位置。
灰狼位置更新公式如下:

式中 A 為收斂因子,A=2ar2-a;r2為[0,1]上均勻分布的隨機數,變量a隨迭代次數的增加從2線性遞減到0。
為了模擬灰狼的狩獵行為,猜測利用狼α、β和δ去確定獵物的潛在位置。因此,在保存歷史獲得的前3個的最優值,迫使其他搜索個體(包括ω)根據最優值的位置不斷更新它們的位置。數學描述如下:

由式(10)~式(15)可計算出其他灰狼個體與α、β和δ的距離及更新后的灰狼位置,然后由式(16)確定獵物所在的方位。
盡管GWO算法得到了成功的應用,但也存在求解準確度低、易陷入局部最優解的缺點。因此,本文引入差分進化的變異、交叉、選擇操作克服這些缺點。如果優化得到的個體目標函數值f(n)大于上一代該個體的目標函數值f(l),則被放棄,反之被接受,公式為

式中:r4——[0,1]的隨機變量;
Xn(t+1)——新位置;
Xl(t)——上一次的位置;
p——交叉概率。
SVM的懲罰因子c和核函數參數g是由算法隨機給出的,通常情況下,這種模型的分類準確度很低。通過改進GWO算法,可以在保證不遺漏全局最優解的前提下加快搜尋速度,對關鍵參數進行動態的尋優,可以針對SVM模型建立的隨機性進行改進,使得通過設置較少的種群數目和迭代次數就可以達到較高的分類準確度。
本文以吉林省亞泰集團2000t/d生產線為研究對象,結合水泥生產工藝專家的意見,從水泥回轉窯生產現場選取窯內結大蛋、窯內結圈、跑生料、紅窯、篦冷機堆雪人、飛砂料6類工藝故障,并賦予故障類號:1~6,數據樣本為9維106組,并作為診斷模型輸入進行驗證。鑒于采集數據量綱和單位不一致的問題,對樣本進行歸一化處理到[0,1]之間的小數[13],公式表述為

式中:xi、——數據樣本歸一化前后的值;
xmin、xmax——數據樣本中的最小值,最大值。
然后將歸一化后的樣本數據進行PCA降維,通過線性變換的方式將數據轉為一組各維度線性無關的組合,消除冗余和不相干的變量關系,方便數據的分析處理[5]。依據累計貢獻率不小于95%的原則,如圖1所示,由原來的9維降到4維,從而能夠消除冗余的特征信息,降低模型構建的復雜度。

圖1 樣本數據PCA降維
為驗證本文所建立的故障診斷模型的準確性,將PCA降維后的故障樣本數據集分為訓練集和測試集,其中訓練集樣本為54組,用于故障診斷模型關鍵參數尋化和模型的建立;剩余的52組為測試集樣本,對已建立的診斷模型進行預測。選取狼群數量10,迭代次數30次,參數上限ub為100,參數下限lb為0.01,縮放比例因子F上界為0.8、下界為0.2,交叉概率p為0.3,進行仿真。IGWO-SVM模型的適應度曲線如圖2所示。

圖2 IGWO-SVM適應度曲線
由圖可知,最終故障分類的目標函數值穩定在0.308 9。水泥回轉窯故障診斷的訓練集和測試集的分類效果圖如圖3所示,從而可得出訓練集的預測準確率為98.148 1%,測試集的預測準確率達到96.1538%,可見基于IGWO-SVM的模型能夠對水泥回轉窯的故障進行有效的分類。

圖3 水泥回轉窯故障診斷真實類與預測類對比

表1 采用不同的診斷模型對分類性能的影響
為進一步驗證該改進算法的分類效果,本文將其與基于 GWO-SVM、PCA-SVM、PCA-GWO-SVM 等的故障診斷模型的預測準確度進行對比。對于GWO-SVM模型,采用徑向基核函數,設置種群規模10,迭代次數30,參數上界ub為100,下界lb為0.01,利用未改進的GWO對核函數寬度g和懲罰因子c進行迭代尋優;而PCA-SVM模型,將原始數據進行降維處理,消除冗余信息,作為SVM模型的輸入進行故障分類;對于PCA-GWO-SVM模型,首先進行降維處理,與GWO-SVM模型進行對比。表1給出了采用不同的模型對水泥回轉窯故障的診斷所得出的分類效果,可知PCA-GWO-SVM在建模時間方面較GWO-SVM降低,同時準確度提高,這表明進行PCA降維處理,能夠提高診斷模型的分類性能;而對于PCA-GWO-SVM模型,雖然其訓練時間比PCA-SVM模型長,但測試機準確度高很多;對于改進后的PCA-IGWO-SVM模型,通過引入DE算法,設置交叉概率p、縮放比例因子F,保證種群多樣性的前提下,選擇目標函數值最優的個體,這對故障診斷分類的性能有了更大的提高。
1)本文提出了一種基于PCA和IGWO-SVM的水泥回轉窯故障診斷模型,使用PCA對故障數據進行特征提取,在保證信息盡可能完整的情況下濾除不相關的信息,降低數據維度,突顯數據差異。
2)利用IGWO算法對SVM的懲罰因子c和核函數寬度g進行動態的迭代尋優,克服GWO易陷入局部最優、過早收斂的缺陷,使得優化后的SVM分類器能夠實現快速準確的診斷。
3)通過仿真對比,本文所提出的故障診斷模型具有快速準確的優勢,模型構建時間為2.9720s,分類準確率達96.1538%,可為水泥行業的故障診斷提供新思路。
[1]ABDELAZIZ E A,SAIDUR R.A review on energy saving strategies in industrial sector[J].Renewable and Sustainable Energy Reviews,2011,15(1):150-168.
[2]李軒.基于貝葉斯網絡的水泥回轉窯故障診斷模型的研究[D].秦皇島:燕山大學,2014.
[3] 王蘭軍.水泥回轉窯故障診斷系統的研究[D].杭州:浙江大學,2004.
[4] 高緒偉.核PCA特征提取方法及其應用研究[D].南京:南京航空航天大學,2009.
[5] 鐘小鳳,賀德強,苗劍.基于PCA-LSSVM的機車走行部滾動軸承故障診斷研究[J].廣西大學學報(自然科學版),2014,39(2):328-333.
[6]SAHIN F, YAVUZ M C, ARNAVUT Z, et al.Fault diagnosis for airplane engines using Bayesian networks and distributed particle swarm optimization[J].Parallel Computing,2007,33(2):124-143.
[7]BACHA K, SOUAHLIA S, GOSSA M.Power transformer fault diagnosis based on dissolved gas analysis by support vector machine[J].Electric Power System Research,2012,83(1):73-79.
[8]吳翊,李永樂.應用數理統計[M].長沙:國防科技大學出版社,2012:290-292.
[9]WIDODO A,YANG B S.Supportvector machine in machine condition monitoring and fault diagnosis[J].Mechanical Systems and Signal Processing,2007,21(6):2560-2574.
[10]MIRJALILI S, MIRJALILI S M, LEWIS A.Grey wolf optimizer[J].Advances in Engineering Software,2014,69(7):46-61.
[11]羅佳,唐斌.基于收斂因子非線性動態變化的灰狼優算法[J].中國科技論文,2016,11(17):1991-1997.
[12]姚鵬,王宏倫.基于改進流體擾動算法與灰狼優化的無人機三維航路規劃[J].控制與決策,2014,31(4):701-708.
[13]邱東,張楠,趙晨旭,等.基于灰色神經網絡的中低碳烙鐵終點硫含量預報模型研究[J].中國測試,2014,40(4):68-70.
Research of fault diagnosis of cement rotary kiln based on PCA and IGWO-SVM
JIN Xing, SHAO Zhuchao, WANG Shenghui
(College of Electrical and Electronic Engineering,Changchun University of Technology,Changchun 130012,China)
In order to precisely diagnose the faults of cement rotary kiln,a fault diagnosis model based on principal component analysis(PCA)and support vector machine(SVM)is proposed.The variation, crossover and selection operation of differential evolution(DE)are used to maintain the diversity of the population and are introduced into GWO to avoid premature convergence.Improved gray wolf optimizer(IGWO)is used to dynamically optimize the penalty factor (c)and the kernel function parameter (g)of SVM model.PCA is used to reduce the dimension of the collected data,eliminate the irrelevant factors and reduce the difficulty of data processing.Then the data after feature extraction are used as the inputs to establish the fault diagnosis model and the built IGWO-SVM model is compared with the general SVM model.The experiment shows that under the condition of less useful information loss,the classification precision is 96.153 8%and the model building time reaches 2.9720s,which verifies the accuracy and high efficiency of the IGWO-SVM model.
cement rotary kiln; fault diagnosis; PCA; SVM; IGWO
A
1674-5124(2017)10-0092-05
10.11857/j.issn.1674-5124.2017.10.018

2016-12-08;
2017-01-23
吉林省科學技術廳計劃項目(20150203003SF)
金 星(1976-),男,吉林長春市人,副教授,碩導,研究方向為測控技術與智能系統。
(編輯:莫婕)