陳虎
(重慶市軌道交通(集團)有限公司,重慶400042)
基于參數(shù)優(yōu)化的支撐矢量機及其在故障診斷中的應(yīng)用
陳虎
(重慶市軌道交通(集團)有限公司,重慶400042)
為了有效的診斷出設(shè)備的故障,給出了一種基于參數(shù)優(yōu)化的支撐矢量機算法。該算法首先引入免疫克隆選擇機制,以兩個十進制數(shù)表示一個抗體來構(gòu)建抗體群,以漏報率為基礎(chǔ)構(gòu)造親和度函數(shù),實現(xiàn)支撐矢量機參數(shù)的優(yōu)化。然后使用優(yōu)化后的參數(shù)構(gòu)造支撐矢量分類器對設(shè)備數(shù)據(jù)進行分類檢測。通過在汽輪發(fā)電機組的數(shù)據(jù)集上進行仿真驗證,實驗結(jié)果表明,該算法相對傳統(tǒng)的支撐矢量機算法不會顯著增加訓(xùn)練時間,并且能夠有效提高檢測率和降低誤檢率。
機電工程;故障診斷;支撐矢量機;參數(shù)優(yōu)化;免疫克隆算法
故障診斷是工程技術(shù)領(lǐng)域一個重要的問題。如何及時有效地檢測出故障對保證設(shè)備正常運行和業(yè)務(wù)的連續(xù)開展有關(guān)鍵作用。近年來故障診斷方法研究也成為學(xué)術(shù)及工程技術(shù)等領(lǐng)域的熱點,相關(guān)學(xué)者提出了許多可用的方法,如神經(jīng)網(wǎng)絡(luò)[1]、支撐矢量機[2]、獨立分量分析[3]及各種組合算法[4-7]的使用,都取得了一定的效果。
作為一個好的分類器,支撐矢量機相對于其它的分類算法具有更高的推廣能力。然而,支撐矢量機在實際的應(yīng)用中有一個顯著的問題是如何選擇合適的參數(shù)來構(gòu)造一個有效的分類器并使其具有最好的性能。一般而言,支撐矢量機中的參數(shù)選擇主要借助于專家的實踐經(jīng)驗,但這種參數(shù)的確定方法在實踐中往往不能夠獲得最優(yōu)的分類器,從而影響了支撐矢量機的分類效果。
基于上述原因,筆者引入了免疫克隆選擇算法,并將其用于優(yōu)化支撐矢量機的參數(shù)。為驗證優(yōu)化后的分類效果,筆者將優(yōu)化后的分類器用于對汽輪發(fā)電機組的故障進行診斷分類,提出了一種基于參數(shù)優(yōu)化的支撐矢量機故障診斷方法。
筆者的內(nèi)容組織如下:首先對文中用到的基本技術(shù),既支撐矢量機和免疫克隆選擇算法[8]進行介紹;并提出了一種基于免疫克隆選擇優(yōu)化的支撐矢量分類器;最后描述了其仿真結(jié)果并對仿真結(jié)果進行了分析。
1.1支撐矢量機(support vector machines,SVM)
支持矢量機是當(dāng)前比較流行的一種小樣本分類算法,它能夠利用少量的樣本進行訓(xùn)練學(xué)習(xí),從而得到比較理想的分類效果。其基礎(chǔ)理論是利用了統(tǒng)計學(xué)中的VC維理論[9],并引入了結(jié)構(gòu)風(fēng)險最小化原理。利用少量樣本,對SVM進行訓(xùn)練,得到一個相對最佳的超平面,并通過該超平面可實現(xiàn)數(shù)據(jù)的分類。
SVM主要用來解決二類可分的問題,基本目標(biāo)就是找到一個最佳的超平面,它可用于線性可分與線性不可分兩種場景。在線性可分的情況下,可將尋找最佳超平的問題轉(zhuǎn)化為求解一個最優(yōu)(凸規(guī)劃)的問題。而在非線性可分的問題中,則需要使用非線性映射算法將低維線性不可分的問題轉(zhuǎn)化為高維特征空間中線性可分的問題,因此它具有較好的推廣能力。同時它基于Vapnik結(jié)構(gòu)風(fēng)險最小化原則,具有較好的泛化能力?;赟VM的非線性問題的分類算法如下。
假定:x為k維向量,并給定m個樣本集分別為(x1,y1),…,(xm,ym),x∈Rk,y∈{-1,1}。則有如下超平面:w·x+b=0。
若上述超平面可以將樣本分隔為兩類,則構(gòu)造最佳超平面的問題,就可以轉(zhuǎn)化為尋找向量w0和常數(shù)b0的問題。由此可給出如下的構(gòu)造,即使向量w0具有最小的范數(shù),并且滿足約束條件:
yi[(xi·w0)+b0]≥1
(1)
引入松弛變量ζi≥0,問題轉(zhuǎn)化為最小化下列二次優(yōu)化問題,約束條件如式(1):
(2)
式中:C為正常數(shù),代表對錯分的懲罰因子。
在對偶空間求解這個二次優(yōu)化問題,由此問題轉(zhuǎn)化為

(3)
C≥ai≥0,i=1,…,m
得到解
(4)
最優(yōu)解w0和b0必須滿足Kuhn-Tucker條件,由此得
yi(xi·w0+b0)=1
(5)

(6)
根據(jù)Mercer定理,任何滿足半正定的函數(shù)都可以作為核函數(shù),而對于滿足條件的核函數(shù),都會對應(yīng)一個特征空間中的內(nèi)積。因此在最佳超平面上選擇合適的內(nèi)積函數(shù),就可實現(xiàn)線性不可分問題到線性可分問題的映射。由此非線性支持矢量機的優(yōu)化問題如式(6)。
非線性支持矢量機的判決函數(shù)如下:

(7)
1.2免疫克隆選擇算法
受生物免疫系統(tǒng)克隆選擇機理的啟發(fā),研究者設(shè)計了一種新的智能優(yōu)化算法,既免疫克隆選擇算法(immune clone selection algorithm,ICSA)。該算法可很好的結(jié)合先驗知識,并引入了生物免疫系統(tǒng)中的自適應(yīng)能力,所以在信息處理方面具有很強的魯棒性,在進行優(yōu)化搜索時可收斂到全局最優(yōu)。
作為一種新提出的全局最優(yōu)搜索算法,該算法在實現(xiàn)上能夠兼顧全部和局部搜索。在搜索過程中能夠構(gòu)造記憶單元,記憶最優(yōu)解的群體,從而比單純的遺傳算法具有更好的收斂性。
克隆算法利用記憶單元和將變異算子升級為主要算法,可以在候選解中構(gòu)造一個變異解的群體,使得搜索范圍更大,從而使得抗體群的多樣性大大增加,由此可以保證算法能夠以概率1收斂到最優(yōu)解。免疫克隆算法的基本步驟如下:
步驟1:初始化抗體群,設(shè)定算法的參數(shù)并計算初始親和度;
步驟2:根據(jù)親和度和抗體克隆規(guī)模,進行克隆操作、免疫基因操作、克隆選擇,生成新的抗體群;
步驟3:計算新的親和度;
步驟4:若滿足結(jié)束條件,則退出;否則,跳轉(zhuǎn)到步驟2。
在使用支撐矢量機進行分類的過程中,其參數(shù)的選擇對分類和檢測的性能有很大的影響,因此筆者介紹使用免疫克隆選擇算法進行支撐矢量機參數(shù)優(yōu)化的基本思路。
2.1支撐矢量機中的主要參數(shù)
在式(2)中:C為一個正常數(shù),它控制對錯分樣本懲罰的程度。若C太小,則懲罰力度不夠,會導(dǎo)致算法對數(shù)據(jù)的擬合不夠;若C太大,則會導(dǎo)致算法的過度擬合。ξ為算法引入的一個正的松弛因子,代表允許錯分樣本的存在,它會影響到分類器所產(chǎn)生的支撐矢量的個數(shù),從而進一步影響到分類器的最大總誤差。如果ξ太大,則獲得支撐矢量的個數(shù)就會減少,使得分類的誤差增加,反之依然。
而核函數(shù)中的參數(shù)則反應(yīng)了訓(xùn)練數(shù)據(jù)的特征,對整體的分類性能有很大影響,因此也需慎重選擇。在支撐矢量機中經(jīng)常用到的核函數(shù)是線性核函數(shù)、多項式核函數(shù)和RBF核函數(shù)。筆者選擇RBF核函數(shù)作為支撐矢量機的核,原因是雖然線性核函數(shù),參數(shù)比較少,相對速度快,但對非線性問題無能為力。RBF核函數(shù)與多項式核函數(shù)相比,RBF需要確定的參數(shù)要少,復(fù)雜度相應(yīng)較低。此外,需要考慮的是:多項式核函數(shù)存在當(dāng)階數(shù)較高時,核矩陣元素值過大或過小的問題,而RBF則不會出現(xiàn)此類問題。
RBF核函數(shù)的形式如式(8):

(8)
式中:σ為函數(shù)的寬度參數(shù),用于控制函數(shù)的徑向范圍。
2.2編碼方案
進行優(yōu)化的第一步就是對需要優(yōu)化的參數(shù)確定合適的編碼方案,能夠以指定長度的數(shù)字串來標(biāo)示這些參數(shù)在問題空間中的所有取值情況。筆者考慮到所要解決問題的實際情況,以十進制的編碼方式來構(gòu)造抗體種群,基因使用了十進制整數(shù)的方式進行編碼,設(shè)計使用兩個十進制數(shù)表示一個抗體,參數(shù)取值組合的索引則由碼位的值來表示。
2.3親和度函數(shù)
優(yōu)化中抗體選擇與否與該抗體值構(gòu)造的支撐矢量機的分類效果有關(guān)。為了盡量降低計算的復(fù)雜度,筆者設(shè)計的親和度函數(shù)如式(9):
f=1/(1+F)
(9)
式中:F為漏報率。
3.1實驗中使用的數(shù)據(jù)集
為評價文中算法的性能,筆者選用汽輪發(fā)電機組的故障數(shù)據(jù)集作為實驗數(shù)據(jù),以機組常見的3種故障(油膜振蕩F1,不平衡F2,不對中F3)為分析對象。表1列出了用于訓(xùn)練的代表性樣本,數(shù)據(jù)中有振幅數(shù)據(jù)6個,f為發(fā)電機轉(zhuǎn)子的頻率。

表1汽輪發(fā)電機組數(shù)據(jù)集Table 1Turbo generator data set
3.2獲得優(yōu)化后的參數(shù)
選擇好實驗用的數(shù)據(jù)集后,利用免疫克隆選擇算法根據(jù)分類器在分類過程的漏報率進行優(yōu)化獲得優(yōu)化的參數(shù)值。優(yōu)化過程中當(dāng)進行800次迭代時,親和度的變化趨于穩(wěn)定,最后得到優(yōu)化后的結(jié)果為:C=6.4,ξ=3.9,σ=0.026;為了避免優(yōu)化過程中的偶然性,提高參數(shù)的可靠性,所給出的優(yōu)化參數(shù)是30次試驗的均值。
3.3實驗結(jié)果及分析
在此使用兩個指標(biāo)對算法的性能進行評價,一個是能夠正確檢測的比率(既檢測率),記作TDR(true detection rate);另一個是錯誤檢測的比率(既誤檢率),記作FDR(falsedetection rate)。在實驗中還分別測試了標(biāo)準(zhǔn)SVM算法的診斷結(jié)果,實驗結(jié)果如表2。
由表2看出:文中算法在檢測率方面明顯優(yōu)于傳統(tǒng)的SVM算法。在誤檢率方面也比傳統(tǒng)的SVM算法低。

表2文中算法和標(biāo)準(zhǔn)SVM的性能比較Table 2Performance comparison of the proposed algorithm and the standard SVM
此外,筆者對引入優(yōu)化算法后的算法執(zhí)行效率情況進行了分析。圖1表示在不同數(shù)據(jù)規(guī)模的情況下,使用文中算法和標(biāo)準(zhǔn)的支撐矢量算法進行分類器訓(xùn)練學(xué)習(xí)所消耗時間的比較。

圖1文中算法和標(biāo)準(zhǔn)SVM訓(xùn)練時間比較Fig.1Comparison of the training time of the proposed algorithm and the standard SVM
由圖1看出:由于筆者在參數(shù)優(yōu)化時所選擇的交叉驗證的數(shù)據(jù)量比較小,使得文中算法和傳統(tǒng)支撐矢量機的訓(xùn)練速度基本相當(dāng)。從而也體現(xiàn)了文中算法在提高故障分類診斷檢測正確率的情況下,并沒有產(chǎn)生時間顯著增加的問題,而在算法的診斷檢測階段,由于已經(jīng)獲得了優(yōu)化的參數(shù),因此在診斷階段無需再附加優(yōu)化的過程。
筆者研究了基于參數(shù)優(yōu)化的支撐矢量機,引入免疫克隆選擇算法采用交叉驗證的方法,優(yōu)化獲得了支撐矢量機的參數(shù),并在汽輪發(fā)電機組故障數(shù)據(jù)集進行了驗證,從實驗結(jié)果可以看出,文中方法在保證訓(xùn)練速度的基礎(chǔ)上提升了識別正確率。
[1] SIMANI S,F(xiàn)ANTUZZI C.Fault diagnosis in power plant using neural networks[J].InformationSciencesanInternationalJournal,2000,127(3/4):125-136.
[2] MURALIDHARAN V,SUGUMARAN V,INDIRA V.Fault diagnosis of mono-block centrifugal pump using SVM[J].EngineeringScienceandTechnologyanInternationalJournal,2014,17(3):152-157.
[3] 陸百川,張凱,馬慶祿,等.基于數(shù)據(jù)驅(qū)動的數(shù)據(jù)故障診斷模型[J].重慶交通大學(xué)學(xué)報(自然科學(xué)版),2014,33(5):111-115.
LU Baichuan,ZHANG Kai,MA Qinglu,et al.Data fault diagnosis model based on data-driven[J].JournalofChongqingJiaotongUniversity(NaturalScience),2014,33(5):111-115.
[4] JAYASWAL P,VERMA S N,WADHWANI A K.Application of ANN,fuzzy logic and wavelet transform in machine fault diagnosis using vibration signal analysis[J].JournalofQualityinMaintenanceEngineering,2010,16(2): 190-213.
[5] 高振興,郭創(chuàng)新,俞斌,等.基于多源信息融合的電網(wǎng)故障診斷方法研究[J].電力系統(tǒng)保護與控制,2011,39(6):17-23.
GAO Zhenxing,GUO Chuangxin,YU Bin,et al.Study of a fault diagnosis approach for power grid with information fusion based on multi-data resources[J].PowerSystemProtectionandControl,2011,39(6):17-23.
[6] 陸百川,郭桂林,肖汶謙,等.基于多尺度主元分析法的動態(tài)交通數(shù)據(jù)故障診斷與修復(fù)[J].重慶交通大學(xué)學(xué)報(自然科學(xué)版),2016,35(1):134-137.
LU Baichuan,GUO Guilin,XIAO Wenqian,et al.Fault diagnosing and modifying of dynamic traffic data based on MSPCA[J].JournalofChongqingJiaotongUniversity(NaturalScience),2016,35(1):134-137.
[7] 王波,劉樹林,張宏利,等.相關(guān)向量機及其在機械故障診斷中的應(yīng)用研究進展[J].振動與沖擊,2015,34(5):145-153.
WANG Bo,LIU Shulin,ZHANG Hongli,et al.Advances about relevance vector machine and its applications in machine fault diagnosis[J].JournalofVibrationandShock,2015,34(5):145-153.
[8] DU Haifeng,JIAO Licheng,WANG Sunan.Clonal operator and antibody clone algorithms[C]//InternationalConferenceonMachineLearningandCybernetics2002 Proceedings.IEEE,2002: 506-510.
[9] VAPNIK V N.TheNatureofStatisticalLearningTheory[M].New York: Springer-Verlag,1995.
(責(zé)任編輯:劉韜)
Support Vector Machine Based on Parameter Optimization and Its Application in Fault Diagnosis
CHEN Hu
(Chongqing Rail Transit (Group)Co.Ltd.,Chongqing400042,P.R.China)
In order to effectively diagnose the fault of the equipment,a support vector machine algorithm based on parameter optimization was proposed.Firstly,the immune clonal selection mechanism was introduced.The antibody group was constructed,in which an antibody was expressed in two decimal numbers.Then,the affinity function was established on the basis of the missing report rate.Thus,the parameters of support vector machine were optimized.After that,the support vector classifier with optimized parameters was constructed and used to classify and detect the equipment data.Simulation verification was carried out on the data of turbo generator set.The simulation results indicate that the proposed algorithm does not significantly increase the training time,compared with the traditional support vector machine algorithm.Moreover,it can effectively improve the detection rate and reduce the false detection rate.
electromechanical engineering; fault diagnostics; support vector machines; parameter optimization; immune clone algorithm
TH17
A
1674-0696(2017)10-119-04
2016-03-16;
2016-06-16
國家安全監(jiān)管總局科技攻關(guān)項目(zhishu-031-2013AQ)
陳虎(1982—),男,山東冠縣人,工程師,主要從事事故診斷與檢測方面的研究。E-mail: chenhu531@163.com。
10.3969/j.issn.1674-0696.2017.10.20