王保建, 張小麗, 傅楊奧驍, 陳雪峰
(1.西安交通大學機械基礎國家級實驗教學示范中心 西安, 710049)(2.長安大學道路施工技術與裝備教育部重點實驗室 西安, 710064)
?
優化支持向量機及其在智能故障診斷中的應用
王保建1, 張小麗2, 傅楊奧驍1, 陳雪峰1
(1.西安交通大學機械基礎國家級實驗教學示范中心 西安, 710049)(2.長安大學道路施工技術與裝備教育部重點實驗室 西安, 710064)
單一支持向量機在軸承齒輪故障診斷中精度較低,為了提高支持向量機在軸承齒輪故障診斷中的精度,對支持向量機的樣本特征提取方法以及支持向量機參數優化的方法進行了研究。首先,通過核主成分分析方法構造支持向量機的輸入樣本,可以減少數據間的冗余,提取數據的高維信息;其次,通過粒子群優化算法優化支持向量機核函數參數和懲罰因子;最后,使用優化后的支持向量機模型進行故障診斷。通過實際軸承齒輪故障診斷對比實驗,結果表明,所提方法相比一般的支持向量機診斷方法診斷精度大幅提高,驗證了該混合智能診斷方法的有效性和優勢。
支持向量機;核主成分;粒子群優化算法;故障診斷
隨著中國制造2025的提出,自動化、智能化成為我國制造業的發展方向。故障診斷技術已經發展到了智能故障診斷階段,其中支持向量機(support vector machine,簡稱SVM)作為智能故障診斷技術領域的熱點之一,以其基于統計學習理論的特點,非常適合故障診斷這種典型的小樣本問題。目前,支持向量機在軸承、齒輪、電機等機械狀態監測與故障診斷中得到了廣泛應用,取得了良好的效果。根據文獻[1-2],將改進核函數的支持向量機智能診斷方案用于軸承的故障診斷,將局部均值分解與支持向量機相結合用于電機的故障診斷,以及將主成分分析和SVM結合的方法用于內燃機的故障診斷等都取得較好結果。文獻[3-6]將神經網絡和SVM的超參數優化用于離心泵的故障診斷,將基于物理模型的SVM用于滾動軸承的故障診斷,也取得了較好的效果。但是,目前標準的支持向量機算法通常對樣本的分布假設過于理想,樣本構造復雜,樣本間數據存在冗余、無法提取數據間高維信息及預測速度慢、預測精度低的問題,在處理工程實際問題時容易出現問題。SVM 的性能取決于訓練樣本數據的質量和SVM核函數參數g和懲罰因子C的選擇,因此,筆者對支持向量機的樣本特征提取方法以及支持向量機參數優化的方法進行了研究。
SVM是一種針對小樣本和少樣本情況下的機器學習的新方法。支持向量機不同于傳統的基于經驗風險最小化原則的學習方法,它是基于結構風險最小化的原則,在解決小樣本、非線性及高維問題時表現出很多獨特的優勢[7-8]。
支持向量機的基礎是尋找在線性可分條件下的最優分類超平面。首先給定一個樣本集

其中:xi為數據;yi為數據所屬的類別。
若超平面方程wx+b=0達到了最優分類平面的標準(即在分類間隔最大的情況下將樣本正確地分開),則求解最優分類平面的問題可以轉換為下述目標函數和約束條件
(1)
其中:w為權重向量;b為偏置向量。
在許多情況下,一些樣本往往不能被正確地分類,為了確保分類的準確性,這里引入了松弛因子ξi≥0,i=1,2,…,n,則優化問題可以表示為
(2)
其中:C為懲罰因子。
由于算法復雜程度與分類精度之間的矛盾,通過調節懲罰因子的大小來實現折中。式(2)則變成了一個二次規劃問題,通過求拉格朗日函數的鞍點得到問題的最優解。
由最優化條件(karush-kuhn-tucker,簡稱KKT)定理得知最初的求解最優超平面的問題被轉換為求解二次優化問題

至于非線性條件下的分類問題,支持向量機的基本思想是通過核函數實現從低維向高維的映射,然后在高維特征空間中使用支持向量機進行線性分類,其具體是通過核函數來實現。現在常用的核函數包括線性核函數、高斯徑向基核函數、多項式核函數及指數徑向核函數等,使用不同的核函數所產生的支持向量機會得到不同的分類和預測結果。
在軸承與齒輪的故障診斷中,最常用的方法是使用各種現代信號處理方法去提取被檢測信號中的故障特征頻率部分。通常情況下,軸承、齒輪的故障特征頻率可以通過各種一般公式直接求得;但是也有一些情況下,其故障特征頻率不容易求得,或者即使求得了故障特征頻率,在故障早期及噪聲大的情況下也很難準確分析出特征頻率。智能診斷方法不求特征頻率,而是從信號的指標上進行自學習及分類。筆者采用的基于核主成分及粒子群參數優化的支持向量機智能故障診斷方法是針對設備振動信號的診斷方法,首先,采集設備振動信號;然后,采用信號的時域指標直接構造故障樣本,故障樣本采用核主成分進行降維及減少冗余處理,處理后的樣本用于SVM訓練樣本,支持向量機的懲罰因子C和核函數參數g采用粒子群算法進行優化;最后,使用優化SVM對測試樣本進行分類診斷。具體的方法流程圖見圖1。

圖1 方法流程圖Fig.1 Method flow chart
2.1 樣本構造


表1 幾種時域統計特征
2.2 基于核主成分分析的樣本處理方法
在構造時域統計特征訓練樣本時,時域變量(如均方根、峭度等)之間存在相關的關系,信息之間存在冗余,直接構造難免使得訓練樣本復雜化,進而影響分類精度。運用核主成分分析(kernel principal component analysis ,簡稱KPCA)方法提取這些統計特征樣本的有效信息,去除冗余信息,同時減小數據的維數,可以減小計算量,加快分類速度[9-10]。

(4)
在特征空間中使用主成分分析方法,即求解方程Cν=λν中的特征值λ和特征向量ν,即有
(5)

(6)
其中:v=1,2,…,M。
定義M×M的矩陣K
則式(6)可以簡化為MλKα=K2α,通過對上式的求解,即可以得到所要求的特征值λ和特征向量ν。
支持向量機的懲罰因子C和核函數g的選擇對預測分類精度影響很大,采用粒子群優化方法優化支持向量機參數C和g[11-13]。粒子群優化算法(particle swarm optimization algorithm,簡稱PSO)基本理論如下。

1) 自身搜索到的歷史最優值
2) 全部粒子搜索到的最優值
之后每個粒子則會按照式(7)來更新自己所處的位置和此時的速度
(7)
其中:ω為慣性權重,是粒子保持自己之前的速度的權重系數;c1為粒子根據自身經驗尋找最優值的權重系數,一般取2;c2為粒子根據群體經驗尋找最優值的權重系數,一般也取為2;ξ,η為區間[0,1]之間均勻分布的隨機數;r為約束因子,通常取1。
依據公式(3)引入產業創新速度的2次項估計其非線性效應,經檢驗采用固定效應模型,結果見表1。結果顯示,所有變量均通過了統計檢驗,模型擬合優度為0.993。其中,產業創新速度二次項的彈性系數為-0.145,說明產業創新速度與創新效益之間呈倒U型曲線關系,產業創新速度彈性最高點取自然對數后為4.586,轉換成產業創新速度為98.10%。即當產業創新速度小于98.10%時,產業創新速度越高,其彈性系數越大;當產業創新速度大于98.10%時,產業創新速度越大,其彈性系數越小。
粒子群優化算法流程見圖2。

圖2 粒子群優化算法流程圖Fig.2 Flow chart of particle swarm optimization algorithm
筆者所提方法經過仿真數據實驗,結果表明本方法比直接用SVM診斷精度大為提高。為了進一步驗證所提方法有效性,在故障模擬實驗臺上進行了軸承和齒輪的故障模擬實驗。實驗系統結構如圖3所示,實物如圖4所示。該系統主要包括SQI(MFS-PK4)故障模擬實驗臺(轉子由2個軸承支撐,電機用過聯軸器帶動轉子旋轉,轉子通過皮帶輪帶動齒輪箱運動)、PCB加速度傳感器及東華數據采集系統。通過更換轉子系統的支撐軸承來模擬不同故障的軸承,包括正常軸承、內圈故障、外圈故障、滾動體故障及混合故障5種情況;通過更換齒輪箱的齒輪來模擬不同齒輪故障,包括正常齒輪、齒輪缺齒、齒輪斷齒及齒輪均勻磨損4種情況,其中齒輪均勻磨損有一個專用的齒輪箱來模擬。一個加速度傳感器置于右端軸承座上方(按照徑向方向)采集軸承振動信號,另一個置于齒輪箱上方采集齒輪振動信號,采樣頻率為12.8kHz。實驗用故障軸承及故障齒輪如圖5所示。
使用所采集振動信號的前一半樣本作為訓練樣本集,后一半樣本作為測試樣本集,得到了70個訓練集樣本和70個測試集樣本。由于徑向基核函數(rbf)具有很好的學習能力,所以本研究中SVM的核函數均采用徑向基核函數。

圖3 實驗系統結構示意圖Fig.3 Schematic diagram of experimental system structure

圖4 實驗系統實物圖Fig.4 Physical picture of experimental system

圖5 故障軸承及故障齒輪Fig.5 Fault bearing and fault gear
為了驗證所提方法的有效性,筆者采用了不同方法對比的研究思路,具體如下。
對比測試1:使用16個時域指標構造樣本,直接使用不經過優化的支持向量機進行分類,參數為C=3,ker=rbf,g=2,實驗分類精度Acc=87.14%(61/70),如圖6所示。其中:圈表示測試樣本的標簽;星號表示支持向量機判別的對應樣本的標簽。如果星號與圈重合,則判別正確;否則判別錯誤。

圖6 軸承對比測試1的實驗結果Fig.6 Experimental results of bearing contrast test 1
對比測試2:使用16個時域指標構造樣本,使用經過粒子群優化的支持向量機進行分類,優化結果為C=4.487,ker=rbf,g=0.514,實驗結果為Acc=92.86%(65/70)。
對比測試3:使用主成分分析方法重構樣本,再使用粒子群優化參數后的支持向量機進行分類,參數優化后為C=56.45,ker=rbf,g=5.13,實驗結果為Acc=97.14%(68/70),如圖7所示。

圖7 軸承對比測試3的實驗結果Fig.7 Experimental results of bearing contrast test 3
對比測試4:使用16個時域統計特征作為核主成分分析的輸入矩陣,通過核主成分分析方法,選取主成分矩陣前l列累計貢獻率達到95%的主成分作為支持向量機的輸入樣本,在軸承實驗中前2列的累計貢獻率達到99%,在齒輪試驗中前4列的累計貢獻率達到99%。軸承和齒輪的主成分累計貢獻率如圖8所示。

圖8 軸承和齒數的主成分累計貢獻率Fig.8 The main components cumulative contribution rate of bearing and gear
使用粒子群優化參數后的支持向量機進行分類,參數優化后為:C=33.2,ker=rbf,g=61.4,實驗結果為Acc=100%(70/70),如圖9所示。從圖中可以看出,所有的樣本均被正確分類。

圖9 軸承對比測試4的實驗結果Fig.9 Experimental results of bearing contrast test 4
軸承故障診斷的4次對比測試結果匯總于表2,齒輪故障診斷的4次對比測試結果見表3。

表2 軸承對比實驗結果
SVM為支持向量機;PSO為粒子群優化算法;PCA為主成分分析;KPCA為核主成分分析

表3 齒輪對比實驗結果
從軸承和齒輪單獨樣本的故障診斷結果來看,粒子群算法優化支持向量機(PSO-SVM)的參數后,分類精度提高了。在此基礎之上使用主成分分析方法構造樣本(PCA-PSO-SVM),去除了原有樣本中的冗余信息,簡化了樣本的構造,精度進一步提高。使用核主成分分析構造樣本時(KPCA-PSO-SVM),較主成分分析而言,其能夠提取樣本數據之間高維的信息,進一步提高了精度。
采用核主成分加粒子群算法優化支持向量機參數的方法,構造了一套混合智能故障診斷系統。核主成分分析方法方便了樣本矩陣的構造,減小了數據的冗余,提取了樣本數據之間的高維信息,采用粒子群優化算法對支持向量機核函數參數g及懲罰因子C進行了優化,完成了機械故障模擬實驗臺上軸承和齒輪的故障診斷實驗。通過與使用一般時域指標方法、使用主成分分析方法兩種構造樣本方法及SVM參數不優化和優化進行實驗對比,結果表明,所提方法在軸承和齒輪兩種數據樣本上的診斷上精度非常高,證明了所提方法的科學性和有效性。
[1] 劉永斌,何清波,孔凡讓. 基于PCA和SVM的內燃機故障診斷[J]. 振動、測試與診斷,2012,32(2):250-255.
Liu Yongbin,He Qingbo,Kong Fanrang. Fault diagnosis of internal combustion engine based on PCA and SVM[J]. Journal of Vibration,Measurement & Diagnosis,2012, 32(2):250-255.(in Chinese)
[2] 鞠華,沈長青,黃偉國. 基于支持向量回歸的軸承故障定量診斷應用[J]. 振動、測試與診斷,2014,34(4):767-771.
Ju Hua,Shen Changqing,Huang Weiguo. Application of bearing fault quantify diagnosis based on support vector regression[J]. Journal of Vibration,Measurement & Diagnosis, 2014,34(4):767-771. (in Chinese)
[3] Azadeh A, Saberi M, Kazem A, et al. A flexible algorithm for fault diagnosis in a centrifugal pump with corrupted data and noise based on ANN and support vector machine with hyper-parameters optimization[J]. Applied Soft Computing, 2013, 13(3): 1478-1485.
[4] Gryllias K C, Antoniadis I A. A support vector machine approach based on physical model training for rolling element bearing fault detection in industrial environments[J]. Engineering Applications of Artificial Intelligence, 2012, 25(2): 326-344.
[5] Chen Fafa, Tang Baoping, Song Tao, et al. Multi-fault diagnosis study on roller bearing based on multi-kernel support vector machine with chaotic particle swarm optimization[J]. Measurement, 2014, 47: 576-590.
[6] Kuang Fangjun, Zhang Siyong, Jin Zhong, et al. A novel SVM by combining kernel principal component analysis and improved chaotic particle swarm optimization for intrusion detection[J]. Soft Computing, 2015, 19(5): 1187-1199.
[7] Shen Zhongjie. Remaining life predictions of rolling bearing based on relative features and multivariable support vector machine[J]. Journal of Mechanical Engineering, 2013, 49 (2): 183-189.
[8] 郭明瑋,趙宇宙,項俊平. 基于支持向量機的目標檢測算法綜述[J]. 控制與決策,2014(2):193-200.
Guo Mingwei, Zhao Yuzhou, Xiang Junping. A review of the target detection algorithm based on support vector machine[J]. Control and Decision,2014(2):193-200. (in Chinese)
[9] 彭令,牛瑞卿,趙艷南.基于核主成分分析和粒子群優化支持向量機的滑坡位移預測[J]. 武漢大學學報,2013,38(2):148-452.
Peng Ling, Niu Ruiqing, Zhao Yannan. Landslide displacement prediction based on kernel principal component analysis and particle swarm optimization support vector machine [J]. Journal of Wuhan University,2013,38(2):148-452. (in Chinese)
[10]李平,李學軍,蔣玲莉. 基于KPCA和PSOSVM的異步電機故障診斷[J]. 振動、測試與診斷,2014,34(4):616-620.
Li Ping,Li Xuejun,Jiang Lingli. Fault diagnosis of induction motor based on KPCA and PSOSVM[J]. Journal of Vibration,Measurement & Diagnosis,2014,34(4):616-620. (in Chinese)
[11]聶立新,張天俠,趙波. 粒子群算法優化雙核支持向量機及應用[J]. 振動、測試與診斷,2014,34(4):565-569.
Nie Lixin, Zhang Tianxia, Zhao Bo. Particle swarm optimization algorithm for dual core support vector machine and its application[J] . Journal of Vibration,Measurement & Diagnosis,2014,34(4):565-569. (in Chinese)
[12]谷文成,柴寶仁,滕艷平. 基于粒子群優化算法的支持向量機研究[J]. 北京理工大學學報,2014(7):705-709.
Gu Wencheng, Chai Baoren, Teng Yanping. Research on support vector machine based on particle swarm optimization algorithm[J] .Journal of Beijing Institute of Technology ,2014(7):705-709. (in Chinese)
[13]張周鎖,侯照文,孫闖.應用粒計算的混合智能故障診斷技術研究[J]. 西安交通大學學報,2011,45(1):48-53.
Zhang Zhousuo, Hou Zhaowen, Sun Chuang. Research on the technology of hybrid intelligent fault diagnosis based on granular computing[J]. Journal of Xi′an Jiaotong University,2011,45(1):48-53.(in Chinese)

10.16450/j.cnki.issn.1004-6801.2017.03.020
航空科學基金資助項目(20151070005);國家自然科學基金資助項目(51405028);中國博士后科學基金資助項目(2015M572552)
2016-09-06;
2016-11-07
TH17;TP18
王保建,男,1983年5月生,博士生、工程師。主要研究方向為機械系統故障診斷。曾發表《基于“雙導師制CDIO”本科生課程教學改革與實踐》(《實驗室研究與探索》2016年第35卷第3期)等論文。 E-mail:wangbaojian@mail.xjtu.edu.cn