韓 霞, 趙 軍, 西熱娜依·白克力,郭天太,孔 明
(1.中國計量大學 計量測試工程學院,浙江 杭州 310018;2.哈密市質量與計量檢測所,新疆 哈密 839000)
支持向量機(support vector machine,SVM)通過最小化泛化誤差并最大化訓練集兩分類之間的幾何邊距來構建分類模型,保證能夠獲得全局最優解[1],是一種監督學習方法。
選擇合適的核函數對于改善SVM分類性能具有重要意義。韓華等人采用網格搜索的方法尋找最優核參數,并用十折交叉驗證方法評價參數的有效性,但要求具有一定的經驗性[2]。Li S J和Wu H等人為了提高分類準確度,使用遺傳算法來優化SVM模型參數[3]。Aydin I等人則采用多目標人工免疫算法對SVM的模型參數進行了優化[4]。然而上述方法都不適用于非線性分類問題。
粒子群優化(particle swarm optimization,PSO)算法是一種基于群體智能的演化算法[5]。與其他算法相比,PSO算法中間迭代步驟簡單,對解空間的搜索能力強,收斂速度快,因此,可用于SVM模型參數尋優。李松等人通過腦機接口(brain computer interface,BCI)數據集測試了遺傳算法尋優、PSO尋優等5種SVM參數尋優算法,結果顯示利用PSO進行參數優化后的模型具有較高的分類正確率[6]。
本文利用PSO算法,對影響非線性SVM分類性能的2個參數,懲罰參數及其核參數,進行優化,并將優化后的算法用于減速機齒輪故障診斷分類中。
SVM學習和泛化能力強,在分析處理小樣本、非線性和局部極小等問題時表現出強大的優越性[7]。
SVM的模型原理描述如下:用(xi,yi),1≤i≤N,表示一組含有N個采樣數據的樣本,每個樣本必須符合條件xi∈Rd。yi為相應的樣本xi所屬的類,則yi∈{-1,1}。d為輸入數據的維度。分類超平面可以被推導為
w·xi+b=0,1≤i≤N
(1)
w·xi+b=±1
(2)
依據式(2),對每一個樣本點均有
yi(w·xi+b)≥1
(3)
問題即變成找到最優的w和b。由SVM學習產生的最優超平面,含有距離支持向量的最大距離,分離超平面的邊距為2/‖w‖ 。為找到最優超平面,則最小化‖w‖。用1/2 ‖w‖2來代替‖w‖,則識別分類問題歸結為一個二次規劃問題。
對于非線性問題,引進非負的松弛變量ξi,有
(4)
式中C為懲罰參數,用于平衡邊距最大化和誤差最小化2個因素。上述問題可使用拉格朗日乘子法求解,分類決策函數變成
(5)
式中αi為拉格朗日乘子。
K(xi,xj)=φ(xi)·φ(xj)為核函數可通過另外一個映射函數φ(x)得到。二次規劃求解器可以用于求解αi,則有w和b為
(6)
(7)
式中NSV為支持向量的數目;x為輸入的未知樣本。
本文采用常用的高斯徑向核函數[8]
(8)
模型的分類性能主要由核參數σ和誤差懲罰參數C兩個參數決定[9]。
采用K折交叉驗證法(K—CV):將訓練樣本隨機分為k組,每組含有相同數目且無交集的訓練樣本,將其中k-1組作為訓練集來訓練SVM,用剩下的一組樣本作為測試集測試訓練所得分類器模型的正確率。重復操作k次之后,最終取這k次預測得到的分類正確率的平均值作為該模型的分類正確率。本文選用3折交叉驗證法。
本文提出利用PSO算法[10~12]對SVM齒輪故障分類模型進行參數優化,其懲罰參數C和高斯核參數σ的選取不再依靠人為經驗或者是任意選取,而是基于PSO算法的迭代優化選取,對于不同的核函數或者訓練樣本集,計算并匹配不同最佳參數(C,σ)。
為驗證PSO-SVM算法在實測實驗中的分類性能,搭建了減速機齒輪診斷實驗臺。采用型號為RV50的減速機,減速比7.5。減速機直接與驅動電機相連,驅動電機將動力傳到減速機,帶動減速機產生振動。加速度信號經傳感器由研華PCI-1714UL型四通道同步采集卡采集傳輸至電腦端,輸入SVM。圖1為實驗搭建的減速機實驗臺,用螺紋栓將傳感器固定在減速機表面中心的螺紋孔,該螺紋孔位于齒輪嚙合正上方,加速度傳感器固定在此處測量能較好地測得振動信號(圖1中圓圈所示)。

圖1 減速機實驗臺
減速機的蝸輪和蝸桿硬度相差較大,相對于蝸桿,蝸輪出現故障的概率要大得多,所以本次實驗的故障設置在蝸輪齒輪上。設置的故障分別為齒輪磕碰、齒輪磨損,2種故障與正常齒輪共構成3種類別,通過分類器進行分類。正常齒輪獲取正常齒輪減速機的振動信號,作為標準樣本庫;故障樣本庫包含2個已知齒輪故障減速機的振動信號,故障類型分別為齒輪的磕碰故障及磨損故障。由于在實際情況中,采集的振動信號并非理想的線性信號,因此,本文選用了非線性SVM,并利用啟發式智能算法對核函數及模型參數進行調整,以達到良好的分類效果。
利用PCB356A33加速度傳感器測得振動信號計算21項常用時域統計指標,以此作為支持向量機的輸入。
測點位置選擇在圖1所示減速機上方圓圈處。該測點位置處于減速機齒輪嚙合的正上方,可較好地接收故障信號的傳遞,所含齒輪故障信息較多。在驅動電機轉速為1 500 r/min的情況下測量齒輪的振動數據。初始采樣頻率為fs=80 kHz,數據長度為1 048 576,通過降采樣操作后采樣頻率為fs=20 kHz,數據長度為262 144。將所測數據按每組2 048個分成128組,組成SVM訓練集。從128個輸入中隨機抽取32個作為測試集輸入,檢測SVM的分類性能。
按照數據的類型,將樣本數據分為3類,即有量綱指標數據集、無量綱指標數據集及綜合的21項指標數據集,分別用3類數據集對SVM進行訓練和測試,并比較所得3個模型分類的正確率。
表1所示為2種算法對比下的21項指標,可以看出,PSO-SVM正確率為93.8%,其分類效果優于SVM分類效果,預測結果具有較高正確率,表明采用 PSO算法能夠獲得全局最優解。

表1 21項指標下2種算法對比
利用PSO對SVM進行參數優化時,選用不同特征向量指標作為輸入的的分類結果如表2。其中,CV 正確率表示在3折交叉驗證方法下SVM模型的最高分類正確率。可知,利用樣本數據集的3類不同特征向量指標訓練模型時,得到的參數的最優值明顯不同,分類效果也不盡相同,但均能達到93 %以上。

表2 PSO算法關于不同特征指標的分析結果
以有量綱特征向量指標為例,由圖2中有量綱特征向量指標下的PSO算法適應度曲線,可以看出,通過約300次的迭代,最佳適應度達到87 %,平均適應度約為75 %。

圖2 有量綱指標下迭代優化的適應度曲線
圖3為有量綱特征向量指標下的測試集樣本分類,有量綱特征項向量指標組成測試集,作為PSO-SVM的輸入。通過對比測試集實際分類可以算出模型預測準確率,由圖可見測試樣本中分類錯誤的點只有9個,測試集分類的正確率達到了92.7 %。

圖3 有量綱指標下優化模型的測試分類
由以上可知,分別將3類特征向量,作為SVM訓練集,可得到不同的模型,其模型參數C和σ有明顯差異,分類效果也不相同。
以本文實驗平臺減速機所測得的數據為例,在驅動電機轉速在300~1 500 r/min的情況下,對減速機振動加速度數據進行訓練和測試。表3為特定轉速情況下,2種模型的相關參數和測試集分類結果。可知,PSO-SVM得出的正確率(90.6 %)明顯高于未進行參數優化而得出的正確率(78.13 %)。

表3 轉速600 r/min時2種算法對比
表4為驅動電機在不同轉速下帶動減速機振動,其振動數據通過PSO算法得到的SVM分類結果。由表格可以看出,轉速越高,PSO-SVM的分類正確率越高。這是因為轉速高的情況下振動能量較大,各項指標相對變化幅度較大,從而分類效果較理想。
將PSO應用到SVM參數優化中,使PSO-SVM齒輪故障分類系統具有良好的自學習、自適應能力,能更精確地找到最優解,分類正確率得到提高。粒子群算法對多目標問題解空間具有強大的搜索能力。
參考文獻:
[1] Vapink V N.The nature of statistical learning theory[M].New York:Spring Verlag,1995:21-22.
[2] 韓 華,谷 波,康 嘉.基于遺傳算法和支持矢量機參數優化的制冷機組故障檢測與診斷研究[J].機械工程學報,2011,47(16):120-121.
[3] Li S J,Wu H.An effective feature selection method for hyperspectral image classification based on genetic algorithm and support vector machine[J].Knowledge-Based System,2011,24(1):40-48.
[4] Aydin I,Karakose M,Akin E.A multi-objective artificial immune algorithm for parameter optimization in support vector ma-chine[J].Applied Soft Computing,2009,11 (1):120-129.
[5] Kennedy J,Eberhart R.Particle swarm optimization[C]∥IEEE International Conference on Neural Networks,San Diego:IEEE,1995:1942-1948.
[6] 李 松,伏云發,陳 健,等.五種SVM 參數尋優識別運動想象腦電比較研究[J].傳感器與微系統,2017,36(4):42-46.
[7] 何學文,趙海鳴.支持向量機及其在機械故障診斷中的應用[J].中南大學學報:自然科學版,2005,36(1):97-101.
[8] 奉國和.SVM分類核函數及參數選擇比較[J].計算機工程與應用,2011,47(3):123-124,128.
[9] 都 衡,潘宏俠.基于信息熵和GA-SVM的自動機故障診斷[J].機械設計與研究,2013,29(5):128-129.
[10] 王 凱,侯著榮,王聰麗.基于交叉驗證SVM的網絡入侵檢測[J].測試技術學報, 2010,24 (5):420-421.
[11] Kennedy J,Eberhart R C.Particle swarm optimization[C]∥Proceedings of IEEE International Conference on Neural Networks,Piscataway,1995:1942-1948.
[12] 翟彥蓉,黃 歡,張 申,等.改進粒子群優化算法在TDOA定位中的應用[J].傳感器與微系統,2013,32(4):145-148,152.