溫國強,文妍,譚繼文
(青島理工大學,山東青島266033)
滾珠絲杠是一種高精度、高效率的傳動部件,已經成為數控機床中廣為應用的傳動和定位元件之一。滾珠絲杠的質量將會直接影響到數控機床的整體性能,因此,研究滾珠絲杠的故障診斷方法,對提高產品質量和生產效率具有重要意義[1]。
為實現對滾珠絲杠故障做出更精確的診斷,提出了基于平均影響值與SVM 的滾珠絲杠故障診斷方法。由于從采集的滾珠絲杠振動信號中獲得的特征量較多,而用太多的特征量進行模型設計,會增大計算復雜度并且可能降低模型性能。引入平均影響值理論,去掉對診斷結果有負面影響的變量,將剩余特征量作為輸入,實現變量篩選。支持向量機與傳統BP 網絡相比具有更強的逼近能力和泛化能力且不會陷入局部極小,在處理多維小樣本數據時優勢突出。最后通過實例中建立的滾珠絲杠故障診斷模型,對該診斷方法進行了可行性研究。
平均影響值(Mean Impact Value,MIV)是一種目前被認為是在神經網絡中評價變量相關性的最好指標之一[2]。該算法可用于確定輸入變量對輸出變量的影響大小,其符號代表相關的方向,絕對值代表影響的大小。
通常采用BP 神經網絡作為訓練網絡,構建基于BP 網絡的MIV 算法流程[3],如圖1所示。

圖1 基于BP 網絡的MIV 變量篩選流程圖
支持向量機(Support Vector Machine,SVM)是在統計學習理論中VC 維理論和結構風險最小化原則基礎上建立的一種具有很多優越性的新型機器學習方法。支持向量機不僅具有高度的理論嚴密性、很強的適應性,同時也具有較高的訓練速度和良好的泛化能力,是解決小樣本、非線性、局部極小等問題的有效工具[4]。
SVM 是從線性可分條件下的最優分類面發展而來的,基本原理可借助圖2 說明。

圖2 線性可分情況下的最優分類線
圖2 中的圓形點和方形點分別代表兩種樣本,H為分類線,H1、H2分別為平行于分類線且離分類線最近的直線,它們之間的距離叫做分類間隔。所謂最優分類線就是要求分類線間隔最大且能使兩類樣本正確分開,擴展到高維度上就是最優分類面。
假設訓練樣本集{(xi,yi),i=1,2,…,l},xi∈Rn,yi∈{-1,1};l 為樣本數,n 為輸入維數;構建分類超平面H:xi·w +b =0,(w 為權向量,b為偏置向量)。利用公式(1)可實現超平面的優化:

式中:ξi為松弛因子,是為考慮分類誤差而引入的;c 為懲罰參數,目的是控制對錯分樣本的懲罰程度。這時分類間隔bmargin=2/‖w‖,所以, “使間隔最大”等價于使‖w‖最小或‖w‖2/2 最小。因此,使‖w‖2/2 最小且滿足式(1)的分類面就是最優分類面,H1、H2上的訓練樣本點就叫做支持向量[5]。
針對非線性問題,通常需引入核函數將低維空間非線性問題映射到高維空間,然后變成線性問題進行分類處理[6]。常用的核函數有線性核函數、多項式核函數、RBF 核函數和Sigmoid 核函數。
對正常絲杠、滾珠磨損、滾道磨損及絲杠彎曲4種狀態試件進行狀態模擬。將3 個LC0101 振動加速度傳感器分別置于滾珠絲杠端部軸承座的X 向、Y 向和Z 向,對運行狀態振動信號進行采集,如圖3所示。

圖3 傳感器布置圖
對每種狀態分別采集20 組信號,將前16 組信號作為訓練集,后4 組作為測試集。
(1)使用經驗模態分解法[7]對振動信號進行分解,將前8 個IMF 的能量值C 作為頻域特征(注:一般情況下,原始信號中最重要的信息基本體現在經驗模態分解出的前幾個IMF 分量中,通常提取前幾個IMF 分量的能量值作為特征值)。
(2)提取振動信號的標準差、均方根、峭度、峰值、峰度、偏斜度共6 個時域特征。
基于MIV 的篩選方法依托于BP 網絡訓練,首先需要確定BP 網絡結構以及并進行參數設定。
(1)網絡結構
選用3 層BP 網絡,輸入層節點數為特征值總數,記為a:{a=(8 +6)×3 =42};輸出層節點數記為b:{b=1},分別用“1”、“2”、“3”、“4”代表正常絲杠、滾珠磨損、滾道磨損及絲杠彎曲4 種狀態。
確定隱層節點的經驗公式:

式中:a 為輸入層節點數,b 為輸出層節點數。計算得隱層節點在7 ~16 之間取值,經多次網絡訓練后發現,當k=15 時網絡收斂速度最快且效果最好,則確定隱層節點為15。
(2)網絡參數
①期望誤差。通常期望誤差設定值越小,網絡診斷精度越高,但若太小會使網絡訓練時間過長甚至不能收斂。經多次試驗,選取期望誤差為0.002 較為合適。
②學習速率。學習速率的選取范圍在0.01 ~0.8之間,通常選用較小的學習速率以保證系統的穩定性。結合該實例經多次試驗后,發現當速率取0.1 時效果較好。
(3)篩選結果
原始樣本特征經MIV 篩選后得到各特征排序結果,見表1。

表1 MIV 位次表
由表1 可選出與輸出結果成正相關且MIV 值相對較大的前8 個特征作為新的特征集合,分別是:C3X、C1X、標準差δX、C1Y、峰度αY、峭度βY、C4Y、C2Z。
3.4.1 確定SVM 的輸入、輸出
輸入:選用由篩選后的8 個特征組成的新特征集作為SVM 的輸入。
輸出:分別用“1”、“2”、“3”、“4”代表正常絲杠、滾珠磨損、滾道磨損及絲杠彎曲4 種狀態。
3.4.2 核函數的選擇
由于模型會隨著核參數增多而變復雜,RBF 核函數只有一個核參數比其余核函數少,所以參數優化相對簡單。另外,RBF 核函數[8]具有廣泛適應性,適宜于任意分布的樣本。所以,RBF 核函數是當前SVM 中應用最為普遍的核函數,其形式如下:

3.4.3 懲罰參數c 與核參數γ 優化
選定RBF 核函數后,便需要對懲罰參數c 與核參數γ 進行設定。常采用網格搜索法、蟻群算法或GA 遺傳算法或PSO 粒子算法實現對SVM 參數的尋優。網格搜索法[9]能夠遍歷搜索范圍內所有的參數組合,可以保證搜索到最優參數,適合于樣本較小的預測模型。文中預測模型的樣本較小,因此用網格搜索方法最為合適。采用網格搜索法對參數(c,γ)進行優化,優化結果如圖4、圖5所示。

圖4 預測準確率2D 等高線圖

圖5 預測準確率3D 等高線圖
由上可得優化后的SVM 參數為:c =9.189 6,γ=0.108 82。
3.4.4 診斷結果
為了體現基于MIV-SVM 故障診斷模型的優越性,引入了另外兩種診斷模型作為對比。則3 種模型分別是:模型Ⅰ(不進行篩選,直接用BP 網絡診斷)、模型Ⅱ(不進行篩選,只通過SVM 診斷)、模型Ⅲ(基于MIV 與SVM 相結合的故障診斷),診斷結果見表2。

表2 三模型診斷結果對照表
通過表2 可得如下結論:
(1)相比于BP 網絡,SVM 的訓練時間明顯縮短且故障識別率相對較高;
(2)基于MIV 篩選后的SVM 相對于未篩選的SVM 網絡,訓練時間有一定程度縮短,故障識別率明顯提高。
采集滾珠絲杠的振動信號分析其故障狀態特征,并利用平均影響值(MIV)算法對獲得的時頻域特征進行變量篩選。通過變量篩選,可以簡化診斷模型的結構,降低模型構建的復雜度。依據SVM 在處理小樣本數據上的優勢,將其應用到絲杠的故障診斷中。相比于傳統BP 網絡,該方法具有訓練速度快、診斷精度高且不存在局部極小等優點。實例中將兩種算法相結合,建立基于平均影響值與SVM 的滾珠絲杠故障診斷模型并與傳統診斷方法進行了對比分析,結果表明:該模型較之傳統的故障診斷模型具有更好的性能。
【1】劉東升.基于EMD 的滾珠絲杠振動信號濾波技術研究[J].機床與液壓,2010,40(7):51-55.
【2】王紫微,葉奇旺.基于神經網絡MIV 值分析的腫瘤基因信息提取[J].數學的實踐與認識,2011,41(14):47-58.
【3】周瑩,程衛東.基于MIV 特征篩選和BP 神經網絡的滾動軸承故障診斷技術研究[D].北京:北京交通大學,2011:25-27.
【4】毋文峰,蘇勛家,陳小虎,等.基于小波包和支持向量機的液壓泵故障診斷[J].機床與液壓,2011,39(9):146-147.
【5】郭晶亮,姚玉南,涂鋼.基于支持向量機的柴油機故障診斷系統研究[D].武漢:武漢理工大學,2011:17-21.
【6】王素云,崔麗威,宮雷,等.SVM 方法在滾動軸承故障診斷中的應用[J].西安文理學院學報:自然科學版,2011,14(3):30-33.
【7】HUANG N E,SHEN Z,LONG S R,et al.The Empirical Mode Decomposition and the Hilbert Spectrum for Non-linear and Non-stationary Time Series Analysis[C]//Proc R Soc Lond A,1998:903-995.
【8】毛先柏,李昌禧.基于支持向量機的模擬電路故障診斷研究[D].武漢:華中科技大學,2009:40-42.
【9】張向東,馮勝洋,王長江.基于網格搜索的支持向量機砂土液化預測模型[J].應用力學學報,2011(1):24-28.