毛嘉偉,李永華,王佳楠,胡超群
(大連交通大學 機車車輛工程學院,遼寧 大連 116028)
動車組制動閘片作為基礎制動裝置的關鍵部件,其健康狀態直接決定著制動系統能否正常運轉。在運用過程中,制動閘片絕大多數失效都由摩擦磨損引起,因而對于制動閘片進行壽命預測的主要工作就是能夠準確預測閘片在不同運用時期的實際厚度[1]。在統計學模型和物理模型方面,李宏偉等[2]通過觀測及研究350 km/h標準動車組制動閘片在實際服役條件下的磨損行為,采用曲線擬合的方式對其進行了使用壽命的初步預測。王嫻等[3]針對磨耗數據采用Kalman濾波方法預測閘片剩余壽命,并通過實例驗證了該方法的有效性。張一喆等[4]建立了三參數威布爾壽命分布模型,對制動閘片的壽命進行評估的同時也對后續檢修更換周期做出了討論。這2類預測方法為保證預測精確度對研究對象試驗數據的準確性要求極高且適用范圍受限,并非當今主流方式。近年來,人工智能、機器學習和數據挖掘等領域相關理論與技術已經愈發成熟,基于數據驅動的智能算法已被廣泛用于壽命預測領域。DUC等[5]為克服基于物理模型預測對制造以及監測環境的強烈依賴性,采用決策樹以及隨機森林算法對剎車片的剩余壽命進行預測。FENG等[6]采用了神經網絡及灰色理論對動車組制動閘片的壽命進行預測。然而神經網絡方法對于小樣本以及高維度數據的處理上存在著泛化能力差,收斂速度慢等問題。支持向量機(Support Vector Machines, SVM)克服了神經網絡方法在小樣本壽命預測中存在的一系列問題,且具有較高的預測精確度以及良好的泛化能力,在壽命預測領域應用逐漸廣泛[7]。但值得一提的是,SVM關鍵參數的選取對模型的性能有著絕對的影響,是提高壽命預測精確度最為關鍵的一步。為進一步提高SVM模型的分類及回歸性能,LAREF等[8]對SVM中每個超參數對模型性能的影響進行了分析,并提出了一種廣義模式搜索法GPSM(Generalized Potential Search, Method)來提升網格搜索算法對超參數尋優求解的效率。SU等[9]為進一步優化SVM核參數,提高模型分類效率,提出了一種改進的粒子群算法,有效解決了小樣本情況下風電機組系統故障難以識別問題。HWEJU等[10]提出了精細化高斯SVR模型,預測精度高于傳統的線性回歸SVR模型,實現了在小樣本情況下對車床表面粗糙度的精確預測。陳偉根等[11]建立了基于GA-SVR的變壓器繞組熱點溫度預測模型,并證明該模型的預測結果與實驗結果基本一致,在預測精度上優于Elman神經網絡方法。目前基于SVM的壽命預測研究方面,主要通過尋找最優單個核函數或者通過智能算法優化核參數來提高分類或回歸預測的準確率,但同樣存在不能兼顧SVM核矩陣結構的改進以及核參數最優化的問題,仍具有一定的局限性[12]。為了更好地提高SVM方法的預測精度,本文考慮SVM中全局核函數與局部核函數特點,并采用遺傳算法對核參數進行尋優求解,建立一種采用混合核函數的GA-SVR回歸模型應用于動車組制動閘片的壽命預測。結果表明,該模型的預測精度以及泛化能力上相比于單核模型都有所提高,體現了所述模型的有效性。
SVM模型中核函數的選取對模型的分類效果、回歸精度及泛化能力等許多特性具有決定性的作用。但不同類型的核函數作用概括來說分為2點:第一,將低維空間的樣本映射到高維特征空間,從而進行數據類別劃分,得出變量之間的非線性關系。第二,使得樣本之間在空間中的內積運算維數降低,極大簡化計算量。常見的核函數有以多項式核函數和徑向基核函數為代表的2類[13]。
1) 多項式核函數:
多項式函數是一種典型的全局核函數,函數曲線圖如圖1所示,在與測試點x=0.1相距很遠的樣本點依然能對核函數取值產生較大影響,因而便于提取樣本信息總體特征,有良好的外推能力。

圖1 多項式核函數特性曲線圖Fig. 1 Characteristic curves of polynomial kernel function
2) 徑向基核函數:
徑向基函數是一種典型的局部核函數,具有優秀的局部插值能力。函數曲線圖如圖2所示。測試點x=0.2附近區域核函數取值不為0,隨著距離的增加,核函數值幾乎為0。因而便于提取樣本的局部特性,有著卓越的學習能力。

圖2 徑向基核函數特性曲線圖Fig. 2 Characteristic curve of radial basis kernel function
單一核函數模型在對非線性樣本進行高維空間映射時往往具有一定的局限性,因此經過訓練得到映射空間的特征分布與實際情況均存在不同類型的偏差。因此即便是對核參數進行優化后,得到的也不盡是精確的預測結果。RBF核函數學習能力極強,通過合理的設置參數便可用于服從任意分布的樣本回歸預測。多項式核函數的推廣能力極強,項的次數越低,推廣性越強。因此本節通過考慮局部以及全局核函數的各自優點,構造一種結合多項式核函數與RBF核函數特性的混合核函數代替單個核函數,應用到壽命預測之中進一步提高回歸預測的準確率。
核函數的組合方式有很多種,均要滿足Mercer條件[14]。本文構建了一種基于Mercer條件的混合核函數的支持向量機。為保證一定的泛化能力并盡可能降低計算復雜度,多項式核函數的次數為2次,具體組合形式為式(3)。
式中:參數λ是調節多項式核函數和RBF核函數特性占比的常數,取值范圍為[0, 2][15]。而通過大量的試驗可以確定,λ一般取0.25~1.99,且當λ取值較大時(經驗證本文為1.75),融合的性能最佳。混合后核函數曲線圖如圖3所示。

圖3 混合核函數特性曲線圖Fig. 3 Characteristic curves of mixed kernel function
混合后的核函數能夠同時體現樣本的總體及局部特征,給定合適維度的輸入樣本,經過核函數的映射及模型自身的學習,可以得出相匹配的SVR回歸決策函數。
采用SVR回歸模型進行預測時需要調節關鍵參數才能使其具有最佳性能。本文主要針對核函數中的懲罰參數c以及核函數參數g進行優化。懲罰參數c的大小代表著對模型誤差大于ε樣本的懲罰力度,核函數參數g的大小決定著模型局域寬度以及邊界的復雜程度。
交叉驗證(Cross-Validation, CV)是一種應用于驗證分類器性能的統計學方法,能夠有效避免模型過學習和欠學習現象的發生[16]。而遺傳算法(Genetic Algorithm, GA)是一種全局搜索以及優化算法,以適應度來模擬個體的生存幾率。有著全局搜索以及迭代速度快優點[17]。因而將二者結合可以有效地對模型所選參數進行優化,提升回歸預測精確度。選取的評價指標通常為均方誤差Mse以及平方相關系數R2。
本文中對SVR回歸模型進行參數優化的基本步驟如下:
1) 確定優化參數,并對其進行編碼,設定尋優的初始范圍;
2) 生成初始群體,隨機產生個體,并設定遺傳算法的相關參數;
3) 在K-CV方法的意義下以Mse和R2為評價標準計算適應度驗證分類準確率;
4) 選擇、交叉、變異;
5) 終止條件判斷:滿足迭代次數或解收斂則進行解碼并輸出最優結果,否則重復第2步繼續進行。
為獲得最優模型參數,需對遺傳算法中的初始參數以及優化參數取值范圍進行預設值,并給定合適的交叉驗證次數,以保證在避開繁重的計算量的同時得到可信的最優解。本節首先給出基于遺傳算法優化SVR模型參數的數學模型設計優化三要素選擇,優化設計的數學模型通常為式(4)。
式中:z為目標函數,在本文中為CV交叉驗證方法下產生累計均方誤差和的最小值。h(x,y)和g(x,y)分別為等式不等式約束,本文均為不等式約束,分別為約束單次交叉驗證產生的Mse值小于1×10-4,以及迭代的最大次數小于給定的代數。設計變量為模型的懲罰因子c以及核函數帶寬g,變量空間及遺傳算法中各參數設置見表1。
依照表1參數設置方式分別對多項式核函數、RBF核函數構成的模型進行K-CV意義下的參數優化,得到的c/g尋優算法的適應度變化曲線分別如圖4和圖5所示。

圖4 多項式核函數c/g參數適應度變化曲線Fig. 4 Polynomial kernel function c/g parameter evolution iterative process

圖5 RBF核函數c/g參數適應度變化曲線Fig. 5 RBF kernel function c/g parameter evolution iterative process
在K=5時的CV交叉驗證方法下,通過遺傳算法優化獲得的2種核函數SVR模型的最佳懲罰因子Bestc,最佳核函數帶寬Bestg的取值以及Mse值見表2。

表2 2種核函數的最佳參數及均方誤差值Table 2 Optimal parameters and mean square error of the two kernel functions
由此便通過遺傳算法確定了以多項式函數以及RBF函數為主體的2個單核性能最佳的SVR回歸模型,進而采用式(3)的方式對得到的最優模型的單核矩陣進行融合便得到混合核GA-SVR模型用于后續的壽命預測。相關流程如圖6所示。

圖6 基于混合核GA-SVR模型壽命預測流程Fig. 6 Flow chart of hybrid core GA-SVR model life prediction
在實際運用過程中,閘片的厚度都是基于有限時間內測量得到的,通常間隔一段時間對其進行一次性能檢測,因而該類預測屬于小樣本預測事件。SVR最主要優勢在于處理小樣本回歸問題時具有傳統算法無法解決的抗干擾能力,且使用RBF核函數的SVR模型在解決樣本總數與特征數相差不大的問題中具有卓群的效果。因而準確地選取出能夠表征閘片在運用時磨損情況的相關特征變量作為輸入,以閘片實際厚度作為輸出變量,通過SVR模型進行回歸預測是基于摩擦磨損原理進行預測的外另一種準確可行的預測方法。
在分析制動閘片磨損塊厚度變化對動車組制動性能的影響時可以發現,隨著磨損塊的不斷損耗,閘片的摩擦因數會不斷降低,與輪對的接觸性能會有所下降,進而導致采取止動后列車的實際制動距離會不斷增加、制動時間不斷延長。直觀的表現就是在摩擦產生的溫升現象更加嚴重,導致磨損塊表面溫度不斷劇烈升高,這些特性是反映閘片性能的重要因素。選取RBF核函數可以有效識別這些輸入變量的變化對輸出變量的影響,準確地提取特性。多項式核函數在此基礎上能夠提高模型的泛化能力,即便樣本個數較大,也能準確表征出磨損特征,在大小樣本上都能體現出一定的適用性,表明了采用機器學習方法進行閘片壽命預測的先進性。
選取某項目動車組制動閘片作為研究對象,每月同一時刻對磨損塊厚度進行實測[3],并對其上述制動性能參數也加以監測,連續采集一定時間得到的部分數據見表3。其中實際制動距離代表列車開始空氣制動時閘片的磨損塊作用于輪對開始到停止所走行的實際距離,對應的時間為實際制動時間。在200 km/h的速度下制動最大距離不應超過2 000 m。表面最高溫度即進行空氣制動時閘片與輪對摩擦造成的溫升,最高溫度不應超過600 ℃。摩擦因數是磨損塊與輪對之間的摩擦力與正壓力的比值,其值越大便表明二者間產生的

表3 制動閘片厚度及制動特性測量數據Table 3 Brake disc thickness and brake characteristics measurement data
有效摩擦力越大,在一般情況下取值通常為0.25~0.5。
選取數據中的第1列作為回歸預測的輸出指標,后4列作為輸入特征,構成模型的核矩陣參數。由于各個輸入特征間的數量級相差較大,直接對其進行訓練并進行模型的建立會導致模型性能不夠理想,通常為消除這種影響要對其進行歸一化處理。區間選取上[0, 1]反映的是樣本的概率分布,[-1, 1]則更多地反映樣本的狀態分布或坐標分布,因此本文歸一化的區間上選取[-1, 1],處理方式為式(5)。
式中:x為輸入樣本,xmin和xmax分別為輸入樣本中的最小值和最大值,xnew為歸一化后的輸入特征。部分歸一化后的數據見表4。

表4 歸一化后的測量數據Table 4 Normalized measurement data
其中極值-1和1分別代表閘片在實際運行中的健康狀態,具體表現在實際制動距離的不斷增大、制動時間的逐漸提高、盤面溫度的不斷升高以及摩擦因數的降低。因此歸一化后相比于實際數據既能反映出真實運行狀態,又能有效消除數量級的差異對模型性能的影響。選取以上歸一化后的50組數據作為訓練集,用于混合核函數模型的學習與建立,選取2組同一型號的閘片在不同起始記錄時期的運行時的實測數據作為訓練集,用于進行使用壽命的預測,將得到的結果與單核模型的對其進行壽命預測的預測結果進行對比,體現本文所提出的模型與單一核函數模型的優越性。
采用50組測得的某項目動車組制動閘片全周期磨損數據作為模型的訓練集,選取同一型號的閘片在2個不同部分運用周期內的18組厚度變化數據作為預測集,基于混合核函數預測模型進行壽命預測與模型精度檢驗。在采用訓練集數據進行模型訓練時,選擇訓練時產生的相對誤差作為模型性能判定指標,分別得到了單一RBF核函數以及混合核函數模型在訓練時產生的誤差結果,如圖7和圖8所示。

圖7 RBF核函數訓練集相對誤差圖Fig. 7 RBF kernel function training set relative error chart

圖8 混合核函數訓練集相對誤差圖Fig. 8 Mixed kernel training set error relative chart
從圖7和圖8中可看出混合核方法誤差整體上更低,局部誤差過大的現象得到了明顯的改善,累積相對誤差較單一RBF核方法相比降低了8.85%。在預測相對誤差數值波動上更加平穩,方差比單一RBF核方法降低了11.20%,這也體現了模型泛化的能力上有了一定的提升。在保證了一定的擬合度(0.95)前提下,2個模型的Mse值分別為1.27×10-4和1.24×10-4,從模型評價指標上也體現了混合核函數作用下的SVR模型預測精確度更高。為進一步驗證該模型的實際預測精度,選取同一型號的制動閘片,以2個不同起始記錄時刻(分別以a和b時段指代)得到的閘片厚度實測數據作為預測集進行預測,與RBF單核方法得到的制動閘片壽命預測結果進行對比,結果如圖9~12所示。

圖9 a時段制動閘片壽命預測結果(RBF)Fig. 9 Brake disc life prediction results in period a (RBF)

圖10 a時段制動閘片壽命預測結果(混合核)Fig. 10 Brake disc life prediction results in period a
從a和b 2個不同起始記錄時段預測的結果上可以看出經過GA算法優化的RBF單核方法與混合核函數方法進行預測所得到的結果都具有良好的效果,預測得到的制動閘片磨損曲線與實際測得的磨損曲線趨勢基本一致,體現了采用小樣本機器學習方法進行閘片壽命預測的準確與可行性。但從整體來看在服役前中期,顯然混合核方法的預測結果與實際值的近似程度均更高,克服了RBF核方法存在的局部性能不穩定的問題,定性地說明了本文模型的泛化能力有了提高。為定量得出混合核方法在精度上的優越性,對不同預測周期內采用2種方法得到的相對誤差分別進行了對比,得到的結果如圖13和圖14所示。

圖11 b時段制動閘片壽命預測結果(RBF)Fig. 11 Brake disc life prediction results in period b (RBF)

圖12 b時段制動閘片壽命預測結果(混合核)Fig. 12 Brake disc life prediction results in period b

圖13 a時段制動閘片壽命預測相對誤差圖Fig. 13 Brake disc life prediction relative error chart in period a (RBF)

圖14 b時段制動閘片壽命預測相對誤差圖Fig. 14 Brake disc life prediction relative error chartin period b
從得到的相對誤差對比來看,2種方法給出的壽命預測結果都顯得相對保守。由于2個單核模型經過遺傳算法優化后得到的懲罰因子c均較大,對于出錯樣本的懲罰力度較強,因而得到的預測值絕大部分會向上逼近真實值。相對誤差值大多為負,說明預測的厚度磨損情況要比實際更為嚴重,即在一定的服役時間內,預測的閘片厚度要低于實際厚度,在實際運用上有利于及早預警。在累積相對誤差對比上,混合核方法相比于單一RBF核方法分別降低了45.23%和34.29%,相對誤差值的方差上降低了76.23%和44.21%,可見在不同預測集上,模型準確性與穩定性都有了較大的提高,體現了本文方法的合理性以及一定的普適性。
1) 采用遺傳算法以訓練誤差和為適應度函數分別對RBF和多項式單一核核函數的SVR回歸模型進行參數優化,分別確定了2個單一核函數模型的最佳c/g值,得到最優單核模型。
2) 融合核矩陣,建立混合核函數GA-SVR回歸模型,并用其對動車組制動閘片的壽命進行預測,將得到的結果與實際壽命以及采用RBF單核的GA-SVR模型預測結果進行對比,保證了足夠的擬合精度(0.99以上)情況下,采用本文提出方法在2個運用時段進行預測的累計相對誤差相較單核方法分別降低了45.23%和34.29%,直觀表明了混合核函數方法具有更高的預測精度。
3) 從預測的誤差趨勢來看,采用本文提出方法在2個運用時段內得到相對誤差的方差相比于單核方法分別降低了76.23%和44.21%,說明采用混合核函數方法預測產生的誤差在數值整體波動更加平穩,模型的泛化能力有了提高,為提高動車組制動閘片剩余壽命的準確性提供了一定的實際參考價值。