陳紫薇 ,張 渝,邱春蓉
(西南交通大學 物理科學與技術學院,成都 610031)
良好的動車輪對外形尺寸不僅能保證列車在軌道上的正確位置,使列車安全運行[1],還能降低輪軌間的磨耗,延長車輪的使用壽命,從而減少制造和維修成本[2]。因此,動車輪對尺寸的預測將有助于提前預防風險,確保運行安全并提供經濟的維修建議。
近年來,有大量基于數據挖掘的預測算法被應用在輪對磨耗與尺寸數據的預測中。衷路生等人[3]提出基于耦合模擬退火優化最小二乘支持向量機的車輪踏面磨耗量預測模型,所建立的模型用于現場車輪踏面磨耗量的預測是有效的。何蕾[4]采用了ARIMA模型和BP神經網絡預測高速列車輪對尺寸數據,結果顯示BP神經網絡的預測結果更加準確。廖貴玲[5]分別采用BP神經網絡和GA-SVR方法進行了輪對尺寸預測建模和仿真,試驗結果表明,GASVR比BP算法的預測精確度更高。華莎等人[6]提出了一種結合PSO-GA-LM優化的最小二乘支持向量機預測模型,該模型在車輪踏面磨耗預測中具有良好的性能。
盡管上述模型能夠有效地進行輪對預測,但是仍然存在參數復雜,大數據量處理速度慢,預測精度有待進一步提升的不足。極限學習機(ELM,Extreme Learning Machine)是近年來備受關注的神經網絡模型之一,被廣泛應用于故障診斷、圖像識別、風速預測等工程領域[7]。相比于其他預測模型,它具有計算速度快,泛化性能好及預測精度高的優點。將核函數引入極限學習機中,能夠有效地改善原始ELM模型的穩定性[8]。核函數有多種類型,融合多種核函數的多核學習方法能夠獲得較為精準的預測結果[9],由此提出了多核極限學習機(MK-ELM,Multiple Kernel Extreme Learning Machine)[10]模型。采用粒子群優化算法(PSO,Particle Swarm Optimization)對MK-ELM模型的關鍵參數進行尋優,將優化模型應于動車車輪尺寸數據預測,利用CRH2車型動車實測數據驗證該方法的合理性和可行性。
ELM[11]是一種單隱層前饋神經網絡,它包括3個分層,即輸入層、隱含層與輸出層。
給定N組訓練樣本數據集(x,t),x、t分別為輸入、輸出向量。當ELM的隱含層節點數為L,且激勵函數為g(x)時,網絡輸出可表示為

式中,βi為第i個隱含層節點和輸出層節點之間的權值向量;w為隱含層節點的輸入權值;b為偏置。式(1)可以簡化為Hβ=T。ELM隨機產生w與b,通過計算隱含層的輸出矩陣H,來計算輸出權值矩陣β=H+T。其中,T為目標矩陣,H+為隱含層輸出矩陣H的廣義逆,當HHT為非奇異時,H+=HT(HHT)-1。為了提高網絡穩定性,引入正則化系數η,I為單位矩陣,則輸出權值的最小二乘解為:

因此,ELM的相應輸出函數為

在特征映射函數g(x)未知的情形下,將核函數引入到ELM中,則可形成新的基于核的核極限學習機方法,定義核矩陣

結合式(4),網絡輸出可表示為

核矩陣是每個點之間的高維映射之后的內積構成的矩陣。稱為核函數的核矩陣必須是半正定的。常用的核函數有:

由于每個核函數的自身的局限性,在面對部分輪對尺寸復雜的數據結構、較大的數據規模時,常用的核函數構成的學習機不能很好的兼顧預測結果的泛化性能和學習性能。考慮到全局函數多項式核函數泛化性能強,學習能力弱,局部函數RBF核函數學習能力強,泛化能力弱的特點,基于核函數的Mercer性質[12],構造了多項式核函數Kpoly和RBF核函數Krbf加權構成的多核函數:

式中,μ∈[0,1],表示多核函數權重系數,當μ為1時,多核函數K為多項式核函數,當μ為0時,K為RBF核函數。
MK-ELM需對式(5)中正則化系數η以及式(9)中的核參數σ、p、μ進行尋優,若隨機選擇模型關鍵參數則可能導致結果誤差較大,因此,在本文中,采用PSO算法優化參量η,σ、p、μ以建立PSOMK-ELM預測模型。PSO算法[13]是一種隨機搜索和并行優化算法,具有簡單,易于實現和快速收斂等優點。模型回歸預測值相對于實際值的偏差可用均方根誤差(RMSE,Root Mean Square Error)表示,選擇RMSE作為算法的適應度函數:

式中,xi表示實際值;yi表示預測值;n表示訓練樣本的總數。也就是說,在給定范圍內尋找到一組η,σ、p、μ,以確保模型的RMSE值最小。待獲取到模型優化參數后,將之代入式(5)、式(9),即可得到PSO-MK-ELM模型表達式。
PSO-MK-ELM預測模型的詳細建模過程如下:
(1)產生一組種群規模為40的粒子群初始值。每一個粒子的位置P(i).location=[ηi(t),σi(t),pi(t),μi(t)]T和速度P(i).velocity=[Δηi(t),Δσi(t),Δpi(t),Δμi(t)]T隨機初始化。
(2)通過等式(10)計算F得到個體適應度作為確定單個粒子的最佳位置P(i).best,以及每個群體的最佳位置G(i).best。
(3)使用以下等式更新粒子速度和位置:

式中:ω表示慣性權重;ωmax取0.9;ωmin取0.4;c1、c2表示學習因子,c1取 2.2,c2取 1.8 ;r1、r2表示兩個隨機數。種群數為50,最大迭代次數為100。
(4)重復步驟(2)和(3),直到滿足終止條件F<1×10-3。返回最佳參數η,σ、p、μ。
輪對包括車輪和車軸,車輪與鋼軌接觸面為踏面。由于車輪傳遞輪軌間的驅動力及制動力,且經常與軌道發生撞擊、摩擦,容易導致車輪踏面磨損,使車輪踏面直徑減少。日常檢修車輪,主要通過檢測輪對踏面外形尺寸來初步判斷車輪磨耗程度,包括輪徑值等。輪徑值即車輪踏面直徑,本文采用的CRH2車型動車輪對尺寸原始數據是由裝載于鐵軌上的光截圖像檢測系統記錄所得,其輪徑值安全運用范圍為790 mm~860 mm。
圖1表示PSO-MK-ELM輪對尺寸預測模型建模過程,包括數據處理流程圖,預測模型建立及PSO參數優化。具體建模步驟如下:
(1)數據采集與清洗。由于動車輪對的檢測數據易受測量位置、維修人員測量習慣及載荷、鋼軌狀況等因素的影響,導致記錄歷史測量數據會存在測量誤差和明顯的異常點,故采用局部加權回歸散點平滑法(LOWESS ,Locally Weighted Scatterplot Smoothing)對數據進行去噪處理。
(2)數據重構。輪對尺寸數據整體呈現為隨運行時間變化的時間序列。采用滾動預測模式,假定序列中前m個歷史輪對數據對此后的第m+1個值有影響,設原始序列Xi按照xi=(Xi,Xi+1,…,Xi+(m-1))重構出的多維矩陣即為輸入數據集,yi=Xi+m為輸出集,并將重構的樣本劃分為訓練集和測試集。
(3)預測模型建立。用訓練集數據訓練MKELM網絡,采用PSO算法進行關鍵參數尋優,獲取最佳模型參數。
(4)預測結果評價。獲取到模型參數后,應用測試集數據在建立好的PSO-MK-ELM模型中進行預測,得到模型最終預測結果。

圖1 基于PSO-MK-ELM的輪對尺寸預測模型建模過程
為了準確地評價本文所建立的PSO-MK-ELM輪對尺寸預測模型的性能,采用擬合優度R2、均方差(MSE,Mean Square Error)、平均絕對誤差(MAE ,Mean Absolute Error)和平均絕對百分比誤差(MAPE ,Mean Absolute Percent Error)作為標準來衡量預測結果精度。計算公式如下:


其中,yi為車輪尺寸數據真實值;為模型的預測值和分別為真實和預測車輪尺寸的平均值;n為預測樣本數。
一般來說,模型預測結果的R2越接近于1越好,MSE、MAE和MAPE越接近于0越好。
采用CRH2車型某動車1車廂1號輪2016年—2017年的部分歷史輪徑值作為數據樣本,如圖2所示。圖2a為原始數據記錄值的散點圖,圖2b表示輪徑預處理值,即原始數據經LOWESS去噪后的結果。去噪后的輪徑值序列反映了車輪踏面直徑隨運行時間增加呈單調遞減的規律。
擬設定序列中前5個歷史輪徑值對此后的第6個輪徑值有影響,將輪徑值序列重構出228組輸入輸出數據集。同時按照訓練集與測試集數據量比值為4:1進行學習預測,即前184組作為訓練樣本集,后44組作為測試樣本集。

圖2 輪徑值數據樣本
基于MK-ELM算法對訓練集進行網絡訓練,采用PSO迭代尋找模型最佳參數。圖3表示PSOMK-ELM預測模型訓練輪徑值迭代100次的最優適應度函數變化圖。由圖3可知,網絡模型在迭代到第29次時訓練集的RMSE達到了最低值,輸出此時的網絡參數,即為模型最優參數。
用測試集數據進行模型性能檢驗。預測結果如圖4所示,采用PSO-MK-ELM模型對輪徑值進行預測的結果與實際情況具有很好的一致性。計算得到預測值的R2為0.995 1,MSE為0.001 5,MAE為0.028 5,MAPE為0.000 3%,反映出PSO-MKELM預測模型具有較高的精度和擬合泛化能力。

圖3 PSO-MK-ELM預測模型100次迭代優化圖

圖4 車輪直徑預測結果
為了綜合評定多核極限學習機預測車輪尺寸數據的性能,選取傳統BP神經網絡,極限學習機(ELM),以及線性核極限學習機(L-ELM)、多項式核極限學習機(P-ELM)、RBF核極限學習機(RELM)3種常用的核極限學習機算法與粒子群優化的多核極限學習機(PSO-MK-ELM)的預測結果作比較。同時采用R2、MSE、MAE和MAPE作為評定指標進行分析,預測結果,如表1所示。
由表1可知,ELM模型與傳統BP神經網絡相比,預測結果的R2較高,MSE、MAE和MAPE較低,說明針對輪徑值的預測,ELM泛化性能更好,預測精度更高。BP神經網絡和ELM的預測結果具有不穩定性,引入核函數后不僅保證了預測結果的穩定性,還在一定程度上改善了預測模型性能。其中,引入多項式核函數后顯著提高了模型的R2,說明P-ELM的泛化性能較強,引入RBF核函數后降低了模型的MSE、MAE和MAPE,說明R-ELM的預測準確性較好。MK-ELM模型由P-ELM和R-ELM加權構成,結合了兩者的優點。采用PSO-MK-ELM模型進行輪徑值預測,與P-ELM相比,預測結果的R2從0.994 9提高到了0.995 1;與R-ELM相比,MSE降低了92.4%,MAE降低了74.7%,MAPE降低了40%。PSO-MK-ELM模型預測結果的MSE、MAE和MAPE均低于其他5個模型,說明該優化模型針對輪徑值預測的精度和準確性最高,且模型的R2較高,也反映出模型的擬合泛化能力較強。
從實測數據驗證可以看出,與BP神經網絡、ELM、L-ELM、P-ELM及R-ELM模型相比,PSO-MK-ELM模型既避免了傳統神經網絡可能存在的結果不穩健的缺點,同時保證了預測的準確性,預測結果表明模型具有較高的預測精度、準確度和擬合泛化能力,能夠較精準地預測輪對尺寸。

表1 車輪直徑不同算法預測結果比較
(1)本文將PSO-MK-ELM算法應用到動車車輪尺寸預測上,通過模型建立及參數優化,對CRH2車型動車某車輪直徑數據進行了預測,采用擬合優度R2、均方差MSE、平均絕對誤差MAE和平均絕對百分比誤差MAPE作為標準來衡量預測結果精度,R2為 0.995 1,MSE為 0.001 5,MAE為 0.028 5,MAPE為0.000 3%。
(2)通過比較BP算法、ELM、L-ELM、P-ELM、R-ELM、PSO-MK-ELM的預測結果,針對車輪尺寸的預測,ELM模型比傳統BP神經網絡的泛化性能更好,預測精度更高;引入核函數后一定程度地改善了預測模型性能,PSO-MK-ELM模型針對輪徑值預測的精度和準確性更高,擬合泛化能力更強。
(3)建立的模型在動車輪對尺寸預測上具有較好的應用價值,可為相關部門提供參考。