張煜 楊飛 尤明熙 李國龍 龍亦語
(中國鐵道科學研究院集團有限公司基礎設施檢測研究所,北京 100081)
軌道不平順是引起車輛動態響應主要原因之一,直接影響車輛運行的安全性和舒適性。由于我國軌道不平順評價體系未考慮波長和形狀特性及多種不平順相互疊加的影響,因此評價結果與車輛動態響應之間關聯性較低。近年來,大量研究開始關注通過結合車輛響應來評估軌道幾何質量的方法,例如荷蘭ProRail 基于車輛濾波器的Pupil 系統、奧地利?BB 點質量加速法[1]、德國 DB 車輛響應分析方法[2]和美國TTCI基于性能的軌道幾何檢測技術[3-4]等。根據TTCI研究報告,在當前運營環境中,超過50%導致車輛不良響應的軌道位置沒有被確認。這些方法雖然增強了軌道幾何不平順與車輛動態響應的相關性,但未能表明影響車輛動態響應的主要因素。
本文基于軌道幾何動態檢測數據和車載式線路檢查儀數據,利用隨機森林模型,分析各項軌道幾何特征對垂向和水平晃車影響程度,并通過迭代決策樹(GBDT)算法預測疑似晃車點,達到較高的準確率;能夠識別超出現有幅值評判標準對車輛運行有顯著影響的軌道病害區段,對于完善軌道幾何不平順評價體系及工務設備養護維修具有重要意義。
GBDT 是一種基于集成思想的決策樹模型,算法采用加法模型(即基函數的線性組合)與前向分布算法[5-6],以決策樹為基函數,通過構建M個決策樹(弱分類器),經過多次迭代最終組合為一個強分類器。每一次迭代是為了改進上一次結果,減少上一次模型殘差,并在殘差減少的梯度方向上建立新的組合模型。具體步驟如下。
輸入:訓練數據集T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈X,yi∈Y,i=1,2,…,N。輸出:決策樹fM(x)。
1)初始化f0(x)=0;
2)對m=1,2,…,M:
①按式(1)計算殘差,

②擬合殘差學習一個決策樹,得到T(x,Θm),
③更新fm(x)=fm-1(x)+T(x,Θm);
3)得到最終決策樹為

為確定殘差減少的梯度,引入損失函數(Loss Function)概念。由于本文所涉問題屬于二分類問題,因此選用對數損失函數(Log Like Hood Loss)。其定義如下:對于二項分布,y*∈{0,1},定義預測概率為p(x)=P(y*=1),即二項分布的概率,可得

式(3)可合并為

數據源于一客運專線上行2016 年1—3 月數據:①動態檢測數據,包括里程、左高低、右高低、左軌向、右軌向、軌距、超高、水平、三角坑、曲率、車速等軌道幾何信息;②晃車儀檢測數據,包括水平和垂向晃車點的里程、時間、晃車次數等。
為提高模型準確率,結合現場工作一般情況,以1—2 月動態檢測數據和晃車儀檢測數據為訓練集,3 月動態檢測數據和晃車儀數據為測試集。數據源統計見表1。

表1 數據源統計
2.2.1 動態檢測數據處理
由于動態檢測數據體量龐大(樣本數量共246 萬條),且單點檢測數據無法準確表述線路幾何狀態,加之晃車儀檢測里程誤差,利用原始數據建立模型無法保證預測的準確性。因此,結合動態檢測數據物理意義及晃車儀精度范圍,將原始數據按照一定長度劃分區段,并以每區段為單位分別計算其特征屬性[7-8],具體字段包含左高低、右高低、左軌向、右軌向、軌距、水平、超高、三角坑、曲率屬性的標準差、幅值和最大變化率,以及區段內車速的平均值。
以左高低PL為例,其標準差σPL為一定區段內左高低值與其平均數離差平方算術平均數的平方根:

式中,xi∈PL,μ是其平均值。
左高低幅值δPL為一定區段內,左高低峰峰值的最大值:

式中,x∈PL。
左高低最大變化率αPL為區段內相鄰波峰及波谷間的最大變化速率,即變化量與距離比值的最大值:

式中,(xi,yi),(xj,yj)是區段內左高低波形的2 個連續的極值點。
由于檢測誤差和某些異常值的存在,原始波形存在一定異常波動,對最大變化率的計算造成了干擾。因此,在計算最大變化率前,先采用滑動平均法對原始波形進行了濾波處理,滑塊寬度設置為3 m,部分原始波形和濾波后波形如圖1所示。

圖1 波形處理示意
2.2.2 晃車儀檢測數據處理
根據晃車儀測量精度,將相距小于20 m 的晃車數據合并為1條數據,并根據預處理后的軌道幾何數據,為每個區段添加1 個標識位,用來標注該區段內是否存在晃車點(1表示存在晃車點,0表示不存在)。
2.2.3 數據標準化
由于動態檢測數據中,不同屬性具有不同單位和變異程度,會影響模型預測的準確性,因此需對計算后軌道幾何數據進行標準化處理。本文使用scikitlearn 自帶的標準化函數,將預處理動態檢測數據按其屬性(按列進行)減去其均值,并除以其方差,將每列屬性的數值都聚集在0 附近,方差為1,以保障數據的分布范圍和變化幅度。
2.3.1 垂向晃車
根據對垂向加速度影響顯著的成因分析與研究成果[9-10],從預處理后的軌道幾何數據中選取了左高低、右高低和三角坑的標準差、幅值和最大變化率,以及平均速度和垂直晃車因子等11 個字段作為垂向晃車特征屬性。其中垂向晃車因子βV為區段內左高低PL與右高低PR之和的算術平均值,表示為

式中,xi∈PL,yi∈PR。
利用隨機森林模型,通過gini 指數判斷各特征值的相關性[11-12],如圖2 所示。可知,垂向晃車因子相關性最高,其次是左高低、右高低和三角坑的標準差及最大變化率的影響較高,均大于0.08;平均速度和各類幅值的影響最小。
2.3.2 水平晃車

圖2 垂向晃車特征相關性分析
選取左軌向、右軌向、軌向的標準差、幅值和最大變化率,以及平均行駛速度和水平晃車因子等11個字段作為水平晃車的特征屬性。其中,水平晃車因子βL為區段內左軌向aL與右軌向aR之和的算術平均值,表示為

式中,xi∈aL,yi∈aR。
通過模型計算后,相關性分析結果如圖3 所示。可知,水平晃車因子相關性最高,左軌向與右軌向的標準差和最大變化率相關性較高,均大于0.1;軌距的最大變化率也有較高的相關性。

圖3 水平晃車特征相關性分析
2.4.1 垂向晃車
以預處理后該線路上行1—2 月軌道幾何數據和垂向晃車數據為訓練集,以左高低、右高低、三角坑的標準差、幅值和最大變化率,以及平均行駛速度和垂直晃車因子等11 個字段作為特征屬性,通過GBDT 算法建立預測模型,通過調整參數“權重縮小系數”優化模型準確率,見表2。
當權重縮小系數為0.02 時,模型得到最優解,共預測8 個晃車點,其中有6 個點預測正確,預測準確率為75%。

表2 垂向晃車預測模型調整參數結果
2.4.2 水平晃車
水平晃車預測模型調整參數結果見圖4。當權重縮小系數為0.02 時,模型得到最優解,共預測8 個晃車點,其中有4 個點預測正確,預測準確率為50%,所有預測點(含錯誤點)距離最近的真實晃車點平均距離為150 m。

圖4 水平晃車預測模型調整參數結果
權重縮小系數為0.02 時,利用1—2 月數據訓練垂向晃車模型,對3月動態檢測數據進行預測,共發現8 處疑似軌道不平順區段,通過與實測晃車儀檢查結果比對,有6 處區段確認發生過晃車情況。其中預測晃車點 K133+212 處在 3 月共發生 2 次晃車,如圖 5 所示。K133+212 處各項軌道幾何參數均未達到日常保養I 級標準管理值,但左高低和右高低通道出現較大波動,K133+212處左高低波谷為-2.67 mm,K133+219處左高低波峰為4.08mm,峰峰值為6.75 mm,三角坑增大較為明顯,引起晃車反應。

圖5 垂向晃車預測點K133+212處3月動態檢測波形
預測的垂向晃車點K142+613 處,根據實測晃車儀驗證,該區段在3月共發生3次晃車,如圖6所示,在K142+613晃車區段內,雖未出現高低和三角坑大值偏差超限,但包含2處波長為4~5 m、峰峰值為4~5 mm的突變,產生了變化率較大的軌道幾何不平順,并通過車輛動態響應反映了出來,造成車輛垂向晃車。

圖6 垂向晃車預測點K142+613處3月動態檢測波形
本文以軌道幾何動態檢測數據和車載式線路檢查儀(晃車儀)數據為基礎,利用隨機森林模型,分析了各項軌道幾何特征對垂向和水平晃車影響程度。主要結論如下:
1)通過GBDT算法,建立疑似晃車預測模型,能夠識別對車輛運行有顯著影響的軌道不良區段,識別準確率最高達到75%,完善了僅靠幅值評價軌道狀態的不足。通過對一客運專線現場實際驗證,模型能夠較好地預測出未超幅值管理標準的晃車處,指導線路養護維修。
2)在垂向晃車特征中,構建的垂向晃車因子與晃車儀垂向晃車數據相關性最高,其次是高低和三角坑的標準差及最大變化率。
3)在水平晃車特征中,構建的水平晃車因子與晃車儀水平晃車數據相關性最高;其次是軌向的標準差和最大變化率及軌距最大變化率。
下一步將研究更為有效的特征屬性,優化預測模型,在保證準確率前提下,提高召回率,更加全面準確識別軌道幾何病害區段。