張梓鴻 趙正陽 王文斌** 李 洋 李沅軍
(1.中國鐵道科學研究院集團有限公司城市軌道交通中心, 100081, 北京;2.石家莊鐵道大學交通運輸學院, 050043, 石家莊∥第一作者, 助理研究員)
城市軌道交通軌道幾何是評價軌道平順性的重要指標,也是影響線路運行安全性、舒適性的關鍵因素。目前,對于軌道幾何不平順的預測方法主要包括傳統預測和機器學習預測[1-4]兩大類。文獻[5]將列車加載作為影響道床變形的因素,建立了軌道有限元模型,通過道床變形模量得到道床累積變形隨加載次數的變化規律。文獻[6]基于概率分布的基本思想,建立軌道幾何不平順狀態推移矩陣,計算得出軌道幾何不平順的推移變化規律。文獻[7]基于灰色區間理論并引入時變參數,建立時間序列的非等時距灰色時變參數模型,對軌道質量指數進行了預測。文獻[8]基于灰色區間理論對軌道幾何不平順指標進行了預測。文獻[9]考慮維修作業對軌道幾何不平順變化規律的影響,通過三次多項式對直線段和曲線段軌道幾何不平順隨時間變化的規律進行了擬合,并分別對小半徑曲線段和直線段進行了預測。文獻[10]采用數值模擬方法,建立了軌道幾何不平順指數型惡化函數以及搗固后恢復函數,對搗固作業后軌道幾何不平順的狀態進行了預測。文獻[11]基于機器學習方法對建立了城市軌道交通軌道幾何神經網絡預測模型。文獻[12]通過機器學習建立雙隱層BP(反向傳播)神經網絡模型,并對7項軌道幾何不平順指標進行了預測。文獻[13]采用時間序列對城市軌道交通軌道質量指數進行了預測,建立了輸入層節點個數為6、輸出層節點個數為1、隱含層節點個數為10的3層結構的BP神經網絡模型。文獻[14]通過3D卷積神經網絡對高鐵軌道質量指數進行了預測,將時間、空間和軌道幾何不平順指標等檢測項作為模型的輸入,并從初始化參數、學習速率、激活函數及損失函數等方面對模型進行了優化。基于調研發現,當前對于城市軌道交通軌道幾何不平順指標預測研究仍存在一定的不足:傳統方法對部分因素進行了量化,預測精度較低且只適用于部分城市軌道交通線路;依靠已有的神經網絡法搭建的神經網絡較為簡單,不能較好地擬合輸入、輸出數據,且主要通過時間序列對數據進行預測,預測精度有限。
本文基于城市軌道交通軌道幾何動態檢測數據,結合時間、空間及檢測項等特征,建立了基于卷積神經網絡的軌道幾何不平順指標預測模型,并利用某城市軌道交通線路實測數據進行了驗證。試驗結果表明,結合時間、空間及檢測項等特征的基于卷積神經網絡的軌道幾何不平順指標預測模型有較高的預測精度,為軌道幾何不平順預測提供了新思路。
軌道幾何不平順預測的整體流程主要包括數據選取、數據集構建、模型訓練和模型評估4個部分,如圖1所示。

注:m為當前檢測月份;x為選取區段的起始里程,單位km。
分別建立左高低、右高低、左軌向、右軌向、軌距、水平和三角坑等7項指標的基于卷積神經網絡的軌道幾何不平順指標預測模型。對該模型訓練的數據集從檢測項、時間及里程等3個維度對數據進行整合處理。
1) 檢測項:左高低、右高低、左軌向、右軌向、軌距、水平及三角坑等各指標間并非獨立存在。在卷積神經網絡中將每項檢測指標作為模型訓練的特征參數構建模型,提高模型的預測能力。
2) 時間:反映軌道區段隨時間連續變化情況。將時間作為特征參數對軌道幾何不平順隨時間的變化特征進行提取,充分挖掘不同月份條件下軌道幾何不平順的變化情況,以提升模型的訓練效果。以2022年某城市軌道交通上行線路K16+700—K16+900區段第1、2期左高低檢測數據為例,其左高低-里程關系曲線如圖2所示。

圖2 某城市軌道交通上行線路左高低-里程關系曲線
3) 空間:里程維度通常能夠反映某軌道區段的整體情況。分析列車荷載、地質條件等因素影響該預測單元受的軌道幾何不平順變化情況。以2020年1月9日某城市軌道交通上行線路K16+700—K16+900區段檢測數據為例,其7項檢測指標-里程關系曲線如圖3所示。

圖3 K16+700—K16+900區段內7項檢測指標-里程關系曲線
通過對數據的多維度統計,將某城市軌道交通上行線路K16+700—K16+900區段2020年1月9日至3月16日共6期7項檢測指標數據形成的特征矩陣可視化至三維散點圖中,如圖4所示。

注:散點顏色深淺表示檢測值的大小。
本文構建的卷積神經網絡共3層,包括1層輸入層、7層卷積層、3層池化層、4層全連接層和1層輸出層。卷積神經網絡結構如表1所示。

表1 卷積神經網絡結構
卷積神經網絡內部卷積、池化及全連接層模型如圖5所示。

注:括號中的數值表示卷積層和池化層的層數。
Adam(自適應矩估計)結合AdaGrad(自適應梯度)算法和RMSProp(均方根反向傳播)算法的優點,綜合考慮梯度的一階矩估計和二階矩估計重新對步長進行計算,并根據每個參數的歷史梯度信息對學習率的大小進行自適應調整,有效解決學習率難以調整和局部極小值問題。
激活函數均選取ReLU,它是卷積神經網絡中常用的激活函數之一。激活函數fReLU(x)的計算公式如下:
fReLU(x)=max(0,x)
(1)
對于負數輸入,fReLU(x)函數的梯度為0,可能導致神經元無法更新權重。本文添加了一個小的正值斜率0.01來修正負數輸入的梯度。修正后的fReLU(x)函數曲線如圖6所示。

圖6 修正后的fReLU(x)函數曲線
fReLU(x)函數在訓練時易收斂,計算速度快。fReLU(x)函數在卷積神經網絡的隱藏層中引入非線性,使網絡可以學習非線性的特征,同時還能緩解梯度消失的問題,從而提高網絡的性能。
本文選擇均方誤差作為損失函數,它是回歸問題中常用的損失函數。損失函數EMS的計算公式為:
(2)
式中:
f(xi)、xi——第i個樣本的真實值和預測值;
n——樣本個數。
忽略下標i,以f(x)-x為橫坐標,以EMS為縱坐標,形成的EMS隨f(x)-x的變化曲線如圖7所示。

圖7 EMS隨f(x)-x的變化曲線
EMS函數曲線光滑、連續,處處可導,便于使用梯度下降算法。誤差減小的同時梯度逐漸減小,這有利于EMS函數的收斂。
為防止過擬合同時加快模型訓練速度,本文在卷積神經網絡的全連接層采用Dropout方法[14]。隨機選取全連接層90%的神經元進行訓練和預測,計算公式如下:
rl~Bernoulli(p)
(3)
(4)
(5)
yl+1=f(zl+1)
(6)
式中:
Bernoulli(p)——概率隨機函數;
rl——第l層激活神經概率矩陣;
yl——第l層神經元輸入向量;

wl+1——權重矩陣;
bl+1——偏移矩陣;
f(zl+1)——正向傳播函數,zl+1為第l+1層卷積神經網絡實際輸入向量。
基于卷積神經網絡的軌道幾何不平順指標預測模型的訓練測試環境選用Windows 10系統,CPU(中央處理器)為AMD Ryzen 7 4800U,最高頻率為4.2 GHz,內存為16 GB,環境管理器為Anaconda 4.10.3,語言環境為Python 3.9.7,深度學習框架為TensorFlow 2.10.0。本文通過上述環境搭建并測試基于卷積神經網絡的城市軌道交通軌道幾何不平順預測模型。
本次選取某城市軌道交通線路的檢測數據作為評估數據集,其中訓練集由前34期檢測數據構成,驗證集由后7期檢測數據構成,以完成模型評估。
預測未來數據變化屬于回歸問題。本文通過EMS對軌道幾何不平順預測結果進行了評估。
(7)
式中:
y——真實的動態幾何不平順值;

n——預測區間內檢測數據總量。
以三角坑為例,基于卷積神經網絡的軌道幾何不平順指標預測模型下三角坑EMS-迭代次數變化曲線如圖8所示。

圖8 三角坑EMS-迭代次數變化曲線
由圖8可以看出:訓練迭代50次后,基于卷積神經網絡的軌道幾何不平順指標預測模型達到收斂。
利用訓練后的模型進行預測,采用EMS對預測結果進行量化,三角坑的EMS為0.018 4,其他指標的EMS均在0.020 0左右。軌道幾何不平順指標預測數據與真實數據對比結果如圖9所示。

a) 左高低
由圖9可見:軌道幾何不平順指標的預測數據與檢測數據的擬合度較高,說明基于卷積神經網絡的軌道幾何不平順指標預測模型能夠較為準確地預測出各指標的整體變化規律。
基于上述數據集,采用文獻[16]中單隱層BP神經網絡、雙隱層BP神經網絡、多元回歸分析及本文的卷積神經網絡等方法對三角坑軌道幾何不平順的EMS進行對比,結果如表2所示。由表2可知:相比單隱層BP神經網絡、雙隱層BP神經網絡和多元回歸分析,卷積神經網絡下的EMS分別降低了73.29%、71.80%和664.81%,說明卷積神經網絡具有更好的擬合能力。

表2 4類預測方法下的EMS
為了更加精準預測城市軌道交通軌道幾何不平順變化趨勢,本文通過分析影響其變化因素,建立了基于檢測項、時間、里程等3個維度的基于卷積神經網絡的軌道幾何不平順指標預測模型,并從學習速率、激活函數、損失函數、Dropout方法等角度對該模型進行優化。利用某城市軌道交通線路歷史檢測數據作為試驗數據對模型進行了驗證,與多元回歸分析、雙隱層BP神經網絡相比,卷積神經網絡預測的軌道幾何不平順指標的均方誤差顯著降低。結果表明,基于卷積神經網絡的軌道幾何不平順指標預測模型能對大范圍、長時間的軌道動態幾何不平順變化趨勢進行良好的預測,可為后續城市軌道交通行業維保模式向狀態修轉變提供良好的技術基礎。