張卜,劉怡伶,張文靜
(201620 上海市 上海工程技術大學 機械與汽車工程學院)
隨著人工智能蓬勃發展,利用機器學習和深度學習的方法挖掘大量軌道交通監測數據背后的規律,建立基于數據的預測方法成為了最近的研究熱點。郭超[1]等結合深度信念網絡(DBN)與多個支持向量機建立了EDBN—SVM 網絡,以構架振動響應為數據集訓練網絡,實現了對空氣彈簧故障、橫向減振器故障、抗蛇行減振器故障3 種典型故障的分類;龐榮[2]等利用自動編碼器(DAE)對原始數據進行降噪,再利用softmax 分類器進行特征分類,對各工況下的轉向架故障進行了準確分類;肖爽[3]根據汽車運動軌跡的時序特性,將深度學習技術應用于有軌電車安全性評價,驗證了基于長短時記憶神經網絡的軌跡預測方法,采取均方差函數作為損失函數優化模型,測試了不同學習參數下網絡的準確度和收斂速度,結合列車碰撞安全距離公式驗證了網絡可靠性;金永澤[4]分別使用誤差逆傳播網絡(BP)和LSTM 對列車制動模型的參數進行了預測,發現BP 網絡在預測過程中比LSTM 更加依賴數據的輸入;DINDAR[5]建立了決策樹(DT)模型分析事故起因,利用遺傳算法對模型進行剪枝;Yan[6]等人利用深層信念網絡(Deep Belief Network,DBN)對列車運行的安全性進行預測,并且考慮了乘客舒適性。Serdar Dindar 用分層貝葉斯網絡預測了美國列車事故的高發地帶,并以極大似然估計加以驗證。
為了解決單項深度學習預測模型的缺陷,增加準確性,學者嘗試將多個神經網絡結合起來使用。SITTON[7]等建立了多個BP 網絡分別訓練,網絡收斂后將預測結果與驗證集進行比較,根據網絡性能表現對它們賦予權重,將多個帶權重的BP 網絡組成投票系統以預測貨車沖擊對軌、橋帶來的破壞;KAEENI[8]通過遺傳算法(GA)對人工神經網絡(ANN)、樸素貝葉斯(NB)和決策樹(DT)3種深度學習賦予權重,將三者結合起來提出了一種針對軌道交通運輸中脫軌事故隱患預測的組合式模型,將不同模型結合起來得出最終預測。以上兩種利用組合式神經網絡的研究的優點在于學習規律全面、預測結果準確、有較強的泛化性能。DINDAR[9]等人設計了一種由貝葉斯分類器(NB)組成的網絡,該網絡上層NB 的分類結果會成為下一層NB 的輸入,可對因極端天氣造成的脫軌事故進行準確分類。然而,目前系統地利用大規模多源輪軌系統力學、運動學以及交叉的動力學響應作為數據集,訓練不同的組合式深度學習模型,從而較為準確地評估輪軌接觸安全的研究尚未見到。
綜上所述,可知兩點:第一,在分析軌道交通事故方面,研究者們在利用深度學習方法,從列車安全距離、軌道橋梁系統安全性和事故分類等多方面展開了深入的研究,但是在根據列車工況預測脫軌方面的研究還不多;第二,學者們在利用深度學習研究車輛脫軌問題時,傾向于結合多個相同或不同結構的神經網絡的預測結果,組成預測更準確、泛化性能更強的組合式預測模型。
要想保證深度學習的效果,需要準備大量的訓練數據,然而列車實車試驗成本高昂,鐵路日常運營中收集到的數據一般研究機構也難以獲得。通過仿真方法獲取數據集是解決該難題的方法之一。近年來,仿真軟件的性能逐步提升,被學者們廣泛應用到研究之中,其中SIMPACK 在多體動力學,尤其是輪軌接觸方面的仿真效果非常有效。陳楊[10]在SIMPACK 中建立了整車動力學仿真模型,并對輪軌接觸面和懸掛系統做了處理,加入軌道不平順激勵模型,得到了較為真實的仿真場景,利用仿真研究了各向不平順對蛇形失穩臨界速度的影響;王海濤[11]在SIMPACK 中建立了車-線-隧剛柔耦合動力學模型,利用仿真與實測數據研究了車輪抬升力、車輪踏面磨耗數與隧道壁振幅等參數對列車運行的影響;何銀川[12]在SIMPACK 中建立了馱背運輸車輛系統振動模型,根據仿真分析了臨界速度、曲線通過能力和懸架對垂向穩定性的影響,并且做了實際試驗,結果與仿真結果相吻合;姚常偉[13]通過Fluent、ANSYS 和SIMPACK 等仿真軟件對受側風影響的列車模型進行了仿真,仿真結果與通過理論計算得到的風載荷對車輛的影響是等效的。
上述科研成果都能證明SIMPACK 在研究輪軌接觸方面的可靠性,因此借助仿真工具得到數據集,再用深度學習方法分析數據得到關鍵參數與列車輪軌狀態之關系是可行的。
本文對車輛在曲線上運行的最大脫軌系數進行研究,選取了線路半徑、車速、車體重心橫向偏移量和外軌超高角作為參數變量,建立仿真模型,對不同工況下車輛在曲線處的脫軌系數進行模擬,得到列車脫軌數據集,分別對多層前饋神經網絡(BP 網絡)和長短時記憶神經網絡(LSTM 網絡)進行訓練和優化,使二者能夠獨立預測脫軌系數,最后綜合二者建立了用于預測列車曲線脫軌系數的最優加權系數法組合式神經網絡。
誤差逆傳播神經網絡即BP 神經網絡(以下簡稱BPNN)是目前最成熟、應用最廣泛的一種人工神經網絡,BPNN 單元結構如圖1 所示。

圖1 神經網絡單元結構Fig.1 Neural network unit structure
BPNN 訓練時將誤差沿著原先的權重通道反向傳播,按照梯度下降的原則調整通道權重與神經元閾值。在如圖2 的網絡中,輸入網絡的樣例由 d種屬性描述,輸出的是l 維向量,所以該網絡的輸入層有d 個單元,輸出層有l 個單元,隱藏層設為q 個單元。第h 個隱藏層單元的閾值為γh,第j 個隱藏層單元的閾值為θj。輸入層第i 個單元到隱層第h 個單元之間的信息通道權重為νih,隱藏層第h個單元到輸出層第j 個單元之間的信息通道權重為ωhj。隱藏層第h 個單元的輸入為輸出為bh,輸出層第j 個單元的輸入為隱藏層和輸出層都采用Sigmoid 函數,如圖3(a)所示,其表達式為

圖2 神經網絡結構示意圖Fig.2 Neural network structure

圖3 激活函數圖像Fig.3 Activation function image

其導函數見式(2),圖像見3(b)。

LSTM 具有外部循環和本身節點間的自循環能力。自循環由遺忘門、輸入門和輸出門控制,這三者可根據當前時刻的輸入從隱層中刪除、添加、提取信息,在訓練過程中控制每個節點上的輸入對整體結果的影響。圖4 展示了LSTM 的單元結構。

圖4 LSTM 的單元結構Fig.4 LSTM unit structure
其中,遺忘門會根據當前的輸入Xt、上一時刻的輸出ht-1,其激活函數為sigmoid 函數;表示當前時刻第i 個循環體單元的遺忘門的輸出值,可用式(3)計算:

輸入門根據x(t)、輸入門的輸入偏置b(g)和h(t-1)決定計算當前時刻輸出的狀態,可用式(4)計算。

式中:U——單元體輸入門的輸入權重;W——單元體輸入門的循環權重;sigmoid——激活函數。

組合式預測方法的核心是用各種單項模型針對訓練數據展開學習,在單項網絡都能從數據集中有效學習規律后,用某些準則或者方法,將多個單項網絡的預測結果統合起來解決問題[14]。本文使用的組合方案如圖5 所示,采用BP 神經網絡和LSTM 神經網絡兩種不同單項預測模型通過加權平均法組成異質組合式預測模型,獲得該組合式預測模型有2 個步驟:(1)通過數據集訓練單項神經網絡,使其預測得盡可能準確,一般來說,單項網絡的結構應該盡可能不同,通過將2 個學習偏好分歧較大的預測模型組合能多角度、全面地學習數據集規律;(2)通過加權平均法組合二者的預測結果。

圖5 組合式預測模型架構Fig.5 Construction of combined forecasting model
LSTM 和BPNN 的結構不同,性能有區別,應使用加權平均法進行組合。加權平均法根據各單項模型的性能為其賦予不同的權值,調整各模型對最終預測的影響,ωi表示單項模型的權重,其組合可表示為

設模型需要通過學習掌握的真實規律為f(x),x 從分布p(x)中取樣獲得,則組合單項模型后的組合預測法的誤差為

要想求得最優權重,即

需求得BPNN 和LSTM 兩種預測方法的偏差矩陣,e1x和e2x分別表示2 種網絡對樣例x 的預測值和真實值的誤差,有N 條預測樣例,則

根據拉格朗日乘子法可求得如下最優解:

ω1和ω2即為BPNN 和LSTM 的最優權重,R為單位矩陣。
本文所使用的模型中,車身、構架和輪對考慮到了沿長度、寬度及高度方向上的平移,以及繞3 條軸線的轉動共6 個自由度,軸箱考慮繞車架交接點的轉動,只有1 個自由度,搖枕與車身剛性連接,不考慮其自由度,故該模型共有50 個自由度。
該模型包含54 個力元,因只考慮單節車輛,故沒有車鉤力,其中軸套與構架間使用43 號力元,一系懸掛中的彈簧使用85 號力元,一二系懸掛中的阻尼以及蛇形減振器選用6 號力元,二系懸掛的兩個剪切彈簧使用79 號力元,車架與搖枕之間用13 號力元作為緩沖器以防止二者碰撞,輪軌接觸力元采用78 號力元并考慮到了它的非線性特性。該模型拓撲結構如圖6 所示,其轉向架拓撲結構如圖7 所示。

圖6 主模型拓撲結構Fig.6 Topological structure of main model

圖7 轉向架拓撲結構Fig.7 Topological structure of bogie structure
車輛行駛線路包括:直線—過渡曲線—彎道—過渡曲線—直線。列車在直線的行駛狀態不是研究重點,故設置為10 m;過渡曲線用線性過渡,長度為10 m;彎道的長度為500 m,半徑可調。引入的軌道水平不平順激勵參考美國6 級譜[19],式(12)是其譜密度分析式。

式中:Av=0.033 9 cm2·(rad/m);Ωc=0.438 0 rad/m;Ωv=0.824 5 rad/m。
列車在彎道上的脫軌系數會受到線路、車速等眾多因素影響,本文將重點放在車速、重心橫向偏移量、半徑和超高上,研究這3 者對脫軌系數的影響,通過不同條件下的仿真實驗,提取車速、半徑、超高、重心橫向偏移量作為屬性,對應的脫軌系數作為標記,得到如表1 所示的1 269 條樣例。

表1 脫軌系數數據集Tab.1 Derailment coefficient data
由于各值之間數量級相差巨大,且網絡采用了誤差梯度下降法,數據直接輸入網絡會導致誤差無法沿最短梯度方向下降,故采用進行歸一化處理,將各維度的數值放縮至(0,1)范圍,x為原始數值,μ為該維數據的平均值,σ為該維數據的標準差。
根據加權平均法加權系數的求解方法求得BPNN和LSTM 的最優加權系數,2 種網絡的預測結果乘以各自的加權系數之和Y=ωBPyBP+yLSTMωLSTM即為組合式預測模型的輸出結果,如圖8 所示。

圖8 組合模型的預測結果Fig.8 Prediction of BP-LSTM
其在驗證集上的RMSE 為0.005 34,相較BPNN 減少了30.1%,較LSTM 減少了43.4%,符合加權平均法預測誤差相較單項模型減少的特性,BP-LSTM 網絡綜合了2 種網絡的特點,即可體現出LSTM 對脫軌系數隨重心偏移量變化的敏感性,在整體走勢上,BPNN 的引入也糾正了單項LSTM相差實際值較小的弱點。在樣本號150~200 之間的一段曲線,不論是單項網絡還是BP-LSTM 都沒能給出較好的預測,推測是樣本集上某些特殊規律造成的變化,但是預測值的走勢還是與實際值一致的,實際預測中也不可能使網絡輸出和真實值完全一致,重要的是BP-LSTM 能夠預測出脫軌系數隨工況惡化而增大的趨勢,實際應用中可為列車脫軌提供預警。
本文分析了國內外深度學習方法在列車安全運營上的研究現狀,說明誤差逆傳播神經網絡和長短時記憶神經網絡的結構、功能及數學原理,對2 種網絡的缺點和改善方法進行分析。對組合式預測方法的原理進行描述,說明其相較單項神經網絡在預測問題上具有的優勢。基于Python 語言和TensorFlow 框架完成預測脫軌系數的組合式神經網絡BP-LSTM。分別對多層前饋神經網絡(BPNN)和長短時記憶神經網絡(LSTM)進行訓練,使二者能夠獨立預測脫軌系數,最后求得二者在驗證集上的最優加權系數,通過最優加權系數法建立用于預測列車曲線脫軌系數的組合式神經網絡,結果表明,二者能采用加權平均法進行組合后,BPLSTM 預測精度有很大提升。