夏 明,蔣仁鋼
(卡斯柯信號有限公司 北京分公司,北京 100055)
城際鐵路列控系統[1-2]通過建立車地之間連續、雙向的通信,使列車命令和狀態信息在車輛和地面之間可靠交互,將地面設備和受控列車緊密的結合,可靠而精確地檢測列車位置,控制列車按運行計劃運行。城際鐵路列控系統的地面設備和車載設備,通過GSM-R無線數據通信網絡連接,構成了系統的核心。
因為采用GSM-R無線通信網絡進行信息傳輸,地面設備與車載設備之間的通信延時是無法克服的。車地通信延時的存在造成系統中車載設備和地面設備對信息使用的不同步。例如,當軌旁設備收到車載設備的位置報文時,列車實際位置可能已發生改變,這對列車的運行控制而言存在一定的安全風險[3-4]。因此,城際鐵路列控系統需考慮通信延時對列車運行控制的影響。由于延時時間的無法準確計算,目前的研究主要基于統計學方法,如文獻[5]提出了一種延時時間的檢測方法,利用一段歷史時間內(10個周期)的延時時間的平均值作為估算值。該方法的估算值精確度不高,難以獲得良好的效果。
鑒于深度學習神經網絡自身具有高度自學習性,不依賴高質量特征的特點,相比于統計學等數學模型更具有適用性,被廣泛的應用在圖像識別、語音識別、預測分析等領域[6-9]。本文運用具有長短期記憶(LSTM ,Long Short Term Memory)單元的深度學習神經網絡構建了無線延時時間預測模型,解決無線通信延遲時間估計問題,選取了實際數據、歷史平均時間數據進行比較分析,仿真結果表明LSTM神經網絡模型優于平均值算法,訓練結果與實際值接近,預測精度高。預測結果為車地通信消息有效性的精確判斷、列車精確定位提供依據。
車地通信延時時間Tdt包括車地通信網絡的固有傳輸時間Tnetwork和信息傳輸延誤時間Tdelay,即Tdt=Tnetwork+Tdelay。其中,Tnetwork可依據網絡傳輸設備的反應時間和通信周期等進行估算。但是,列車消息在由車載系統采用GSM-R無線方式傳送至地面系統時受無線信號質量的影響和無線通信延時的制約,設備具有一定的反應時間,所以Tdelay無法控制且不能直接檢測。因此,一般采用常量時間判定的方式來確定車地通信時間是否有效。即在系統中設置一個車地通信報文時效性的時間參數,通過該參數判定車地通信報文的最大使用許可時間。例如:CCS系統在接收列車消息后,獲取消息時間戳發送給列車的消息時間戳列車接收列車消息后,判斷Tccs是否在之間(a為延時常量),否則將丟棄該消息。如果Tdt估算不準確,將影響消息有效性判斷的準確性。城際鐵路地面設備與車載設備信息通信示意圖,如圖1所示。

圖1 城際鐵路地面設備與車載設備信息通信示意圖
簡單的遞歸神經網絡(RNN ,Simple-RNN)和一般的深度神經網絡(DNN)區別是在隱藏層中增加節點間的互連,通過這種連接,隱藏層能夠保存并利用歷史信息來輔助處理當前數據。RNN展開后相當于一個多層的DNN神經網絡,當層數過多時會導致參數訓練的梯度消失問題,導致長時信號損失。為了彌補這一缺陷,設計出LSTM替代隱藏層中的RNN網絡,使模型能夠建模信號的長時依賴關系。LSTM遞歸神經網絡將隱含層作了改進,其神經元結構,如圖2所示,灰色線代表有權重的網絡連接關系,灰色虛線代表遞歸連接關系。

圖2 LSTM內部神經元結構
LSTM遞歸神經網絡中遞歸連接為線性連接,該連接依靠信號來控制,該門被稱為遺忘門(forget gate)。因為它不需要經過類似sigmoid函數的非線性變換,所以在訓練中,LSTM的梯度信號在不同時刻的傳遞過程中不會衰減。除了遺忘門之外,還有輸入門(input gate)和輸出門(output gate),對應信號it和ot。在LSTM遞歸神經網絡模型中,xt和yt分別為t時刻網絡的輸入和輸出。令ct和mt分別為t時刻的神經元激活函數輸出和隱含層輸出,則從xt到yt的計算式為:

其中:Wcx、Wix、Wfx、Wox是連接輸入信號xi的權重矩陣;
Wcm、Wim、Wfm、Wom是連接神經元隱含層輸出信號m_t的權重矩陣;
Wic、 Wfc、 Woc是連接神經元激活函數輸出矢量ct和門函數的對角矩陣;
bi、bf、bc、bo是偏置向量;
Wym和 by是LSTM輸出的權重矩陣和偏置矢量;ct是胞元的激活函數輸出矢量;
g和h是胞元輸入到輸出的激活函數;
g和h通常是tanh函數;
σ為sigmoid函數;
φ是輸出層的softmax函數;
代價函數這里使用交叉熵。
在實際的建模過程中使用兩層的LSTM遞歸神經網絡,對于深層的LSTM遞歸神經網絡,它在時間域和空間域上都具有深層結構。
本文使用兩層的LSTM神經網絡,文獻[5]認為延時時間與數據包的大小有關,所以提取無線通信延時問題的輸入特征為數據包大小(字節數)和對應的延時時間。
LSTM神經網絡以損失函數評價實驗結果,通常選為均方誤差(MSE ,Mean Squared Error)。這是回歸分析中普遍采用的評價標準。均方誤差的式為:

實驗數據為每隔單位時間從CCS系統上采集的數據包大小與傳輸延時時間數據。實驗采用Python語言,LSTM模型由Tensorflow深度學習框架提供[10]。應用規范化(BN ,Batch Normalization)方法提高收斂速度,采用指數衰減法自動調整學習效率,避免訓練時間過長,防止參數在最優點附近震蕩。經過多次實驗,當隱藏層節點數為10,batch size取為40,timesteps(timesteps代表LSTM能夠利用的時間序列長度,LSTM可以訓練時間序列上的數據,利用數據在時間上的相關性使得訓練結果更加精確。)取為10時取得較好的訓練效果,如圖3所示,經過1 000組數據訓練后,損失函數降低為:0.044,預測精度達到95%以上。在80個測試集上的MSE平均值沒有超過0.06,證明該預測方法在實踐上具有有效性。與之相比,平均值法曲線波動較大,準確度不高。

圖3 預測數據與采用歷史平均延時時間的計算結果的比較
因為列控系統的工作狀態前后之間具有關聯性,因此該數據在時間上具有天然的連續性。具體采用timesteps的大小應由生產過程中的客觀因素決定,當天氣、地形、線路、設備等條件發生改變時,數據前后之間的關聯性便會隨之變化。
實驗結果如圖4所示,當timestep=1,收斂最快,收斂速度與timesteps大小成反比。原因是當timesteps增加時,同樣的輸出結果對應的輸入數據增多,計算量增加。同時可以看到,當timesteps=10時,模型精度反而略高于timesteps=64,說明timesteps不是越大越好,過大的timesteps不僅會增加收斂時間、提高模型訓練難度,有可能降低模型精度。因為當數據在時間序列上的長度過長時,前后之間的關聯性可能就逐漸減低甚至失去關聯性。因此建議將timesteps設置為可以被學習的參數,當模型的訓練精度不再下降甚至反而上升時,便可以進行參數學習更改,取得更優的訓練效果。
城際鐵路列控系統車-地無線通信延時,會影響無線消息有效性判斷。本文引入遞歸神經網絡對無線通信延遲時間進行預測,解決了傳統統計分析方法難以從歷史延時時間數據中提取特征的問題,證明了該預測方法在實踐上具有有效性,并解決傳統方法難以解決的問題。本文采用BN等深度學習方法,結合LSTM的模型特點對模型的訓練方法進行優化,大大縮短了模型的訓練時間。下一步工作的目標之一是在本文模型上進一步提高收斂速度與精度,提高模型的適用性。

圖 4 不同timesteps對比圖
[1]邸洪濤,王長林.關于客運專線列車運行控制系統的探討[J].鐵路計算機應用,2007,16(5):21-22.
[2]楊曉娟,賈利民.列車控制系統架構與技術現狀及發展方向[J].鐵路計算機應用,2012,21(3):49-52.
[3]李曉剛.車地通信延時對CBTC系統列車運行控制的影響分析[J].鐵路通信信號工程技術,2011,12(8):44-46.
[4]劉宏杰,劉 波,夏夕盛.CBTC列車安全定位中通信延時的研究[J].市政技術,2010,(S2):474-479.
[5]劉立明,韓 濤,蔣仁鋼.一種城際鐵路GSM-R無線消息延遲的檢測方法技術:CN105873123A[P].中國專利,2016-03-21.
[6]黃光許,田 筀,康 健,等.低資源條件下基于i-vector特征的LSTM遞歸神經網絡語音識別系統[J].計算機應用研究,2017,34(2):392-396.
[7]王 晶.基于深度學習神經網絡的車牌字符識別技術的研究[J].工業控制計算機,2017(3):51-52.
[8]張洪剛,李 煥.基于長短時記憶模型的中文分詞方法[J].華南理工大學學報:自然科學版,2017(3):61-67.
[9]殷瑞剛,魏 帥,李 晗,等.深度學習中的無監督學習方法綜述[J].計算機系統應用,2016(8):1-7.
[10]鄭澤宇,顧思宇.TensorFlow實戰Google深度學習框架[M].北京:電子工業出版社,2017.