馬文俊
馬文俊:西安鐵路局西安電務段 工程師 710005 西安
CTCS-3級列控系統主要由列控車載系統(ATP)、鐵路專用移動通信系統(GSM-R)、無線閉塞中心(RBC)三大模塊及其他地面設備組成。系統中任何一個環節存在異常大都會反映到列控車載設備上,表現為無線連接超時,而且因發生時機不同對列車的影響各不相同。概括起來有以下幾類:①絕大部分制動10~20 s后自動緩解;②少數制動20~30 s后會降級為C2運行;③低速下B7級制動導致停車;④極少數因交權流程取消等原因導致的緊急制動停車。
無線連接超時,是指CTCS-3級列控系統中,因無線鏈路異常,導致車載設備最新收到的無線消息的時間戳與其當前時間的差大于參數T_NVCONTACT時,列控車載系統按照安全邏輯向車體輸出B7級制動,影響動車組正常運行問題的統稱。
對于無線連接超時故障,盡管采取了軟件升級、系統優化等措施,但由于系統復雜、技術要求高、涉及部門多等原因,這個問題始終未能得到徹底、有效解決,長期困擾系統維護人員。
車載設備無線傳輸模塊由MT電臺及電臺與ATP主機的專用接口模塊組成。接口模塊根據ATP設備型號不同而略有差異,如300S型為RIM模塊,300T型為 GCD+STU-V模塊,300H型為RTM模塊。車載無線傳輸模塊中MT電臺故障率較低,絕大多數是接口模塊軟件或硬件(含MT電臺天饋系統)異常所致,其中軟件異常占絕大多數,而在軟件異常中絕大多數又發生在啟機自檢過程中,通常斷電重啟可以克服。
判斷車載設備是否正常的最有效標準:ATP系統未經斷電重啟的情況下,如果在后續交權區均發生無線連接超時,則判定為車載設備故障,否則為其他設備影響。主要依據是專用接口模塊不具備故障自恢復功能,必須經過系統自檢通過后才能掛上總線,并實現通信控制功能。300T設備在每個交權區均發生無線連接超時后,同時降級為C2級運行,前方站出站后轉入C3。
RBC系統作為CTCS-3級列控系統的核心設備,其安全性、可靠性、可用性和可維護性等方面均經過嚴格測試,而且設備安裝所處環境良好,RBC通信接口單元故障的可能性較小。即使發生異常也會被RBC主機及時發現,并采取切換至冗余系統、宕機等措施排除故障,確保RBC系統安全平臺邏輯運算和控制正確無誤,因此造成無線連接超時的概率非常小。
而因RBC主機問題影響C3級列車正常運行的情況,基本是因為 RBC主機發現與地面 IXL、TSRS等設備安全連接異常、RBC移交過程中發生的移交取消等特定場景、RBC數據配置與實際(如車號、地面基礎數據)不符等,此時,軟件啟動故障-安全機制,使RBC系統導向安全側。
GSM-R系統頻段:上行鏈路885~889 MHz,下行鏈路930~934 MHz,帶寬4MHz,與中國移動共用EGSM頻段,而且采用頻率空間分割方式,由于部分地區清頻不徹底,移動基站業務量大時會占用GSM-R頻點,造成網間同頻干擾。
而無線電波的傳播又受地形地貌、電磁環境、氣候條件、系統抗干擾能力等諸多因素影響。所以,GSM-R系統傳輸性能很大程度上決定了無線連接超時發生的概率,也是觸發車載ATP、地面RBC設備發起安全會話終止的主要原因。
無線連接超時發生的原因復雜,應從C3級列控系統的角度,采取車-網-地聯合分析的方法,以及信號、通信等各相關專業全力配合,共同查找故障點。除了300H型ATP設備具備鏈路層、傳輸層、安全層及網絡質量測量報告等通信底層數據記錄功能,其他300S、300T系統均沒有底層數據記錄功能,JRU及Dump數據也只分別記錄了應用層無線消息和ATP系統自身的故障代碼。所以,從車載側分析故障原因,主要依據車載安全邏輯及后續交路運行情況綜合判斷,車載數據提供的有效信息有限。
無線連接超時分析,要綜合ATP設備和RBC設備應用層消息交互內容和邏輯、消息發送和接收時延、時序,以及GSM-R系統Abis、A、PRI接口數據等一同進行。常規分析流程如下。
1.判斷故障是否發生在RBC交權區,后續交路及交權區運行是否正常。
2.車載及RBC設備有無故障代碼、異常燈顯等軟件、硬件問題。此類問題盡管發生概率較小,但判斷方法、實現途徑較為簡便,可以在故障發生后最短時間內及時進行確認。所以故障發生時,首先安排RBC工區值班人員觀察附近列車運行情況,同時檢查故障發生位置對應RBC設備硬件燈位顯示及工作狀態。其次,安排ATP工區人員撥打司機GSM-R手持機,請求司機確認ATP電臺及接口模塊燈位顯示及工作狀態,如300S設備MT電臺SIM卡指示燈、NW網絡指示燈是否為紅燈,主備系RIM模塊燈位狀態是否一致。此方法受單司機值乘等因素影響,可以通過DMS系統盯控該車后續運行情況判斷,在非特殊緊急情況下,不建議電務人員采用。再次,可以請求核心網工區結合GSM-R系統檢測數據進行初步分析。
3.通過RBC數據分析,判斷故障發生時應用層無線消息是否按正常流程終止會話,以確定車載設備工作狀態,便于進一步縮小故障范圍。由于下載RBC日志文件不受時間等其他條件制約,易于獲得,所以可以通過RBC記錄的車-地之間L4層日志進行先期分析判斷。除發生在交權區和C3→C2等級轉換點的正常掛斷流程外,RBC發送的M24+P42消息是RBC設備要求車載啟動正常掛斷流程的唯一方式。
應用層會話正常掛掉流程規定:RBC收到ATP發送M156“通信會話結束”消息后,RBC認為終止了其通信會話;ATP收到RBC回復M39“通信會話結束確認”消息后,ATP認為終止了其通信會話。
RBC對其“發送安全消息的頻率”和“再次發送消息前的確認消息等待時間”分別設置定時器T_ALIVE(6s)和T_ACK(12 s),當定時器超時后還未收到車載回復的確認消息,RBC將發送M24+P42消息要求車載斷開通信會話。如果車載及時向RBC發送M156消息,說明車載及時收到并正確處理了RBC發送的M24+P42消息,據此可以初步判斷車載ATP設備工作正常。
一個典型列子為:LKDR-S型RBC在配置時間內(18 s)沒有收到車載對其發送M24+P65(M_ACK=1)消息的確認消息M146,RBC觸發安全處理邏輯向車載發送M24+P42要求車載主動斷開與其通信會話?,F場信號人員結合故障發生位置,判斷是否為應用層啟動正常掛斷流程,對排除信號設備異常尤其重要。接下來的工作需故障車體入庫后上車下載ATP數據,并進行相關檢查測試。
4.ATP及RBC聯合分析。通過比對車-地會話過程,分析是否存在應用層消息丟失、重傳、失序、錯發(確保最新收到的消息T_TRAIN參數不大于前一個消息的T_TRAIN參數)等異常情況。
RBC數據記錄,16:34:53:734 RBC向ATP發送T_TRAIN=2125.8的M24無線消息,之后又發送了9條M24無線消息。與之對應,ATP數據顯示記錄,16:34:55:0 ATP收到RBC發送的T_TRAIN=2125.8無線消息M24之后,再未收到RBC側的任何應用層消息。按照RBC配置參數T_NVCONTACT=10,16:35:04:0車-地會話中斷10 s后,ATP向RBC發送“無線連接超時”錯誤消息,并于1 s后輸出B7制動。通過上述比對分析,本次無線連接超時,應用層邏輯無異常。故障原因為通信底層傳輸異常,導致車-地通信會話過程中應用層無線消息大量丟失所致。深入分析無線消息丟失的原因,就需要通信部門結合GSM-R系統各接口數據確定底層通信異常的原因。
5.信號人員也可結合GSM-R系統監測數據,從PRI接口和Abis接口數據做初步分析,找出異常原因。
1)Abis接口位于基站收發信臺BTS與基站控制器BSC之間,主要記錄網絡質量和電平、TA值等參數。數據分析主要關注質量和電平指標是否超出范圍。GSM-R網絡質量指標規定:信號電平為-47~-98 dBm,-47 dBm質量最好;通話質量等級為0~7級,0級最好,大于5級將不能正常承載上層列控業務,導致“無線連接超時”。另外,可通過分析比對故障時段與正常時段TA值大小判斷是否存在網內同頻干擾問題。
2)PRI接口是移動交換中心MSC與無線閉塞中心RBC之間的接口,主要記錄鏈路的建立、信息交互,釋放等過程。數據主要從以下4方面進行分析:一是安全及通信連接建立、數據傳輸、連接釋放等過程和時序是否符合規范;二是鏈路層、網絡層、傳輸層、安全層各層間信令類型、傳輸時延、數據長度是否與其他時段明顯不同,CRC校驗是否正確;三是數據鏈路層I(信息幀)、S(監控幀)、U(非數字幀)三類幀與其他各層幀類型對應是否正確,是否存在 SREJ選擇性拒絕幀、DISC模式中斷幀等;四是車-地通信雙方I幀與S幀幀編號是否正確,故障發生前是否存在大量單方向重傳信息幀等。
車-地通信過程中存在諸多異常,如:鏈路層的I幀(信息幀)及RR幀(監督幀)編號錯誤;傳輸層出現丟幀及未知幀;安全層缺失AU1、AU3驗證消息;應用層RBC→ATP發送M32“系統確認”消息前缺失 M155“通信會話開始”消息;CRC校驗多次錯誤等,均是導致底層拆鏈的原因,即造成無線連接超時。
3)A接口為BSC與MSC之間的接口,主要是傳遞呼叫處理、移動性管理、基站管理等功能,需要關注信令和小區切換是否正常。比對該區段歷史數據,分析是否存在切換失敗、切換位置發生明顯變化、2次切換間隔小于傳輸恢復時間(大于20 s)等情況。同時可結合Abis接口電平參數,分析主、從信號相差是否太小(小于6 dB)使切換提前,進一步導致乒乓切換。另外,車速也是影響切換的因素之一。
C3級列控系統龐大而復雜,車、地、無線通道、互聯互通等任何環節出現異常,大部分以“無線連接超時”故障反映出來,所以“無線連接超時”故障應急及分析處理存在很大難度。筆者結合多年來維護管理經驗和對各型ATP設備原理、設備規范的學習,提出以下幾點建議僅供參考。
1.對于運行途中非交權區發生的1次無線連接超時,很大可能是外部干擾或網內同頻干擾所致,ATP專業應做好后續交路盯控。
2.對于長大交路中的少數幾次非連續無線連接超時,原因及應急措施同上。
3.同一地點附近(3~3.5 km)多趟列車發生無線連接超時,重點檢查基站硬件或監測附近外網干擾。
4.一定時期內線路交匯處及樞紐地區多次發生無線鏈接超時,主要考慮新線引入導致的基站覆蓋變化、網內干擾等方面存在問題,ATP專業應主動了解該地區鐵路建設情況,并積極向上級部門匯報,請求協調處理。
5.運行途中所有交權區均發生無線連接超時,基本可以判定為車載電臺1系故障或該系電臺接口模塊啟機失敗(軟件BUG),即單電臺交權故障。建議司機在條件允許時重啟ATP系統。
此類故障發生時,ATP專業須待車入庫后重點檢查測試,主要檢查接口模塊硬件和電臺天饋線是否異常。檢查步驟如下:啟機及呼叫試驗、下載數據分析故障代碼、測試對應電臺天線駐波比、登頂檢查天線外觀、打開車頂天線檢查饋線連接情況、測試饋線衰耗、檢查車體饋線出線口密封情況及天線安裝平臺內部是否有銹跡(防止車體內部熱空氣進入密閉空間形成冷凝水,引起功率損失)等,逐步定位故障點。
從現場維護管理角度出發,對“無線連接超時”故障的定義、成因、判斷要點和流程、故障應急處理等方面進行分析;從列控車載設備、傳輸通道、列控地面設備三個通信相關方分別進行了故障概率研判和數據分析知識點歸納。藉此拋磚引玉,給現場信號、通信專業大量新入職的干部職工提供一種分析判斷方法,并幫助其開闊思路。
[1]中國人民共和國鐵道部.運基信號[2010]224號.CTCS3級列控系統無線功能接口規范(V1.0)[S].2010.
[2]韓斌杰.GSM原理及其網絡優化[M].(第2版)北京:機械工業出版社,2009.
[3]丁建文,鐘章隊.基于GSM-R的CTCS-3級列控系統安全數據傳輸通信協議幀分析[J].鐵道通信信號,2010(9).
[4]楊帆,丁珣.高速鐵路GSM-R網絡優化過程研究[J].鐵道通信信號,2013(7).