梅 靖 中國鐵路上海局集團有限公司上海通信段
GSM-R是基于目前已經成熟、通用的公共無線通信系統GSM平臺發展而來的,專門為滿足鐵路應用而開發的數字移動通信系統。本文對上海局將鄭徐線BSC從諾基亞MSC割接至上海華為MSC之后,鄭徐高鐵線陸續發生列車CTCS-3(以下簡稱C3)降級[1-4]運行的問題,通過截取E接口、A接口信令,對列車降級原因進行分析定位,分析局間切換流程、后續切換流程、MSC局間消息傳遞流程進行故障定位,對今后的日常維護工作具有一定的指導意義。
2018年8月10日上海通信段完成了鄭徐高鐵(上海局管段)BSC接入新設MSC,隨即發現列車運行在徐州東站至銅山線路所區間內,上下行均多次發生列車CTCS-3降級運行。
2018年8月10日凌晨,上海局將鄭徐高鐵線XZBSC1從諾基亞MSC割接至上海華為MSC之后,部分列車在上海局與濟南局交界處發生C3降級。
(1)徐州東往鄭州方向:徐州東(上海諾基亞MSC)切換ZZ-XZD19(濟南 MSC)成功,ZZ-XZD19切換 ZZ-XZD18 成功,ZZ-XZD18(濟南 MSC)切換 TSXLS01A(上海華為 MSC)失敗后C3降級。
(2)鄭州往徐州東方向:TSXLS01A(上海華為MSC)切換ZZ-XZD18(濟南 MSC)成功,ZZ-XZD18切換 ZZ-XZD19 成功,ZZ-XZD19(濟南 MSC)切換 XuZhouDong(上海華為 MSC)失敗后C3降級。
由此可見,列車降級時主要涉及諾基亞MSC、濟南MSC、華為MSC之間的跨MSC切換,主要涉及后續切換信令流程。
根據接入新設的MSC后5天內降級車次比例進行分析,降級車次數量占總車次數量30%到48%不等,從降級次數、降級時間上看無明顯規律,如表1所示。

表1 降級車次數量占比分析
因列車降級涉及到上海諾基亞MSC、上海華為MSC、濟南MSC、武漢STP、北京STP,為保證分析數據的完整性,多家單位配合共同定位故障點。在濟南局MSC的E接口、A接口和BSC的Abis接口上掛信令儀。在上海局對MSC21和MSC22、XZBSC1、njBSC1的 E接口、A 接口和 Abis接口掛接信令儀,各掛接位置跟濟南局MSC掛接一致。
經過對降級車次數據進行綜合分析,判斷降級區段集中在shMSC2、濟南MSC與shMSC1跨局切換區域,為進一步定位故障原因,通過對A口、E口掛表截取信令。
通過在上海MSC和北京武漢STP之間追蹤到一個切換失敗的記錄進行分析。從信令流程中可見,切換未完成就收到華為的發REL消息,后面的切換流程中斷。由于A->B->C跨局切換失敗涉及到的三個局的A口和E口消息,僅僅從C局的E口消息無法判斷具體的故障點,需要整個流程完整的信令消息才可用進行更進一步的分析定位。
3.2.1 上行列車(鄭州往上海)E接口信令分析
以2018年8月11日G1914次列車為例對E接口信令分析。上海局華為MSC在10:22:55收到濟南局MSC的后續切換請求消息,攜帶目的小區LAC 0X410b以及目的MSC號碼8614900411(上海諾西MSC)。華為MSC向上海諾西MSC發起切換消息,上海諾西MSC返回切換響應消息。局間連接建立完成后,10:22:57上海華為MSC給濟南MSC回后續切換響應消息,此時上海華為MSC進入等待切換檢測消息狀態。7 s后上海華為MSC未收到上海諾西MSC發送的切換檢測消息,定時器超時,主動發出ABORT消息,拆除呼叫。
3.2.2 下行列車(上海往鄭州)E接口信令分析
以2018年8月12日G1879次列車為例對E接口信令分析。08:39:48上海華為MSC接收到來自上海諾西MSC的切換請求消息,上海華為MSC回切換響應消息給上海諾西MSC,華為MSC處理機制正常。
3.2.3 A接口信令分析
08:39:48上海華為MSC收到上海諾西MSC發送的切換請求消息后,上海華為MSC 08:39:48向上海BSC發送HO_Request,上海BSC返回HO_Request_ack給上海華為MSC。上海華為MSC回切換響應消息給上海諾西MSC。但是之后未收到上海鄭徐線BSC發送的切換檢測消息HO_DETECT消息。08:39:56上海華為MSC發clear_command消息拆除呼叫。
3.2.4 至武漢STP信令分析
08:39:49上海諾西MSC給上海華為發IAM消息,進行局間連接建立。08:39:49上海華為MSC給上海諾西MSC回ACM消息,但是由于上海鄭徐線BSC未發送切換檢測消息給華為MSC,導致上海華為MSC未發切換檢測消息給上海諾西MSC,約7 s后08:39:56上海華為MSC等待切換檢測定時器超時,華為MSC向上海諾西MSC發REL(拆線)消息,同時收到了上海諾西MSC發送的REL消息,拆除呼叫。
3.2.5 原因分析綜述
上海諾西MSC沒有發送切換檢測消息(HO_DETECT)給上海華為MSC,最終導致上海華為MSC等待切換檢測消息(HO_DETECT)定時器超時,呼叫被釋放,后列車發生C3降級。
通過濟南局C3三接口檢測A接口和Abis接口數據分析發現濟南的MSC給BSC下發了HandOverCommand(切換命令),但是BSC收到該消息后并沒有將該消息發給BTS。
當車載MT設備在上海諾基亞MSC下起呼鄭徐RBC后,首先切換至濟南MSC,后切換至上海華為MSC下,類似涉及3個MSC的跨局切換稱為“后續切換”,“后續切換流程”如圖1所示,MSC-A代表諾基亞MSC,2G-MSC-B代表濟南MSC,2G-MSC-B'代表華為MSC。移動用戶從MSC-A(諾基亞MSC)起呼,切換至2G-MSC-B(濟南MSC),后續切換至2G-MSC-B'(華為MSC)。

圖1 后續切換流程圖
(1)BSC-B向2G-MSC-B發送切換請求消息HANDOVER REQUIRED,該消息中含有切換類型、原因、源位置信息、目標位置區小區信息等切換必須的信元。
(2)接收到切換請求消息后,2G-MSC-B根據查詢所得到的目的位置區小區的位置,確定本次切換是局間切換,向2G-MSC-A發送后續切換請求MAP_PREPARE_SUBSEQUENT_HANDOVER_REQ消息,該消息中包含了目標MSC的ID、目的位置區小區等信息,2G-MSC-A收到消息后,查詢消息中所攜帶的目的位置區小區的位置。
(3)2G-MSC-A根據目的MSC的ID判斷本次切換是后續切回還是后續切換到第三方。通過查表確定本次切換為后續切換到第三方,發送MAP_PREPARE_HANDOVER_REQ消息,示意2G-MSC-B'進行切換前準備工作,在該消息中帶有HANDOVER REQUIRED消息的所有信息。
(4)2G-MSC-B'請求VLR-B為本次切換分配切換號碼。2G-MSC-B'根據位置區小區號查詢目的位置區小區的位置,確定該小區屬于本局,然后構造切換請求消息HANDOVER REQUEST,發送給目標BSC-B',請求為本次切換分配無線資源。2G-MSC-B'向BSC-B請求無線資源和向VLR-B'請求切換號碼是并行的,2G-MSC-B'只有在收到這兩個請求的回復后,才會向2G-MSC-A回復消息。
(5)BSC-B'分配好無線資源,對2G-MSC-B'回復HANDOVER REQUEST ACKNOWLEDGE消息。
(6)VLR-B'分配好切換號碼后,2G-MSC-B'向2G-MSC-A發送MAP_PREPARE_HANDOVER_RSP消息,通知2GMSC-A切換準備完成。該消息中含有切換號碼,2G-MSC-A可以通過該號碼實現到2G-MSC-B'的話路路由。
(7)2G-MSC-A對切換號碼做分析,進行出局選路,選路成功后,則發送IAM消息到2G-MSC-B'。
(8)2G-MSC-B'對IAM消息中攜帶的號碼進行被叫號碼分析,確認是切換號碼,則通知VLR-B'釋放切換號碼。該消息可以在2G-MSC-B'收到IAM消息后的任何時間發送。同時2G-MSC-B'對2G-MSC-A返回ACM(Address Complete Message)消息。
(9)2G-MSC-A 發送 MAP_PREPARE_SUBSEQUENT_HANDOVER_RSP消息,通知2G-MSC-B后續切換準備完成。
(10)2G-MSC-B發送HANDOVER COMMAND消息給BSC-B,通知MS可以發送切換了。
(11)BSC-B'檢測到正確的MS后,向2G-MSC-B'發送HANDOVER DETECT消息。此時MS已經檢測到新的無線信道,并且具備接入的條件,但尚未真正切入,對于語音切換,必須要建立話路。
(12)2G-MSC-B'通過 MAP_PROCESS_ACCESS_SIGNALLING消息將HANDOVER DETECT消息透傳給2GMSC-A,2G-MSC-A收到該消息后,請求在MGW-A的上下文中改變端點間的流方向,并進行內部接網。
(13)新的話路已經建立,用戶繼續通話或進行其他業務,BSC-B'向2G-MSC-B'發送HANDOVER COMPLETE消息上報切換完成。
(14)2G-MSC-B'通過MAP_SEND_END_SIGNAL_REQ消息將HANDOVER COMPLETE消息透傳給2G-MSC-A,通知2G-MSC-A切換已經完成。
(15)2G-MSC-B'向 2G-MSC-A 發送 ANM(Answer Message)消息,切換完成。該消息沒有實際意義,其目的是為了和局間中繼信令保持一致。
(16)2G-MSC-A 向 2G-MSC-B 發送 REL(Release)消息,通知釋放局間切換時建立的局間電路。
(17)2G-MSC-A向 2G-MSC-B發送 MAP_SEND_END_SIGNAL_RSP消息,釋放局間切換時占用的MAP(Mobile Application Part)資源。
(18)2G-MSC-B對BSC-B發送CLEAR COMMAND消息,通知其釋放資源。
(19)BSC-B釋放完地面資源和無線資源后,對2G-MSCB回復CLEAR COMPLETE消息。
(20)通話結束,2G-MSC-A向2G-MSC-B'發送REL消息,釋放呼叫以及局間電路。
(21)2G-MSC-A 向 2G-MSC-B'發送 MAP_SEND_END_SIGNAL_RSP消息,釋放局間MAP資源。
3.5.1 信令分析
綜合信令儀測試手機的數據分析,得出以下結論:
(1)華為MSC作為主控MSC時,沒有收到上海諾基亞MSC發送的切換檢測消息(HO_DETECT);
(2)諾基亞MSC作為主控MSC時,也沒有收到上海華為MSC發送的切換檢測消息(HO_DETECT),而華為MSC沒有發該消息,是因為沒有收到鄭徐BSC發送的切換檢測消息HO_DETECT消息;
(3)從三接口檢測數據看,濟南BSC沒有發HandOver Command給BTS,因此可以很自然的推測出:濟南收到上海回的“切換響應”消息后,BSC沒有將“切換命令”下發給ATP,導致ATP沒有在上海的小區下發送“HO ACCESS”消息,上海側網元等待消息超時,拆除切換流程,切換失敗。
因此,定位問題的關鍵節點在濟南MSC和BSS之間。
3.5.2 故障定位
對接入新MSC后4天內所有C3降級車次的信令進行逐一分析,發現華為MSC從收到濟南切換請求,到往濟南方向發出切換響應消息,至少需要1.4 s以上(不含到武漢到濟南的回程傳輸時間以及武漢STP和濟南MSC的消息處理時間),同時降級車次的切換響應時長基本在1.5 s以上,如表2所示。
根據切換成功與失敗的相應時間對比,初步判斷列車跨局切換降級的原因為濟南京滬高BSC的T7計時器配置[5-7]存在問題,并結合接口檢測看到的切換執行時長數據中,切換失敗的時長都大于2 s,可能導致濟南局京滬高BSC T7計時器超時。
3.5.3 BSC T7定時器參數說明
T7計時器在流程中的起止位置:出BSC切換時,BSC上報切換請求消息后,T7定時器啟動;在T7定時器超時前,如果BSC收到切換請求應答消息,T7定時器停止;T7定時器超時后,BSC進行出BSC切換失敗處理。其位置如圖2所示。
該定時器設置過長,可能會浪費信道資源,造成擁塞;該定時器設置過短,可能會影響切換成功率。根據不同設備廠家提供的產品手冊顯示,華為BSC,T7定時器默認值為10 s,無需修改。而諾西BSC設備其產品手冊中有如下描述,“特別在MSC之間切換時,等待HO CMD消息的時間可能超過3 s”,因此跨MSC切換時建議該值設置不低于3 s,具體值看實際情況。

表2 切換響應時間對比
因為濟南局核心網京滬高BSC T7定時器的設置為2 s,在總公司通信中心指導下,濟南局將濟南京滬高BSC T7定時器設定為3.5 s后,經過5天的驗證,鄭徐高鐵線跨MSC切換時未再發生C3降級。
本次故障的定位主要通過截取E口、A口信令,深入分析局間切換流程、后續切換流程、MSC局間消息傳遞流程以及信令中的異常環節,最終定位列車C3故障原因為濟南局BSC的T7計時器設置過短導致。同時通過對此次故障處置,發現對于跨3個不同廠家的MSC切換場景,如果BSC T7定時器設定為2 s過短,會導致一部分車次由于T7定時器超時,BSC即使收到了切換命令(HandOver Command)也將其丟棄而不處理,導致后續的切換流程無法繼續執行,從而導致切換失敗。通過對此類故障的排查流程,以及處置措施,對今后的日常維護工作具有一定的指導意義。

圖2 T7計時器在流程中的起止位置