李秀芳
(中國鐵路北京局集團有限公司北京通信段,北京 100860)
鐵路移動通信系統(GSM-R)如圖1 所示,包括智能網(IN)、網絡交換子系統(NSS)、基站子系統(BSS)、操作支撐子系統(OSS)、通用分組無線子系統(GPRS)以及移動臺(MS)等。本文主要針對服務GPRS 支持節點(SGSN)設備時鐘系統功能出現異常時對相關無線網絡的影響進行分析、處理、應急等,最終對諾基亞SGSN 系統(硬件版本為DX200,軟件版本為SG7CD10)時鐘軟件配置、硬件設置等達到更深入的了解,以提高維護人員對諾基亞SGSN DX200 系統的維護水平,進而提高設備維護質量。

圖1 GSM-R系統網絡結構Fig.1 Network structure of GSM-R system
京廣高鐵無線系統網管告警信息,基站控制器(BSC)與SGSN 互聯的兩個2 M 接口,其中 PCMG:1 和PCMG:0 同時出現級別為重要告警的信息內容,顯示:Loss of Frame/slip Alarm onLink B 和Loss of Fram e/slip Alarm onLink A,如圖2 所示。

圖2 京廣高鐵無線系統網管告警截圖Fig.2 Alarm screenshot of wireless system network management of Beijing-Guangzhou high-speed railway
在京廣高鐵BSC 系統上報告警信息的同時,京滬高鐵BSC 系統也同樣上報上述告警信息,即兩條高鐵線的BSC 系統與SGSN 互聯的接口均出現滑碼/幀丟失告警。
鑒于同時兩條高鐵線的無線系統BSC 網管均上報同樣的告警信息,引起維護人員的高度重視,立即對問題進行排查分析。由于兩套BSC 均出現與SGSN 之間滑碼/幀丟失告警,所以首先對SGSN 系統運行情況進行檢查,發現SGSN 出現時鐘晶振告警,而且處于主用狀態的CLS-0 單元發生了自動切換,導致原來備用狀態的CLS-1 單元變成主用狀態。
上述SGSN 晶振告警與京廣高鐵、京滬高鐵的BSC PCMG 出現滑碼告警相吻合,需要進一步對SGSN 系統此時的時鐘同步狀態進行檢查。在SGSN網管界面主菜單下使用DRI 命令查看時鐘同步狀態,結果如圖3 所示。
此時時鐘狀態顯示當前SGSN 提取為“2M1”線路時鐘,同步單元CLS-0 為快速跟隨模式,暫未跟蹤到時鐘信號。初步分析CLS-0 時鐘模塊故障導致主備冗余板件進行自動倒換,計劃對SGSN 系統的CLS-0 時鐘模塊進行更換。

圖3 SGSN系統晶振告警時的時鐘同步狀態Fig.3 Clock synchronization status when the crystal oscillator of SGSN system alarm is given
2019年12月11日00:00,更換CLS-0 時鐘模塊1 h 后,發生如下變化:1)SGSN 的時鐘晶振告警消除;2)京滬高鐵和京廣高鐵BSC 告警未消除;3)使用DRI 命令查詢SGSN 系統時鐘同步狀態,除同步晶振控制字為15359 偏離正常標稱值32768 較大外,其他均正常。當時判斷更換時鐘模塊后,同步外部參考時鐘需要一定的時間,于是進一步觀察。
直至11日10:57,再次使用DRI 命令查看SGSN 系統時鐘狀態,發現時鐘狀態與CLS-0 故障時狀態一致,而且0、1 兩側同步晶振控制字均為0。正常應該接近標稱值32768,0 側同步晶振控制模式為快速跟隨模式(FAST),暫未跟蹤到時鐘信號。而1 側同步晶振控制模式為NORMAL,而且京廣、京滬BSC PCMG 滑碼告警仍然未消除,如圖4 所示。

圖4 更換SGSN的CLS-0時鐘模塊9 h后的系統時鐘同步狀態System clock synchronization status after replacing the CLS-0 clock module of SGSN for 9 hours
通過上述問題的排查,發現問題原因非SGSN系統本身CLS-0 時鐘模塊問題,于是對系統在用的2M1 時鐘徑路進行排查。由于SGSN 的外部時鐘從2M1 抽取,即SGSN 通過固定的時鐘線纜2M1接入特定的交換終端(ET)2 M 接口背板槽位,再通過成端至DDF 架ET 的2 M 線與上級網元實現2 M 對接,最終SGSN 系統達到提取上級網元的頻率同步信號。根據上述時鐘抽取方式,進一步確定SGSN 系統時鐘線纜與ET-256 相連。
需要進一步檢查線路時鐘2M1 的時鐘提取方式、相關的線纜接入以及涉及到ET-256 的硬件設備等。首先嘗試更換線路時鐘源2M1 的2 M 電路線纜,發現斷開時鐘2M1 的2 M 線纜后, SGSN 設備對應的ET-256 沒有上報中斷的傳輸告警,狀態依舊為正常狀態,并對ET-256 進行診斷,結果未通過,由此可以判斷為2 M1 提供線路時鐘的ET-256 硬件存在問題,而承載ET-256 的硬件為ET4C模塊,其中一個ET4C 可以提供4 個2 M,只能從序號第一個2 M 抽取時鐘,分析由于ET4C 模塊故障導致無法提取線路時鐘,需要進一步對ET4C 硬件模塊進行更換。
后續對SGSN 的ET-256 對應的ET4C 模塊進一步檢查時,發現此模塊除ET-256 其中此2 M 承載SGSN 與信令轉接點(STP)互聯,專門用來抽取時鐘外(此2 M 無其他業務,只提供時鐘信號跟蹤),還有1 個2 M ET-258 承載SGSN 至STP 互聯即Gr 接口業務,考慮到更換ET4C 模塊會影響Gr 接口互聯業務,計劃通過應急措施調整ET 位置,改變線路時鐘源位置,即調整機框背板外部參考時鐘線纜的位置,來實現從其他固定的ET 位置來獲取線路時鐘,將ET-256 調整到ET-276。諾基亞SGSN 可以提供時鐘信號的ET 位置如表1 所示。

表1 諾基亞SGSN系統可以提供時鐘信號的ET編號Tab.1 ET number of clock signal which can be provided by Nokia SGSN syste
在調整機框背板外部參考時鐘線纜時,發現2M3 外部參考時鐘線纜插錯位置, 2M3 對應的外部參考時鐘線纜SGAC_152 插在了ET-258 的位置,由于ET-258 不對外提供線路時鐘信號,只有每個ET4C 的第1 個2 M 位置才有時鐘信號輸出,當時錯誤的時鐘線纜接線位置如圖5 所示。

圖5 SGSN 2M3時鐘線纜錯誤接至ET258位置Fig.5 SGSN 2M3 clock cable is incorrectly connected to ET258
SGAC_150 電纜為2M1,對應的ET 位置為ET-256;SGAC_152 電纜為2M3,對應的ET 位置為ET-258;所以導致2M3 一直跟蹤不到線路時鐘,整個設備只通過一路2M1 來抽取線路時鐘。正常情況下,當2M1 外時鐘不正常時,系統會自動倒換至2M3 的外時鐘,使SGSN 系統時鐘跟蹤不會出現問題。在處理2M1 抽取時鐘異常的問題時,同時又發現了2M3 的錯誤接法,所以還要對2M3 進行處理,保證正常情況下SGSN 系統兩路線路時鐘跟蹤均處于良好狀態,系統再根據人為設置的時鐘優先等級進行外時鐘的抽取等。
鑒于上述2M1 和2M3 的時鐘線纜均需要調整位置,結合SGSN 設備本身ET 的出線成端至DDF架的情況,再根據表1 進行適當的調整,最終調整情況如下。
在SGSN 設備的后背板調整2M1 外部參考時鐘線纜SGAC_150 至ET-276 位 置,同時將ET-276 成端至DDF 架的2 M 線跳至原與STP 2 M互聯的DDF 位置,通過SGSN的時鐘設置可以看到,將2M1設置優先級最高為7 級,通過STP 進行時鐘同步。
在SGSN 設備的后背板調整2M3 外部參考時鐘線纜SGAC_152 至ET-260 位 置,ET-260 是SGSN 與STP 互聯業務電路,同樣可以完成從STP 側抽取時鐘功能,只是優先級設置為5 級,低于2M1 的優先級。
調整后的時鐘2M1 和2M3 的電纜與ET 背板接線如圖6 所示。
經過上述調整后,2M1 線路時鐘立刻同步成功,同步晶振控制狀態也恢復為NORMAL,同時將2M1 外部參考時鐘斷開,系統也能自動切換到2M3外部參考時鐘,而且無線網絡系統京廣高鐵和京滬高鐵BSC、PCMG 滑碼等告警消失,觀察數小時后,系統穩定運行,時鐘跟蹤異常的問題得到解決。

圖6 SGSN系統 2M1和2M3時鐘線纜正確調整至ET相關位置圖Fig.6 Diagram of the 2M1 and 2M3 clock cables of SGSN system are correctly adjusted to ET related positions
問題解決后當時的系統時鐘跟蹤情況如圖7 所示,2M1 和2M3 為鏈接狀態“CONNECTED”,同步單元0 側和1 側均能跟蹤到時鐘信號,狀態顯示NORMAL。當2 M1 時鐘跟蹤有問題時,系統會自動選擇狀態為“CONNECTED”的2M3 進行時鐘跟蹤。當時只有同步晶振控制字40072 和41 108偏離正常值較大外(正常后會逐步接近頻率標稱值32768),其他均恢復正常,相關告警全部消失。

圖7 問題解決后的SGSN系統時鐘跟蹤情況Fig.7 Clock tracking situation of SGSN system after the problem is resolved
原SGSN 2M1 外部參考時鐘源線纜SGAC_150接的ET-256 硬件故障,無法取到線路時鐘信號。
原SGSN 2M3 外部參考時鐘源線纜SGAC_152 接的ET-258 位置不提供線路時鐘信號。
開局時SGSN 系統外部參考時鐘設置存在問題,4 路外部參考時鐘,其中只有第一路外部參考時鐘為正常狀態,由于第三路外部參考時鐘線纜接入錯誤,整個SGSN 系統只有一路外部參考時鐘,所以當僅有的一路時鐘出現任何問題,導致整個SGSN 系統時鐘出現異常。
掌握系統提供外時鐘的方式及方法,才能做到在處理時鐘問題時先應急恢復再排查問題,本案例由于采取了及時的應急處置方式,將時鐘倒接至其他ET 位置,所以后續仍需對攜帶業務的ET4C 故障模塊進行更換。
日常技術維護人員在對SGSN 系統執表維護時,在熟悉系統時鐘設置的情況下,根據檢修周期,定期檢查時鐘跟蹤狀態,發現異常及時排查處理,確保系統時鐘運行正常。
高速鐵路利用GSM-R 的GPRS 網絡分組數據業務實現車載設備和地面設備間雙向信息傳輸,包括行車調度命令、進路預告、無線車次號校核信息傳送以及承載列車自動駕駛(ATO)應用系統等,所以GPRS 系統在高速鐵路通信系統中發揮著重要的作用,而SGSN 做為 GPRS 系統的重要組成部分,日常維護人員需要深入研究設備的相關工作原理,提高對設備的維護水平,以提供高可靠性的設備質量,為高速鐵路行車調度提供可靠的通信保障。