莊達希
(中國民用航空湛江空中交通管理站,廣東 湛江 524000)
民航通信網由一張傳輸網和兩張承載網組成,主要承接的業務包括民航綜合及專業業務、空管綜合管理業務、部分航空安全業務、臺站環動監控以及航空安全保障業務(雷達、甚高頻、轉報等)等。傳輸網采用的是雙星型架構,采用自有傳輸設備(華為的OptiX OSN系列設備),為承載網提供各種干線[1-3]。兩個承載網分別是IP網和時分復用(Time-Division Multiplexing,TDM)網。IP網主要承載大寬帶民航業務,例如民航綜合管理業務等;TDM網主要承載與空管安全業務相關的窄帶IP業務,包括雷達、甚高頻、轉報以及管制移交電話等[4]。
民航通信網光傳輸網是民航通信網的基礎傳送支撐平臺,網絡覆蓋站點包括兩個網控中心、7個地區空管局、7個區域管制中心、民航局、民航空管局、十里河、37個空管分局/站、7個地區管理局、41個監管局、兩個終端管制中心、6個機場航管樓以及176個民航運輸機場等物理站點,并部署傳輸設備、波分設備。
光傳輸網核心層采用雙星型結構,一級節點為北京、上海網控中心,二級節點為7個地區空管局和7個區域管制中心。傳輸網的匯聚層包含三級節點和37個空管分局/站。傳輸網的接入層包含民航局、空管局、7個管理局、41個監管局以及各中小機場等節點。光傳輸網的網絡拓撲結構如圖1所示。

圖1 光傳輸網絡拓撲結構
光傳輸網采用華為的OSN系列設備。其中,一級節點和二級節點部署OSN7500設備;三級節點和各管理局、監管局部署OSN3500設備;各民用機場部署OSN1500設備。下面以三級節點使用的OSN3500為例進行介紹。OSN3500支架尺寸為722 mm(高)×497 mm(寬)×295 mm(深),結構如圖2所示。

圖2 OSN3500設備結構
OSN系列設備的板卡分為5大類,分別是同步數字體系(Synchronous Digital Hierarchy,SDH)單元、準 同 步 數 字 體 系(Plesiochronous Digital Hierarchy,PDH)單元、以太網單元、交叉時鐘和系統控制單元以及常見輔助單元。SDH單元板卡的作用是連接光纖。PDH板卡的作用是連接E1/T1接口。以太網單元板卡提供以太網透傳或交換的功能。時鐘交叉單元板卡集中了時鐘單元和交叉單元[5]。對于時鐘單元,其作用是跟蹤外部時鐘源或接口時鐘源,為本板和系統提供同步時鐘源提供兩路同步時鐘的輸入和輸出;對于交叉單元,其作用是提供多種業務級別的子網連接保護(Sub-network Connection Protection,SNCP),包括VC-4-4c、VC-4-8c、VC-4-16c、VC-4-64c、VC-4、VC-12、VC-3以及自身的1+1熱備份等。主控單元板卡的作用是保存配置數據、收集管理告警與性能事件以及外聯網管軟件等。
民航傳輸網承載著主要的民航業務,傳輸網的安全穩定對保障民航的安全運行非常關鍵。采用OSN設備的光纖自愈環可實現多種形式的通道保護,例如線性復用段保護、環形網絡保護以及子網連接保護,具有較強的網絡自愈能力。其中,線性復用段保護包括“1+1線性復用段”與“1∶N線形復用段”[6-8]。環形網絡保護分為復用段保護環(Multiplex Section Protection,MSP) 和 通 道 保 護 環(Path Protection rings,PP)。MSP包含二纖單向復用段共享保護環、二纖雙向復用段共享保護環以及四纖雙向復用段保護環;PP包含二纖單向通道保護環、二纖雙向通道保護環以及子網連接保護。雖然光環網具以上的網絡自愈性能,但是也會存在網絡自愈性能故障的情況,例如復用段倒換故障。
復用段倒換是指以復用段為基礎的倒換,倒換與否是由環上傳輸的復用段信號的質量決定的,倒換的發生由K1K2字節所攜帶的APS協議來啟動,當復用段出現問題時,環上整個STM-N或1/2STM-N的業務都切換到備用通道上[9-11]。復用段的保護條件是LOF、LOS、MS-AIS、MS-ESC(復用段誤碼過量)告警信號。當發生保護倒換故障時,則會出現以下幾種情況。一是全網正常狀態下,突然發生不明原因的倒換;二是在應該發生保護倒換時,全網未進入保護倒換狀態;三是進入保護倒換后,全網或部分業務發生中斷的情況。作為光傳輸網重要的自愈保護功能,復用段倒換故障會對民航傳輸業務造成巨大的影響。常見的導致復用段倒換故障的原因可分為外部原因、數據配置原因以及設備故障原因3大類,具體如表1所示。

表1 復用段保護倒換故障的常見原因分類
根據復用段倒換故障的原因,故障處理可采取以下思路。
在處理故障時,首先應該檢查設備外部的情況,例如是否人為停止了自動保護倒換(Automatic Protection Switching,APS)協議、錯誤設置了強制倒換、人為插入了MS_AIS、MS_RDI告警。同時應檢查是否供電系統出現了問題,如電源故障、蓄電池故障等。在排除外部原因后,如果故障仍然存在,可采用其他方法進行故障定位。
(1)保護倒換協議正常啟動,但保護倒換不成功。檢查復用段協議是判斷故障時必須進行的步驟,通過網管對各個網元的當前狀態進行查詢,若整個網絡中有兩個相鄰網元的狀態為“倒換態”(S),而其他網元均為“穿通態”(P),則說明APS協議正常啟動。若各網元的狀態正確,APS正常啟動,但業務仍然中斷,則可以考慮通過網管重新啟動協議。如果重新啟停協議后業務仍然中斷,則需考慮是否是單板存在問題,這時可以按一般的業務中斷故障進行處理。
(2)保護倒換協議異常,保護倒換不成功。APS協議異常會引起K字節的穿通和上報出現問題,從而導致保護倒換不成功。此時可以先檢查各網元的復用段參數是否配置正確、是否有網元的復用段參數丟失,如果參數設置沒有異常,就可以檢查光板和交叉板是否工作正常。
(3)強制倒換,先恢復業務。例如某段光路有大誤碼,可以通過拔纖或下發強制倒換命令,使業務先恢復正常后再處理故障。
3.3.1 故障情況描述
某單位6個站組成一個復用段保護環,如圖3所示。其中1號站為中心站,連接網管服務器。3號站和4號站的光纖斷后,部分業務中斷。

圖3 案例分析網絡示意圖
3.3.2 故障處理過程
首先,檢查設備外部的情況。在網管服務器檢查設置,是否人為停止了APS協議、錯誤設置了強制倒換或人為插入了MS_AIS、MS_RDI告警。同時檢查3號站及4號站是否供電系統出現了問題,如電源故障、蓄電池故障等。經檢查,設備外部情況正常。
其次,排除外部故障后檢查APS協議和復用段參數。通過網關服務器檢查復用段倒換保護狀態,無APS_INDI等復用段倒換告警上報,各網元倒換狀態不正常,確定未發生倒換,倒換協議未正常啟動。
最后,檢查復用段配置參數。檢查發現,導致復用段無法倒換的原因為復用段參數配置錯誤,各節點復用段保護參數錯誤按照順時針方向配置。原復用段節點參數如表2所示。

表2 原復用段節點參數
按照逆時針順序修改配置參數后重啟協議,環路正常進行倒換,業務恢復正常。修改后配置參數如表3所示。

表3 修改后復用段節點參數
3.3.3 原因分析
案例中,復用段倒換失敗的原因為復用段參數配置不正確。節點號未按照逆時針順序配置,3號網元復用段模塊處理時默認為西向光板對應的網元節點號比自身小1,東向光板對應的網元節點號比自身大1,導致協議處理異常。環上復用段節點號建議從0開始,節點號小于16,按主環方向逐站遞增。
民航傳輸網作為民航領域重要的傳輸干線,整體架構已逐漸完善。設備保障人員不但要充分了解傳輸網絡配置情況及網絡拓撲情況、熟悉傳輸設備的硬件配置、熟練掌握各種基本保護子網的保護機理、掌握命令行及網管配置業務的方法,而且還要熟悉故障排查方法,在組網及配置上充分考慮傳輸的安全性,在面對故障時要思路清晰,熟練解決各種問題,盡量避免業務受到影響。同時也需要與時俱進,多交流學習新的故障處理方法,積累經驗。