謝 芳,黃 河
(海峽之聲廣播電臺,廈門 361001)
隨著IP技術廣泛應用,傳統的SDH傳輸技術以越來越無法滿足人們的需求,MSTP越來越被人們重視起來。本文列舉了MSTP設備常見的幾類故障場景,并針對各個故障場景,逐一給出故障現象及故障處理方法。
隨著MSTP設備應用的廣泛,MSTP設備的維護也得到了重視。簡單的設備維護可以從以下幾個步驟入手:
步驟一:日常數據備份
數據庫自動備份策略設置的網管入口:系統>網元軟件管理>網元備份策略管理,ASON&分組網元每天一次,其他網元每周一次。
網管腳本定時備份:在網管上創建“全網配置腳本”文件的定時備份任務,每周一次。
網管數據庫定時備份:在網管上創建數據庫定時備份任務,每月一次。
網管側業務路徑信息導出:網管側SDH業務路徑導出,ASON控制鏈路/TE鏈路/智能電路信息導出,分組Tunnel/PWE3業務路徑導出,每周一次。
步驟二:采集工具部署
在Support網站下載“UEasyDataCollection”工具后安裝在U2000網管服務器上。
步驟三:日常例行檢查
數據庫檢查:在Support網站下載“DBCheckerUI"工具檢查。
高危告警檢查:篩查&處理全網高危告警(如下表),禁止屏蔽。

表1 重要告警列表
故障信息采集是較為重要的一環,我們可以借助相關工具來更加快速精準的完成故障信息采集。
故障業務相關信息反饋:
(1)故障發生時間、網管告警、網元異常狀態(如脫管、響應慢等)。
(2)業務保護類型&狀態、設備類型&版本。
(3)中斷業旁類別數量,選取一條中斷業務給出路徑信息。
故障前后異常&操作信息反饋:
(1)故障前:是否有升級、掉電、割接、光纖中斷、對接設備的操作等。
(2)故障后:是否有網管配置上下載、業務配置、拔插纖纜/單板等。
數據備份情況:
是否有網元數據庫/網管配置腳本備份、巡檢數據等。
數據采集:
采集網管當前告警、操作日志、異常事件(推薦使用UEasyDataCollection工具快速采集)。
3.1.1 環形復用段業務中斷
故障現象:
環形復用段倒換或倒換恢復后業務中斷,或者環形復用段狀態異常。
處理方法:
(1)復用段協議全環停啟(可能會導致環上業務短暫中斷)。
(2)復用段斷纖點區段兩側強制倒換。
(3)斷纖點兩端網元交叉板主備倒換。
(4)復用段環先刪后建。
(5)核實故障業務是否配置在復用段的額外通道上、是否多點斷纖、是否光纖錯連。
3.1.2 線性復用段業務中斷
故障現象:
線性復用段創換或倒換恢復后業務中斷,或者線性復用段狀態異常。
處理方法:
(1)停啟復用段協議。
(2)強制倒換到保護通道。
(3)復用段先刪后建。
(4)排查1+1線性復用段是否缺少雙發業務。
(5)若和友商設備對接,關閉激光器觸發對端倒換。
(6)若和友商設備對接,修改兩端配置為1+1單端線性復用段保護。
3.2.1 EoS板業務中斷
故障現象:
EoS板端口流量為0或很小,其他TDM業務正常,即可判定為EoS板業務中斷。
處理方法:
若有配置操作,則回退。
若無,則判定SDH通道是否異常:
(1)數據板是否存在SDH側告警(如AIS、UNEQ、SLM、EXC、SQM等)。
(2)測試幀結果是否正常。
(3)修改數據板通道開銷J1/J2(VC4只能在線路板修改J1)在對端檢測實收值。
若SDH通道異常,則去激活后激活SDH業務或更換SDH路徑。
若SDH通道正常:
(1)倒換BPS/PPS/DLAG/LAG。
(2)去使能后重新使能以太端口;去使能后集新使能LCAS。
(3)刪除VCTRUNK綁定后重新綁定。
(4)刪除后重配以太業務。
(5)硬復位單板(會影響整板業務)。
(6)修改專網為專線業務。
檢查端口參數:
檢查端口TAG屬性&工作模式&封裝模式&VLAN ID是否配置正確。
3.2.2 EoS板業務成環
故障現象:
對于EoS專網業務,故障端口廣播或組播流量達到1M以上,或單板響應很慢、查詢端口實際工作模式等命令超時,或存在ETHOAM_SELF_LOOP、ETHOAM_ VCG_SELF_LOOP告警,其他TDM業務正常。
處理方法:(1)若有配置操作(如新增交叉、配置VCTRUNK等),則回退。(2)檢查Hub/Spoke屬性。注:若單板響應慢導致命令無法下發,請先在網管設置,然后硬復位單板,使配置生效。
(3)刪除VB內所有端口后逐一添加,判斷添加到哪個端口后業務異常。
3.3.1 ASON網絡資源不足
故障現象:
ASON網絡斷纖/斷纜后:
(1)故障業務存在CP_SRV_INT/CP_SER_INT/SER_INT告警。
(2)查看網管異常事件,故障業務在對應時間點存在重路由失敗(事件錯誤碼為40497)。
處理方法:
盡快修復中斷的光纖/纜(如無法立即修復,可嘗試如下操怍):
(1)國將與故障業務源宿節點相同的鉆石級業務轉為銀級業務(選中需要操作的業務,單擊鼠標右鍵選擇“在線轉換”->“銀級”)。
(2)手工優化其他相關的ASON業務路由,確保中斷的業務有資源可重路由。
(3)若存在CP TEL DEGRADE告警,排查鏈路DCC通道的 D4-D12是否配置正常(“網元管理器”->“通信”->“DCC 管理”)。
3.3.2 ASON業務中斷
斷纖/斷纜觸發的ASON重路由后業務中斷(已排除ASON資源不足)
故障現象&判定:
(1)ASON網內故障:故障業務存在CP_SRV_INT/CP_SER_INT/SER_INT告警。
(2)ASON網外故障:業務源端有RLOS/RLOF/AU_CMM/AU_AIS/HP_UNEQ或CP_SRV_INT_OUT告警。
處理方法:
(1)若是ASON網內故障:一是解除鎖定:在“智能路徑管理”界面選中故障路徑,單擊鼠標右鍵選擇“設置路由屬性”,修改成不鎖定。二是業務優化:在“配置”>“SDH智能”>“智能路徑管理”>“維護”界面中,單擊優化。三是重新配置:去激活后重新激活業務;刪除智能業務后重建靜態業務。
(2)若是ASON網外故障:一是接入點保護倒換:若ASON業務的源/宿接入點存在1+1或1:1MSP保護,進行保護倒換。二是接入點告警清除:若ASON業務源/宿節點端口有RLOS/RLOF/AU_CMM/AU_AIS/AU_LOP/HP_UNEQ/HP_TIM等告警,先清除這些告警。
除了以上列舉的故障外還有一些比較簡單的其他故障,如電源故障、單板故障等。MSTP技術一定會被越來越多的人接受,其設備的日常維護與故障處理保障也將成為必要。