武海英
【摘要】 SDH2.5G光板—S16光板在處理光路和業務方面正常,但處理倒換K字節異常,影響了復用段環的正常倒換,造成復用段環上的業務中斷。由于K字節只有在倒換時才發送,無法提前通過告警等發現異常,正因為S16光板本身無告警,給故障處理帶來了一定的難度。
【關鍵詞】 光板 K字節 異常 中斷
SDH2.5G光板—S16光板在處理光路和業務方面正常,但處理倒換K字節異常,影響了復用段環的正常倒換,造成復用段環上的業務中斷。由于K字節只有在倒換時才發送,無法提前通過告警等發現異常,正因為S16光板本身無告警,給故障處理帶來了一定的難度?,F將由于太原一樞紐S16光板處理倒換K字節出現異常導致部分臨汾業務中斷的故障情況做以下詳細的介紹。
一、系統網絡情況介紹
省南環WDM32λ系統建于2002年,以太原一、二樞紐為核心,覆蓋太原以南的榆次、臨汾、運城、晉城、長治、陽泉6個地市,采用華為Optix BWS 320G設備,每波速率為2.5Gb/s或10Gb/s,共32波,現已占用24波,承載IP2.5G/10G顆粒及SDH2.5G/10G傳輸系統。其中第λ8波承載太原臨汾環SDH2.5G系統,為兩纖雙向復用段保換環,環上開有臨汾的多條2M固話交換電路、大客戶出租電路、2條114百兆電路。
省南環WDM32λ系統網絡結構圖如圖1。
第λ8波承載的太原臨汾環SDH2.5G系統網絡結構圖如圖2。
二、故障現象
臨汾告部分臨汾2M固話交換電路、大客戶出租電路、2條114百兆電路均不好。查看這些電路均開在省南環WDM32λ系統第λ8波承載的太原臨汾環SDH2.5G系統中,分別為臨汾S-1N0009、臨汾S-1N0012、臨汾FE0001、臨汾FE002。查看網管太原臨汾環SDH2.5G系統中205-臨汾-1-PQ1板和205-臨汾-3-PQ1板的63個2M口均有TU-AIS告警、205-臨汾-14-EFS板4個FE口均有VC3-AIS告警 。查看太原臨汾環SDH2.5G系統太原二樞紐-臨汾段之間發生復用段倒換。
三、故障處理及定位過程
1、首先查看太原臨汾環SDH2.5G的復用段倒換狀態,未發現異常,后重新啟停全網復用段協議無效。
2、接著根據省南環WDM32λ系統第λ8波的信號流查看90-臨汾-7-TWC板無誤碼,84-榆次-5-TWC板無誤碼,145-太原二樞紐-4-RWC板有大誤碼,初步判定是省南環WDM32λ系統第λ8波太原二樞紐收榆次之間波道不好,導致第λ8波下掛太原臨汾環SDH2.5G發生倒換。
3、為盡快恢復波道,需要通過空閑波道倒接的方法臨時搶通榆次到太原二樞紐之間的第λ8波。由于太原二樞紐為無人值守機房,通知太原派人到二樞紐處理。
4、為盡快搶通受影響的臨汾業務,決定先在網管上通過更改業務配置,即業務走環網另外一個方向路由的方法來快速恢復業務。利用太原臨汾環SDH2.5G臨汾—太原段之間第1-8個VC4時隙中空閑VC4時隙重新配置交叉連接數據,先恢復了205-臨汾3-PQ1板的的2M業務,即臨汾S-1N0012上的所有2M電路,接著恢復了205-臨汾-14-EFS板的第2個百兆業務,即臨汾FE0002電路。
5、由于太原臨汾環SDH2.5G臨汾-太原段之間空閑VC4時隙不足,剩余臨汾業務無法通過更改業務配置的方法進行恢復。接著又對網元復用段配置、復用段倒換事件等信息進行采集分析,逐條分析倒換事件,發現211-二樞紐倒換沒有正常執行,分析三個站點的K字節傳送,發現202-太原的5槽位S16板始終接收不正確的K字節,但沒有發送,初步判斷可能為202-太原的5槽位S16板故障,處理K字節有誤碼,影響復用段環倒換。
6、太原維護人員到達二樞紐機房后,榆次與太原二樞紐用空閑通道進行倒接,榆次到太原二樞紐之間波分側恢復正常,太原臨汾環SDH2.5G太原二樞紐到臨汾的光路顯示恢復,10分鐘后,太原臨汾環SDH2.5G復用段倒換結束,剩余部分中斷的臨汾業務恢復。至此,臨汾業務全部恢復正常。
7、對現網數據再次進行分析,基本確定是202-太原的5槽位S16光板故障。需要在晚上0點以后進行測試處理。
四、故障的最終徹底解決
晚上0:00分開始,對太原臨汾環SDH2.5G進行測試處理。首先在網管上模擬中斷202-太原到205-臨汾之間的光路,太原臨汾環SDH2.5G倒換,倒換后業務正常。接著更換202-太原的5槽位S16板,倒換恢復后,修改205-臨汾的3槽位PQ1業務配置路由,恢復回原來的路由—臨汾和太原二樞紐之間。模擬中斷205-臨汾到211-二樞紐之間的光路,觀察205-臨汾的3槽位PQ1板業務,未發現中斷,分析復用段倒換事件,未發現異常,確認復用段倒換正常。后將太原臨汾環SDH2.5G逐段模擬光路中斷進行倒換測試,均未發現有業務中斷情況,確認問題解決。
五、后續建議和改進措施
1、光板在處理光路和業務方面正常,處理倒換k字節異常時,由于K字節只有在倒換時才發送,因此無法提前通過告警等發現,只能通過倒換測試發現。今后要定期對SDH環進行倒換測試,以便能及時發現網絡隱患。
2、在處理波分側故障時,在SDH環倒換時,首先確認SDH環倒換情況,若倒換失敗,則需要馬上恢復波分光路,以便業務能快速恢復。
3、目前省南、北環WDM32λ在網時間已有11年,設備已進入后生命周期,需要盡快整體替換該網絡。