【摘要】介紹了OTN數字傳輸系統的常見故障類型并通過實例介紹了傳輸系統出現故障后的分析與處理。
【關鍵詞】傳輸系統故障分析與處理
OTN數字傳輸系統的運行一般較穩定,但仍會有故障情況出現。出現故障后如何處理,盡快查出故障原因,快速排除故障,恢復系統的傳輸業務,是維護人員的第一要務。
一、設備內部故障的案例分析與處理
設備內部硬件故障通常在設備長時間連續運作下會出現,作為維護人員,可以通過OMS告警維護終端查看,從硬件單板工作狀態的顯示燈查看到等。通常有:BORA板卡故障、機柜內部電源故障、單件板卡故障、機框至ODF配線柜接口的光纖連接松動等。
實例分析
故障現象:使用OTN節點箱進行業務傳輸的UPS、高頻開關電源、廣播等設備的監控通信中斷,無法監控以上設備的運行狀態。
故障分析與處理:首先對UPS、高頻開關電源等設備進行檢查,發現設備處于正常狀態。檢查傳輸設備,發現OTN節點箱第三槽位的ET100DAE板卡指示燈異常,由板卡上的指示燈顯示,判斷該ET100DAE板卡無電源供電,板卡不工作。多次復位ET100DAE板卡后,故障依舊。由此判定板卡不是軟件掛死,而是硬件問題。之后更換該板卡,并進行撥碼設置,插入傳輸機柜,連接線纜。各指示燈正常閃爍,設備恢復,各設備網管維護終端顯示通信恢復。
由上可知,板卡上的指示燈信息一定要牢記,這樣利于現場的快速判斷與處理。如上所提到的,ET100DAE板卡有3個指示燈,每個端口有兩個指示燈,故障當時對應含義如下:HW紅燈:板卡無電源供應;RUN不亮:板卡不可用,CPU不工作;ERR不亮:在板卡正常工作情況下無錯誤;LA不亮:無連接;HD不亮:全雙工方式工作。
由此判斷:HW紅燈表示該板卡無電源供應,板卡未工作,因此其余指示燈全部不亮。在故障處理的時候要熟悉常規的故障現象:硬件故障,HW燈亮,此類故障只能更換板卡;軟件卡死故障,顯示某個業務有告警,通常重啟或插拔板卡后恢復。
二、由其它外接用戶系統引起故障的案例分析與處理
用戶常見的故障現象可以分為個別用戶故障和大面積用戶故障,這就要求維護人員能夠識別用戶系統的所有故障并能夠判斷它所屬的故障類型。
實例分析
故障現象:在一次雷擊過后,相應區域內的信號系統業務中斷。
故障分析與處理:根據故障報告記錄,可知在雷擊過后,信號系統監控終端上有關該區域內的信號系統業務信息全部丟失。到達設備房觀察傳輸設備的運行狀態,指示燈顯示正常,無告警,詢問網管得知OTN網管沒有告警。維護人員在信號系統使用的傳輸通道上進行打環測試,發現信號系統監控終端側只能發送數據,卻接受不到數據。根據以上情況,初步判斷信號系統業務通道故障。檢查本地信號業務在連接OTN的RS422通道前所經過的數據保安單元,發現線纜接口處線纜有燒損的跡象,由此判斷由于雨天雷擊造成傳輸設備的RS422數據接口損壞。在更換傳輸系統RSXMM板卡時發現RS422接口有一針腳有燒損印跡,板卡更換后,信號系統故障現象消失,系統恢復。
RSXMM板卡上配置的業務包括信號、無線、時鐘3種業務。信號系統監控終端顯示區域內業務信息全部丟失時,無線、時鐘系統均沒有告警,RSXMM板上其它業務仍能正常工作,說明RSXMM板的RS422數據接口上燒糊的針腳正好對應信號的數據通道。假設本地傳輸設備接地不好造成雷擊,RSXMM板塊損壞,應該同時影響到時鐘、無線業務。傳輸設備有機柜接地和節點箱接地兩重保護,目前尚未發現板卡被燒壞的實例,由此推斷出可能有以下兩種可能原因:一是信號系統戶外終端設備或設備房防雷絕緣不佳,從而造成雷擊電流通過信號系統數據連接線時造成線纜溫度升高,致使燒焦保安單元和RSXMM板上RS422口的針腳;二是通信傳輸設備出現防雷問題,導致打雷時正好只損壞了RSXMM板卡上的信號系統對應的數據接口針腳。
三、總結
OTN傳輸系統故障的因素是多種多樣的,只有在日常維護過程中,多動手實踐,勤于思考,善于發現問題的根本原因并及時解決才能不斷地提高系統的運行質量,所以,要求在進行故障分析的時候,一定要從多角度出發、詳盡地了解故障現象和靈活地運用邏輯分析能力,同時要做好對各種數據的記錄,整理每一次故障分析與處理的全過程用于事后總結、積累經驗,不斷提高故障處理的能力。