尚麗霞
摘要:誤碼問題是傳輸維護中經常碰到的問題。本文首先介紹一些誤碼檢測原理以及誤碼產生的原因,然后論述了誤碼問題的處理思路和方法。
關鍵詞:光傳輸;誤碼檢測;誤碼處理誤碼是指經接收機接收、判決、再生后,數字碼流中的某些比特發生了差錯,使傳輸的信息質量產生損傷。誤碼問題是傳輸設備維護中經常碰到的問題,雖然有時小誤碼問題并不會對業務造成很大的影響,但當出現誤碼時,說明傳輸系統中局部已經出現性能劣化,需要盡快處理,否則有可能發展成影響業務的重大故障
1誤碼機理
1.1 誤碼檢測
光傳輸系統對誤碼的檢測,是以“塊”為單位的。當同一塊內的任意比特發生差錯時,就稱該塊為誤碼塊。SDH光傳輸設備中按分段分層的思想對誤碼進行全面系統的檢測。具體有再生段誤碼B1、復用段誤碼B2、高階通道誤碼B3、低階通道誤碼V5。一般來說,有高階誤碼則會有低階誤碼。例如,如果有B1誤碼,一般就會有B2、B3和V5誤碼;反之,有低階誤碼則不一定有高階誤碼。如有V5誤碼,則不一定會有B3、B2和B1誤碼。
由于高階誤碼會導致低階誤碼,因此在處理誤碼問題時,應按照先處理高階誤碼后處理低階誤碼的順序來進行處理。
1.2 誤碼相關的性能和告警事件
光傳輸系統本端檢測到誤碼時,除本端上報誤碼性能或告警事件外,本端還將誤碼檢測情況通過開銷字節通知對端。根據本端和對端上報的這些性能和告警事件,可以方便地定位是哪一段通道或哪一個方向出現誤碼。
2誤碼問題常見原因
2.1 外部原因
⑴光纖性能劣化、損耗過高。接收光功率低于接收靈敏度。⑵傳輸距離過短、未加衰減器,導致接受光功率過載。⑶光纖接頭不清潔或連接不正確。⑷設備附近有強烈干擾源。⑸設備接地不好。⑹設備散熱不良、工作溫度過高。
2.2 設備原因
⑴線路板接收側信號衰減過大、對端發送板故障、本端接收板故障。⑵時鐘同步性能不好。⑶交叉板與線路板、支路板配合不好。⑷支路板故障。⑸風扇故障,導致設備散熱不良。
3誤碼問題處理方法
3.1 常用方法
⑴告警性能分析法。處理誤碼問題時,通過對誤碼性能、告警事件仔細分析,定位出故障點,再通過環回或替換法進行驗證和排除故障。分析內容包括:通過網管查詢BBE、FEBBE、指針調整性能事件,REI、B1OVER、B2OVER、B3OVER、BIP-EXC、SD、SF等告警事件。產生性能/告警時間的網元/單板/通道,最好能給出受誤碼影響的業務通道路徑圖。性能/告警事件發生的時間:對網管上報的性能/告警事件,要查詢是何時上報的,尤其是對瞬間誤碼過大而引起的業務瞬斷,要查詢告警/性能事件的產生時間,由于北方凌晨、午夜、中午、傍晚這4個時間點是氣溫變化比較大的時間點,對于架空或裸露的光纖影響比較大,如果光纖質量不好或敷設不好,在光纖的接頭處,受氣溫變化影響比較大,會發生短暫的突發性大誤碼,導致有規律性的業務瞬斷。性能/告警事件發生的頻度:通過查詢15分鐘和24小時的寄存器,可以看出性能/告警事件發生的頻度,是否有大致規律,這樣也有利于下一步的故障處理操作。
⑵逐段環回法。環回法尤其是對VC4和STM-N接口進行環回,會造成VC4和STM-N通道內其他業務的中斷,一般比較少用。但若條件允許,可使用環回法快速定位出故障站點。在出現誤碼過量導致業務中斷情況時,可以對出現誤碼過量的單板通道進行環回,如果本端做外環回后誤碼數量有明顯變化,則可以認為本站或后續站點的單板存在問題。如果故障已經定位到單站后,可以進一步進行光板、支路板或交叉板環回,定位出故障單板。
⑶替換法。對于設備器件性能不良或性能劣化的情況,替換法都是故障定位的好方法。通過單板對調、光纖對調、交叉板主備倒換或網絡保護倒換,查看誤碼是否發生變化,進而定位和排除故障。替換的對象可以是一段光纖、一個設備、一塊單板、一個業務通道或一個光器件等。替換法適用于排除傳輸外部設備的問題,如光纖、中繼電纜、交換機、供電設備等;或故障定位到單站后,用于排除單站內單板、通道、模塊的問題。
⑷經驗處理法。在一些特殊情況下,通過復位單板、掉電重啟等手段可有效排除故障、恢復業務。但因為該方法不利于故障原因的徹底查清。所以除非情況緊急,一般盡量少用。
3.2 處理步驟
第一步:首先排除外部的故障因素,如接地不好、工作溫度過高、線路板接收光功率過低或過高等問題。第二步:分析線路板誤碼性能事件,排除線路誤碼。觀察線路板誤碼情況,若某站所有線路板都有誤碼,則可能是該站時鐘板問題,更換時鐘板。若只是某塊線路板報誤碼,則可能是本站線路板問題,也可能是對端站或光纖的問題。若定位出是單板的故障,可通過更換相應單板解決。若定位出是光纖的故障,可通過更換相應光纖解決。如果允許的話,可使用環回法定位故障。包括VC4通道的環回、電口環回和通過尾纖光口環回。第三步:分析支路誤碼性能事件,排除支路誤碼。若只有支路誤碼,則可能是本站交叉板或支路板有問題。更換相應支路板或交叉板即可。
總之,在實際處理誤碼問題時,一定不要被太多的告警和性能所迷惑,按照先高階、后低階的順序來處理,先采用告警性能分析法,關注誤碼發生的時間、發生的頻度、誤碼數量,然后通過逐段環回,找出發生故障的單站甚至單板,最后使用替換法來解決故障。