張 平
張 平:北京鐵路局北京通信段滄州車間 助理工程師 061000 河北滄州
隨著光纖通信設備的快速增長和通信業務量的急劇膨脹,光傳輸網中的各類故障也不斷出現,已成為影響通信質量的主要因素。有些故障相當復雜,需要維護人員具有扎實的理論知識和實踐技巧,才能做到迅速、準確、安全排除故障,把影響和損失降到最低。為此,總結故障維修的原則和分析思路,并舉例說明。
定位故障的基本原則是先外部、后傳輸;先單站、后單板;先線路、后支路;先高級、后低級。
在定位故障點時,先排除外部的可能因素,比如光纖線路、交換機、電源的故障,以及設備接地不良、周圍工作環境惡劣等,再考慮傳輸設備的問題。要遵循由大到小,逐步縮小故障范圍的查找方法。首先,判斷是哪個單站的問題,然后查找是哪個單板問題。由于線路板的故障常常會引起支路板異常告警,在定位時應按照“先線路、后支路”的順序去查找。在分析告警時應先分析高級別的告警,如危急告警和主要告警,再分析低級別的告警,因為高級別的告警常常會引起低級別的告警。遵循以上原則,可以少走彎路,節省時間。
當故障發生時,要盡快掌握現場設備與網管終端的告警信息,以及相關部門或人員提供的情況,掌握得越詳細越好。然后對這些信息進行分析,初步判斷故障范圍,為下一步工作奠定基礎。
環回法分軟件環回和硬件環回。
1.軟件環回。通過軟件設置的方法,對設備端口(光接口和電接口)或通道進行的環回操作。軟件環回分外環回和內環回。其中,當需要弄清單板的接口模塊及外部電纜是否正常時,應設置外環回,然后再用誤碼儀測試,根據測試結果可以判斷出單板的接口模塊與外部電纜是否工作正常,按不同接口分為SDH和PDH接口板外環回。當需要弄清設備的交叉單元及業務路徑是否正常時,應設置內環回。在單板上設置了內環回后,根據誤碼儀測試的結果就可以判斷交叉單元和業務路徑是否正常,按不同接口分為SDH和PDH接口板內環回。
2.硬件環回是用尾纖和自環電纜對物理端口進行(光接口和電接口)的環回操作。硬件環回時,需確保光模塊的接收光功率小于過載光功率。為防止光功率過高損壞接收光模塊,在硬件環回時,應加上衰減器來降低輸入光功率,根據環回位置,SDH接口的硬件環回分為本板自環和交叉自環。
環回法可將故障定位到單站或在分離外部故障時使用,不依賴告警、性能事件的分析,方便、快捷,但可能影響ECC及正常業務。
當故障定位到某個單板或外部接口插頭時,重新拔插,如果故障消失,說明是接觸不良,否則考慮其他方法。拔插法操作簡單、快捷,能分清是單板接觸不良還是本身有故障。
替換法就是用一個性能完全正常的部件去替換一個被懷疑工作不正常的部件,需要有備板,通過替換來判斷該部件是否有問題??商鎿Q的部件包括線纜、光纖、法蘭盤、電源、單板和設備等。替換法適用于排除外部設備的問題,或者當故障定位到單站后,用于排除單站內單板的問題。替換法,操作簡單,但需要注意的是在插拔單板時要小心,避免弄壞板件,造成人為故障。
故障定位到單站后,可查詢設備當前的配置數據,如邏輯系統及其屬性、復用段的節點參數、線路板和支路板通道的環回設置、支路通道保護屬性,以及通道追蹤字節等是否正常來定位故障。對于網管誤操作,還可以查看網管的操作日志來進行確認。配置數據分析法對查清故障的真正原因非常有效,但定位故障的時間相對較長,且要求維護人員對設備非常熟悉。
實例1:某地傳輸網采用中興通訊的ZXMP 320設備組網,整個網絡由3個S320組成,構成一個無保護鏈結構,中心局設在A網元,A網元的7#OIB1的第1個光口接B網元7#OIB1的第2個光口,B網元7#OIB1的第1個光口接C網元7#OIB1的第2個光口,各網元間都有2Mb/s業務,網絡結構如圖1所示。在網管上發現B與C網元的業務偶有瞬斷,同時在A光口與C光口出現OFS告警,2Mb/s業務出現AIS及UAS告警。

圖1 網絡結構
故障分析:無光纖中斷、接地故障等,排除外部原因。由于A網元與C網元同時出現OFS告警,這種2個網元同時故障導致業務不通的可能性很小,因此排除A與C網元,把故障定位在B網元??赡苁墙徊姘濉r鐘板、電源板及OIB1出現問題。對交叉板與時鐘板,先用拔插法,再使用替換法,故障依舊;在更換OIB1時,發現所有的單板出現復位現象,懷疑電源板的供電電路出現問題或者背板總線出現故障,更換電源板后,故障消失。
實例2:傳輸網元A,B,C為一鏈形組網,需要在A和C 2個站點間增開2個2 Mb/s通道(中間跨1個站點),如圖2所示。按照步驟,在A站、C站將時隙配到電支路板,B站相應時隙穿通,配置命令下發后,顯示配置成功。在對新開通的通道測試中發現,C站硬件環回,A站掛表測試,信號正常,但當C站斷開環回時,信號仍然正常,判斷通道中存在軟環。

圖2 傳輸網元A,B,C為鏈形組網
故障分析:從網管上查看通道中并沒有做環,于是初步判斷B或C站有問題。首先到達B站,將A方向尾纖斷開,軟環消失,恢復后仍然存在,再將C方向尾纖斷開,軟環也消失,說明軟環存在于C站。因C站并沒有告警,故判斷可能交叉板死機或NCP板死機,將交叉板切換后,軟環仍然存在,問題集中在NCP板上,懷疑NCP板數據沒有下發到網元。于是決定重啟NCP板,結果NCP板拔插后,工作恢復。
實例3:傳輸網元A,B,C為一鏈形組網,A站為主時鐘,B和C抽取線路時鐘,B和C之間有專網電話通道,如圖3所示。B站和C站之間的2 Mb/s通道誤碼非常大,音頻電話雜音也很大。

圖3 傳輸網元A,B,C為一鏈形組網
故障分析:登錄網管后,沒有發現告警,但性能參數不好。查詢時鐘源狀態,發現B網元上排電源時鐘板時鐘狀態不能鎖定,切換到下排電源時鐘板后,時鐘狀態能鎖定,故障排除,于是判斷出故障的原因是由于B網元上排電源時鐘板時鐘單元造成的。
總之故障定位有多種方法,各有其適用范圍,各有其特點、在實際應用中,常常需要幾種方法綜合運用,才能取得好的效果。
[1]田國棟.光纖通信技術[M].西安:西安電子科技大學出版社.2008.
[2]孫桂芝、孫秀英等.光傳輸網絡組建與北京鐵路局運行維護[M].北京:機械工業出版社.2011.