唐 思
?
傳輸設備的故障處理思路與方法
唐 思
沈陽鐵路局沈陽通信段網管中心,遼寧 沈陽 110001
眾所周知,SDH技術之所以得到廣泛的應用,除了它具有靈活的分插復用能力和強大的自愈保護功能外,還緣于其強大的網管能力。而SDH技術在鐵路通信中作為最基本的傳輸系統,起著至關重要的作用,所以在日常維護中需要掌握更多的故障處理思路和方法。由于產生故障的因素眾多、定位復雜,往往是維護工作的難點。基于此,論述了傳輸設備日常故障產生的原因及基本定位思路和測試方法。
SDH技術;故障原因;故障定位方法
傳輸設備經過工程安裝人員的安裝和調試后,都能正常穩定地運行。但有時由于多方面的原因,比如受系統外部環境的影響、部分元器件的老化、損壞、維護過程中的誤操作等,都可能導致設備進入不正常的狀態。此時,就需要維護人員對設備故障進行正確分析、定位和排除,使系統迅速恢復正常。
1.1 故障定位的基本思路
1.1.1 工程問題
工程問題是指由于工程施工不規范、工程質量差等原因造成的設備故障。此類問題有的在工程施工期間就能暴露出來,有的可能在設備運行一段時間或某些外因作用下,才暴露出來,為設備的穩定運行埋下隱患。因此,嚴格按工程規范施工安裝,認真細致的按規范要求進行單點和全網的調試和測試,是阻止此類問題出現的有效手段[1]。
1.1.2 外部原因
外部原因主要包括:供電電源故障,如設備掉電、供電電壓過低等;交換機故障;光纖故障,如光纖性能劣化、損耗過高,或光纖損斷,光纖接頭接觸不良;中繼電纜脫落、損壞或接觸不良;設備接地不良;設備周圍環境劣化等。
1.1.3 操作不當
此類問題一般都是因為維護人員對設備了解不夠深入所導致,也是在維護工作中最容易出現的情況。
對設備的一些細節性的性能特點及注意事項,對新老設備的一些特點和差別以及新舊版本的一些特點和差別不是非常清楚的情況下,就冒然開通,往往就會產生一些問題。
此類問題一般在現場改網,擴容,新老設備混用,新老版本混用,升級,使用新版本的備板,使用一些未經系統聯調的板件的情況下易出現[2]。
1.1.4 設備對接問題
傳輸設備傳送業務種類的繁多造成對接設備的復雜,同時,各種業務對傳輸通道的性能要求也不完全相同,所以在實際使用中有時會存在對接問題。主要表現在線纜連接錯誤;設備接地問題;傳輸、交換網絡之間時鐘同步問題;SDH幀結構中開銷字節的定義不同等。
1.1.5 設備原因
主要包括設備自然損壞或板件的配合問題。一般在設備運行較長時間后,板件因老化出現的自然損壞。其特點是:設備已使用較長時間,在故障之前設備基本正常,故障只是在個別點、個別板件出現,或在一些外因作用下出現[3]。
1.2 故障定位的常見方法
1.2.1 觀察分析法
當系統發生故障時,在設備和網管上將出現相應的告警信息。通過觀察設備上的告警燈運行情況,可以及時發現故障;故障發生時,網管上會記錄非常豐富的告警事件和性能數據信息,通過分析這些信息,并結合SDH幀結構中的開銷字節和SDH告警原理機制,可以初步判斷故障類型和故障點的位置。
通過網管采集告警和性能信息時,必須保證網絡中各網元的當前運行時間設置和網管的時間一致。如果時間設置上有偏差會導致對網元告警、性能信息采集的錯誤和不及時[4]。
1.2.2 測試法
通過觀察分析法不能解決的問題,如組網、業務以及故障信息相當復雜的情況和無明顯告警和性能信息上報的特殊故障情況。可以利用網管提供的維護功能進行測試,判斷故障點和故障類型。下面以環回為例進行說明。
環回操作是定位故障點最有效和常用的方法,要求維護人員熟練掌握。環回不需要對告警和性能做太深入的分析[5]。
進行環回操作前,首先必須確定需要環回的通道、時隙,環回的單板,環回的方向。對于同時出問題的業務,一般都具有一定的相關性,因此對環回通道進行選擇時應該堅持從多個有故障的網元中選擇一個網元,從所選擇網元的多個有故障的業務通道中選擇一個業務通道,對所選擇的業務通道逐個方向分析的原則[6]。
進行環回操作時,先將故障業務通道的業務流程進行分解,畫出業務路由圖,將業務的源和宿,經過的網元,所占用的通道和時隙號羅列出來。然后逐段環回,定位故障網元。故障定位到網元后通過線路側和支路側環回基本定位出可能存在故障的單板。最后結合其他處理辦法,確認故障單板予以更換排除故障[7]。
1.2.3 拔插法
對最初發現某種電路板故障時,可以通過插拔一下電路板和外部接口插頭的方法,排除因接觸不良或處理機異常的故障。在插拔過程中,應嚴格遵循單板插拔的操作規范。插拔單板時,若不按規范執行,還可能導致板件損壞等其他問題的發生。
1.2.4 替換法
當用拔插法不能解決故障時,可以考慮替換法。替換法就是使用一個工作正常的物件去替換一個被懷疑工作不正常的物件,從而達到定位故障、排除故障的目的。這里的物件,可以是一段線纜、一塊單板或一個設備。
替換法適用于排除傳輸外部設備的問題,如光纖、中繼電纜、交換機、供電設備等;或故障定位到單站后,用于排除單站內單板的問題。如某站光板有告警,我們懷疑收發光纖接反了,則可將收、發兩根光纖互換。若互換后,光板告警消失,就說明確實光纖接反。
如支路板某個2 M有“CV性能超值”或者“2 M信號丟失”的告警,我們懷疑是交換機或中繼線的問題,則可與其他正常通道互換一下。若互換后告警發生了轉移,則說明是外部中繼電纜或交換機的問題,若互換后故障現象不變,則可能是傳輸的問題。
替換法的優點在于方法簡單,對維護人員要求不高,是比較實用的方法,但對備件有要求[8]。
1.2.5 配置數據分析法
在某些特殊情況下,如外界環境的突然改變,或由于誤操作,可能會導致設備的配置數據遭到破壞或改變,導致業務中斷等故障的發生。此時,故障定位到網元單站后,可通過查詢、分析設備當前的配置數據;對于網管誤操作,還可以通過查看網管的用戶操作日志來進行確認。
顯然,“配置數據分析法”也適用于故障定位到網元后,故障的進一步分析,該方法可以查清真正的故障原因[9]。
1.2.6 更改配置法
更改配置法更改的配置內容可以包括時隙配置、板位配置、單板參數配置等。因此更改配置法適用于故障定位到單個站點后,排除由于配置錯誤導致的故障。更改配置法最典型的應用是排除指針問題。
如懷疑支路板的某些通道或某一塊支路板有問題,可以更改時隙配置將業務下到另外的通道或另一塊支路板,若懷疑某個槽位有問題,可通過更改板位配置進行排除;若懷疑某一個VC4有問題可以將時隙調整到另一個VC4。
在升級擴容改造中,若懷疑新的配置有錯,可以重新下發原配置以定位是否是配置問題。
當通過更改時隙配置不能將故障確切地定位到是哪塊單板的問題(線路板、交叉板、支路板、還是后背板問題)時,需進一步通過替換法進行故障定位。因此該方法適用于沒有備板的情況下,初步定位故障類型,并使用其他業務通道或板位暫時恢復業務。應用更改配置法在定位指針調整問題時,可以通過更改時鐘的抽取方向以及時鐘源進行定位。
1.2.7 儀表測試法
儀表測試法一般用于排除傳輸設備外部問題以及與其他設備的對接問題。如懷疑電源供電電壓過高或過低,可以用萬用表進行測試;若懷疑傳輸設備與其他設備無法對接是由于接地造成,則可用萬用表測量對接通道發端和收端的同軸端口屏蔽層之間的電壓值,若電壓值超過500mV,則可認為接地有問題,若懷疑無法對接是由于信號不對,則可通過相應的分析儀表觀察幀信號是否正常,開銷字節是否正常,是否有異常告警等[10]。
1.2.8 經驗處理法
在一些特殊的情況下,如由于瞬間供電異常,低壓或外部強烈的電磁干擾,致使傳輸設備某些單板進入異常工作狀態。此時的故障現象,如業務中斷、ECC通信中斷等,可能伴隨相應的告警,也可能沒有任何告警,檢查各單板的配置數據可能也是完全正常的。經驗證明,在這種情況下,通過復位單板,網元掉電重啟。
重新下發配置或將業務倒換到備用通道等手段,可有效地及時排除故障、恢復業務。
1.3 排除故障的一般思路
機房維護人員維護工作中,不免會遇見設備出現故障,在處理故障時,應該遵循“一查看、二詢問、三思考、四動手”的基本原則。
1.3.1 查看
首先到達現場后查看出現故障的現象,即查看設備的哪一部分出現故障,有何種告警產生,嚴重程度如何,造成多大危害等,才能透過現象看本質。
1.3.2 詢問
觀察完現象后,應詢問各階段現場人員,是何種原因造成了此故障,比如是否有人修改了數據、刪除了文件、更換了電路板、停電或雷擊、誤操作等。
1.3.3 思考
問明情況后,透過現象、原因等,根據自己的知 識作思考、分析,判斷何種原因可能引起該種故障等,作出較為正確的判斷。
1.3.4 動手
根據前面三個步驟找出故障點,通過修改數據、更換電路板及芯片等手段解決、排除故障。
因傳輸設備產生故障的原因眾多,在實際的處理過程中,我們應結合具體情況具體分析。靈活采用多種處理方法及時有效地進行處理,避免系統性能劣化對整個設備造成損傷,從而影響重要業務。SDH系統作為骨干傳送網,是數據網、核心網、無線G網等所有業務網的安全運行基礎,保障其穩定運行是運維管理工作的重點。首先分析定位人員須熟悉網絡、掌握SDH系統相關知識,能有序指導相關部門展開定位分析。其次,設備運行環境不達標會影響系統的穩定性,機房溫度、濕度和清潔度需努力整治實現標準化。
[1]云利峰.淺析大唐光傳輸設備常見故障及處理方法[J].內蒙古科技與經濟,2016(7):155-159.
[2]呂卓瓊,冷秀敏,欒洋.淺談傳輸網絡及設備的故障定位處理方法[J].科技視界,2015(25):273.
[3]李艷紅.試論SDH傳輸維護中故障定位處理技術[J].中國新通信,2011(20):88-89.
[4]肖瀟,唐艷冰.電力通信系統維護中幾例故障分析與處理[J].中國高新技術企業,2010(15):126-127.
[5]沈劍.SDH同步傳輸系統的故障處理方法[J].電信技術,2001(1):40-41.
[6]郝文娟.SDH系統故障定位及主要故障處理探討[J].硅谷,2014(24):49-50.
[7]張宗亮.SDH設備故障的定位與方法[J].中國電子商情:科技創新,2014(3):117.
[8]李艷紅.SDH傳送網中通道保護倒換問題分析[J].信息通信,2011(5):164-165.
[9]劉欣,葉敏.SDH傳輸網絡故障分析與處理方法[J].科研,2016(5):00047.
[10]王銘.芻議SDH傳輸維護中故障定位以及處理技術[J].華東科技:學術版,2015(12):29.
Troubleshooting ideas and methods of the transmission equipment
Tang Si
Shenyang Railway Administration Center of Shenyang Railway Administration, Liaoning Shenyang 110001
It is well known that SDH technology reason to be widely used, except it has a flexible points in multiplexing capability and strong self-healing protection function, but also due to its strong management capabilities. And SDH technology in railway communication do for the most basic transmission system, plays a vital role, so in the daily maintenance of the need to master more troubleshooting ideas and methods. Because of the many factors that produce fault, the location is complex, it is often difficult to maintain the work. This paper discusses the causes of the daily failure of transmission equipment and the basic orientation and testing methods.
SDH technology; fault reason; fault location method
TN929.11
A
1009-6434(2016)08-0105-03