李志安 屈偉平
摘 要 本文主要介紹了SDH光纖設備常見的故障和其產生的原因,并在此基總結了解決該類設備常見問題的方法,最后列舉了SDH故障的案例,并對其進行分析處理。
關鍵詞 SDH 故障定位 排除方法 維護
1 引言
SDH(Synchronous Digital Hierarchy,同步數字系列)是PDH的改進版,它的發明是電信傳輸體制的革命之一,原因在于它可以對同步信號進行傳送、分插、交叉連接和復用,不僅可以通過衛星、光線,還可以微波等進行傳送,是一種新的傳輸體制。
SDH光纖通訊技術的廣泛應用為軍隊的資源共享做出了巨大貢獻,而且在不斷迅速發展,但是要想光纖傳輸的正常,就必須保證網絡設備的正常運轉,但是設備的故障在所難免,因此,有必要提高對網絡設備的維護能力,出現問題可以及時解決,這樣就能使其更好的為軍隊的網絡建設和信息傳輸服務。
因此,有必要提高通信維護人員的理論水平,提高其的業務熟練度,比如:掌握和SDH相關的基本理論知識、出現問題時各種警告代號的含義和解決措施和警告信號的來龍去脈和影響等等。同時還要熟悉網絡的基本概念,比如系統配置,數據的采集和傳輸,同時加強分析故障和解決故障的能力。
1 傳輸故障成因分析
引起SDH傳輸故障的原因主要有:工程質量問題、維護操作不當、設備自身問題和外部設備問題等。
1.1 工程質量問題
施工期間的不規范施工和偷工減料很有可能導致SDH的傳輸故障,但是這些問題并不一定能及時暴露出來,有的可能施工時就能發現,有的是在工程竣工后發現,有的可能在設備運行期間才能被發現。要想徹底根除這類故障,必須嚴把工程質量關,施工期間要加強監管,項目驗收時要認真細致。因此竣工調試和測試十分必要,同時做好測試報告,方便日后的設備維護。
1.2 維護操作不當
由于維護工作人員的操作不當和失誤都有可能導致SDH的傳輸故障。引起造作不當的原因很多,比如對系統的具體情況了解不夠,不規范操作,不按照規程對設備進行檢修。還有新老設備的不同或者系統版本的新舊導致的操作不當,因此,這方面一定要加強維護人員的基本素質和維護技能。
1.3 設備的自身問題
比如設備的故障和損壞都有可能導致SDH傳輸故障,比如:元器件的損壞、系統故障和網線故障等。
1.4 設備外部問題
比如:傳輸線路故障、系統配置的不合理、電纜的接觸不良、供電不足、設備的對接失敗和突然斷電等也有可能導致SDH的傳輸故障,因此,出現問題時要從多方面考慮不能片面,這樣才能快速排除故障。
2 故障常見處理方法
在SDH設備的維護過程中,為了快速準確的發現問題和解決問題,因此,有必要對發生的故障及時定位,定位越準確越有利于故障的排除,比如定位到單板。這這也對維護人員除了更高的要求,首先,必須了解各故障的表現;其次要了解各故障的成因;再次,要了解問題處理的原則;最后,要掌握常見故障的處理方法,這也是重中之重,因此有必要重點介紹,下面我們就詳細介紹各種故障處理法。
2.1 報警分析法
由于SDH傳輸設備的廣泛使用,因此,隨時都有報警的發生,正確掌握各種報警的含義和特征有利于故障的定位和解決。因為,系統故障時,網管都會記錄各種報警,包括發生的時間、位置以及其他設備的表現,根據這些特征結合開銷字節和警告原理機制,對故障的排除十分有用。怎樣才能更好的使用報警分析法,關鍵是及時準確獲取報警信息。因此,有必要了解故障的來源,故障的來源一方面是網管的記錄,這個來源非常容易也比較詳實,而且可以前后對比,通判考慮,方便故障的排除;另一方面是觀察和記錄設備的指示燈。雖然這種方法具有時效性,但是比較片名,不能反映設備過去情況,不夠全面。因此在運用報警分析法時一定要綜合考慮。
2.2 環回法
環回法也是通常判斷設備故障的常用和有效的方法,因為,通常情況下傳輸的信號都可以形成一個回路,這也環回法應用的基礎,也是環回法名稱的來源,這種方法在電路增開和電路調度方面應用廣泛。環回法的優點是不需要對警告信息的分析就能實現對故障的快速定位,而且操作簡單易學測。當然,有利就有弊,回還法也有其缺點,就是影響正常業務的進行,這也是此方法輕易不使用的原因。
環回法可分為硬件環回與軟件環回。其中硬件環回徹底,但是不能遠程操作,也不方便。軟件回環則恰恰相反,方便也可以遠程操作,但是對故障的定位不如硬件回環準確。
如圖1所示,在該鏈形組圖中,A站為業務集中型網管中心站,即A站和B站和C站都有業務聯系。下面我們就舉例分析回環法的應用。某天,網管發現和A站和C站之間業務中斷。利用回環法,利用誤碼測試儀監測A站和C站之間的業務聯系,發現業務中斷;再利用環回法對C站進行軟件內回環,發現業務正常,由此可得C站存在問題;在C站的接口轉換板等處再做硬件內回環,發現業務失常,因此表明,C站的接口轉換板、電纜、支路板或者設備背板有問題。通常情況下,為了避免對該板其他業務的影響,在更換支路板之前,應首先測試電纜和電纜端之間的連接是否正常,如果正常,就說明是支路板的問題,更換后即可排除故障。
2.3 數據分析法
利用網管平時記錄的報警信息和性能數據,在分析SDH的傳輸故障時可以對故障進行初定位和“定型”。通常情況下警告信息的獲取方法有網管系統和涉筆的運行指示燈。
利用報警信息和性能數據可以方便我們了解設備的運行狀況和故障先兆,把故障扼殺在萌芽狀態。當故障出現時,通過這些信息可以知道設備出現問題前的運行狀態和報警信息以及其他設備的癥狀等。但是在用數據分析法時,一定得核對系統的時間設置,時間正確的話可以上報,時間不統一的話可以進行時差轉換之后進行上報。
同樣如圖1所示,A站為網管站,A與C之間業務中斷,且不能在A站登錄C站,B站東(E)有MS-RDI警告和HP-RDI警告,A站與才站之間有LP-RDI警告。通過上述警告信息我們可以得知C站無法接收B站所發出的信號,B站可以接收C站所發的信號。因此故障的原因可能是E向光板信號發送失常;C站光板無法正確接收信號根;C站所接收信號有問題;還有就是光路問題。
2.4 替換法
如果拔插法還不能解決故障的話,替換法也是一種選擇。所謂替換法,就是用正常工作的元件去替換被懷疑有故障的元件,從而實現對故障的定位,達到排除故障的目的。這里所提到的元件是指任何設備,無論是復雜到一個設備或者是小到一段線纜。
替換法主要用于排除用以傳輸的外部設備問題,比如電纜、供電設備、光纖和交換機等,或者排除某個單站內的單板問題。舉例如下:當某一個站的光板出現警告,有可能是收、發光纖的正反接錯問題。互換接收線,如果報警消失則說明確實是光纖接反導致的。如若支路板的信號有性能超值或者信號丟失的警告,有可能是中繼線或交換機的問題,可以與其他工作正常的通道互換,若警告轉移,則可以證明中繼線或交換機的問題,若不是,則可能是傳輸故障。該方法的優點是簡單實用。
2.5 斷開光路法
當傳輸網是環形時可采用斷開光路法進行故障診斷。如圖2所示,A站也為集中型業務中心站。某天發現B站和C站的通道中有大量TU-AIS和信號丟失警告,而且指示燈頻繁閃爍,影響了B站和C站的ONU設備的正常工作。但是網管處監測是正常的,可以進行初步判斷,說明問題出現在B站或者C站的交叉板上。首先斷開A站與C站之間的連接,報警依舊。回復A站和C站之間的連接,再斷開B站和C站之間的連接,C站業務顯示正常,B站警報不斷。利用網絡拓撲圖,初步判斷是B站的問題,B站的交叉板更換之后業務正常。
2.6 更改配置法
在出現故障時,對系統更換設備有可能有利于故障的定位和排除。該法主要用于排除由于配置錯誤引起的故障。更換配置包括更換配置的內容包括板位配置、時隙配置和單板參數配置等。如若懷疑故障出現在某通道或者支路板上,可以進行時隙配置更換,把業務換到其他通道或者支路板,以解決問題;如若懷疑某個支路板的槽位問題,通過板位配置更換可以進行故障排除;如果系統升級或者擴建之后出現問題,懷疑是配置問題,則可以進行重新配置以檢驗是否配置問題。
2.7 儀表測試法
該方法主要用于排除外部設備問題或者設備的對接問題。例如懷疑供電電壓不正常,可以用萬用表進行測試;如若懷疑設備的接地問題,則可以用外用表測試相關通道之間的電壓值,如果超過0.5V,則可說明是接地問題。總之,儀表測試法在分析故障時準確方便,但是對維護人員要求較高且對儀表的性能有要求。
2.8 經驗處理法
在通常情況下,如果故障出現問題,但是無論怎么檢查都發現不了問題,沒有警告也沒有配置錯誤。此時可以通過經驗來進行判斷,對故障進行定位。比如供電異常、電磁干擾和通信中斷等都可以用此方法進行故障定位。但是此方法對維護者有要求,必須是老練或者經驗豐富的人員,新手或者業務不熟練者則不行。
3 SDH傳輸告警故障案例分析及處理
為了加強對傳輸故障何其解決方法的進一步理解,掌握常見問題的解決思路和方法,下面就舉幾個案例進行分析,具體如下。
3.1 光路出現阻斷
當光路出現阻斷時,網管上會有OFF、RS-LOS和LOF等光路警告。倘若是單纖斷,B網元就會收到OOF、RS-LOS、LOF等報警,A網元則會出現MS-RDI等報警,相應指示燈會閃爍指示。出現這類問題時,維護人員可以根據報警信息并用光功率計測量接收對收方向的光纖,倘若有信號,有可能是光盤、入端光尾纖或者本端光接頭的問題;反之,可能是光纜阻斷的問題,以此來對故障進行排查,方便故障的定位,進一步用OTDR進行故障的確定。另外,接收端沒有信號輸入,也有可能出現當R-LOS報警,此時應根據報警進一步進行故障鑒定和定位。
3.2 誤碼告警
產生的誤碼主要包含于B1、B2、B3和V5等字節中,網管方會產生BBE、SES、ES和UAS等報警。這些報警課進一步分為近端報警和遠端報警。B2類的誤碼報警通過M1字節告知對端次報警的;而B3類的誤碼通過G1字節的b1~b4比特回送;還有,V5 類的b1b2誤碼報警通過該字節的B3比特進行回送,與此相對應,對端在回送后在會產生MS-REI、HP-REI和P-REI報警。
如若是B1與B2誤碼報警,則可以通過本地終端或者網管系統登陸報警網元,如果只是單端誤碼,則通過核對本站S16盤的相應光接口的接收功率是否正常,如果不正常則進行相應處理;如若是雙端誤碼,可以對光纖進行測試,但是通常情況下光纖不會出問題。
如果B3與V5出現誤碼,可以用SDH無碼分析儀進行相應測試并進行回環處理,直至找到故障點,然后再進行相應的檢查處理。有時,傳輸維護過程中也有誤碼現象的產生,而且報警種類多,因此有必要熟練掌握各個無碼報警的含義及其解決方法,并不斷進行經驗積累,結合誤碼信息進行障礙的迅速排除。
3.3 UNEQ報警
例如,UNEQ報警,此報警是通道未裝載業務時的報警。該報警在高階通道時的信號標記由C2監測并產生,其值為00H,此時警告為HP=UNEQ。與之相對應,其報警由V5的b5b6b7沉聲,此時,同時報警為LP-UNEQ。
從UNEQ的產生原理我們可以知道,當光路接受不正常時便會產生此報警,因此我們可以核查該段業務路由的連接,如果有錯誤便對其修改,如若有遺漏便進行增補,并刪除所有路由時隙,并重新進行數據的下放。如:某網管的PD1盤的某個接口出現LP-UNEQ報警
3.4 T-ALOS告警
TT-ALOS報警比較常見,產生的原因是本端的2M盤無法接收用戶的報警所致。如果是鏈接交換設備,則可以核查交換機的DDF架;如果是交換機未有信號送來,則可以檢查交換機的一方;如若信號發出但是沒有收到,則可以認真核查每個相關的接口,必要時可以用萬用表進行測試。
3.5 AIS告警
由于高階通道出現故障時,下游站點會受到該站點發送的當“1”碼,而且本地端口有TU-AIS報警,對應端口產生LP-RDI報警。所以出現此類報警時,首先核對高階通道是否有報警產生,再進行下一步處理。若只是2M上有這種情況,應首先檢查本地接收通道的各環節。
3.6 HP-SML及LP-SLM告警
當接收端月發送端的信號不一致則會有HP-SLM報警出現,進而出現報警:高階通道信號標記字節失配。與此相對應,在低端時,則會出現LP-SLM報警。
處理此警告時,首先要查看報警的優先級,應先處理優先級高的報警;如果只有這種報警產生,則查看是對端與本端機盤開銷字節的內容一致性,通常情況下,該問題是由于雙端的信號不同所致,只需進行字節的重新設置即可解決。需要注意的是,誤碼也有可能產生此報警。由于J1、J2 和C2字節的修改會導致電路的中斷,因此不能輕易修改其值。此通道主要用于設備開通時的通道測試。
上述問題都是SDH維護過程種的常見問題,由于篇幅所限,這里僅僅給出常見警告的處理方法。當警告很多時,要根據經驗綜合考慮,并認真分析其產生機理和特征,以方便日后的故障排除。
4 結語
由于SDH的光通信傳輸設備所出現的故障多種多樣,因此處理起來就比較復雜,這就需要維護人員加強自身知識和技能的學習,同時不斷總結經驗,理論和實踐相結合,并具體問題具體分析,這樣才能做好SDH光纖設備的維護工作,同時使自己在工作中得到提高。