張琳 王藝旋
[摘 要] 針對電力通信系統廣泛應用的光傳輸設備SDH的核心部件交叉單元,提出了交叉單元在渠首變此次故障的處理方案。本方案依著減少傳輸設備故障,保證業務正常傳輸的原則,對傳輸設備網管告警中具體的現象及處理進行了系統分析。
[關鍵詞] SDH;交叉單元;告警
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 22. 031
[中圖分類號] TM73 [文獻標識碼] A [文章編號] 1673 - 0194(2014)22- 0051- 02
0 引 言
目前光通訊在通訊方式中占據主導地位,也是電力通訊網的主要傳輸方式。電力系統通信網是我國專用通信網中規模較大、發展較為完善的專網。在工作中如何有效地做好光通訊設備的日常維護,確保其安全穩定地運行,是非常重要的。
在日常運行維護中南陽供電公司渠首變SDH光設備出現的交叉單元所發生的故障及處理分析過程,使更深刻了解了數字同步的重要性,同步是保證通信質量的關鍵因素,若失步就會出現業務質量受損甚至中斷。本文對該故障進行了簡單的歸納和總結。
1 故障現象
220kV渠首站省網光端機在前期正常運行中先是在早上8時在X1(HLXC384),X2(HLXC384),I7(MCS5)槽位出現BIT Slightly Degrade(BIT輕微劣化)告警,不到1分鐘渠首變所有業務板卡出現BIT Failed(BIT失敗)告警,相關光口DEG(信號劣化),2M業務端口LOS(信號丟失),業務中斷。對端相應站相關光口7:57左右出現DEG(信號劣化),8:00左右出現LOF(幀丟失)告警。渠首變網元在8:06失連。在8:28左右,渠首變網元與網管通信恢復,相關中斷業務也同時恢復,X2(HLXC384)出現BIT Failed(BIT失敗)告警,根據BIT Code,該告警指示TMU DSP Failed。
如圖1所示。
2 故障定位
板卡的故障類型一般分為硬件故障、軟件故障和外圍設備故障3類。現單板在位,但業務出現中斷。外圍設備光纖無中斷電源也并無異常,業務配置在前期工作中正常運行。
該故障出現有以下特征或步驟:
(1)當該故障發生在時鐘(TMU)主用的HLXC384上時,另一塊備用HLXC384上會出現BIT Slightly Degrade(BIT輕微劣化),其他業務板卡則出現BIT Failed (BIT失敗)告警,業務中斷。
(2)隨后當BIT Failed(TMU DSP Failed)出現在故障HLXC384上,時鐘切換,業務恢復。
(3)當故障HLXC384被更換,所有告警消失。
通過綜合分析這些告警,交叉單元在主板不能正常工作的情況下,”1+1”備用交叉板也沒能及時切換至通道正常運行。可以將故障定位到交叉連接單元主用時鐘(TMV)所在板卡(HLXC 384)故障。
3 故障分析
本次故障主要原因是隨著通信網絡規模的擴大,BITS設備的投運,BITS設備可以避免時鐘劣化的現象,網元傳輸的誤碼率可以更好地控制,但是SDH網元僅僅只是時鐘精度高是不夠的,SDH網還要實現同步。
SDH設備由子架和功能單元組成。其中功能單元中的交叉連接單元由交叉板組成,設備支持交叉板“1+1”熱保護,就是一臺設備上同時插兩塊交叉板,一主一備。當主用交叉板故障后,備用交叉板立即啟動代替主用板工作,信號失效時間小于50ms,從而達到不間斷運行的目的。但是使用中往往只設置一個跟蹤時鐘。
故障是由于主用時鐘(TMU)所在HLXC384板卡故障引起。由于XDM設備時鐘單元在HLXC交叉連接卡上,無論外部時鐘(External)、線路時鐘(Line)或內部時鐘(Internal)均是通過該時鐘單元(TMU)給各業務板卡和通信板卡提供時鐘,當這個時鐘質量降低但又未達到切換條件時,導致各業務板卡上承載業務均出現信號質量嚴重下降,從而導致了中斷。最后時鐘單元因板卡故障最終不能工作時,出現BIT Failed引發時鐘單元切換到備用板卡上的TMU,從而恢復了該網元的時鐘,除故障HLXC外的各板卡隨之工作正常。
4 故障處理
(1)確認各站HLXC板卡上時鐘(Timing)已設置關聯互為保護。
(2)在HLXC出現BIT Slightly Degrade告警時,有時可能因不是主用等原因暫未影響業務,也需及時處理。
(3)在HLXC同時出現BIT Slightly Degrade,其他各業務卡也出現BIT Failed時,需立即檢查時鐘所在HLXC,并從網管上冷復位該板卡,以使時鐘和業務立即切換到備用HLXC的TMU上。
(4)處理結果是我班組人員進站更換故障板卡(X2 HLXC384)后恢復正常。
5 結 語
南陽地區省網光纖傳輸網絡只有一套系統組成,所以SDH光設備的各個單元中“1+1”備用板的作用就尤為重要。另外在SDH設備中由不同的板卡相互配合而工作,任意一種板卡故障都有可能引起SDH系統故障,這些故障將影響本網元的所有業務。現電網通信業務中接入有穩控保護、差動保護、遠動等各種業務,若業務接入的中斷,會給電力系統造成損失,SDH中不間斷運行為電網的安全可靠運行提供強有力的后盾,應引起我們足夠的重視。