王志東 蔣曉平 盧紅
摘 要:隨著電網的迅速發展,電網的安全、經濟、穩定運行對通信系統的依賴和要求越來越高,而通信技術的飛速發展,尤其是光通信技術越來越廣泛地應用于生產環境中。作為電力通信系統中重要組成部分的通信設備SDH,承載著電力信息、調度數據、通信數據、繼電保護、電視會議、視頻監控等生產和管理業務。SDH設備的正常運行,是各個變電站及供電所通信及網絡連接的重要保障,一旦SDH設備出現故障,可能導致整個變電站及供電所通信網絡陷入癱瘓,極大影響各部門工作的正常開展。文章主要研究分析SDH設備的CSF交叉板溫度越線、時隙對接、網絡數據不一致等幾個故障的處理總結。
關鍵詞:SDH;光傳輸系統;溫度越限;時隙;NCP;ECC;保護倒換
中圖分類號:TN915 文獻標志碼:A 文章編號:2095-2945(2018)32-0070-02
Abstract: With the rapid development of power grid, the security, economy and stability of power grid depend more and more on the communication system, and the rapid development of communication technology, especially optical communication technology, is more and more widely used in the production environment. As an important part of the power communication system, the communication equipment SDH, carries the production and management services such as power information, dispatching data, communication data, relay protection, video conference, video surveillance and so on. The normal operation of SDH equipment is an important guarantee for the communication and network connection of each substation and power supply station. Once the SDH equipment fails, the communication network of the whole substation and power supply station may be paralyzed, which will greatly affect the normal development of the work of various departments. This paper mainly studies and summarizes the treatment of several faults of SDH equipment, such as temperature crossing line of CSF cross board, time slot docking, network data inconsistency and so on.
Keywords: SDH; optical transmission system; temperature over limit; time slot; NCP; ECC; protection switching
1 概述
SDH光傳輸設備,是一種將復接、線路傳輸及交換功能融為一體、并由統一網管系統操作的綜合信息傳送網絡。SDH光傳輸設備可實現網絡有效管理、實時業務監控、動態網絡維護、不同廠商設備間的互通等多項功能,能大大提高網絡資源利用率、降低管理及維護費用、實現靈活可靠和高效的網絡運行與維護。SDH光纖通信自愈環網能最大程度的滿足電網穩定運行的需求,已成為大勢所趨。如何來維護好SDH光傳輸網是本文主要討論的問題。
2 SDH傳輸設備故障分析
2.1 SDH設備交叉板探測點溫度越限問題的分析、處理及防范措施
U31網管發現, 220kV變電站S385設備出現設備告警,通過告警詳細信息查看發現,網元內定位為CS[0-1-9-1]-Temperature[id:1],告警碼為探測點溫度(℃)越限(245)。
(1)故障檢查。首先檢查變電站內機房內空調狀態,發現空調都正常開啟,并且機房內溫度并不高,所以排除了因環境溫度偏高導致的設備溫度越限。隨即對SDH設備進行檢查,設備除了交叉板,其他部件并不告警指示燈在亮,并且設備散熱風扇都正常運行,故排除因散熱風扇故障導致的設備板卡溫度越限,且設備所在機柜前后柜門均為網面,并無機柜內散熱不良現象。對設備進行進一步檢查的時候發現,在設備散熱風扇的出風口,無明顯出風,隨即對設備防塵網進行拆卸檢查。拆卸防塵網后發現,防塵網的網眼已被灰塵嚴重堵塞,空氣幾乎無法通過防塵網。故此判斷,是防塵網堵塞導致SDH設備散熱出現故障,并最終導致設備溫度過高,告警出現。(2)故障原因分析。由于該220kV變電站為新建投運的站點,本應不會發生環境因素導致的設備運行問題發生。但是,由于在建站過程中,可能發生站內設備開始運行時間早于變電站內基礎設施及站內裝修完全結束,就會導致在站內基礎設施及裝修過程中,站內環境無法達到設備要求的運行條件,導致了設備運行的故障提前出現。比如,變電站內的通信設備,尤其是SDH等基礎通信設備,一般在機房未完全完工就需要安裝、調試、并試運行。在后期機房內墻面施工、鋪設地板、打掃衛生等施工環節中,必將產生大量灰塵。這些灰塵吸附在設備散熱風扇及防塵網上,最終導致防塵網堵塞,散熱出現問題。(3)機房潔凈度與新風量要求。a.一類、二類通信主機房內灰塵粒子濃度:直徑大于0.5μm的灰塵粒子濃度≤3500粒/升;直徑大于5μm的灰塵粒子濃度≤30/粒升,且不能是導電的、鐵磁性的和腐蝕性的粒子。b.凡與空氣接觸的墻壁、也板、頂棚表面不起塵。c.設有防止灰塵、腐蝕性氣體、有害氣體、易燃易爆氣體流入通信機房措施。d.設有排出蓄電池放出有害氣體到室外的措施。e.機房新風量以同時工作的最多工作人員計算,每人新鮮空氣量不小于30m3/h。
2.2 不同廠家的SDH設備之間的時隙對接原則
公司主要采用中興S385與S330 SDH設備組網,部分用戶變傳輸設備品牌為華為OSN3500、朗訊。在設備對接的過程中,我們需要注意的是不同廠家的2M時隙編號是否一致。支路位置編號通常有2種方式,時隙編號和線路編號。
(1)時隙編號。在SDH中低速率的SDH信號按字節間插的方式復用為高速率的信號。3個VC12按字節間插的方式復用為TUG-2幀,而7個TUG-2幀按字節間插的方式復用為TUG-3幀,3個TUG-3幀再按字節間插的方式復用為VC4幀。這樣,線路編號相鄰的VC12在VC4中將相隔21個Byte。如果以線路編號為1的VC12出現的位置為時隙1的話,線路編號為2的VC12將出現在時隙22的位置上。這時,我們就使用時隙22作為VC12的編號。(2)線路編號。從第一個TUG-3的第一個TUG-2開始,將同一個TUG-2內的VC12業務順序編號方式。處理過程:華為和RAISECOM品牌設備采用時隙編號方式,中興、烽火、MARCONI、朗訊品牌設備采用線路編號方式。不同廠家的傳輸設備對接時如果支路信號在VC-4中的位置不一致,必然會造成對接后業務不通。
我們也可以通過下面的公式得到,按照時隙編號方式進行編號的VC-12可以采用如下公式計算其序號:VC-12序號=TUG-3編號+(TUG-2編號-1)×3+(TU-12編號-1)×21。
按照線路編號方式進行編號的VC-12可采用如下公式計算其序號:VC-12序號=(TUG-3編號-1)×21+(TUG-2編號-1)×3+TU-12編號。
從計算出的時隙對照可以看出,不同廠家所表示的時隙號其實并不是同一時隙,所以兩種編號方式在實際應用中會有不同,我們只要根據3-7-3編號來上下業務就可以了。比如在中興設備測業務下發至1#VC4的第24個VC12上,即3-7-3結構中的編號為2-1-3的VC12。對端其他廠家使用時隙編號的設備下業務時,列如華為設備,只需要把2-1-3對應的44個VC12接出即可。目前中興U31網管上可以通過一個選項的設置在兩種編號方式之間自由切換,解決兩種編號方式帶來的對接維護不便問題。
2.3 SDH設備運行期間出現的網元數據不一致問題
中興SDH組網中,一個支環上相連的兩個網元:A變和B變,出現數據比較不一致現象,并且無法進行數據同步。對A變進行數據上載時,上載進度至98%后,進度條不動,等待1-2分鐘后提示ASN解碼失敗,上載失敗。對B變進行數據下載時,下載進度緩慢,預計需要10分鐘時間,且下載至100%進度時提示下載配置失敗。且進行數據比較時,比較進度一直顯示0%,等待1-2分鐘之后提示超時,數據比較失敗。
(1)處理過程。在機房使用自帶網管電腦接入城網設備Qx口,新建A變網元,并且上載數據,提示發生未知異常,操作失敗,說明不是統一網管問題,需要從其他方面排查問題。遠程telnet至A變SDH設備,查看NCP版本,顯示為最新版本,沒有問題。在A變現場拔出原設備ncp板,更換上新的ncp板后,通知網管運維人員進行數據上載下發測試,仍提示失敗。現場Telnet至城網設備,輸入route-a,查看路由,發現A變和B變的路由均選擇C變。網管屏蔽A變12槽1口DCC,將A變路由強制選擇D變方向,然后進行數據比較和數據上載,均操作正常。測試正常后,打開A變12槽1口DCC,排除A變SDH設備問題。至B變現場后,屏蔽B變11槽1口DCC,將B變路由強制選擇D變方向,然后分別對B變和A變進行數據比較和數據上載,均操作正常,業務也能正常下發。隨后對B變的下一個點C變進行數據下發和上載操作,均操作正常,因此判斷是B變至C變之間DCC路由有問題,需要進一步排查。現場更換B變NCP板卡,進行數據下發和上載操作,問題依然存在,排除NCP板卡問題。隨后telnet至B變NCP,進行sccreset操作,初始化B變所有的PPP通道,再進行數據下發和上載操作,問題依舊。經分析,影響DCC路由的板卡有NCP和光板,現排除NCP板卡問題,問題只可能在B變或者C變的光板。查看B變和C變的當前性能,均無性能值,也無告警,無法判斷光板好壞,只能采用排除法來處理問題。更換B變OL4*2光板后,對B變和A變進行數據上載和下發操作,均操作成功,問題得到解決。(2)原因分析。ECC即嵌入式控制通道,是英文Embedded Control Channel的縮寫,用來實現網元間的通訊,該協議構架在由SDH的D字節構成的DCC通道上。影響ECC協議通訊的單板有NCP和光板,NCP通過ECC通道實現網元之間網管信息的互通,網管通過接入網元的NCP板和子網中其他網元的NCP板ECC的互聯,管理整個子網;光板的控制單元提供接口和通道與NCP建立通信,完成性能統計,告警檢測,溫度控制,狀態控制,板間通信等功能,業務處理單元實現ECC轉發處理等功能。綜上所述,本次問題是由于光板問題,造成DCC通道不通暢,但并未導致DCC路由完全中斷,所以導致濟川變、官河變網元能夠管理,卻出現數據比較不一致告警,以及上載下發數據超時等問題。
3 結束語
在排查故障,進行故障點定位時,首先要排查設備是否運行正常,對設備每個模塊進行無故障確認,發現問題以便及時處理。
處理故障時,盡可能不要觸碰運行正常的設備,避免二次故障的發生。
在進行業務配置時,時隙的分配是重要的一部分,由于時分模塊容量有限,對于大型組網,業務較多較復雜時,很可能出現時分不夠的提示,不僅會造成人為的業務中斷,而且還必須重新分配時隙,大大的增加了工作的難度。因此,對時隙的了解以及合理分配是非常重要的。
運維人員應當熟悉SDH NCP和光板的工作原理和功能,并熟悉網管DCC通道路由的走向,從而判斷設備出現數據不同步的原因,并及時解決問題。
參考文獻:
[1]李方健,周鑫.SDH光傳輸設備開局與維護(第二版)[M].科學出版社.
[2]孫學康,毛京麗.SDH技術[M].人民郵電出版社.