趙悅清
(廣州鐵路(集團)公司廣州通信段,廣州 510400)
隨著傳輸網絡規模越來越大,一個網絡內ECC互通的網元數有的已達300~400個。同時OptiX(華為傳輸系列)設備支持的數據通信通路(DCC)路數越來越多,OSN9500(華為傳輸設備系列)已經達到288路,OSN7500達到160路。例如武廣客運專線廣鐵集團岳陽東到廣州南就有OSN2000設備358臺,OSN3500設備39臺,全線共分8個ECC子網。前期因工程工期緊,對ECC網絡缺少規劃,造成網絡隱患,經常出現網元脫管等問題。因此有必要對ECC存在問題進行探討并優化,確保高鐵安全、有效運行。
1)導致網元脫管。
2)導致通道堵塞,使告警丟失或延遲上報,嚴重時影響業務配置/ 下載。
3)導致主機頻繁復位,嚴重影響業務。
4)對軟件加載效率和成功性的影響。
1)管理DCN本質上是個星形網絡,更重要的是其帶內帶寬始終不變,最大768 kbit/s。
2)在最短路徑尋徑方式下,導致數據擁塞。
3)DCC鏈路多的網元,信息量就集中,而DCN(數據通信網)帶寬始終不變。
4)在DCN網絡規模過大的情況下,在網絡拓撲因為故障或擴容出現變化時,會導致網絡路由信息需要較長時間才能收斂,加劇DCN擁塞。更嚴重的情況下由于信令的擁塞,可能出現路由振蕩。
傳輸網ECC路由表刷新、接收到的數據包流量過大導致內存不夠,產生的中斷過于頻繁,可能會導致主機產生異常復位。
1)影響復用段保護倒換。
2)影響SNCP(子網連接保護)保護倒換。3)影響TPS(支路保護倒換)倒換。
4)影響配置下發或網元數據下載。
1)會使路由計算速度下降
網絡變化時,路由廣播信息在網絡中不斷廣播,造成路由不斷重算,導致ECC路由長期得不到穩定。
2)容易導致ECC不停振蕩
大的網絡,中間有一個網元脫網的概率大大增加。而當該網元不可達時,路由信息會廣播到整個網絡,讓所有其他網元都知道該網元已經不可達。這一路由信息的擴散是需要一定時間的。有可能在此期間,該網元又變為可達的,或有其他網元又脫網了。這樣就會導致整個網絡不停振蕩。
1)只使用D1—D3時,實測單DCC鏈路的轉發能力為20 kbyte/s左右。
2)每個告警的開始、結束信息都要包含30個左右的字節。
3)T2000(華為傳輸網管)限定每秒最多處理600條告警;應答機制也會使處理速度變慢。
4)告警上報后網管未及時應答時,則會重復上報告警,加劇網絡擁塞。
1)當各DCC通道趨向于滿流量時,在入路最多的非網關網元處最容易出現流量擁塞,從而提前丟包。
2)實際網絡中,外接光纖最多的網元最可能出現擁塞,而不是網關網元。
無論是重路由信息的傳遞,還是告警信息的傳遞,都會造成管理DCN中的數據流量增大,從而造成管理DCN中的關鍵鏈路出現擁塞,造成問題。
1)目前采用了每包確認的機制,這樣,通過的中間網元越多,單個數據包傳輸延時越長,加載速度就越慢。
2)ECC規模過大時,可能出現網元脫網現象,持續時間有長有短,頻度不一。
①網管以1 min為周期與設備嘗試通信;連續2次連接不上,則判定通信連接中斷。
②假設第一次連接報文丟失,那么若第二次報文出現些許延時,就可能造成瞬間脫網的錯誤判斷。
認識到巨網ECC對網絡的穩定運行和日常維護造成的危害;傳輸網絡建設和維護時,應同時做好ECC網絡的規劃,避免由于ECC影響到日常維護工作和網絡的穩定運行。
將一個大的網絡劃分為多個小的ECC子網,并將各個ECC子網之間互通的STM-N光/電接口的ECC關閉,以確保路由信息和數據只在小網內傳播,不會擴散到其他網絡。
1)該方案需要增加網關網元的數量,每個子網通過網關網元與網管實現通信;網關通過DCN數據通信網直接和中心網管通信。
2)該方案能夠大大提高ECC通信網絡的穩定性,減少網絡維護的開銷,便于對整個網絡的管理。
3)該方案需要額外增加DCN數據通信網。
ECC的組網能力限制是指在網絡中通過DCC(或擴展ECC)互相連接的網元個數限制。即ECC組網限制是一個網關網元所轄的網元數。
1)為了避免因ECC網絡過大影響網絡的正常維護和運行安全,考慮各種因素、結合網上經驗、參考業界做法,OptiX網絡必須合理地規劃ECC組網。
2)對于OptiX網絡,一個ECC子網內允許的網元數量≤64。
1)可靠性原則:分割后,應能夠確保網絡在出現異常情況(斷纖、DCN異常、換板)時,網管能夠和分割前一樣仍可達各網元,避免影響維護。
2)保證性能的原則:各個ECC子網內的網元數控制在建議的數量范圍內。
3)按分層、分域的管理原則:分層(骨干網、省干、本地網;或主節點與下掛的網元之間)、分域(如不同節點之間)進行分割。
實施ECC分割優化方案后,網絡上任何一處斷纖或其他異常情況,應確保能夠達到分割前的ECC路由恢復(保護)能力。
1)劃分ECC子網,選擇網關網元。
2)確定DCN路由,確保路由的可靠性。
3)建立和調測DCN路由。
4)各子網之間ECC路由(包括擴展ECC路由)的關閉。
5)驗證和測試。
按分層、分域的管理原則,將相鄰網絡劃分為同一個子網;當子網中仍具有多個環路和鏈路時,網關網元取其中處于最多環路和鏈路的設備之上。
需要注意的是:方案實施后,對于環網,ECC分割方案應確保環上斷纖后各個網元仍能實現正常監管。
1)選擇設定在子網中星形業務的中心節點上,以避免大量的管理信息需要通過基于DCC這種窄帶寬信道傳送,減少DCN再發生擁塞的可能性。
2)或設置在子網中入路光纖最多的設備。以減少子網中基于DCC的管理DCN再發生擁塞的可能性。
考慮DCN通道的安全性,ECC分割時采用主、備網關的方式,避免一個網關的DCN路由失效時,失去對整個網絡的監控。
1)要求DCN帶寬不低于OptiX網絡使用的DCC帶寬;使用256 kbit/s的鏈路已滿足需求。
2)選擇的2 M通道由其他網絡(非監控網絡)提供,并且2 M通道具有環網保護功能。
3)建議使用帶外DCN通道,應提供主備的DCN路由,或使用主備網關。
4)建議選擇2 M通道傳送DCN路由。
對于與網管不在同一機房的ECC子網,使用主備網關網元,可以避免一個網關失效或DCN通道失效導致的網元無法監控的情況。
1)在ECC子網仍能成環保護情況下的應用
可以選擇一個主節點,再選擇一個其他的網元作為網關網元。
2)在ECC子網不能成環保護情況下的應用
如果原來成環的網絡,分割后無法再成環,采用主備網關也可以達到斷纖后監控各網元的目的。
1)關閉通過擴展ECC(自動/人工)實現的ECC子網之間的互通。
2)關閉通過STM(同步傳輸模塊)光/電口實現的ECC子網之間的互通。
目前,武廣高速鐵路(廣鐵集團管段)傳輸系統設置了8個網關網元,分別設置在汨羅東、長沙南、株州西、衡山西、郴州西、韶關東、清遠和東山通信站。傳輸系統共劃分8個ECC子網,每個ECC子網內有主備兩個網關,但由于相鄰子網關閉了相應的DCC通道,備用網關實際上不起作用。各網關網元通過一條2 M帶寬的電路匯聚到東山通信站的3個FE(以太網端口)口,由于這些2 M電路為帶內電路,若10 G鏈上出現主備用光纜中斷或某個網元出現宕機將造成網元大面積脫管;同時傳輸網絡規模大,對ECC網絡缺少規劃,也造成網絡隱患,經常出現網元脫管和ECC風暴問題。因此有必要對ECC進行優化。優化后,網絡運行正常,沒有出現因ECC設置造成的大量網元大面積脫管。
優化前ECC組網如圖1所示。
優化后ECC組網如圖2所示。

本文對傳輸通信網導致的問題和隱患進行初步探討,闡述了ECC對網絡的穩定運行和日常維護造成的危害,并對ECC優化中的分層分域地管理和分割原則提出新的看法和優化手段。該方法對華為傳輸設備ECC的維護和應用有很好的參考價值,該優化方法有待進一步完善和后續更加深入的研究。參考文獻
[1]華為.OSN3500技術手冊 產品概述分冊(V1.21).2009.
[2]華為.OSN3500技術手冊 組網與應用分冊(V1.21).2009.
[3]華為.OSN3500設備調試(V1.21)手冊.2009.
[4]華為.OSN3500&2500&1500 業務配置(V1.21)手冊.2009.
[5]鄧燁飛.SDH網絡告警的相關性分析[J].鐵路通信信號工程技術,2008(6):27-29.
[6]郭慶.基于SDH傳輸網ECC巨網分割的研究[J].科技創新導報,2008(36):14-15.