吳桂龍
(中國鐵路北京局集團有限公司北京通信段,北京 100038)
以張唐線為例,2015年12月30日張唐鐵路開通運營,全長528 km,途徑張家口站、孔家莊站、張家口南站、趙川北站、龍門站、赤城站、楊木柵子站、豐寧站、塔黃旗東站、灤平東站、承德西站、李家營站、半壁山站、團飄莊站、豐潤西站、唐山西站、豐南南站、唐海站、曹妃甸北站,后更名為唐包線。
唐包線傳輸網匯聚層速率為2.5 G,采用1+1線性復用段保護,接入層傳輸速率為622 M,采用兩纖雙向復用段保護,全線只有一條24芯光纜。傳輸設備主要采用華為OSN系列設備,以太網板支持物理層、鏈路層協議,類似二層交換機。
唐包線數據網張家口路由器華為NE20E-S8采用IP-Trunk模式雙POS口接入客專數據網,豐潤網監室路由器華為NE20E-S8采用ETH-Trunk模式雙GE口接入客專數據網。
唐包線紅外線局端接入方式:車輛5T機房兩臺路由器分別與客專數據網兩臺路由器對接,紅外線網管主、備通道分別接入車輛5T機房兩臺路由器。
唐包線牽引運動局端接入方式:供電機房兩臺路由器分別與客專數據網兩臺路由器對接,牽引遠動網管主、備通道分別接入供電機房兩臺路由器。
唐包線電力運動局端接入方式:供電機房兩臺路由器分別與客專數據網兩臺路由器對接,電力遠動網管主、備通道分別接入供電機房兩臺路由器。
唐包線紅外線業務通過傳輸設備的以太網板共享匯聚,采用星形主、備方式進行組網,每個探測點主用匯聚接入張家口交換機華為S2700,每個探測點備用匯聚接入豐潤網監室交換機華為S2700,兩站的交換機分別上聯本站路由器,業務網關設置在路由器上。共21個紅外線站點,41個紅外線探測點,主、備分別兩個匯聚口,劃分2個虛擬局域網。如圖1所示。

圖1 唐包線紅外線組網示意Fig.1 Schematic diagram of infrared ray networking on Tang-Bao line
唐包線牽引遠動業務通過傳輸設備的以太網板共享匯聚,采用環形串接方式進行組網,主用匯聚接入張家口交換機華為S2700,備用匯聚接入豐潤網監室交換機華為S2700,兩站的交換機分別上聯本站路由器,業務網關設置在路由器上。牽引遠動共分為5個主備環,46個站點,主、備分別一個匯聚口,劃分5個虛擬局域網。如圖2所示。

圖2 唐包線牽引遠動組網示意Fig.2 Schematic diagram oftraction tele-control networking on Tang-Bao line
唐包線電力遠動業務通過傳輸設備的以太網板共享匯聚,采用環形串接方式進行組網,主用匯聚接入張家口交換機華為S2700,備用匯聚接入豐潤網監室交換機華為S2700,兩站的交換機分別上聯本站路由器,業務網關設置在路由器上。電力遠動共分為13個主備環,137個站點,主、備分別一個匯聚口,劃分13個虛擬局域網,牽引遠動與電力遠動組網方式一致。
以牽引遠動為例,用戶側反映唐包線牽引遠動業務主用通道全部中斷。
1)查看唐包線傳輸和數據網網管,確保各項性能、指標正常,沒有與之相關聯的異常告警,排除傳輸、數據網設備、光路、單板或端口等故障。
2)通過用戶側反映的故障現象,聯系相關站段故障現象一致,PING測用戶側服務器和復式終端地址正常,排出用戶側服務器和復式終端故障造成主用通道全部中斷,用戶側沒有相應排查手段,需通信維護人員協助排查。
3)初步判斷為牽引遠動業務主用所帶的站點發生了環路、廣播風暴、ARP攻擊等問題時,將匯聚端口阻塞,造成以太網匯聚業務主用通道全部中斷。
4)查詢傳輸、數據網網管數據配置,登錄唐包數據網張家口路由器,關閉牽引主用通道對應的5個子接口,再分別開啟牽引遠動主用對應的5個子接口,逐一與用戶側進行確認,判斷為子接口3問題。
5)對照圖紙臺賬,登錄唐包線傳輸網管,逐站關閉子接口3下掛的傳輸以太網業務口,分別與用戶側進行確認,最終判斷為某個站點故障,關閉故障站點,通知用戶側安排人員進行排查、處理。
6)開啟除故障站點外的所有子接口和業務端口,業務恢復,通知現場通信人員配合相關用戶進行排查。
針對此類故障,由于唐包線傳輸以太網匯聚業務某個站點業務側有環路,產生廣播風暴,使張家口交換機對路由器上行接口帶寬被占滿,將端口阻塞,造成唐包線牽引遠動業務主用通道全部中斷,需用戶側進行詳細排查。
通過以上故障案例、判斷過程、原因分析,歸納出傳輸以太網匯聚業務存在以下幾點問題。
1)唐包線數據網匯聚點只有張家口和豐潤網監室,如發生環路,產生廣播風暴或出現ARP攻擊等問題,造成主用或備用業務全部中斷,高鐵及客專線等傳輸以太網匯聚業務也存在類似問題。
2)即使每個環都劃分了VLAN,但是使用同一個匯聚口,其中一臺設備發生了環路、廣播風暴、ARP攻擊等問題,也會造成匯聚口DOWN掉,從而影響相關業務。
3)定位故障點需通信人員通過傳輸網管進行復雜操作,分別只保留一個環,其他環全部甩掉,判斷某個環的問題,然后逐站將環內業務端口DOWN掉,每一步需聯系相應用戶側網管查看設備狀態,故障定位時間較長,一般需要2~3 h,才能定位故障站點,再通知用戶側對故障站點進行處理,網管操作復雜,需依次進行排查。
4)用戶側只有業務中斷時才進行反饋并組織處理,當通道1(主用)或通道2(備用)出現故障時,業務不受影響,沒有第一時間反饋并組織排查、處理,或用戶側無法監控備用通道,判斷不出備用通道好壞。當另外一條通道故障,造成業務中斷時,才會聯系通信人員配合處理。
1)改變現有唐包線數據網單一組網結構,增設數據網匯聚及接入站點趙川北站、赤城站、豐寧站、灤平東站、李家營站和曹妃甸北等,將傳輸以太網匯聚業務進行“匯聚分擔”,并將環形串接組網方式改為主備鏈組網方式,如圖3所示。

圖3 優化后傳輸以太網匯聚業務示意Fig.3 Schematic diagram of optimized transmitting Ethernet aggregation service
優點:徹底解決唐包線數據網單一組網缺陷;數據遷移簡單,業務影響時間較短,不需用戶側各點進行數據修改;減小故障影響范圍,壓縮故障處理時間;便于日常維護,提高勞動生產率;有效保障傳輸以太網匯聚業務安全。
缺點:需要增加一部分資金投入;數據網需重新進行組網、調試、開通。
2)更換張家口和豐潤網監室路由器下掛的交換機,具備三層交換和流量控制功能。
優點:資金投入較少;數據配置策略簡單。
缺點:不能徹底解決唐包線數據網單一組網缺陷;張家口或豐潤出現重大故障會造成主用或備用通道全部中斷;后期業務擴容和新業務接入會造成資源不足的情況;數據遷移過程中,業務影響時間較長;配置流量控制功能,由于每個環業務站點數量不一致,可能會造成業務延時較大,實時性不高。
3)用戶側逐站更換各業務站點接入交換機為三層交換機,具備三層交換和流量控制功能,將網關設置在相關本地業務點,配置相關策略,增設數據網網管用于監控,逐站更改相關業務地址。
優點:通信專業維護PE設備,其他專業維護CE設備,與用戶側分清網絡維護管理界面;故障排查更加簡單。
缺點:資金投入較大;相關專業配置數據網網管,需專業人員進行維護;各業務地址需要重新分配,每個業務點需安排人員重新調試、開通;張家口、豐潤更換配置更高的三層交換機,啟用VRRP協議,開通張家口至豐潤交換機互聯電路。
綜上所述,通過優化傳輸以太網匯聚業務組網結構,同時實現“匯聚分擔”,并將環形串接組網改為主備鏈組網的方式,以較小的資金投入,解決了數據網單一組網缺陷,提升網絡容災能力,縮小了業務影響范圍,壓縮了故障定位時間,使組網結構更加簡單、層次更加分明,故障判斷更加迅捷,業務資源更加豐富,并能有效防止單站業務發生環路、廣播風暴、ARP攻擊等問題對匯聚端口的影響,大幅提高了鐵路傳輸以太網匯聚業務的安全性和可靠性。