陳鄭超 岳銘凱
(北京全路通信信號研究設計院有限公司,北京 100073)
鐵路數據網應用FRR技術研究
陳鄭超 岳銘凱
(北京全路通信信號研究設計院有限公司,北京 100073)
數據網承載實時性業務后,對流量的中斷非常敏感,討論當網絡節點或鏈路失效后,如何通過快速重路由FRR(快速重路由)實現對流量的快速恢復。
數據網;快速重路由;鐵路應用
隨著數據網網絡規模的擴大,承載的實時性業務(如語音、流媒體、以及視頻會議等)不斷增長,對流量的中斷非常敏感。當網絡節點或鏈路失效后,如何實現對流量的快速恢復越來越重要。
當網絡中某條鏈路或者某個節點失效后,網絡中其他路由器無法立刻發現,仍然向該鏈路或該節點上轉發流量,導致經過這些失效節點的報文被丟棄;或者在路由器發現鏈路或節點失效后,由于網絡收斂,導致全網路由轉發表不一致,出現轉發層面的環路。導致網絡產生瞬時流量中斷或流量回環,在網絡收斂完成后才能恢復正常轉發。
快速重路由(FRR)機制正是為解決以上問題而提出,主要實現以下功能。
*鏈路失效的快速發現。
*備份路徑的快速提供。
*在網絡收斂過程中避免路由環路。
目前業界FRR的主要技術實現有在IP網絡環境下的IP FRR,以及在MPLS網絡環境下的MPLS TE FRR、LDP FRR、VPN-FRR等多種實現方式。
IP FRR仍然是依據傳統IP轉發模式,通過配置本節點備用路由方式實現,在設備檢測到原本主用路由不可用時,不立即廣播路由更新信息并進行全網路由計算,而是利用預配置的備份路由條目優先進行故障修復。在全網路由更新期間,優先通過備份路由進行數據轉發,盡量減少轉發流量的中斷。
目前,支持IP FRR功能的路由協議有靜態路由、OSPF、IS-IS和RIP。配置IP FRR時,可以使用路由策略靜態指定備份下一跳(4種路由協議都支持),可針對指定的IP地址前綴應用FRR;也可以采用自動計算備份下一跳的方式(僅OSPF和IS-IS支持),由路由協議自動計算,所有OSPF或IS-IS路由都會有備份下一跳。
由于IP轉發是無信令連接,本節點的IP FRR備用路由配置,包括備用路由的建立和流量的轉發,都不會影響其下一跳節點以及其備用下一跳節點的轉發路由表,在臨時狀態中,流量在被倒換至備用下一跳之后的去向和狀態,對于本節點是不可見的,因此進行IP FRR配置必須在網絡方案的設計上來規避IP FRR可能導致的流量環路,通過人工計算確保每條備份路由沒有發生環路,全網考慮IGPCost值的部署,以保證其部署后的可用性。
同時,由于目前IP隧道(例如:IPv6 over IPv4隧道等)不支持BFD(雙向轉發狀態檢測),導致當IP隧道鏈路故障時,設備無法進行快速備份鏈路切換,因此IP隧道方式組網也暫不支持IP FRR。
傳統路由選路協議通常選擇最短的路徑(跳數)或鏈路帶寬(鏈路狀態協議)作為路由計算參數,不考慮鏈路負載等因素,因此即使鏈路發生擁塞,通常也不會進行鏈路切換。而MPLS TE則是將MPLS技術與流量工程技術相結合,利用資源預留協議,為需要保護的鏈路建立指定的LSP隧道,保證關鍵鏈路的資源預留以及優化,在資源緊張的情況下,還可以根據優先級和搶占參數的情況,由高優先級隧道向下搶占低優先級隧道的帶寬資源;并通過備份路徑和快速重路由技術,在鏈路或節點失效的情況下,通過保護隧道,為關鍵業務提供保護。
MPLS TE FRR是MPLS TE技術中用于實現鏈路和節點冗余保護的機制。當LSP鏈路或節點設備端口故障時,由故障節點設備發起保護倒換,承載流量切換至保護隧道傳輸,從而保證數據傳輸的連續性,同時全網重新進行LSP更新,建立新的LSP拓撲。
目前備份實現方式有2種:Bypass方式和Detour方式。Bypass方式是用1條保護路徑保護多條LSP;Detour方式則是通過一比一方式實現對關鍵LSP的保護。目前在實際部署中,Bypass方式使用更為廣泛。
MPLS TE FRR的特點是網絡快速局部保護,通常部署在對網絡可靠性要求比較高的承載網絡中,用于實現當網絡中關鍵鏈路出現局部失效時的快速倒換,減少對承載業務的影響。
在沒有部署流量工程的MPLS網絡環境中,可以采用LDP FRR技術實現快速重路由,路由器借助LDP協議實現路由標簽分配,快速對路由變化作出響應,達到50 ms保護切換的要求。
在配置了LDP快速重路由功能的網絡中,當接口故障(通過接口自己感知或結合BFD檢測)或者主LSP不通(結合BFD檢測)時,LDP快速重路由功能會將流量快速切換到備份LDP LSP上,實現對主LSP的保護,保證流量的快速切換。
LDP FRR技術同MPLS TE FRR相比,具有明顯優勢:
1)LDP FRR的部署不依賴于MPLS TE技術,對承載設備的壓力較小。
2)本地化標簽分配,不需要進行全路徑標簽分配協商。
3)多節點分布式處理,可同時實現鏈路保護、節點保護和路徑保護,不需要分別建立備份LSP。
但是LDP FRR也存在類似于IP FRR的局限性,由于標簽為本地分發,因此在建立備用轉發方案時,需要通過手動計算確認備份路徑標簽轉發表的可用性,存在部署的擴展性問題,因此目前尚未見到實際部署方案。
CE雙歸屬是MPLS網絡中非常普遍的一種組網形式,但是MPLS TE FRR作為局部網絡保護技術,不能實現業務的端到端保護,一旦PE節點發生故障,只能通過端到端的路由收斂、LSP收斂來恢復業務,其業務收斂時間與MPLS VPN內部路由的數量、承載網轉接跳數密切相關,目前在實際網絡測試,一般在5 s左右。
VPN FRR則是利用VPN私網路由快速切換技術,通過在遠端PE設備中預先配置指向本地主用PE和備用PE的轉發表項,并結合PE設備的故障快速探測,在PE節點設備故障情況下,實現端到端業務收斂時間小于1 s。
鐵路數據網采用MPLS技術路線,所有業務流量均通過MPLS進行承載,同時考慮網絡實際部署案例,建議鐵路數據網FRR技術路線選擇MPLS TE FRR,在網絡設計中,應首先明確FRR是提高業務承載質量的有效手段,但并不是網絡部署的終極目標,在進行該技術部署時,要綜合考慮以下問題。
首先,FRR是業務臨時倒換保護措施,FRR生效后,保護隧道所在的物理鏈路負載必然會上升,因此在網絡設計中仍然需要通過輕載(Over Provisioning)來保障保護鏈路可以同時承載業務流量以及保護流量,以及相應的QoS。為了避免在網絡保護倒換啟動后導致網絡擁塞,因此在網絡設計的帶寬測算時,應考慮在正常情況下,鏈路的帶寬利用率不能超過50%。
其次,FRR切換至保護鏈路只是臨時措施,網絡自身仍會采用make before break機制來進行IGP收斂和首端LSP重優化,并采用顯示共享進一步降低對業務帶寬的占用,因此,在主用鏈路為備份隧道預留帶寬不僅會造成網絡資源的浪費,還會對其他正常TE LSP的最優路徑計算造成影響,因此在網絡設計中建議FRR的保護鏈路是一對一的,即預留帶寬計算只考慮備用鏈路保護主用鏈路,在收斂完成后,網絡仍然進行回切,不要考慮由主用鏈路對備用鏈路進行備份。
最后,基于TE的FRR在實現機理上不同于以往的底層SDH通道、復用段保護,是一種轉發平面先于控制平面進行的保護,對IGP、CSPF、RSVP、LDP收斂等帶來的影響,對網絡流量流向因不同協議收斂機制不同而導致相互之間的作用以及影響還沒有太多實際經驗可供借鑒,需要在網絡運維與管理中進一步進行深入研究。
TE FRR只是局部保護技術,需要明確當鏈路或節點故障發生在TE域之外時,網絡的故障切換及恢復仍然依賴于傳統的IGP以及LDP的收斂來實現。
目前實現FRR的節點保護需要采用LDP FRR,該技術擴展性較差,目前部署FRR都應用在網絡的核心轉發平面,而目前核心設備的可靠性遠遠高于廣域網鏈路,因此不建議進行節點保護策略實施。
部署FRR需考慮在網設備的兼容性,建議在FRR域內盡量采用同一廠家設備。因為雖然各廠家都聲稱其主流設備可實現對TE及FRR的兼容,但根據實際測試結果和以往部署經驗,各廠家在某些特性的具體實現上仍有細微的差別,需要對設備的配置參數進行微調,以達到最佳的協調狀態,這在網絡運行初期尤其是缺乏既往TE維護經驗的情況下難以實現。
鐵路數據網部署FRR技術可以有效減少端口及鏈路故障對承載業務的影響,但FRR實際部署應用案例比較少,建議在網絡建設初期可以對典型業務試點,在積累了運維經驗后進一步進行結合多種技術,優化數據網承載業務體驗。
If a data network carries real-time services, it will be highly sensitive to traffi c interruption. The paper discusses how to quickly recover the traffi c communication through Fast Reroute (FRR) after the network node failure or link failure.
data network; ERR; railway application
10.3969/j.issn.1673-4440.2015.02.009
2015-02-09)
中國鐵路總公司科技研究開發重大課題項目(2300-K1130004.01)