摘 要:概述了保證QoS的MPLS網絡生存性中各種保護和恢復策略,包括它們對QoS的不同要求、算法思想、應用領域、各自的優缺點等。將MPLS網絡生存性與DiffServ模型結合起來,針對不同的業務要求選出不同的保證QoS的生存性方法。
關鍵詞:生存性;服務質量;多協議標簽交換網絡
中圖分類號:TP393文獻標志碼:A
文章編號:1001-3695(2007)06-0306-03
0 引言
多協議標簽交換(MPLS)是將IP層與鏈路層相結合的一種新的分組轉發技術。它可以支持具有QoS的流量和更高級別的生存性要求,從而加強IP網絡的可靠性。考慮QoS的網絡設計關鍵是要考慮網絡的生存性。網絡生存性可以提供在不同網絡層或時間段上運行的不同故障管理機制。在MPLS網絡中有故障發生時,其流量通常可以重新切換至備份標簽交換路徑(LSP)上。所以MPLS提供的故障檢測和故障恢復要比在其他網絡協議或技術上更快、更有效。
最近,在互聯網工程任務組(IETF)提出的草案[1]中詳細描述了有關MPLS生存性特有的優勢:
(1)與底層恢復相比較,具有更好的恢復粒度;
(2)可以根據不同的服務要求選擇相應的生存性策略;
(3)資源利用可行有效(如恢復路徑已經降低了對網絡性能的要求);
(4)根據不同業務提供可保證QoS的端到端恢復;
(5)利用了更低層的告警信號。
本文著重在于根據具體的要求選擇出相應的保證QoS的MPLS生存性策略。分析了MPLS網絡生存性和QoS恢復之間的關系,比較了MPLS生存性中的各種保護模型及其優缺點。
1 MPLS網絡生存性和QoS恢復
圖1總結了MPLS網絡生存性和QoS恢復之間的關系。其中故障生存性(故障管理)的主要目的是用來預先建立一條路由(保護)、確定故障的位置(檢測和定位)以及為受影響的連接重新選路(恢復)。保護是處理故障的首選機制,它在建立工作通路的同時就為受保護的流量預先規劃保護資源(光纖、節點等)。恢復則是在檢測到故障后,從網絡空閑資源中為遭受中斷的流量動態地配置另一條路由。
圖1 MPLS中的網絡生存性和QoS恢復
除此之外,MPLS網絡中的QoS恢復是用來衡量在一條光連接上針對具體業務所提出的生存性方法的性能。在這條光連接上所要求的QoS通常是一系列的限制約束條件,如帶寬、延遲、抖動性、包丟失性和可靠性等。例如,帶寬限制具體是指根據用戶需求建立的一條連接上所選擇的路徑應該具有足夠的帶寬以滿足要求。具體MPLS中保證QoS的不同生存性策略將在以下幾個部分詳細介紹。
2 保證QoS的MPLS保護模型
通常MPLS網絡中提供保護的方法是在故障發生時,依據網絡選路方法、工作通路上流量的具體QoS恢復要求以及對路徑優化管理的考慮,將受故障影響的流量切換至預先建立的一條備份LSP。以圖2所示的MPLS保護方法模型為例,概述了幾種保護模型[1],詳細比較了其優缺點,從而解釋了這些保護方法在提出的保證QoS的MPLS保護策略中的具體應用。
圖2 保證QoS的MPLS保護模型
(1)全局保護
在此模型中,保護通常由入口節點(LSR1)開始,而與工作通路(1-3-5-6)上故障發生的位置無關。該方法中每條工作通路(1-3-5-6)都有另一條與之不相連的備份通路(1-2-4-6)。此方法適用于每條工作通路僅建立一條備份通路且僅為保護切換LSR(PSL)或保護合并LSR(PML)提供兩個LSR的情況。另一方面,由于恢復時間長,全局保護的代價很高。這樣很容易導致包丟失現象。該方法可通過建立LSP并按照實際需求預留資源的方法用于保護一些低QoS要求的流量。
(2)局部修復
局部修復的目的在于保護工作通路的某一部分(3-5-6)以防發生鏈路或節點故障。在此方法中,保護過程從故障出現的節點開始,僅利用一條LSP備份子段(3-4-6)就可以完成保護。該方法的缺陷在于多條備份段(任何時候只要有保護要求就會建立備份段)的配置問題上。這將導致保護過程復雜化和資源利用的不合理。局部修復給入口節點提供了透明度且恢復時間比全局模型低。它可通過預先建立LSP并預留資源的方法用于保護一些高QoS要求的流量。
(3)反向備份
該方法的主要思想是將受保護LSP(1-3-5-6)上發生故障時的流量經由一條反向備份LSP(3-1)傳至源節點(入口節點LSR1),再經由備份通路(1-2-4-6)完成保護。該方法特別適用于對包丟失敏感的流量,它可使故障指示簡化。不足之處在于資源利用率低,因為每個保護域中都需要正、反向兩條備份;另一個缺點是它發送反向故障指示至入口節點所花費的時間較長。因而可以選擇此種方法,通過預先建立LSP并按照實際需求預留資源的方式來保護一些對QoS要求不是很高的流量。
(4)動態多級保護
與以上單個保護方法(全局模型、局部修復或反向備份)相比,MPLS動態多級保護為了滿足網絡環境中高程度的保護要求,可通過利用QoS在線方法動態地建立起來。多級是指同時運用兩種或兩種以上的保護方法;動態是指根據不同QoS參數可選取不同的保護方法。
多級保護適用于網絡中出現多個故障的情況。在圖3(a)中,如果在修復過程中節點6或鏈路1-6、6-7再次出錯,流量將會切換至路由(1-2-3-7-5)上以避免備份鏈路和節點的故障。另一個例子如圖3(b)所示,當局部修復和鏈路3-7出現故障時,如果應用另一條備份機制(如全局模型)就可以避免這些修復時出現的故障。
圖3 多級保護應用
3 保證QoS的恢復機制
提供QoS保證的關鍵是如何選取滿足QoS要求的路徑。解決此問題的方法就是QoS重新選路(QoS Rerouting)。這也是MPLS生存性策略中恢復機制的核心問題所在。根據恢復范圍的不同和恢復路徑建立方式的不同分別介紹保證QoS的MPLS恢復策略。
3.1 部分路徑恢復和路徑恢復
按照恢復范圍的不同,恢復可以是僅圍繞出錯鏈路或節點局部地修復,也可以是經由入口節點至出口節點的全局恢復。這與保護模型類似。
部分路徑恢復試圖找出另一條經檢測到故障發生的下行LSR至入口LSR的路由,用以恢復任何可能存在的上行鏈路或節點故障。每一條受影響連接的恢復過程包括以下三個步驟:
(1)檢測到故障后,發生故障的下行LSR必須沿備份路由反向發送恢復請求(RR)消息以檢查預先選擇的備份路由是否有足夠的資源。如果沒有足夠的資源,備份路由上的LSR則會終止RR消息的發送并前向返回一條釋放消息至下行LSR。
(2)接收到釋放消息后,下行LSR將按照步驟(1)重新檢查其他候選備份路由是否有足夠的資源。如果RR消息成功地沿著候選路由發送,恢復過程將執行步驟(3)。當一系列可行的候選備份路由都用盡且沒有成功,那么保證QoS的恢復連接建立失敗。
(3)如果RR消息成功傳遞至入口LSR,那么入口LSR將改變它的路由表,將流量由出錯鏈路切換至備份路由上。
路徑恢復比起部分路徑恢復更靈活。因為它將整條出錯的LSP切換至另一條經出口LSR至入口LSR的通路上。其他的恢復過程類似于部分恢復的三個步驟;不幸的是路徑恢復的恢復時間可能要比部分路徑恢復長得多。
RR消息和釋放消息對于保證QoS的部分路徑恢復以及路徑恢復是相當重要的。前者是用于QoS重新選路的標簽分配消息。它所含的內容包括識別受影響的連接、標簽、QoS參數(包丟失率、包延遲等)、流量特征、出錯鏈路以及上行/下行LSR。后者不僅包含前者的一些信息,還包括識別拒絕請求的LSR及原因,這使得備份路由上的資源分配更清晰。
3.2 按需建立和預審建立
根據恢復通路建立方法的不同,保證QoS的恢復機制還可更進一步地分為按需建立(Establish-on-Demand)和預審建立(Pre-qualified)兩類。前者在檢測到故障后開始計算并建立一條恢復通路;而后者即便是已經計算好恢復通路卻僅在故障發生時才開始建立。
一種按需建立恢復方法被稱之為兩步恢復技術[3]。它運用了改進的Dijkstra算法,在入口LSR執行恢復程序的位置上建立一條臨時旁路隧道。算法利用了現存的信息(如局部節點最短路徑樹、出錯鏈路和分離的下行節點)以減少故障消息的傳遞時間和內部網關協議(IGP)的更新時間,因而也能降低建立一條旁路隧道所需的時間。一旦所有的LSR都完成了流量的重新選路,建立在出錯上行節點上的旁路隧道就被拆毀。實驗表明按需建立比起預審建立要快五倍,但是這種恢復策略僅針對的是單個鏈路故障。
預審建立的恢復方法有很多。文獻[4]中介紹的方法是現有預審建立機制的改進。它能減少恢復時間,但是需要頻繁更新,以確保當網絡狀態改變時恢復通路依然保持最優化。在該方法中現存IGP的更改用于更新LSR上的網絡信息,如具有流量工程擴展的開放最短路徑優先協議(OSPF-TE)。模擬結果表明,這種新方法雖然可以使恢復時間減少,但是它對來自LSR的額外資源要求很高,如CPU、內存等。
一般來說,恢復機制由于需要計算新路由以及為新建立的LSP預留資源,非常耗時。盡管如此但恢復的代價小,因為如果網絡中沒有故障出現則不需要預留額外的資源。
4 MPLS中區分業務(DiffServ)的生存性策略
MPLS生存性要求結合具體服務類型選擇合適的生存性策略以保證必需的QoS。根據IETF提出的DiffServ草案[5],將業務類型擴展為以下四種類型,即用來傳輸實時流量的加速轉發(Expedited Forwarding,EF)類型、針對允許不同丟失程度流量的兩種可確定轉發(Assured Forwarding,AF1、AF2)類型,還有更一般的即無QoS要求的盡力而為(Best Effort,BE)類型。
根據這些業務類型及其各自的恢復要求和QoS要求提出具體業務的生存性策略。表1是所提出的業務類型及其相應的生存性策略的選擇。
表1 提出的業務類型及其相應的生存性選擇
業務類型EFAF1AF2BE
恢復要求高中等低等無
QoS要求實時丟失甚少丟失少無
恢復時間10-100 ms100 ms-1 s1-10 s不確定
生存性策略保護恢復恢復優先傳送
恢復路徑建立預先建立按需,立即按需,延時無
資源分配預留按需(確保)按需(如果有)無
恢復后的QoS等同可能暫時降低可能降低無
(1)EF:高恢復要求
像EF這種具有高恢復要求的服務所選擇的生存性策略是保護模型(包括局部修復和全局模型)。它應該通過預定義保護路徑的方式分配一條LSP。另外,MPLS網絡利用信令協議中擴展的受限選路方法在另一條與之分離的明晰路由上傳遞信令。當檢測到鏈路或節點故障后,網絡將丟棄低優先級的流量并轉換至另一條路由的LSP上。
(2)AF1:中等恢復要求
針對AF1這種具有中等恢復要求的服務可選擇恢復機制,用于檢測到故障后建立修復路徑的地方。在LSP的建立過程中,僅僅只有一條LSP用于傳遞網絡間的信令。但是資源管理必須要預留出足夠的空閑資源,以防出現故障時可以找到另一條滿足QoS要求的路徑。為了達到所要求的恢復時間,此類服務的生存性策略要求快速故障檢測在幾微秒之內。
(3)AF2:低恢復要求
對于AF2這種低恢復要求的流量,沒有MPLS恢復可配置,也沒有多余的資源或路徑被預留。在故障出現后,網絡僅在EF和AF1恢復完成后才考慮恢復其受影響的流量。EF和AF1在延遲時間內有足夠的時間完成恢復,因而可確保在這段時間內供AF2可選擇的路徑沒有占用AF1恢復時所需用的空閑資源。延遲時間一過,MPLS信令才建立一條QoS要求可能已經降低了的LSP。
(4)BE:無恢復要求
當MPLS域內沒有故障發生時,BE中低優先級的LSP利用更高恢復要求業務(EF或AF2)所需的保護資源和空閑資源,被視為額外流量進行傳輸。如果一旦發現網絡故障,它的包很可能被丟棄。這種情況通常發生在沒有足夠的空閑資源為AF1和AF2恢復所獲得的情況下,或是當BE流量傳輸在EF的保護LSP上的時候。所以BE對應的是通信網中低優先級、預先傳送的流量。
5 結束語
本文主要討論了具有QoS保證的MPLS網絡生存性策略,包括保護模型和恢復機制。保護為業務提供了快速修復功能但網絡利用率較低;恢復能優化恢復路徑且能滿足更多的工作LSP和恢復LSP的請求,其缺點是恢復速度慢。保護和恢復都有各自的優缺點,所以保證QoS的生存性策略的選擇要由業務和恢復的具體要求所決定。最后以MPLS中DiffServ模型的生存性策略為例,根據不同的業務類型分析出各自的QoS要求及其特征,選擇出保證QoS的不同生存性方法。
本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。