呂守向 湯紫雄
(福州理工學院 福建 福州 350506)
SD-EON繼承了軟件定義網絡(SDN)轉發與控制[1]解耦的優勢,在應對云計算環境下隨機突發數據流承載方面發揮出了顯著的服務質量(QoS)成效。尤其在大數據等眾多新型業務快速發展的背景下SD-EON上的多波長業務流類型和數量都將呈現多元化,此時不可避免地出現大象流和老鼠流[2]并存的局面。為了提供優質QoS保障,SD-EON架構中的控制層必須實施全網狀態偵測、基于流特征區分的節能局向方案制定、基于業務等級(CoS)波長通道動態配置等一系列關于QoS的管控策略。然而在高效調度多媒體流期間一旦遭遇控制信道故障勢必引發部分交換機轉發數據失效的局面。若該控制信道肩負著全網控制單元和全網交換機之間調度指令重任,那么無疑將會使整個SD-EON陷入癱瘓[3]。可想而知,在云計算和大數據背景[4]下SD-EON架構在發揮QoS優勢時,其控制平面的穩健性也同樣面臨潛在的危機。因此在當前云計算和大數據等新型技術廣泛部署的背景下研究一個穩健性較高的SD-EON與之協作很有必要。
雖然此前也曾有過不少關于SD-EON穩健性問題的相關探討,但是受限于這些研究的瓶頸而總是未能被高效地推廣實施。以文獻[5]為代表的研究就曾提出一個多維度管控策略來增強SD-EON應對海量流媒體業務的控制能力。該策略原理是在以太網絡中定義一個保護機制并交由專用的主機來控制,然后將該保護機制嵌入到因特網協議層和數據鏈路層中用于實施控制信令的轉發配置。此舉雖在一定程度上良好地保障了控制平面在調度流媒體業務期間的可靠性,卻不足以應對云計算環境下海量大數據業務的承載。可見該策略下的SD-EON控制平面僅在有限規模的網絡中才具備可靠的保障性,因此并不具備普適性。
為彌補上述策略的不足,文獻[6]在SD-EON上規劃了重路由高速自愈和1∶1備份保護自愈兩種抗毀技術來應對大數據背景下重載網絡的集中式管控問題。然而實際部署過程卻發現兩種抗毀技術均存在預置資源過度冗余的弊端。為了克服該弊端,文獻[7]試圖通過對多種拓撲網絡的控制層展開大量分析,求證控制單元的放置對全網管控的效力。實驗表明在SD-EON中科學放置控制單元的前提下全網僅需部署唯一的控制單元即可最小化網絡資源的冗余度并且具有良好的控制時效性。受限于控制單元數量的唯一性,該情形下的全網業務調度對該控制單元產生很高的依賴性。尤其在調度大規模波長業務時,全網對控制資源偏好度更為凸顯。為了避免該控制單元超負荷開銷導致計算精度失效的潛在風險,文獻[8]提出SD-EON多控制器放置和交叉保護算法。該算法雖良好地取得了雙效卻忽略了交換轉發單元在某一個時隙同時執行來自不同控制單元下發的控制信令時可能存在沖突的情形。究其原因在于缺乏對控制單元優先權的定義。為了避免控制單元在下發控制信令時對交換轉發單元造成指令沖突,文獻[9]提議將權威交換轉發單元設置為優先權較低的控制單元,通過這種方式弱化SD-EON對那些優先權較高的單控制器的好感度。然而該提議始終只討論權威交換轉發單元在固定網絡狀態下的部署情況。同時文獻[10]在研討SD-EON控制單元安置的科學性與控制平面可靠性的關聯度基礎上構思了一種基于圖切理論的分區安置方案。實踐表明在該分區安置方案下控制單元僅在域內才表現出良好的可靠性,不足以在域間可靠地實施控制作業。文獻[11]所建立的基于整數線性模型的可靠性算法旨在探索SD-EON中控制單元和交換轉發網元間符合局向分離的最大光通道規模以便優化控制單元部署的科學性。但該模型應用在云計算環境下開展大規模數據計算時所求的解缺乏全局性。甚至在大規模網絡中較為突出的由網元和控制單元之間物理間距引發的控制時效性問題,在所規劃的算法模型中并未被提及。文獻[12]結合帕累托理論為SD-EON設計的控制單元邊緣部署算法在一定程度上解決了前述文獻研究中無法兼顧控制平面可靠性、時效性和全局性等問題,然而對于交換轉發單元執行多控制指令的沖突問題依舊束手無策。
綜上所述,目前圍繞SD-EON控制層面的主流研究仍有較大的可持續改進空間。可通過設計分布式提升方案來實現穩健性目標。具體思路為:(1) 在基于一定的約束前提下從邏輯上將整個SD-EON網絡進行縱向切割,割離出多個分區。(2) 在每個分區子網內引入分區控制單元(SCU)和低優先權交換轉發單元(LPT)。SCU負責對分區子網內的多波長顆粒和跨層調度作業的局部性管控,以及將控制平面對攜帶大數據的多波長業務實施集中式管控期間潛在的可靠性風險分派[13]到各分區子網,從而使控制平面的故障風險在可化解范圍內。同時在每一個分區子網內配置若干個LPT用于應對控制平面因遭遇故障引發可靠性風險問題時,能夠實施較小范圍內的波長顆粒管控,從而使控制平面的可靠性風險問題在最短時間內被排除。(3) 在全網范圍內配置一個統籌控制單元(OCU)用于實施全局網絡中多波長顆粒和跨層調度作業的全局性管控。(4) 結合跨層調度模型為控制平面的信令設計出具有良好生存能力的局向信道并將其嵌入到SD-EON中為云計算環境下攜帶了大數據的多波長業務調度提供可持續性部署方案。根據所述的分布式立體化設計思路,本文構思了一種縱向管控部署下的嵌入式SD-EON穩健性算法,旨在從全局角度出發規劃一種既能突破資源偏好度約束又能克服傳統研究方案所不能兼顧的多指標問題的方法。
部署控制單元必須在符合SD-EON集中管控的情形下進行。在此約束下通過在控制平面上放置一定數量的控制單元,并對全網執行縱向切割將SD-EON分割出具有不同優先權[14]的控制平面。自低向高依次為低優先權控制平面、中優先權控制平面、高優先權控制平面。其中:將LPT定義為低優先權控制單元,用于管控多波長業務顆粒和控制指令的配置并確保控制平面在遭遇故障后實施自愈的時間周期最小化;將SCU定義為中優先權控制單元以降低整個控制平面對OCU資源的偏好度,并確保分區內的故障修復能力;將OCU定義為高優先權控制單元,用于提取跨分區、跨層等多波長顆粒調度期間的全網實時參量狀態。所設計的縱向管控部署模型如圖1所示。通過建立基于不同管控優先級縱向模型為控制平面選取合適的位置植入相應數量控制單元的優勢不僅在于可規避SD-EON在調度多波長業務時出現多個控制單元指令沖突的風險,并可緩解在此期間對某一特定控制單元產生過度的資源偏好現象。具體而言,其風險規避思想為若存在多個控制單元同時向某一個交換轉發網元下發控制信令,則優先級較低的控制單元信令首先被該交換轉發網元丟棄。顯然該縱向切割模型不僅解決了控制指令沖突問題也能降低海量求解運算對單一控制單元的計算資源偏好。為了避免SD-EON中OpenFlow交換設備和控制平面鏈接出現失效,要求OpenFlow交換設備在和一個主用LPT建立鏈接的同時也要和至少一個以上的備用LPT建立鏈接。同時定義一個可獲取分區內部網絡參量和拓撲信息的感知交換節點(SE)用于配合SCU收集分區子網的狀態。由于多個LPT和SE所放置的位置均不同,確保了網絡狀態提取通道和控制單元下發流表項通道具備無相關性。也就是說控制平面在雙向路由期間遭遇同時失效風險的概率極其低,這樣的設計思想在一定程度上提高了控制平面的穩健性,同時也有別于傳統研究設計。

圖1 縱向管控模型設計
由縱向管控模型設計所述可知,控制平面的穩健性與控制單元的方位和規模息息相關。為更好地提升縱向管控效力,在制定縱向管控目標之前首先對該模型的相關參數做如下定義:令SD-EON中的網元vLPT、網元vSE、網元vSCU、網元vOCU形成的網元集合為V;令全網各網元之間的鏈路集合為E,則整個SD-EON的拓撲結構可表征為G=(V,E);同時,定義分區子網x內的節點集合為Nx,其中網元SE的節點集合為vx→SE,于是有vx→SE∈Nx。將Nx內的vx→SE之外的網元節點集合記作Nx -(vx→SE),并假設網元vx -(vx→SE)∈Nx-(vx→SE)。要提高全網波長業務調度期間的管控效率,要求SE在最短時間內偵測到網絡實時參量并令LPT迅速將流表項下發給交換轉發網元,同時讓SCU以最小的時間成本在分區子網內形成低優先權的管控。若要實現這樣的部署目標,則需同時滿足以下四個目標函數。

相比較文獻[15]所提支配極小化機制,縱向管控方案采用極小化覆蓋方式為控制單元規劃數量和方位,對于SD-EON控制平面穩健性而言更符合全網集中管控的要求,更具優勢。其原因可通過下列證明過程獲悉。
首先,假設網元子集I為網元子集V的一個子集,且I定義為全網節點規模最小化覆蓋。對于那些不屬于I的隨機網元m而言,將和其建立鏈接狀態的鏈路集合記作K=(m,n),且m∈E,n∈E。將集合K內除m以外的網元集合記作L=(n),且m∈K,n∈K。則|K|=|L|。若集合K和集合L規模均在兩個以上,且隨機網元m不屬于全網節點規模最小化覆蓋I,那么n∈I,于是有L?I。據此可知對于網元子集I而言,將存在超過兩個以上的網元和I集合以外的隨機網元m建立鏈接。因此在以無向圖G=(V,E)為代表的SD-EON拓撲結構中,若I為全網節點規模最小化覆蓋且所有網元均存在兩個以上連接度,則對隨機的I之外的網元m而言,最少存在兩個來自于I的網元和m鄰接。據此論證,縱向管控部署方案也就會出現兩個以上的控制網元和單個交換轉發網元節點建立鏈接的情況。這在很大程度上保證了SD-EON控制層面的穩健性。此優勢是支配極小化機制[15]所不具備的。以網元A-F構建的兩個拓撲為例做如下比較。假設每個拓撲中的六個網元所建立的光鏈路集均有lA-B、lB-C、lD-C、lD-F、lF-A、lB-F、lF-C、lE-C、lE-F、lE-B。支配極小化機制下的拓撲圖中的網元F以vLPT形式存在并執行流表轉發操作,同時將該網元定義為極小支配集合。其他五個網元均以OpenFlow交換機[16]的形式存在。縱向管控方案下的拓撲具有相同的鏈路集。同樣假設網元B、網元C、網元F以vLPT形式存在并執行流表轉發操作,同時將這三個網元視為極小化覆蓋。其他三個網元均以OpenFlow交換機的形式存在。在這樣的拓撲前提下假定網元D和網元F間的光鏈路遭遇失效,那么對于縱向管控方案下的拓撲而言,因其任意一個網元均存在與超過兩個以上的vLPT保持鏈接狀態使得網元D可經由另外的vLPT接收到控制層面向其轉發的流表指令。相比而言,支配極小化機制下的拓撲因不具備此保障特性而使網元D未能接收到控制層面向其轉發的流表指令。為讓分區網絡中的SCU以最低時間成本偵聽到分區網絡狀態參量進而實施高度統籌管控,那么在規劃部署方案時將網元LPT和網元SE進行融合考慮是有必要的。
其次,既然I被定義為圖G全網節點規模最小化覆蓋,意味著網元子集I和圖G整個網絡中的邊具備關聯性。且圖G內所有網元可受網元子集I來支配,因此網元子集I可以是圖G的支配集合。據此可知多個圖G中的最小支配集合可以視為網元集合I內的子集。因此在以無向圖G=(V,E)為代表的SD-EON拓撲結構中,若I為全網節點規模最小化覆蓋,那么I可視為圖G的支配集合,同時多個圖G的極小支配集合都將作為I的子集來存在。據此論證,要使控制層面在最短時間內偵測到故障風險參數將可能遭遇到的故障風險降到極限,控制單元的部署過程應先參照第一論證中最小化覆蓋I的準則來規劃網元LPT,再參照第二論證I中的支配集合規劃出網元SE并將網元SCU部署在網元SE上。然后再將網元OCU放置在所有網元SCU的中心地帶。
根據所述的縱向管控思想設計出如圖2所示的縱向管控方案。

圖2 縱向管控方案實施過程

使SD-EON具備良好的穩健性不僅需要為控制單元統籌規劃出一個如前文所述的方位配置方案,同時也要考慮為那些向上提供網絡狀態偵聽傳輸、向下提供流表項更新的控制信道設計一個科學的資源路由規劃機制才能夠在保證控制單元穩健性的同時也兼顧到整個控制平面的穩健性。對于控制信道而言,其承擔著網絡狀態數據的收集和流表項資源的下發任務,該信道內的交互式信令規模雖小但生存等級卻是最高的。基于此對控制平面展開資源冗余規劃也是必要的。假設將SD-EON全網從資源的角度分為五個層,自頂向下依次為轉發層、接入層、光口層、時隙層、頻隙層。在此分層級結構設計中,網絡資源因顆粒規模漸大而使其使用率逐漸降低,同時規劃配置資源的時間開銷也相應降低。為最大程度降低因實施控制指令傳輸的光路由通道規模問題引發的控制層面故障風險,資源冗余規劃機制將那些在頻隙層中執行路由計算的控制指令統一調度到光口層后再送至頻隙層。此舉旨在縮小實施信令承載調度的介質規模以降低控制平面遭遇故障的可能性。整個資源冗余規劃機制的步驟為:首先根據前文所述的全局縱向配置方案思想自底向上依次配置出網元LPT、網元SCU、網元OCU并設立分區子網,初始化鏈路集B(B為空)和OCU集λ′。為集合λ′范圍外的每一個SCU和LPT統計出到達集合λ′范圍內網元間距最小的個體,并將這些SCU或LPT個體納入λ′,隨即把SCU / LPT與相應網元間的路由局向存入鏈路集B內同時置其權重為零。如果得到的集合λ′和λ等同,那么保存該鏈路集B;如果不等同,那么重復執行上一步驟。其次,從所保存的鏈路集B內尋找某一個分區子網內所有LPT與該分區子網的SCU最短路由局向,以及每一個分區子網中SCU和OCU的最短路由局向。根據多徑廣播防護策略[18]從全網中搜索出一個圈[19]中的路由用于為那些承載了OCU流表資源的鏈路集B內的鏈路提供保護用途的防護局向。如果光口層在調度資源時出現緊缺情形,那么先從時隙層再從頻隙層調度更多的資源為前兩個步驟計算出的鏈路集B中的主用局向和防護局向分別調配充足的工作和防護資源。一旦控制層面遭遇失效風險,在局部分區子網內開啟恢復策略。依次由次選分區子網、第三分區子網對應的LPT立即給受災網元vb轉發相應的流表資源;同時受災網元vb通過該流表轉發路由向其上層網元SCU提交所偵測到的網絡狀態參量。要是控制層面并未出現險情則默認由首選分區子網對應的LPT向vb傳輸相應的流表資源,同時該vb將所偵測到的網絡狀態參量提交至該分區子網所對應的SCU。不難看出,整個資源冗余規劃機制的目標有兩個:(1) 為交換機到SCU之間的上行單工控制路由、LPT到交換機之間的下行單工控制路由提供低時延的恢復自愈保障;(2) SCU到LPT之間的下行單工路由、SCU到OCU之間的雙工通信提供低時延的保護自愈保障。此雙自愈策略旨在為控制信道提供穩健的生存能力和科學的資源調配方案。


圖3 平均恢復率1

圖4 平均恢復率2


圖5 平均失效風險率1

圖6 平均失效風險率2
此外,控制時延也是衡量SD-EON穩健與否的重要標準。不同的組網結構對控制時延的要求有所差異。理想情況下,方案的部署需控制在相應的時延門限范圍內,盡可能以最低的控制成本把時延代價降至最小。圖7所示的時延代價示意圖內縱坐標三個時延參量從小到大分別表示控制平面生存性時延代價要求[20]、環形網自愈技術門限、網狀網自愈技術門限,其中H、AVE、L分別指部署穩健性策略時付出的最高、平均、最小自愈時延值。顯而易見,穩健性策略下的控制時延總體比可靠性算法、分區安置方案都要低。不僅如此,穩健性策略下的時延代價在滿足生存性指標要求的同時,其峰值參量和均值也明顯地遠低于臨界指標10 ms。這表明穩健性策略能夠以絕對性優勢嵌入到SD-EON實施更可靠的服務。相比之下,奉行控制單元和交換轉發網元間符合局向分離的最大光通道規模的可靠性算法所安置的節點處具有較大的連接規模,且基本上位居全網的中心地帶。因這樣的區域內節點密度較大且距離交換設備遙遠,控制指令在路由過程中產生的時間成本也就最高,故在本項考察中表現出了最弱的穩健性。

圖7 時延代價
通過對比傳統研究在SD-EON可靠性設計方面存在的可持續改進空間,提出一種普適性較強穩健性策略。該策略兼顧了控制單元在局部網絡中和全局網絡中的集中管控作用。主要通過多元化部署網元節點來區分控制單元的權限,避免底層交換機出現執行指令沖突的同時也為控制信道提供穩妥的資源配置方案和故障防護方案。測試結果顯示所研究的縱向管控部署下的嵌入式SD-EON穩健性策略具備良好的科學性。