郭紅峰,黃繼寧
(中國移動通信集團廣東有限公司,廣東 廣州 510623)
未來5G業務的多樣化發展將存在信道、流量需求、業務場景等很多不確定因素。5G核心網云化、網絡切片等資源靈活分配手段,是當前運營商提高用戶服務質量、增加網絡性能的法寶。很多學者在該領域進行相關的研究。Falahatraftar等人[1]在5G應用場景下提出一種基于條件生成對抗網絡的異構車輛網絡切片方法;及翠婷等人[2]在農業網監控傳輸領域提出一種多元化信息的5G切片傳輸方案;Barakabitze等人[3]提出基于SDN和NFV的5G切片方案并提供開源代碼編程器;Abidi等人[4]提出一種基于機器學習和深度學習的5G切片方案,基于深度學習實現最優加權特征提取并提出一個有效的網絡切片混合學習算法;高亮等人[5]提出一種基于SDN的網絡資源管理方法,其仿真結果顯示帶寬資源利用率明顯提高。上述研究大多數從業務請求的動態變化來實現網絡資源的分配,卻沒有結合當前業務流量的感知角度,即僅僅采用簡單方法預測的網絡未來負載狀態來分配資源。上述方法有可能出現VNF(Virtual Network Feature,虛擬網絡功能)頻繁遷移問題,即系統一旦出現網絡流量過載,為了保證業務可靠性,系統開始啟動數據重定向,從而實現數據快速遷移。而VNF頻繁遷移必然占用大量計算資源和存儲資源,降低系統性能,增加用戶使用的業務時延。因此,本文采用一種流量感知的方法預測未來業務對資源的動態需求,降低由于業務請求動態變化引起的VNF遷移頻率,從而在一定程度上避免了由于網絡功能虛擬化調度產生的端到端時延增加的問題。
隨著5G快速商用,用戶需求和業務量規模迅速膨脹,如何在不影響網絡性能的情況下,結合流量現狀描述端到端流量需求,預測流量變化趨勢,結合變化趨勢對網絡切片資源進行智能分配,是解決當前VNF頻繁遷移問題的重要思路。本文針對網絡流量具有自相似性、多分形性的特點,提出一種基于殘差-預測框架的流量重構算法,采用一種多時間序列相關性的流量校正方法,通過多次校正與迭代來復原流量殘差,從而保證流量重構的質量;其次,采用BP神經網絡實現服務器負載的動態預測;最后,采用NFV技術實現網絡切片資源智能分配。
為了實現流量重構,對某時刻待重構流量的近似流量值進行線性組合,通過殘差優化的方法找到一個最佳的線性組合,將該線性組合作為待重構流量的預測值。因此,本文采用一種基于殘差-預測框架的流量重構算法,該方法充分挖掘流量的時間相關性以提高當前時刻流量的預測精度。基于該框架能夠弱化流量“突變”的效應,實現較優的重構性能。基于殘差-預測框架的流量重構算法如圖1所示。

圖1 基于殘差-預測框架的流量重構算法
在解釋圖1的步驟之前,先解釋幾個與殘差-預測框架相關的術語。
殘差是在數理統計中實際觀察值與估計值(擬合值)之間的差[6]。
自回歸是統計上處理時間序列的方法,一個變量的未來變化趨勢通常采用與其他變量的關系來預測[7]。
加權平均法是指利用某變量過去若干個時間序列的觀測值計算對應的權重,并將觀測值乘以權重并求和,得出的數字作為該變量預測值的一種趨勢預測法[8]。
圖1展示的流量重構算法分為三個步驟:
1)流量預測。對T-1時刻和T+1時刻的流量采用自回歸方法進行流量預測,結合T-1時刻和T+1時刻的流量預測值對T時刻的流量值采用加權平均法進行流量預測;
2)殘差重構。采用迭代法計算預測值與實際值之間的殘差,并采用預測殘差重構算法對T時刻的殘差進行重構;
3)重構流量值。將殘差重構的結果加上預測的結果即為當前時刻流量重構的結果。
VNF頻繁遷出會造成網絡資源利用率降低和業務時延過大。VNF頻繁遷出的原因有5G業務的動態變化、用戶使用流量的突發性增長以及用戶對流量反饋時延等。顯然,如何結合流量感知,選擇合適的時間點完成VNF網元遷出,是降低服務器流量負載的重要課題。
因此,如果能夠有效預測未來某一時刻服務器的負載情況,并設置一個比較合理的閾值,那么系統會在服務器出現問題之前將該服務功能鏈的業務模塊遷出該服務器,就能夠很大程度防止系統宕機,降低業務時延。本文基于各業務的流量感知數據,采用BP神經網絡算法預測未來某一個時刻的服務器負載,進而為NFV網元遷移提供依據。
圖2展示了基于BP神經網絡的服務器負載預測,BP神經網絡包括輸入層、隱含層和輸出層。輸入層對應輸入的信息;隱含層肩負特征提取的使命,該層每一個節點都會接收輸入層的不同權重,并通過控制權重的方式形成模式識別偏向;輸出層負責輸出結果,輸出層的神經元根據隱含層的特征與權重的結果進行加權后,會得出最終的識別結果。

圖2 基于BP神經網絡的服務器負載預測
服務器負載與很多因素有關,考慮到5G核心網的服務器負載主要與NFV網元有關,因此,本文將不同類型NFV網元流量感知作為輸入,將不同NFV網元流量預測作為服務器負載,實現基于流量的負載預測,進而結合系統設置的閾值,將變化較大的部分NFV網元遷至其他服務器。其中輸入層包括N個神經元,其實就是NFV神經元的數量;隱含層神經元數量為6;輸出層神經元數量為1。
該方法分為三個步驟:
1)神經網絡中連接神經元權值的訓練。結合歷史數據訓練輸入層到隱含層的連接權值、隱含層到輸出層的連接權值,通過誤差反傳,令網絡預測的誤差不斷縮小,最后BP神經網絡能夠相對準確預測某一個時刻服務器負載。
2)當服務器連續幾個時刻的負載預測值高于系統設定的閾值時,系統將會啟動遷移功能鏈業務模塊的進程,告知系統某一個服務器將會面臨負載過高或者系統存在不穩定的風險。
3)系統將該觀測周期內流量感知變化較大的部分NFV網元遷出,降低本服務器的負載。遷入功能鏈業務模塊的服務器將根據模塊的需求進行資源分配。
基于網絡功能虛擬化的技術,實現軟硬件的完全解耦,從而實現基于NFV網元智能遷出和遷入。基于NFV技術實現網絡切片資源智能分配過程如圖3所示。

圖3 基于NFV技術實現端到端的資源分配過程圖
基于NFV技術能夠將網絡設備資源整合在統一的資源池中,根據抽象出來的網絡服務和功能需求,對資源池進行動態調度。圖3顯示當NFV網元4和網元5共用一個服務器并出現負載過大時,系統根據NFV網元4和網元5的流量感知水平,將NFV部分網元遷出原服務器,遷入到滿足流量需求的服務器中,實現網絡資源的智能分配。
本文在現網5G核心網環境進行試驗,目標是驗證本文提出的資源智能分配算法的有效性,并以NFV網元數據包調度的端到端時延、CPU利用率2個指標進行比較。圖4顯示了不同的資源分配方案下隨著迭代次數的增加數據包整體調度時延的變化情況。
圖4中,三種方案的迭代次數都在降低并趨于穩定,其中ACA-D是一種基于蟻群算法的云計算資源調度策略,它是一種群集智能搜索算法,通過正反饋、分布式協作來尋找最優路徑[9]。該策略假設每一只螞蟻都是獨立個體,獨立個體在信息搜索過程中可以實現信息交換和通信,這種獨立并行的搜索能力將提升全局的搜索能力。但該算法在非凸情況下會出現過早收斂,陷入局部最優現象。GA-D是一種基于遺傳算法的云計算資源調度策略,是一種借鑒生物界進化思想和自然界”優勝劣汰”思想的進化方法[10]。該算法具備并行性和全局解空間搜索的特點。該算法需要設置一個適應度函數,以保證算法收斂,因此,在適應性函數設置不合理的情況下會出現“早熟”問題,同樣會陷入局部最優現象。

圖4 數據包整體調度時延
本文方案在數據包整體調度時延方面優于其他兩種方法,這是因為ACA-D和GA-D沒有對流量進行預測,而是針對現實的流量情況進行調度,容易陷入局部最優解。因此,本文的方案在時延方面的性能優于其他兩種方案。
在CPU利用率方面,本文算法與傳統的ACA-D和GA-D方法進行對比,結果如圖5所示。
圖5顯示了500個觀測周期內不同方案CPU資源利用率的平均值。可以看出本文算法處于較高水平。這是因為本文采用了基于殘差-預測框架重構流量,完成了基于流量感知的服務器負載預測,再結合NFV的技術進行網元調度,實現較為公平的資源分配,避免了類似ACA-D和GA-D算法陷入局部最優的局面,提高了切片資源智能分配的尋優能力。

圖5 集群CPU資源利用率
針對5G業務需求的動態變化和流量反饋時延導致VNF頻繁遷出,造成資源利用率不高和時延過長等問題,提出了一種基于流量感知的網絡切片資源智能分配方法。該模型在獲取流量感知的基礎上,結合殘差-預測框架的流量感知算法來預測網絡流量,并采用神經網絡預測網絡負載,基于預測結果實現資源調度,從而能夠避免基于現實流量情況進行資源調度而容易陷于局部最優的問題;最后利用NFV的技術進行有針對性網元調度,以較為公平的方式實現資源智能分配,能夠降低數據包調度時延,提高CPU資源利用率。未來,不僅研究核心網切片資源的分配,還需要考慮接入網等切片資源的分配,從業務出發實現端到端的切片資源分配,實現業務資源的再優化。