周其龍
(河南師范大學新聯學院,河南 鄭州 450000)
網絡流量短期預測是網絡管理中不可忽視的問題[1]。預測結果的精準度、實時性以及應用范圍直接影響網絡管理的效率。目前,通常使用的預測方式為線性與非線性預測。以小波分析為基礎,進行非線性預測成為新的研究熱點,但小波分析的計算復雜程度較高,并且需要多次重復計算。由于網絡流量具有結構多樣、相似面積大、流量數據多變等特點,因此,非線性預測方法的精準度較低,在流量短期預測中不具有可行性,實用性不高。基于此,提出基于離散變量的網絡流量預測方法,可充分適應網絡流量的不確定和突發性。
龍震岳[2]等人針對傳統網絡預測模型泛化能力弱、準確度低的缺點,提出組合小波包分解和灰狼橫縱多維混合尋優算法,對短期網絡流量進行預測。首先利用小波分解網絡流量,將其劃分成多個頻段序列,通過優化模型對得到的序列進行單步或者多步預測處理;然后重構并累計預測數值,最終得到未來短時間內網絡流量數值。田中大[3]等人在高斯過程回歸模型的基礎上,提出補償自回歸積分滑動平均模型的網絡流量預測方法。首先利用布魯克·德赫特·申克曼的統計量檢驗法,確定網絡流量的時間序列特征;然后通過補償自回歸積分滑動平均模型進行非平穩建模,構建符合時間序列規律的預測模型,優化算法進行誤差序列建模,最終運用預測模型得到的數值與誤差值相加,所得結果為最終的網絡流量預測數值。
但上述方法未考慮短期網絡流量的突發性和不確定特征,預測結果會出現一定偏差,結合以上方法中的優秀部分,提出基于離散變量的多尺度網絡流量短期預測方法。仿真結果表明,所提方法能夠掌握時間序列的變化規律,具有更高的預測精度和更小的預測誤差。
按有序性排列規律的變量數值,稱為離散變量。其中的變量數值通常為整數,可通過計數獲取得到。離散變量的布局及應用在數據預測中占據重要地位,首先要明確離散變量的用途,確定每個數值的取值范圍,然后根據所需完成的預測目的解決問題。
在網絡流量中,許多隨機現象的數值也被稱作變量,每個量的數值都是不固定的,即隨機數據的數量表現。
假設基于離散變量[4]的網絡空間設為S={e},離散變量定為X=(e),是網絡空間S中的實際單值函數。可被用于以下三個方面:
1)離散變量決定網絡空間。
2)離散變量X=(e)是滿足一定條件的函數。取值范圍具有隨機性,但要在網絡空間S范圍內。
3)網絡預測可用離散變量的取值概述。
由此可見,基于離散變量進行的網絡流量預測,其體現的統計規律性可全面判定預測結果的可行性,并進一步提高預測精度。
引入離散變量,分析網絡流量固有的多尺度特性,成為進行多尺度網絡流量短期預測最有效的方法。采用網絡流量多尺度特征進行直接表示,在選擇適當離散變量的情況下,可更直觀得知在不同尺度下,網絡流量的參數值,為后續預測計算作出良好的鋪墊。
多尺度是網絡流量中的主要特征,主要表現為長關聯性、相似特征以及多層次等。不僅體現在Internet網絡中,也存于無線網絡中。多尺度網絡[5]流量的復雜性主要體現在時間尺度與統計層面兩者的突發性特點上,因此多尺度網絡下,流量的性能相比其它要求更高。
由于網絡流量具有復雜性和多變性等特點,在引入離散變量的基礎上,對初始流量數據進行多尺度劃分,從而獲取到在網絡頻率[6]特征不相同情況下,近似數值與細節數值。近似數值指劃分之前的初始流量數據,具有與基本性質相似的分量數據。其中不包括高頻網絡下留存的未劃分相似特性;細節數值指的是動態流量,可映射出細節特征的短期關系。因此,根據多尺度網絡流量預測的要求,在保持初始流量數據降低的同時,還可完成噪聲消除的提前處理,使得網絡流量的復雜特點得到劃分。
相關網絡流量預測研究人員,曾做過關于離散變量的一種數學轉換。簡而言之,就是將多尺度網絡中,初始一個一維的信號表現形式,最終劃分成兩個一維信號,可概括成時間線上的逼近信號,以及尺度頻率上的細節信號。基于預測的多尺度網絡流量,設尺度函數為φ0和流量函數為φ0,從而進行多尺度網絡初始流量的獲取。
為了獲取初始流量,利用流量函數φ0和尺度函數φ0,同時結合高階矩陣,構建無條件的基數值。在多尺度網絡中,假設Pj為逼近信號,j為多尺度范圍,隨著多尺度范圍發生變化,Pj也隨之改變,Pj中包含的采樣信息越少,初始信號數據越逼近。在多尺度網絡流量中,逼近信號都涵蓋上述尺度的采樣信息,并維持一定幅度的頻譜數據信息。同理,伴隨尺度范圍j的擴大,Pj逐漸縮小,但其周期時長不發生改變。通過上述分析,得到多尺度網絡逼近信號的求解公式為
Pj=Pj-1-Dj
(1)
其中,Dj為細節信號。上述計算結果包含在劃分的子空間{Vj}∈z中,同時滿足條件Vj-1?Vj。
多尺度網絡流量是將流量X(k)映射到子空間Vj中,得到逼近信號與流量之間關系如下
Pj={VjX(k)}
(2)
也可表示為:

(3)
在上述式(2)和式(3)中,映射關系因子ax(j,k)可通過流量X(k)以及φ0的定義得出
ax(j,k)=〈X(k),φ0〉
(4)
同樣的,通過下述關系式可得出細節信號與流量之間的關系表示為

(5)
其中,映射關系因子dx(j,k)可通過下述定義得到
dx(j,k)=〈X(k),φ0〉
(6)
根據上述多尺度網絡流量關系,得出流量的求解關系式,即

(7)
在變量相對單一的離散數據信息中,構建預測多尺度網絡流量短期預測模型,可達到收斂速度快、平穩程度高、誤差小的流量預測目標,且極具有效性。多尺度網絡初始流量的獲取為構建準確的短期預測模型奠定了基礎。
對多尺度網絡流量進行短期預測,需要構建短期預測模型,多尺度網絡流量預測模型[7]的建立,對于網絡存儲空間[8]的規劃、網絡性能[9]指標等具有重要意義。
多尺度網絡流量短期預測是基于離散變量構建的模型,將離散變量函數和多尺度函數進行正交,在離散變量中,選取的尺度函數θ(t)、變量函數μ(t),可得到兩個函數的取值范圍如下

(8)
以及
(9)
為了將離散變量引入到多尺度網絡流量短期預測模型中,重點考慮經過計算得到的離散信號A(k),以此為作為多尺度分析的基礎。網絡流量短期預測主要是運用逼近信號Pj進行流量預測計算。因此,將得到的逼近信號分成兩部分,對前部分結合尺度函數進行網絡流量尺度線性預測,預估其數值,隨之利用變量函數,對后半部分進行預測流量估計,由此得到,逼近信號與尺度函數和變量函數的正交結果關系表示為
Pj=θ(k)·μ(k)
(10)
現階段,在網絡流量預測中最常用的是線性預測模型,其中,主要有自回歸AR、平均滑動以及自回歸基礎上的滑動模型,簡稱ARMA模型。
假如Z(t)為時間序列,模型ARMA(p,q)中,若X(k)具有穩定性,針對其中每個流量變量k,可列出流量與尺度函數、變量函數及時間序列的關系為
X(k)=μ(k)X(k-1)θ(k)+Z(t)
(11)
以此類推,可通過多項式將其表達,其中因子不同。ε代表P階多項式中的尺度因子,υ代表Q階多項式中的線性預測因子,B代表前項公式中的移動算子,得到流量線性預測表達式為
υX(k)=B·Z(t)·ε·Pj
(12)
若數據在ARMA模型中具有穩定性,假如時間序列呈現變化趨勢,破壞數據的穩定性,可使用差分算子增強流量預測的穩定性。定義差度數值為1,將差分算子設為σ。則得加入差分算子增強后的流量預測效果表達式為
(13)
若上述表達的是時間多項方程形式,在結束有限次數內的差分,可符合模型檢測。假設差分次數表示為d,因此,得到基于模型ARMA(p,d,q)的流量預測模型為

(14)
因此,基于離散變量的多尺度網絡流量短期預測[10],可采用ARMA模型,得到需預測網絡流量的逼近信號,在多尺度中選取最佳預測部分,進行預測模型的參數估計,預測兩部分各自參數值,從而得到網絡流量短期預測數值。
使用平均相對誤差[11],表示為δ,用于判定預測結果的精準程度,即平均相對誤差精度值為

(15)

假設存在兩個預測模型,分別用M1和M2表示,預測的數值分別用f1和f2表示,則可得到最終預測流量結果

(16)
在上述式(16)中,β1和β2表示回歸參數值[12],ω代表隨機干擾系數。
若滿足δ=y-fi(i=1,2),則可得到兩個預測流量數值的平均相對誤差精度值的實際結果

(17)
預測結果檢驗:當平均相對誤差精度值δ=1時,可說明預測結果準確。若想提高預測模型的預測精度,可通過提高平均先谷底誤差精度值來實現,校驗工作流程如下所示:
第一步,根據計算得到的網絡流量預測結果,對其進行模型的序列排序。
第二步,排列完成后移入待評價指標中,選擇最佳模型。
第三步,測試實際網絡流量與預測流量數值差。
第四步,輸出檢驗結果,數值越小,則準確度越高,證明所用方法的可行性更高。
至此,完成了基于離散變量的多尺度網絡流量短期預測方法。
為了驗證所提基于離散變量的多尺度網絡流量短期預測方法的有效性,進行了一次仿真。
仿真方案:選用MATLAB軟件構建模型,將尺度參數設置為3,網絡協議選擇被普遍使用的TCP版本,總體過程如圖1所示,為仿真過程圖,基于離散變量對多尺度網絡進行分解和構建。

圖1 仿真過程
首先,當設定初始流量表示為H為0.8420時,合成流量H′的數值為0.8393,由此可看出,多尺度網絡下離散變量能表現出流量的特性,因此,可總結出不同的流量樣本呈現如下特點:其一,當多尺度網絡流量超過1秒時,可表現其多變性特點;其二,網絡流量在多尺度中穩定性差。
從下圖2中可看出,將離散變量下的多尺度網絡流量按照尺度特征,表示為4個層次,分別設置為A1,A2,A3,和A4,逐層記性分析,得到的參數如圖中D4所示,基于離散變量下對多尺度網絡流量進行分析和重構,精準度設定不同的情況下,分析得出網絡流量平穩性的變化趨勢,以及周期變化特征,提高了網絡流量短期預測的精準度。

圖2 網絡流量多尺度分析
圖3為所提方法的預測流量、非線性預測方法的預測流量與實際流量的對比圖。

圖3 預測流量與實際流量對比圖
分析圖3可知,采用所提基于離散變量的多尺度網絡流量短期預測方法進行流量短期預測后,其預測流量曲線幾乎與實際流量曲線重合,而非線性預測方法的預測流量與實際流量間存在較大差距,遠低于實際流量。充分說明,所提方法的預測精度較高,預測效果十分理想。
根據圖3的流量預測結果可知,在120s的測試時間中,實際流量約為118Gb。以這一結果為依據,分別采用自回歸滑動模型預測方法、組合小波包分解和灰狼預測方法和所提方法進行短期流量預測,測試三種不同方法的預測精度。將干擾因素考慮到仿真中,得到對比結果如圖4所示。

圖4 三種不同方法的預測流量對比結果
分析圖4可知,采用自回歸滑動模型預測方法進行短期流量預測,在120s的測試時間內的預測流量約為55Gb;采用組合小波包分解和灰狼預測方法,在120s的測試時間內的預測流量約為51Gb;采用所提方法進行短期流量預測,120s內的預測流量約為117.5Gb。與圖3中的實際流量結果對比可得,兩種對比方法的預測結果與實際流量相差較大,預測精度較低,而所提方法的預測結果與實際流量只相差0.5Gb,充分說明,所提方法的預測精度更高。
通過上述實驗證明離散變量下流量預測的實用性以及有效性,即隨著時間的變化,流量浮動變化較小,說明所提方法對于實時性提供了良好的保障。
針對網絡流量預測而言,分析了解多尺度網絡特征具有重要意義,網絡流量預測的精準度對于網絡效率的提高、流量控制研究工程的實施、網絡性能的優化具有重要的研究意義。
短期網絡流量的預測對于規劃網絡存儲空間、提高網絡性能等具有重要作用。提出基于離散變量的多尺度網絡流量短期預測,構建離散變量下的預測模型,并對預測結果進行檢驗。經仿真表明,所提預測方法精準度更高,精確掌握流量的尺度序列規律,可被應用于網絡流量工程研究中。