周任軍,王文晶
(山西大學商務學院,山西 太原 030031)
網絡流量[1]是判定網絡性能和運行狀態的重要指標,對網絡流量進行預測,進而對流量進行適當調整以及控制,對網絡管理具有重要意義。為建立精準、穩定的網絡流量預測模型,近年來神經網絡成為該研究領域關注的焦點,相關研究人員提出了較多研究成果。
胡竟偉[2]提出基于小波變換和極限學習機的流量預測模型。該方法小波變換處理網絡流量的時間序列,對得到的不同頻率特征分量進行空間重構。選用極限學習機對網絡流量各分量建模預測,并對各分量的預測值進行小波重構,得到初始網絡流量預測數值。該方法具有穩定性,但是存在預測精度較低的缺陷。劉科[3]等人提出基于生物地理學優化算法的BBO-ELM預測模型。首先在ELM預測模型的基礎上,將BBO優化算法用于ELM的網絡輸入變量、隱含層節點的配置及參數。在此基礎上進行Tikhonov正則化參數的優化選取。該模型的網絡流量預測準確度較高,但是抗干擾能力較差。強延飛[4]等人針對網絡性能優化中短期流量預測模型選擇問題,采用支持向量回歸、神經網絡和線性時間序列等模型,對MAWILab數據集中骨干網流量進行短期預測。利用一步預測方法,得到不同流量序列樣本的預測結果,通過量化預測誤差比較不同模型的預測性能。該方法有較好的預測準確度,但是記憶能力較差。
針對以上傳統方法存在的不足,提出新的基于深度神經網絡的網絡流量預測模型。仿真結果表明,深度神經網絡具有多隱層結構特征,相比其它流量預測模型,該模型預測精度更高,抗干擾能力更強,可被廣泛應用。
深度神經網絡[4]由微軟公司推出的軟件,可以模仿人類的思考方式,具有快速識別網絡流量動態性特征能力,準確率較高。深度神經網絡具備的多隱層結構,主要用于對網絡中的輸入向量進行多次訓練。其主要結構如圖1所示。

圖1 深度神經網絡結構
深度神經網絡由輸入層、多隱層以及輸入層三部分構成。與傳統神經網絡相比,深度神經網絡(DNN)具有多隱含結構特點。X代表網絡輸入量,輸入量包括m維的列向量值,(W,B)代表各隱含層間的權重和閾值構成的矩陣[5]。深度神經網絡利用每個隱含層自上個層次得到的向量值,進行函數激活的非線性轉變。再將得到的數值傳遞至下一神經元,依次反復迭代,最終傳遞至網絡輸出y處。相比傳統神經網絡,DNN所具備的多隱含層深度明顯提高,可彌補傳統神經網絡的不足。
神經元[6]是深度神經網絡的基本構成元素。圖2為單輸入神經元,x代表輸入數值,w表示神經元的權值,b表示神經元閾值,f則是激勵函數,y為神經元的輸出向量。經過計算,得到輸入數值、權值和閾值的結果,作為激勵函數的輸入數值,此時輸出值為y=f(wx+b)。得到的激勵函數f通常具有連續性的S型函數值,可完成神經網絡中輸入到輸出的任意非線性預測。

圖2 單輸入神經元
假設輸出層包含的神經元為m,深度神經網絡的輸出數值為y′,期望結果為y,將誤差平方和設為E,則可得出

(1)
得到的權值修正方程為

(2)
其中,wij表示在深度神經網絡中神經元i至j的連接權值,η為速率,Ij代表第j個隱含層中的激勵函數值。
基于深度神經網絡構建的網絡流量預測模型中,初始數據及閾值的選擇對預測性能和精確度起著重要作用。若數據選擇不當,則將造成預測模型收斂速度慢、結果不準確等問題。
神經元作為深度神經網絡構成的基本要素,為全面刻畫流量動態序列規律,需構造具有反饋體系的深度神經網絡預測模型。傳統流量預測模型未考慮網絡流量的動態性特征,因此得到的預測結果存在一定缺陷。深度神經網絡預測模型中的單隱層的前饋網絡,屬于局部逼近網絡。其中,隱含層基函數可采用高斯函數表示為

(3)
隱含層中節點輸出加權后進入輸出層,即輸出層為預測模型中隱含層的線型組合,可得知

(4)
在上述式(3)—(4)中,x∈Rn代表輸入向量值,φ(·)為高斯函數,‖·‖為歐幾里德范數,ci∈Rn表示深度神經網絡中第i個隱含節點的場中心,φi∈R表示第i個隱含節點中的場域寬度數值,nc表示隱含層中節點數值,wi表示第i個隱含節點中的基函數值與輸出節點的連接權值,w0表示輸出偏移量的調整值。
不同的網絡輸入向量影響預測結果[7-8]。通常深度神經網絡的輸入類型有:連續時刻的輸入、若干周期數據、某周期內的平均數值、相鄰時間點數據差值等,圖3為數據處理過程。

圖3 數據處理過程
若以某個交換機中一個月內的網絡流量數據作為參考,可發現流量存在顯著“工作日”特性。例如周一至周五網絡活動頻繁,同時初始數據變化幅動較大(數據間有3個數量級的差距),說明網絡流量的動態性較強。
基于深度神經網絡構建的網絡流量預測模型中,若數據選擇不當,可能會造成預測模型收斂速度慢、結果不準確等問題。因此構建預測模型前,對初始數據需進行規則化處理,如下所示:

(5)

深度神經網絡預測模型主要是模仿生物處理模型,通過獲取到智能信息處理論,運用連接大量的復雜神經元,并通過學習、自組織以及非線性動力學等方式,選擇并行分布方式處理信息,如圖4所示。

圖4 深度神經網絡工作流程
模型的輸入向量[10]設為X=[x1,x2,…xn],在n個隱含層中,每層節點數量分別用l1,l2,…,ln代表,同時設置輸出層節點為1。深度神經網絡的第1層隱含層次在時刻t的輸出向量可被描述為
R1(t)=f{W1[X(t),z(t)+B1]}
(6)
在上述式(6)中,R1(t)代表第1層隱含層輸出向量數值;W1、B1表示輸入層與第1層隱含層間的矩陣方程;B1代表在時刻t中,關聯層至第1層隱含層間的反饋輸入數值[11];f代表流量預測模型中隱含層的非線性激活函數值。
網絡流量動態預測模型為
J(k)=R1(t)[(y(k-1),y(k-2),…,y(k-m))]
(7)
其中,m代表預測模型階數,y(k-1),y(k-2),…,y(k-m)分別表示第k,k-1,k-2,…,k-m時間點上的網絡流量數值。f(·)代表復雜的非線性函數值,選用深度神經網絡進行建模,將網絡動態流量設置為5階和6階,分別用m=5和m=6表示,與之對應的網絡流量動態預測模型如圖5所示。

圖5 網絡流量預測模型結構圖
由于深度神經網絡是建立在多層前饋型的神經網絡之上的,層次結構較多,每層結構都由眾多神經元構成。不同層間神經元均采用全互聯方式連接;而同一層間的神經元無連接。因此,每層可選用不同的激勵函數進行計算預測模型。
基于深度神經網絡的網絡流量預測模型計算由兩部分構成:輸入流量的正向傳播、預測誤差的方向傳播。在模型預測的過程中,首先在深度神經網絡中,隨機選取一組神經元之間的連接權值和閾值,預測樣本從輸入層開始逐層計算,直至輸出層則計算結束。將得到的輸出與期望結果進行對比,若誤差值未達到極限誤差數值,則進行輸出層誤差變化值的計算,當誤差值已經達到誤差上線,則誤差信號順沿原本的通路反傳回來,此時調整各層神經元間的權值和閾值,兩個方向反復交替計算,使得網絡流量預測結果與期望誤差平方相加接近設定值,或達到迭代次數位置,使基于深度神經網絡的網絡流量預測模型預測結果接近實際數值,以此選取合適權值和閾值,實現網絡流量的動態預測。
將深度神經網絡中各層次結構之間的權值及閾值進行優化,得出適應度函數為

(8)

在利用深度神經網絡進行預測的研究中,目前還沒有一種通用的可適應各種網絡環境的計算方法,反之,在一個環境下性能較高的算法可能在其它環境下預測結果出現偏差較大。因此,需結合所預測的網絡流量情況選擇適當的神經網絡結構和計算方法,如是否需要反饋數據、保留歷史記錄等。
現階段,網絡流量預測模型計算方式通常使用遺傳算法,但使用遺傳算法計算由深度神經網絡構建的預測模型,由于數據的選取、算子設定等因素,初始數據選擇較大則會造成計算速度慢,選擇數據較小則會降低深度神經網絡多隱含特性,引起誤差。


(9)
因此,可設性能指標的求解方程為

(10)
通過上述求解得出使J處于最小值的權值矩陣W。


(11)
為驗證研究網絡流量預測結果的有效性,設計如下實驗。實驗的軟件環境為Windows10操作系統、Matlab R2012b、Libsvm,硬件環境為Intel Core i54670-3.4GHz,8.OGB內存,500GB硬盤,實驗選取不同模型網絡流量預測誤差和模型穩定性兩個指標作為模型有效性評價的標準。圖6為實驗硬件示意圖。

圖6 實驗環境
本次實驗選取流量的一部分數據作為訓練網絡,剩余部分數據作為預測模型的源數據。通過分析過去時間段內的流量數據,進行預測未來時間段內的數據。兩種預測模型進行預測誤差對比,如圖7和表2所示。

圖7 預測誤差對比
分析圖7給出的預測誤差對比信息,可知隨網絡節點數量的增加,模型1與模型2的預測誤差值高,且預測誤差率變化幅度較大,預測準確度低。所提方法在測試過程中的預測誤差值小,且誤差率變化幅度小。
分析表2數據可知所提方法在不同測試階段的平均絕對百分誤差(MAPE)值均小于模型1及模型2的平均絕對百分誤差值;且預測誤差最大值同樣小于模型1及模型2的預測誤差最大值。綜上所述,所提方法可以預測準確率高。
為進一步驗證所提方法的抗干擾性,在不同方法預測網絡流量之前,對網絡施加干擾,干擾信號的幅值在0~1.2Hz之間,干擾信號如圖8所示。將文獻[2]方法作為實驗對照組,在網絡干擾下,將傳統方法的應用穩定性與所提方法作比較,可對比出不同方法的抗干擾性能。

圖8 干擾信號示意圖
由圖9、圖10、圖11實驗結果可以看出,當網絡存在一定干擾時,文獻[2]方法在流量預測時長150~300s之間出現了明顯不穩定現象,其波動幅值達最高到了0.15Hz;文獻[3]方法在流量預測時長48~60s及150~280s之間分別出現了不穩定現象,其波動幅值最高達到了0.1Hz;而相比之下所提方法受網絡干擾的影響較小,僅在流量預測時長150s~300s之間出現了輕微波動。說明所提方法在預測過程中受網絡干擾影響小,可以較穩定地對網絡流量進行預測。

圖9 文獻[2]傳統方法應用穩定性

圖10 文獻[3]傳統方法應用穩定性

圖11 所提方法應用穩定性
由仿真結果可知,基于深度神經網絡的網絡流量預測模型,相比其它傳統方法,預測效果更佳,且具有更優抗干擾性能。該方法具有更好的應用前景。
針對傳統方法存在網絡流量預測結果精確度低、穩定性差等問題,本文提出基于深度神經網絡的網絡流量預測模型。利用隱含層與關聯層幫助提高神經網絡動態記憶力,劃分深度神經網絡為多個神經元。引入輸出向量構建流量動態預測模型,優化模型權值與閾值,完成網絡流量的預測。在仿真對比實驗中,將所提方法模型與其它預測模型對比,該模型輸入信號的平穩程度有所增強,保障預測精度較高的同時,又保障了流量的基本統計特性。仿真結果驗證了所提方法的有效性。因此,所提方法可被應用于流量預測的研究中。
因本人學識有限,論文仍存在不足,在今后的研究中將以網絡流量的預測效率為方向,進一步完善網絡流量預測模型。