周向軍
小波核函支持向量機(jī)的網(wǎng)絡(luò)流量預(yù)測(cè)模型
周向軍
為了提高網(wǎng)絡(luò)流量的預(yù)測(cè)精度,提出了一種小波核函數(shù)支持向量機(jī)的網(wǎng)絡(luò)流量預(yù)測(cè)模型。首先收集網(wǎng)絡(luò)流量歷史數(shù)據(jù),然后劃分訓(xùn)練樣本和測(cè)試樣本,將訓(xùn)練樣本輸入到小波核函數(shù)支持向量機(jī)進(jìn)行學(xué)習(xí),最后采用測(cè)試樣本進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)表明,本文模型加快了網(wǎng)絡(luò)流量建模的速度,提高了網(wǎng)絡(luò)流量的預(yù)測(cè)效率,而且可以獲得較高的預(yù)測(cè)精度,比傳統(tǒng)模型具有一定的優(yōu)勢(shì),具有廣泛的應(yīng)用前景。
網(wǎng)絡(luò)流量;支持向量機(jī);核函數(shù);預(yù)測(cè)模型
隨著網(wǎng)絡(luò)規(guī)模日益增大,網(wǎng)絡(luò)用戶(hù)日漸增多,網(wǎng)絡(luò)中的數(shù)據(jù)種類(lèi)越來(lái)越多,流量急劇增加,網(wǎng)絡(luò)擁塞越來(lái)越頻繁[1]。網(wǎng)絡(luò)流量預(yù)測(cè)可以幫助管理人員提前了解網(wǎng)絡(luò)流量發(fā)展趨勢(shì),是網(wǎng)絡(luò)管理的基礎(chǔ),因此如何建立性能優(yōu)異的網(wǎng)絡(luò)流量預(yù)測(cè)模型,提高網(wǎng)絡(luò)流量的預(yù)測(cè)精度,一直是人們關(guān)注的焦點(diǎn)[2]。
針對(duì)網(wǎng)絡(luò)流量預(yù)測(cè)問(wèn)題,國(guó)內(nèi)外學(xué)者對(duì)網(wǎng)絡(luò)流量預(yù)測(cè)問(wèn)題進(jìn)行大量研究,傳統(tǒng)預(yù)測(cè)模型有多元線(xiàn)性回歸法、滑動(dòng)平均法、差分自回歸移動(dòng)平均法、指數(shù)平滑法等[3-5],由于網(wǎng)絡(luò)流量受到多因素影響,具有突變性,傳統(tǒng)線(xiàn)性模型難以建立準(zhǔn)確的預(yù)測(cè)模型[6]。針對(duì)網(wǎng)絡(luò)流量變化特點(diǎn),一些學(xué)者將非線(xiàn)性理論引入到網(wǎng)絡(luò)流量預(yù)測(cè)中,出現(xiàn)支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等預(yù)測(cè)模型,它們較好描述了網(wǎng)絡(luò)流量變化趨勢(shì),網(wǎng)絡(luò)流量的預(yù)測(cè)精度大幅度提高[7-9]。神經(jīng)網(wǎng)絡(luò)雖然具有非線(xiàn)性的建模能力,但訓(xùn)練樣本規(guī)模要求大,不然就會(huì)出現(xiàn)“過(guò)擬合”等缺陷,預(yù)測(cè)精度低[10]。支持向量機(jī)較好地解決了非線(xiàn)性預(yù)測(cè)問(wèn)題,比神經(jīng)網(wǎng)絡(luò)取得了更優(yōu)的預(yù)測(cè)效果[11],在實(shí)際應(yīng)用中,支持向量機(jī)的性能與核函數(shù)選擇密切相關(guān),當(dāng)前核函數(shù)眾多,但是還沒(méi)有一個(gè)通用性強(qiáng)的核函數(shù)[12]。
小波核函數(shù)具有多尺度學(xué)習(xí)性能,可以反映復(fù)雜多變的網(wǎng)絡(luò)流量變化特性,為了提高網(wǎng)絡(luò)流量的預(yù)測(cè)精度,針對(duì)支持向量機(jī)的核函數(shù)構(gòu)建問(wèn)題,提出一種小波核函數(shù)支持向量機(jī)的網(wǎng)絡(luò)流量預(yù)測(cè)模型(簡(jiǎn)稱(chēng)小波支持向量機(jī))。首先收集網(wǎng)絡(luò)流量歷史數(shù)據(jù),然后劃分訓(xùn)練樣本和測(cè)試樣本,將訓(xùn)練樣本輸入到小波核函數(shù)支持向量機(jī)進(jìn)行學(xué)習(xí),最后采用測(cè)試樣本進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)表明,本文模型加快了網(wǎng)絡(luò)流量建模的速度,提高了網(wǎng)絡(luò)流量的預(yù)測(cè)效率,而且可以獲得較高的預(yù)測(cè)精度,比傳統(tǒng)模型具有一定的優(yōu)勢(shì),具有一定的實(shí)際應(yīng)用價(jià)值。

SVM的回歸是對(duì)式(5)的問(wèn)題進(jìn)行求解如公式(2):

式中,ei為回歸誤差,C為懲罰參數(shù)。
引入拉格朗日函數(shù),將式(2)轉(zhuǎn)為無(wú)約束優(yōu)化問(wèn)題,即公式(3):

式中,αi為拉格朗日乘子。
根據(jù)最優(yōu)化理論中的KKT理論,得到公式(4):

對(duì)公式(4)消去w和ei,得到公式(5):

其中E=[1,...,1]T,α=[α1,...,αl],y=[y1,...,yl]T,Ωij=φ(xi)T.φ(xj)。
根據(jù)Mercer條件,核函數(shù)定義如公式(6):

根據(jù)式(18)可以得到公式(7):

根據(jù)Q=Ω+γ-1I得到公式(8):

SVM的回歸函數(shù)可表示為公式(9):

式中,k(xi, x))表示核函數(shù)。
在支持向量機(jī)中,核函數(shù)避免了高維的特征空間,降低了計(jì)算復(fù)雜度,常用的核函數(shù)如表1所示:

表1 常用核函數(shù)
2.1小波核函數(shù)
小波分析既保留了傅立葉變換的優(yōu)點(diǎn),又彌補(bǔ)了傅立葉變換的不足,設(shè)φ(x)是一個(gè)母波,a和b分別為尺度參數(shù)和平移參數(shù),若x,x'∈Rn,那么小波核函數(shù)為公式(10):

當(dāng)且僅當(dāng)k(x)的傅立葉變換為公式(11):

是非負(fù)的時(shí)候,平移不變核K(x, x')=k(x-x')是可以作為支持向量的核函數(shù)。此時(shí),滿(mǎn) 足Mercer平移不變性核定理的小波核函數(shù)為公式(12):

2.2小波支持向量機(jī)
在小波支持向量機(jī)建模時(shí),核函數(shù)運(yùn)算時(shí)間要相較稱(chēng),這樣訓(xùn)練效率下降文,為了獲取更好的實(shí)時(shí)預(yù)測(cè)性能,將該在線(xiàn)訓(xùn)練算法與小波支持向量機(jī)相結(jié)融合,通過(guò)緩存矩陣用來(lái)保存重要的核函數(shù),提高小波支持向量機(jī)的訓(xùn)練效率。
(1)構(gòu)建四個(gè)矩陣K(Xn,XS),K(Xn,XE),K(Xn,XR)和K(Xn,Xc),它們的代表矩陣結(jié)構(gòu)為公式(13)、(14):


其中,G為M,S或E;j為G的樣本數(shù);i為E∪R∪M∪C的樣本數(shù);xGk∈G,xnk∈ERMc ,k=1,2,,i 。
(2)新樣本Xc分配到集合G,為公式(15):

(3)當(dāng)樣本xG1從集合G1進(jìn)入集合G2時(shí),按下式更新K(Xn,XG1)和K(Xn,XG2)為公式(16)、(17)、(18):

式中,xGli∈G1,i=1,2,…,m;m為集合Gl的樣本個(gè)數(shù)。
(4)當(dāng)Xc被淘汰出訓(xùn)練樣本集合時(shí),按如下形式更新K(Xn,XS)、K(Xn,XE)、K(Xn,XR)為公式(19):

式中,xGi∈G,i=1,2,…,m;m為集合G 樣本個(gè)數(shù)。
當(dāng)更新樣本集時(shí),利用這四個(gè)要矩陣儲(chǔ)存重要的核函數(shù)信息,提高AOSVM算法的計(jì)算效率。
3.1數(shù)據(jù)源
為了測(cè)試小波支持向量機(jī)的網(wǎng)絡(luò)流量預(yù)測(cè)模型的性能,選擇權(quán)威實(shí)測(cè)流量數(shù)據(jù)集作為研究對(duì)象,收集了路由器Incoming articles從2014年3月1日到2014年3月15日的每小時(shí)網(wǎng)絡(luò)流,得300個(gè)數(shù)據(jù),它們具體如圖1所示:

圖1 網(wǎng)絡(luò)流量數(shù)據(jù)
選擇平均相對(duì)誤差(MAE)、均方根誤差(RMSE)和預(yù)測(cè)時(shí)間t作為預(yù)測(cè)結(jié)果的評(píng)估指標(biāo),MAE和RMSE定義如公式(20)、(21):

式中,xk是樣本k的真實(shí)值,為樣本k的預(yù)測(cè)值。
3.2結(jié)果與分析
為了測(cè)試小波核函數(shù)的優(yōu)越性,選擇用Poly核函數(shù)和RBF核函數(shù)的支持向量機(jī)進(jìn)行對(duì)比實(shí)驗(yàn),前900個(gè)數(shù)據(jù)作為訓(xùn)練集建立預(yù)測(cè)模型,后100個(gè)數(shù)據(jù)作為測(cè)試集進(jìn)行預(yù)測(cè)檢驗(yàn)。它們的預(yù)測(cè)結(jié)果如圖2所示:


圖2 與其它核函數(shù)的支持向量機(jī)結(jié)果對(duì)比
MAE、RMSE以及T的統(tǒng)計(jì)結(jié)果如表2所示:

表2 與其它核函數(shù)預(yù)測(cè)性能對(duì)比
從表2的結(jié)果可知,要對(duì)于對(duì)比核函數(shù)的支持向量機(jī),小波支持向量機(jī)的預(yù)測(cè)精度略有提高,但是執(zhí)行時(shí)間大幅度減少,這主要是由于引入了緩沖矩陣,加速了訓(xùn)練時(shí)間,提高了預(yù)測(cè)效率,同時(shí)旨入小波核函數(shù)建立了更優(yōu)的支持向量機(jī),提高了預(yù)測(cè)精度。
為了進(jìn)一步分析小波支持向量機(jī)的優(yōu)越性,選擇經(jīng)典模型—ARMA進(jìn)行對(duì)比實(shí)驗(yàn),ARIMA的預(yù)測(cè)結(jié)果如圖3所示:

圖3 ARMA的預(yù)測(cè)結(jié)果
MAE、RMSE以及T的統(tǒng)計(jì)結(jié)果如表3所示:

表3 與經(jīng)典模型預(yù)測(cè)性能對(duì)比
從表3中可以看出,ARMA的建模效率高,但預(yù)測(cè)精準(zhǔn)度低于小波支持向量機(jī),這主要是由于ARMA模型依賴(lài)大量的樣本數(shù)據(jù)來(lái)進(jìn)行擬合預(yù)測(cè)的,在小樣本數(shù)據(jù)的情況下,預(yù)測(cè)性能大大降低,則小支持向量機(jī)在樣本數(shù)量少,也可以獲得較高的預(yù)測(cè)精度,相對(duì)于預(yù)測(cè)精度,預(yù)測(cè)速率的微小損失是值得的。
為了提高網(wǎng)絡(luò)流量預(yù)測(cè)精度,提出了一種小波支持向量機(jī)的網(wǎng)絡(luò)流量預(yù)測(cè)模型。首先分析了當(dāng)前網(wǎng)絡(luò)流量的研究現(xiàn)狀,然后針對(duì)支持向量機(jī)的核函數(shù)構(gòu)建問(wèn)題,提出利用小波核函作為支持向量機(jī)的核函數(shù),并采用具體的仿真實(shí)驗(yàn)測(cè)試其有效性。實(shí)驗(yàn)表明,相對(duì)于其它核函數(shù)的支持向量機(jī),本文模型的預(yù)測(cè)精度更高,比傳統(tǒng)的流量預(yù)測(cè)算法相比,不僅加快了網(wǎng)絡(luò)流量的建模速度,而且預(yù)測(cè)精度更高。
[1] 張賓,楊家海,吳建平. Internet 流量模型分析與評(píng)述[J].軟件學(xué)報(bào),2011, 22(1):115-131.
[2] Chuang L Y, Wei T S, Yhong Y C. Chaotic catfish particle swarm optimization for solving global numerical optimization problems [J]. Applied Mathematics and Computation, 2011, 217: 6900-6916.
[3] Callado A, Keu R J, Sadok D, et a1.Better network traffic identification through the independent combination of techniques [J]. Journal of Network and Computer Applications, 2010, 33(4):433-446.
[4] 李世銀,徐冬,劉瓊,等. 網(wǎng)絡(luò)自相似流量預(yù)測(cè)及擁塞控制研究[J]. 系統(tǒng)仿真學(xué)報(bào),2009,21(21):6935-6939.
[5] 程光,龔儉. 大規(guī)模網(wǎng)絡(luò)流量宏觀行為周期性分析研究[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2003, 24(6): 992-994.
[6] 姜明,吳春明,張曼,胡大民. 網(wǎng)絡(luò)流量預(yù)測(cè)中的時(shí)間序列模型比較研究[J]. 電子學(xué)報(bào),2009,37(11):2353-2358.
[7] 鄔平,吳斌. 采用回歸方法優(yōu)化網(wǎng)絡(luò)流量管理模型處理性能[J]. 計(jì)算機(jī)工程與應(yīng)用,2012, 48(4): 104-106.
[8] 高波,張欽宇,梁永生. 基于EMD及ARMA的自相似網(wǎng)絡(luò)流量預(yù)測(cè)[J]. 通信學(xué)報(bào),2011,(32)04-47-56
[9] 趙振江. 基于PSO-BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測(cè)與研究[J]. 計(jì)算機(jī)應(yīng)用與軟件,2009,26(1):218-221
[10] 熊南,劉百芬. 基于自適應(yīng)粒子群優(yōu)化LSSVM的網(wǎng)絡(luò)流量在線(xiàn)預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2013,30(9):21-24,127
[11] 張文金,許愛(ài)軍. 混沌理論和LSSVM相結(jié)合的網(wǎng)絡(luò)流量預(yù)測(cè)[J]. 計(jì)算機(jī)工程與應(yīng)用,2013,49(15):101-104.
[12] 張穎璐. 基于遺傳算法優(yōu)化支持向量機(jī)的網(wǎng)絡(luò)流量預(yù)測(cè)[J].計(jì)算機(jī)科學(xué),2008,35(5):177-180.
Network Traffic Prediction Model Based on Wavelet Kernel Function Support Vector Machine
Zhou Xiangjun
(Department of Information Technology, Guangdong Teachers College of Foreign Language and Arts, Guangzhou 510507, China)
In order to improve the prediction accuracy of network traffic, a new network traffic prediction model based on wavelet kernel function support vector machine is proposed. First, the historical data of network traffic is collected, then the training samples and test samples are divided, and the training samples are input to the wavelet kernel function support vector machine to learn. Finally, the test samples are used to carry out simulation experiments. Experimental results show that this model accelerated the speed of network traffic modeling, improve the efficiency of the network traffic prediction, and can obtain higher prediction accuracy, has certain superiority compared to the traditional model, has a wide application prospect.
Network Traffic; Support Vector Machine; Kernel Function; Prediction Model
TP393
A
1007-757X(2016)06-0062-04
2016.01.26)
周向軍(1971-),男,漢族,汕頭人,廣東省外語(yǔ)藝術(shù)職業(yè)學(xué)院,信息技術(shù)系,副教授,碩士,研究方向:計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、計(jì)算機(jī)多媒體,廣州,510507