邱 婧,夏靖波,吳吉祥
(空軍工程大學 電訊工程學院,陜西 西安710077)
網絡流量預測是流量工程、擁塞控制、網絡業務管理的核心問題。近年來的研究發現,網絡流量即使在流量突變時也呈現出一定的變化規律,這使得對網絡流量序列進行分析、預測成為可能。一旦能夠較早準確地預測出流量的變化趨勢,進而設計出高效的擁塞控制機制,合理地進行資源分配與調度,即可減少或避免擁塞的發生,提高網絡資源的利用率。因此,網絡流量的預測一直是研究人員所關心的重要課題,也是難度較大的研究領域之一。網絡流量預測就是針對網絡的流量數據,通過所建立的數學模型對流量進行預測。一個理想的網絡流量模型應該滿足以下幾個方面的要求:①能夠準確地刻畫與網絡流量相關的統計特性;②在計算上是高效可行的;③可以應用在與網絡設計相關的分析過程中。
國內外專家根據網絡流量特性的不斷發展陸續提出了許多模型,有按預測長短分類的,有按平穩性分類的等,這些模型擁有各自的優缺點。但是隨著網絡的不斷發展以及對網絡流量特性的深入研究后發現,實際網絡中的流量具有長相關、自相似、單分形和多分形[1-2]等多種特性,以往單一模型不能完全對網絡流量的這些特性進行兼顧,通過將不同的單一模型進行組合后對流量進行預測成為新的研究方向。因此網絡流量預測按所使用的模型可分為單一預測模型和組合預測模型,單一預測模型又可分為線性預測和非線性預測;組合預測模型綜合了2種或2種以上單一模型,利用多個不同的模型刻畫流量不同的特性,然后將它們組合起來得到擬合流量來預測網絡流量。本文將圍繞單一預測模型和組合預測模型的分類和各自的特點展開討論。
網絡流量數據屬于時間序列數據,通過當前時刻的一組觀測流量數據Xn-i(i=0,1,2,…,n)建立相應的數學模型來計算來某一時刻的流量Xn+k。傳統的網絡流量預測模型都是單一預測模型,即采用一種數學模型對網絡流量數據進行預測,單一預測模型根據模型輸入輸出數據之間的關系分為線性預測模型和非線性預測模型。
早期研究認為網絡流量服從Poisson分布或近似為Markov過程,一般多采用基于自回歸 (AR)或自回歸滑動平均 (ARMA)[3]的線性預測模型。近年來對網絡流量進一步研究后發現網絡流量具有自相似性[1],人們開始采用能夠表征長相關性和突發性的自相似模型來描述網絡流量,各種基于自相似性的流量模型被不斷地提出。文獻 [4-5]提出的自回歸求和滑動平均模型 (ARIMA)模型基于ARMA模型,通過若干次差分使序列更平穩,較之傳統隨機模型能更好地描述網絡流量多構性、突發連續性和自相似性等特征,它作為線性預測的代表得到了廣泛的應用,但ARIMA模型只能用于處理齊次的非平穩性過程,不能對網絡流量進行長期預測。文獻 [6]使用長相關模型差分自回歸求和滑動平均模型 (FARIMA),利用 “后向預報”技術對序列進行分析反濾波,在參數估計中利用粗、精估計結合的方法建立模型,將FARIMA過程視為分形高斯噪聲經過一個以ARMA參數為濾波器系數進行濾波的結果,因參數簡單而成為自相似網絡流量建模的主要工具,但是計算量比較大。
單一線性預測模型由于數學理論比較完善,應用十分廣泛,較好地滿足了早期網絡的建模需求,在網絡設計、維護、管理和性能分析等方面發揮了很大的作用。但是隨著網絡應用的不斷增多,人們研究發現,網絡流量的某些特性已遠遠超出傳統隊列中的Poisson和Markov流量模型的框架,用線性方法來預測非線型的網絡流量在理論上就存在不足,其預測精度不高。
大規模網絡本身是復雜非線性系統,同時受多種外界因素影響,不僅呈現出非平穩動態隨機變化特性,且其內部運行關系也很難確定。隨著智能算法的不斷發展,其良好的非線性映射能力、靈活有效地學習方式,在預測領域的應用中表現出較大的優勢和潛力,如小波分析、神經網絡理論、混沌理論、支持向量機方法等。典型的非線性預測方法包括神經 網絡模型[7]、灰色模型[8]、混沌模型[9-11]、支持向量機模型[12]等。神經網絡結構具有很強的自學習能力和逼近任意非線性系統的能力。灰色模型通過對已知數據的生成變換,挖掘隱含在其中的規律,由于網絡中一條鏈路或路徑流量的影響因素很多,不完全明確或無法量化,因此便可將網絡中某一條鏈路流量看作一個灰數,用灰色理論分析。混沌模型中基于最大Lyapunov指數的預測方法是直接根據數據序列本身所蘊含的規律來進行預測,不需要實現建立主觀的分析模型,它具有精度高、可信度高的優點。支持向量機以結構風險最小化原則取代傳統機器學習方法中的經驗風險最小化原則,具有很好的泛化能力,在小樣本的機器學習中顯示出了優異的性能,它克服了神經網絡方法固有的局部極小、過學習以及結構和類型的選擇過分依賴經驗等缺陷,已經被廣泛應用于非線性時間序列預測中,并取得了良好的效果。
但目前來說,神經網絡模型還有很多有待改進的地方,其性能還不十分穩定,而且預測時需要大量的訓練樣本和迭代,還要不斷修正模型,從而增加了時間和空間復雜性。此外,單、多步長的預測關系,短長范圍的預測關系及神經網絡自身等還有很多工作以待研究。灰色模型由于本身的存在缺陷,使其僅能適用原始數據序列按指數規律變化且變化速度不快的場合,而當時間序列數據呈不規則波動變化時,數據擬合效果就顯得不夠理想,且預測值精度不高[13]。采用支持向量機求解問題需要選擇一個核函數,目前對核函數及其參數的選擇仍沒有一個統一的模式。支持向量機算法模型的選擇還只能是憑借經驗、實驗對比、大范圍搜索或者利用交叉驗證功能進行尋優。而基于小波分析模型的預測實時性較差[14-15]。
隨著網絡的普及和P2P等新應用的不斷出現,網絡業務需求激增,影響網絡流量特性的不確定因素 (新應用、協議結構變化等)非常多,非線性、多時間尺度的變化越來越明顯,使得網絡流量在一定程度上呈現出隨機和不確定的特性,這些特性可以通過突發性、長相關、周期性和混沌性等來描述。采用單一的預測模型來刻畫網絡流量的原始特性,進行預測時不可避免地會產生較大的誤差。
因此選擇合適的模型是網絡流量預測面臨的關鍵問題。就一個問題的預測而言,可以選用不同的預測方法,通過各種預測模型從不同角度對系統進行模擬,它們之間有著相互聯系的一面,組合預測模型就是把不同的預測模型綜合起來,取長補短,從而達到提高預測精度和增加預測可靠性的效果。近年來,不斷有學者根據復雜網絡流量存在多個特性的事實,采用多個不同的單一預測模型刻畫相應的特性,然后將它們有機組合起來得到擬合流量來預測網絡業務流量,大都取得不錯的預測效果。
對于網絡流量的組合預測有多種形式,根據各個模型之間的組合方式不同,組合預測模型大致可分為3類:線性組合模型、優化組合模型、分解重構組合模型。
線性組合模型就是把不同的單一預測模型組合起來,綜合利用各預測模型所提供的信息,以適當的加權平均形式得出組合預測值,如圖1所示。

圖1 線性組合模型
文獻 [8]在一定條件下分別得到灰色模型和神經網絡模型的預測值,再對兩者的預測值進行加權平均最后得到組合模型的最優預測值。兩者的組合既能克服神經網絡的局限性,又能在長期預測中獲得較為精確的預測值。
文獻 [16]根據神經網絡的自學習能力和模糊邏輯的動態性和及時性等特點,將模糊邏輯和神經網絡有機的結合起來,利用一個具有五層結構的模糊神經網絡 (FNN)作為新模型進行網絡流量預測。仿真結果表明,FNN能夠很好的預測復雜網絡業務,比單獨的神經網絡模型具有更快的收斂速度和更好的預測性能,這為復雜網絡的網絡業務流量的預測研究提供了一種有效途徑。
線性組合模型是組合預測模型中最簡單的組合方式,它利用不同單一預測模型從不同的角度提供各個方面有用的信息,博采眾長,對各個單一模型得到的預測值進行加權組合,從而得到整個組合模型的預測值。線性組合預側的關鍵是如何求出加權系數,使得組合預測模型更加有效地提高預測精度。
優化組合模型有兩種實現方式,一種是先用某種方法對流量序列數據進行預處理,再用單一預測模型對處理后的序列進行預測;另一種是先建立單一預測模型,再用其它方法對模型進行修正,最后用修正之后的模型進行預測。優化組合模型通過一系列的預處理和修正提取出真正能夠反映網絡流量特性的信息建立起預測模型,從而提高了模型的預測性能,如圖2所示。

圖2 優化組合模型
目前的研究結果表明網絡流量存在著混沌特性,混沌支持向量機預測模型首先根據混沌系統的相空間重構理論求出訓練歷史數據的最佳嵌入維數d和時延S,生成訓練樣本;再對生成的訓練樣本進行歸一化處理,以便提高收斂速度、縮短訓練時間;最后生成的訓練樣本利用支持向量機回歸進行訓練,得到預測模型。文獻 [17]采用相空間重構理論計算實際流量的延時、嵌入維數和Lyapunov指數,證實網絡流量存在混沌現象;據此建立混沌-支持向量機預測模型,并確定訓練樣本對實際網絡流量數據進行預測。
文獻 [13]根據網絡流量歷史數據用灰色模型GM(1,1)進行預測,并用自適應過濾法[18]對GM (1,1)預測時產生的殘差進行修正,從而達到較高的預測精度。該方法綜合了GM (1,1)預測所需原始數據少、方法簡單等特點,具有較高的應用價值。
目前對于網絡流量的預測多采用智能算法如神經網絡、支持向量機等,但是智能算法對樣本數據的要求較高,而網絡流量本身又具有復雜的行為特性,給建模和計算都帶來了一定的難度。優化組合模型則通過對樣本數據進行一定的處理,提取出對建模有用的確定性數據,或者對初始預測模型進行修正,然后建立組合預測模型對網絡流量進行預測,降低了算法的難度和預測模型的復雜度,提高了預測精度和效率。
網絡流量具有較高的復雜性、非線性、不平穩特性,而小波變換的核心是多尺度分析,它通過小波基的伸縮變換,研究信號各個尺度層次上的信息。小波變換在信號分析方面顯示了獨特的優勢,被廣泛應用于理論研究中。分解重構組合模型就是通過離散小波對網絡流量序列進行多尺度分解和單支重構,獲得1個逼近信號和多個細節信號,對逼近信號和細節信號分別用不同的單一預測模型進行預測,最后把各個預測的信號通過擬合生成流量的最終預測結果,如圖3所示。

圖3 分解重構組合模型
網絡流量序列經過小波分解后,可采用單一線性或者非線性預測模型對分解信號序列進行預測,目前分解重構組合模型主要的結合方式有:
(1)小波變換與線性預測模型結合:文獻 [19]將網絡流量通過小波分解成不同尺度下的逼近信號和細節信號,然后分別單支重構成低頻序列和高頻序列。根據低頻序列和高頻序列的不同特性,分別采用自回歸模型 (AR)和線性最小均方誤差估計 (LMMSE)[20]對未來網絡流量進行預測,最后重新組合生成預測流量。
(2)小波變換與神經網絡結合:文獻 [21]提出了一種基于小波變換和FIR神經網絡的廣域網網絡流量預測模型,首先采用小波分解把網絡流量數據分解成小波系數和尺度系數,即高頻系數和低頻系數,將這些不同頻率成分的系數單支重構為高頻流量分量和低頻流量分量,再用FIR神經網絡對這些分量分別進行預測,將合成之后的結果作為原始網絡流量的預測值。文獻 [22]提出了一種基于Elman遞歸神經網絡、小波和自回歸的網絡流量組合預測模型,將非線性時間序列施行小波變換,對具有平穩特征的尺度系數序列用AR模型進行預測;而對體現了網絡流量非線性、非平穩特性的小波系數序列使用Elman遞歸神經網絡進行預測,最后通過Mallat算法重構得到網絡流量的預測值。還有基于下一代網絡 (NGN)的運行環境[23],將神經網絡中的轉移函數使用小波函數來替代從而構建出另一種小波神經網絡 (WNN),同時使用小波多尺度變換方法將原始流量信號分解成不同頻率成分的分量信號并將其送到該模型中進行預測。
(3)小波變換與支持向量機結合:文獻 [24]首先將原始流量數據時間序列進行小波分解,并將分解得到的近似部分和各細節部分分別單支重構到原級別上;對各個重構后的序列分別用最小二乘支持向量機進行預測,將各個預測結果重構后得到對原始序列的預測結果。
(4)小波變換與灰色模型結合:文獻 [25]通過將小波分解的平穩化處理優點和灰色理論中的平移處理優點結合起來,根據各自的預測原理建立了基于灰色小波的網絡流量預測模型。模型首先對網絡流量序列進行小波分解,分解后的時間序列分別用灰色理論進行平移預處理,然后對預處理后的序列數據進行預測并重構,從而得到原始時間序列的預測值。
流量序列經過小波多尺度分解后,可以得到近似信號序列和各層的細節信號序列,近似信號序列包含了流量的趨勢項部分,對該部分的預測最為重要;各層的細節信號是網絡的突發部分,體現了流量的局部特征,可以作為對趨勢項的補充。通過小波分解使網絡流量的復雜特性得到分解,得到特性相對比較單一、更加易于預測的時間序列,在此基礎上建立能夠刻畫對應序列特性的模型,得到能夠充分反映網路流量總體趨勢和細節的預測值。因此分解重構組合模型較之線性組合模型和優化組合模型來說,對于網絡流量的預測更加全面、精確。目前對于組合預測模型的研究大多是建立在小波分解的基礎上,國內外學者正嘗試用不同的預測模型對分解后的分支序列進行預測,再將各預測值進行擬合以得到更加精確、可靠的預測值。
應用組合預測模型來預測網絡流量的時候,可以擬合多個模型的優點,更全面地刻畫復雜的流量特性,相對于單一預測模型來說,具有更好的預測效果。基于此,可以認為采用組合預測模型可以更加準確、全面地描述和預測實際網絡流量。目前,這方面的工作仍在探討與研究中。
流量預測作為記錄和反映網絡及其用戶活動的重要載體和為網絡中帶寬分配、流量控制、選路控制、接納控制、安全管理提供有效依據,是目前研究的一個熱點問題。組合預測模型是流量預測的研究趨勢,怎樣建立一個合適的、能夠精確預測網絡流量的模型是有待進一步解決的問題。
鑒于網絡流量本身具有的復雜性與動態性,對網絡流量進行預測應更多地從以下幾方面考慮:
(1)組合預測模型的工作仍在探討與研究中,建立組合模型的主要難點在于確定合適的網絡業務特性及其使用方法;
(2)目前大多數流量預測模型僅僅是對歷史數據的分析,但是在實時網絡流量中由于流量數據的不確定性致使預測模型算法復雜,預測精度不高,因此有必要進一步探索能夠精確預測實時網絡流量的預測模型;
(3)目前網絡流量預測都是針對互聯網網絡流量,對于無線通信網絡與移動通信網絡流量是否也可以用相關模型進行預測是值得進一步探討的問題。
[1]YI Q,Skieewicz J,Dinda P.An empirical study of the multiscale predictability of network traffic [C].IEEE International Symposium on High Performance Distributed Computing,2004:66-76.
[2]Rezaul K M,Grout V.An overview of long-range dependent network traffic engineering and analysis [C].Nantes,France:Charaeteristics,Simulation,Modelling and Control in Proceedings of the 2nd International Conference on Performance Evaluation Method Ologies and Tools,2007:1-10.
[3]Swiecimka P O,KwaPien J,Drozdz S.Wavelet versus descended fluctuation analysis of multifractal structures [J].Physical Review,2006,74 (1):188-190.
[4]YU Guoqiang,ZHANG Changshui.Switching ARIMA model based forecasting for traffic flow [C].Proc of ICASSP.Piscataway:IEEE,2004:429-432.
[5]Zare M H,Masnadi-Shirazi M A.Arima model for network traffic prediction and anomaly detection [C].ITSim’08.Kuala Lumpur:IEEE Press,2008:1-6.
[6]LI Shining,YAN Yan,QIN Zheng.Network traffic forecast based on Farima model [J].Computer Engineering and Applications,2006,42 (29):148-150 (in Chinese).[李士寧,閆焱,覃征.基于FARIMA模型的網絡流量預測 [J].計算機工程與應用,2006,42 (29):148-150.]
[7]Junsong W,Jiukun W,Maohu Z,et al.Prediction of internettraffic based on Elman neural network [C].Guilin:Chinese Control and Deeision Conferenee,2009:1248-1252.
[8]CAO Jianhua,LIU Yuan,DAI Yue.Network traffic prediction based on error advanced DGM (1,1)model [C].International Conference on Wireless Communications Networking and Mobile Computing,2007:6353-6356.
[9]DOU L,Binghui J,Haige X.The on-line predietion of selfsimilar traffic based on chaos theory [C].International Conference on Wireless Communications Networking and Mobile Computing,2006:1-4.
[10]LIU R,SHEN J,ZHANG D,et al.Chaotic forecast of the signaling traffic in NGN [C].China:Control Conference,2008:198-201.
[11]Jinjun L,Zhiquan W.Internet traffic dalaflos forecast by RBF neural network based on phase srace reconstruction [J].Transactions of Nanjing University of Aeronautics & Astronautics,2006,23 (4):316-322.
[12]WANG H F,HU D J.Comparison of SVM and LS-SVM for regression [C].International Conference on Neural Networks and Brain,2005.
[13]MA Hualin,LI Cuifeng,ZHANG Liyan.Network traffic prediction based on grey model and adaptive filter [J].Computer Engineering,2009,35 (1):130-131 (in Chinese).[馬華林,李翠鳳,張立燕.基于灰色模型和自適應過濾的網絡流量預測 [J].計算機工程,2009,35 (1):130-131.]
[14]YANG Jiahai, WU Jianping, AN Changqing. Internet measurement theory and application [M].Beijing:Posts & Telecom Press,1999 (in Chinese).[楊家海,吳建平,安常青.互聯網絡測量理論與應用 [M].北京:人民郵電出版社,2009.]
[15] WEN Chenglin,ZHOU Donghua. Multiscale estimation theory and its application [M].Beijing:Tsinghua University Press,2002(in Chinese).[文成林,周東華.多尺度估計理論及其應用 [M].北京:清華大學出版社,2002.]
[16]WANG Zhaoxia,HAO Tingzhu,CHEN Zengqiang,et al.Predicting nonlinear network using fuzzy neural network [C].Information Communications and Signal and the Fourth Pacific Rim Conference on Multimedia,2003:1697-1701.
[17]LUO Yunqian,XIA Jingbo,WANG Huanbi.Application of
chaos-support vector machine regression in traffic prediction[J].Computer Science,2009,36 (7):244-245 (in Chinese).[羅赟騫,夏靖波,王煥彬.混沌-支持向量機回歸在流量預測中的應用研究 [J].計算機科學,2009,36(7):244-245.]
[18]LIU Xianxing,DING Fei,HU Zhentao,et al.Adaptive filtering algorithm of noise variances based on modified“Current”statistical model [J].Chinese of Journal Electronics,2006,15 (2):265-266.
[19]LI Xiaohang,LIU Yuan,LIU Yuanzhen.Research on network traffic combination prediction method based on wavelet multi-scale analysis [J]. Microelectronics & Computer,2008,25 (1):130-133 (in Chinese).[李小航,劉淵,劉元珍.基于小波多尺度分析的網絡流量組合預測方法研究 [J].微電子學與計算機,2008,25 (1):130-133.]
[20]Gospodinov M.Wavelet-based analysis of simulated net-work traffic [C].Bulgaria:International Conference on Computer Systems and Technologies-Comp Sys Tech University of Veliko Tarnovo,2006.
[21]TIAN Nili,YU Li.AWAN network traffic prediction model based on wavelet transform and FIR neural networks [J].Journal of Electronics &Information Teehnology,2008,30(10):2549 (in Chinese).[田妮莉,喻莉.一種基于小波變換和FIR神經網絡的廣域網網絡流量預測模型 [J].電子與信息學報,2008,30 (10):2549.]
[22]LIU Yuan,YAO Meng.Combination prediction model of network traffic based on recurrent neural networks [J].Computer Engineering and Design,2008,29 (3):700 (in Chinese).[劉淵,姚萌.基于遞歸神經網絡的網絡流量組合預測模型 [J].計算機工程與設計,2008,29(3):700.]
[23]ZHAO Qigang,FANG Xuming,LI Qunzhan,et al.WNN based NGN traffic prediction [R].Chengdu:Proc ISADS,2005:230-234.
[24]LIU Yuan,WANG Peng.Combining wavelet transform and Bayesian least squares support vector machines to predict network traffic [J].Application Research of Computers,2009,26 (6):2229-2231 (in Chinese).[劉淵,王鵬.融合小波變換與貝葉斯LS-SVM的網絡流量預測 [J].計算機應用研究,2009,26 (6):2229-2231.]
[25]GONG Linming,ZHANG Zhenguo.Combination prediction model to network traffic based on grey-wavelet [J].Computer Engineering and Design,2010,31 (8):1660-1661 (in Chinese).[鞏林明,張振國.基于灰色小波的網絡流量組合預測模型 [J].計算機工程與設計,2010,31 (8):1660-1661.]