張志偉 劉立士


摘? 要:計算機網絡體系逐漸擴大,因此網絡的服務質量和性能也急需提高。網絡流量預測是網絡管理的一個重要手段,研究表明網絡流量具有自相似特性,在此基礎上該文提出一種ARIMA預測模型。該模型首先對所生成的網絡流量數據進行預處理,基于相關性與偏相關性選擇ARMA模型,其次通過AIC、BIC確定階數,利用檢驗后的模型進行預測,最后評估預測模型的性能。ARIMA時間序列模型能夠預測非平穩數據,與傳統統計模型相比,具有可忽略其他的隨機變量、預測準確性更高、突發性影響較小的優點。
關鍵詞:ARIMA模型? 自相似? 流量預測? 研究
中圖分類號:TP393 ? ? ? ? ? 文獻標識碼:A 文章編號:1672-3791(2020)08(b)-0025-03
Research on Arima Prediction Model of Self Similarity Traffic
ZHANG Zhiwei? LIU Lishi*
(Shenyang Ligong University, Shenyang, Liaoning Province, 110159 China)
Abstract: With the gradual expansion of computer network system, the service quality and performance of network also need to be improved. Network traffic prediction is an important means of network management. The research shows that network traffic has self similar characteristics. On this basis, this paper proposes an ARIMA prediction model. Firstly, the model preprocesses the generated network traffic data, selects ARMA model based on correlation and partial correlation, then determines the order through AIC and BIC, uses the tested model to predict, and finally evaluates the performance of the prediction model. ARIMA time series model can predict non-stationary data. Compared with the traditional statistical model, ARIMA time series model has the advantages of ignoring other random variables, higher prediction accuracy and less sudden impact.
Key Words: ARIMA model; Self similarity; Traffic prediction; Research
因互聯網的規模越來越大,網絡擁塞、故障等問題也越來越多,提高網絡服務質量也變的尤為重要。目前的研究表明,網絡流量可以預測是因為自相似性[1],因此其也開辟了一個新的研究方向,即可以對網絡流量進行精準的分析和控制。網絡流量的預測是進行網絡規劃的基礎,對于消除網絡擁塞具有重要的參考價值,選擇一種好的預測模型對自相似流量進行預測,動態實時監測自相似流量,進而篩選、去掉不需要的流量,而且還可以將其引入其他的模塊,進行提前預測,這對解決網絡擁塞有極大的幫助[2]。
1? 自相似流量的特性及預測模型
自相似性簡單來說就是局部和整體相似,目前對于網絡流量的研究過程中少不了自相似性的。對于預測目前有很多方法,傳統的統計預測對事物進行定量分析進而得出預測結果,相比于其他模型更簡便、速度更快,但處理突發流量可能有些吃力,該文選擇ARIMA時間序列方法,建立ARMA[3]模型,通過改進使其對自相似流量進行預測。
2? ARIMA原理及預測模型
ARIMA(p,d,q)(差分自回歸移動平均模型)模型的原理:研究對象隨著時間變化而變化,從而建立一個模型,根據當前序列值預測,得到預測值,但是ARIMA模型處理的是平穩對象,因此,在數據輸入時需要進行預處理,加入一個周期函數,易于操作,最后還原。
ARIMA(p,d,q)模型表達式如(1)所示,L為滯后算子,d為大于0的整數,p是自回歸項,q為移動平均項數,d為時間序列的差分次數。
建立網絡流量預測模型:
ARIMA模型的基本流程如下:(1)導入數據首先判斷序列的平穩性,如果序列非平穩,則進行預處理以獲得平穩序列,這里使用ADF檢驗和KPSS檢驗[4]。而該文數據由ON/OFF模型產生,具有隨機性,就需要引入一個周期函數進行處理。(2)選擇模型,根據時間序列的偏相關函數和自相關函數來判斷選擇的模型,經過驗證,該文選擇ARMA模型。(3)對ARIMA(p,d,q)模型進行定階,這里選擇AIC,BIC最小信息量準則。(4)基于ARIMA估計模型預測差分后的數據,差分還原得到平穩的序列,最后去掉前面加入的函數得到最終流量,與原始流量進行對比分析。最后對模型預測的結果進行評測,用來表示預測值和真實值的吻合程度,這里則選擇MAE(平均絕對誤差)和MAPE(平均絕對百分比誤差),誤差越大,其值越大。
3? 仿真驗證與分析
該文選擇基于ON/OFF模型產生的流量數據,并采用ARIMA模型預測。使用Matlab軟件進行仿真,生成的自相似流量由3個部分構成:信源到達過程、信源時間間隔、持續時間。信源到達過程服從泊松分布poissrnd(λ,1,N),N為列向量數,信源到達率λ=0.5,信源時間間隔服從指數分布exprnd(1/λ,1,N),持續時間服從帕累托分布其中X、K、σ、θ分別為0.01、1.5、1、1,傳送速率(packet/s)。
仿真結果如圖1、圖2所示。這里,圖1是基于ON/OFF模型下產生的自相似流量仿真圖,圖2是在ON/OFF模型中基于ARMA網絡模型預測了自相似流量得到的對比仿真圖。
由圖1、圖2可得,選取了7個點作為對比,在時間為5s、17s、37s、46s、63s、67s、91s處產生的自相似流量數據包個數為60、120、180、360、450、180、120,而經過ARMA預測過得數據包個數約為60、120、181、362、454、182、123,其相對誤差百分比為0、0、0.55%,0.55%、0.88%、0.55%、2.5%,該文使用MAE和MAPE作為評價誤差的指標,仿真得到的MAE=1.1102,MAPE=0.0148%,MAE小于預設值4,MAPE遠小于1,接近于0,誤差較小,因此ARMA模型可以實現網絡流量的預測。
4? 結語
該文選取時間序列模型中的ARMA模型進行流量預測,將ON/OFF模型與ARMA模型有效結合,并通過改進,經過多次驗證,使其能夠處理非平穩數據,減少了部分突發性的問題,也證明了自相似流量是可預測的,如果能通過預測對流量實時監控處理,則可以有效避免網絡擁塞,進而提高整體的服務質量。
參考文獻
[1] 王曉婷,王憶文,李平.一種自相似網絡流量生成器的設計與實現[J].微電子學與計算機,2016,33(8):54-58.
[2] 于雅芮.基于自相似流量預測的AOS幀生成技術研究[D].沈陽理工大學,2020.
[3] 于雅芮,劉立士.自相似流量的小波神經網絡預測模型研究[J].科技資訊,2019,17(16):9-10.
[4] 翟靜,曹俊.基于時間序列ARIMA與BP神經網絡的組合預測模型[J].統計與決策,2016(4):29-32.
[5] 耿傳鑫,劉立士.自相似網絡流量預測模型的研究[J].科技創新導報,2018,15(13):148-149.
[6] 史明虎.基于FARIMA模型的自相似業務流量預測[D].西安電子科技大學,2013.