



摘要:現有Web服務器仿真流量預測由于對突發流量變化的適應性不足,存在相對偏差較大、置信水平較低等問題。文章提出基于改進Prophet模型的Web服務器訪問流量預測方法。首先對Web服務器歷史訪問流量數據進行預處理,然后基于經驗模態分解技術對數據進一步分解,提取頻率特征明顯的訪問流量時間序列,最后應用改進Prophet模型分解訪問流量時間序列,通過分量求和實現Web服務器訪問流量預測。實驗結果證明,應用該設計方法,相對偏差不超過0.1,置信水平不低于96%,可實現對Web服務器訪問流量的精準預測。
關鍵詞:改進Prophet模型;Web服務器;訪問流量預測;經驗模態分解
中圖分類號:TP391.9" 文獻標志碼:A
0 引言
隨著互聯網的逐漸普及和廣泛應用,萬維網(World Wide Web,Web)服務器訪問流量預測問題受到研究領域的重視與關注,眾多學者開展研究并已經取得一定研究成果。如孟智慧等[1]提出基于堆疊的長短期記憶網絡預測方法。該方法利用堆疊長短期記憶網絡對流量數據學習,提取流量特征,根據特征預測未來某一時刻的流量值。田愛寶等[2]提出基于Transformer的預測方法。該方法利用Transformer模型通過自注意力機制自動提取輸入流量序列中的特征,捕捉不同時間點之間的長期依賴關系,從而預測訪問流量。以上方法在實際應用中存在相對偏差較大且置信水平較低等問題。針對上述研究的不足,本文開展基于改進Prophet模型的Web服務器訪問流量預測方法研究。
1 Web服務器歷史訪問流量數據預處理與分解設計
在Web服務器日志文件中,每一條記錄都包含有關訪問活動的詳細信息。為便于后續處理,在完成流量數據采集后,對其進行預處理,使其表示為x=(T,N,main)的形式。其中,x為預處理后的Web服務器歷史日志數據;T為訪問時間;N為Web服務器訪問請求數;main為訪問用戶所在的區域。雖然經過預處理的數據已經較為干凈和規整,但直接對其進行建模可能仍然面臨挑戰,現有線性模型難以準確捕捉其變化特征。因此,本文采用經驗模態分解法完成流量數據分解。設Web服務器歷史訪問流量序列x存在局部極值特征,通過3次樣條插值法構建Web服務器歷史訪問流量序列上包絡線和下包絡線,計算2條包絡線均值,其表達式如下:
v(x)=[xmax(t)+xmin(t)]/2(1)
其中,v(x)為Web服務器歷史訪問流量序列上下包絡線的均值;xmax(t)為流量序列上包絡線;xmin(t)為流量序列下包絡線[3]。然后,將均值從原始Web服務器歷史訪問流量序列中刪除,得到一個分量f(t),其可表示為:
f(t)=x(t)-v(x)(2)
完成式(2)計算后,檢查分量f(t)是否滿足本征模態函數(Intrinsic Mode Function,IMF)分量的2個特定條件:第一,極端點數與過零點數相同或差一,過零點是曲線與縱坐標軸交點;第二,局部最大值與最小值包絡線的均值在任意時刻為0[4-5]。如果滿足,判斷f(t)為一個IMF分量,從Web服務器歷史訪問流量序列中減去IMF分量,得到函數殘差項r,以其為新流量序列。重復以上操作,得到最終Web服務器歷史訪問流量序列,可表示為:
x(t)=∑i=1f(t)i+ri(3)
其中,i為分解次數[6]。綜上,完成Web服務器歷史訪問流量數據的預處理與分解,為后續流量預測奠定基礎。
2 基于改進Prophet模型的流量預測
在得到Web服務器歷史訪問流量序列后,為解決傳統Prophet模型對突發流量變化的適應性不足的問題,引入相關因素數據、歷史相似數據進行改進,實現流量預測。將訪問流量IMF分量輸入改進Prophet模型,采用指數增長函數形式計算趨勢項,可表示為:
y(t)=E1+exp[ef(t)-bf(t)](4)
其中,y(t)為Web服務器訪問流量趨勢項;E為改進Prophet模型容量;ef(t)為IMF分量中Web服務器訪問流量增長率;bf(t)為IMF分量中Web服務器訪問流量偏移率[7]。然后,通過傅里葉級數計算Web服務器訪問流量季節項,可表示為:
c(t)=∑i=1R·f(t)/K(5)
其中,c(t)為Web服務器訪問流量季節項;R為IMF分量中季節序列的周期;K為改進Prophet模型估計的系數參數。最后,通過指示函數計算Web服務器訪問流量節假日項,可表示為:
h(t)=∑i=1Wf(t)k(6)
其中,h(t)為Web服務器訪問流量節假日項;Wf(t)為節假日時間序列對應的IMF分量;k為節假日對訪問流量的影響程度系數。將以上3個項相加,得到未來某一時間的Web服務器訪問流量預測結果,可表示為:
p(t+j)=y(t+j)+c(t+j)+h(t+j)(7)
其中,p(t+j)為未來t+j時間Web服務器訪問流量;j為預測時間量。通過以上步驟,完成基于改進Prophet模型的Web服務器訪問流量預測。
3 實驗論證
為驗證所提基于改進Prophet模型預測方法的先進性,本文以某大學圖書館Web服務器為實驗對象,收集服務器近1年內歷史訪問日志文件信息并將其作為數據樣本,選取孟智慧等[1]提出的基于堆疊的長短期記憶網絡預測方法、田愛寶等[2]提出的基于Transformer的預測方法,設置對比實驗。應用3種方法進行未來1~8天Web服務器訪問流量預測并與實際相比,計算其相對偏差及置信水平,多次測試取均值,得到統計結果如表1所示。
分析表1數據可知,本文設計的基于改進Prophet模型預測方法相對偏差不超過0.10,數值非常接近0,遠低于孟智慧等[1]提出的基于堆疊的長短期記憶網絡預測方法、田愛寶等[2]提出的基于Transformer的預測方法。應用本文設計的基于改進Prophet模型的預測方法,置信水平不低于96%,遠高于孟智慧等[1]提出的基于堆疊的長短期記憶網絡預測方法、田愛寶等[2]提出的基于Transformer的預測方法。由此可證明,本文設計的基于改進Prophet模型預測方法在預測精度方面具有優勢,應用效果較好。
4 結語
為提高Web服務器訪問流量預測精度,本文開展基于改進Prophet模型的Web服務器訪問流量預測方法研究。通過本次研究可發現,這一方法在提升預測精度和穩定性方面取得了顯著成效。該方法通過引入新的算法和技術手段對Prophet模型進行優化和改進,克服了原有模型在某些特定場景下的不足,使其更加適用于Web服務器訪問流量預測任務,應用效果更優。
參考文獻
[1]孟智慧,劉輝,劉偉信,等.基于堆疊長短期記憶網絡的互聯網流量預測[J].電信工程技術與標準化,2024(6):80-85.
[2]田愛寶,魏嬌嬌,肖軍弼,等.基于Transformer的網絡流量預測研究[J].信息技術,2024(4):156-160.
[3]鄭佳芳,游貴榮.基于XGBoost和LSTM模型的高校招生網站流量預測研究[J].重慶科技學院學報(自然科學版),2023(5):45-50.
[4]陸勤政,朱曉娟.基于并行多尺度卷積記憶殘差網絡的物聯網流量預測[J].廊坊師范學院學報(自然科學版),2024(1):33-41.
[5]蔣東浩,趙洪華,王真.基于EWT和Neural Prophet-MLP的蜂窩網絡流量長期預測方法[J].現代信息科技,2024(6):52-57.
[6]馬攀.基于ResNet-LSTM組合模型的網絡流量預測研究[J].蘭州文理學院學報(自然科學版),2024(2):45-50.
[7]劉洋,廉咪咪.基于深度學習的移動通信網絡流量預測方法研究[J].長江信息通信,2024(2):90-92.
(編輯 王雪芬編輯)
Traffic prediction method of Web server access based on the improved Prophet model
LIU" Sujun, YANG" Guoying, DING" Jiayu, LI" Changsheng
(Lanzhou Petrochemical University of Vocational Technology, Lanzhou 730060, China)
Abstract:" Due to insufficient adaptability to sudden traffic changes, the existing Web server simulation traffic prediction has problems of relatively large deviation and low confidence level. Therefore, a Web server access traffic prediction method based on an improved Prophet model is proposed. The article first preprocesses the historical access traffic data of the Web server, and then further decomposes the data based on empirical mode decomposition technology to extract the time series of access traffic with obvious frequency characteristics. Finally, the improved Prophet model is applied to decompose the time series of access traffic, and the prediction of Web server access traffic is achieved through component summation. The experimental results demonstrate that the application design method can achieve accurate prediction of web server access traffic with a relative deviation of no more than 0.1 and a confidence level of no less than 96%.
Key words: improved Prophet model; Web server; access traffic prediction; empirical mode decomposition