999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Prophet 混合模型應用于基站網絡流量長期預測

2022-07-21 09:45:16張家晨左興權張百勝
計算機工程與應用 2022年14期
關鍵詞:方法模型

張家晨,左興權,黃 海,韓 靜,張百勝

1.北京郵電大學 計算機學院(國家示范性軟件學院),北京 100876

2.中興通信股份有限公司,上海 201203

隨著5G網絡以及移動端設備的逐漸普及,人們對于移動數據流量的需求不斷增加。隨之而來的數據流量將會以指數形式增長,對于網絡運營商而言,提供不受阻礙、無處不在的高質量服務意義重大。其中,如何建立準確的長周期預測基站小區網絡流量的模型,以指導運營商擴容基站小區無線設備將是一個挑戰。

基站小區網絡流量通常以時間序列的形式呈現,預測周期可分為短周期時間序列預測(預測時長按分鐘、小時和天)和長周期時間序列預測(預測時長按天、周和月)。短周期的基站小區網絡流量預測相對成熟,主要包括三類方法,即傳統統計模型建模方法、神經網絡頇測方法、基于序列分解結合以上兩種方法的混合模型方法。

傳統統計模型建模方法主要包括自回歸模型(autoregressive model,AR)[1]、滑動平均模型(moving average model,MA)[2]、回歸滑動平均模型(autoregressive moving average model,ARMA)[3]、差分整合移動平均自回歸模型(autoregressive integrated moving average model,ARIMA)[4]等模型及其改進。文獻[5]使用線性回歸和非線性回歸方法,對4G基站流量進行預測,實驗結果表明非線性預測算法性能優于線性機器學習算法對基站流量進行直接建模。文獻[6]使用自回歸滑動平均模型與三指數平滑模型,預測上傳和下載熱點的流量,結果表明三指數平滑模型具有更好的預測性能。文獻[7]提出了基于SARIMA(seasonal auto regressive integrated moving average)模型對網絡流量進行預測,實驗表明當預測步長小于10時,預測精度更高。

用于網絡流量預測的神經網絡模型包括循環神經網絡(recurrent neural network,RNN)[8]、BP神經網絡(back propagation neural network,BPNN)[9]及其變體[10]。文獻[11]利用RNN為網絡流量建立預測模型,可準確預測各種網絡應用場景下的流量變化趨勢。文獻[12]利用螢火蟲群算法優化BP神經網絡,對網絡流量進行預測,仿真結果表明該算法具有較高的預測精度。

當前,以“分解和集成”方法為基礎的混合模型預測方法在網絡流量預測中表現良好。文獻[13]提出基于EEMD與RBF神經網絡組合模型對網絡流量進行預測。文獻[14]為了解決自相似網絡流量預測,提出了集合EMD和ARMA的組合模型。文獻[15]基于小波分解聯合使用長短期記憶網絡(long short-term memory,LSTM)模型,該組合預測模型在預測流量突發性方面的性能優于普通的LSTM網絡模型。文獻[16]提出了一種基于小波變換和SARIMA模型的方法,該方法比單一預測模型具有更高的預測精度。文獻[17]提出基于經驗模態分解(empirical mode decomposition,EMD)和支持向量機(support vector machine,SVM)模型對網絡流量進行預測,比單獨使用SVM模型具有較高的準確度。文獻[18]提出小波分解聯合BP神經網絡的方法對網絡流量進行預測,通過使用一種自適應學習率的方法對BP進行優化以提高預測準確度。

可以看出,以上研究大多對基站網絡流量進行短期預測,缺乏長期預測研究,而只有對基站網絡流量進行長期預測,才能更有效地指導基站的擴容。此外,基站網絡流量數據存在較大的噪聲以及數據缺失現象,當前方法普遍未全面考慮這些情況,導致難以保證實際預測效果。

本文提出了一種結合EEMD與Prophet模型的基站小區網絡流量長期預測方法(E-Prophet)。EEMD是對EMD分解方法的一種改進,解決了EMD因極值點分布不均勻導致的“模式混合”現象,通過EEMD分解能夠對信號進行平穩化處理,將時間序列分解為具有不同時間尺度的分量序列。相比小波分解,EEMD不依賴基函數且具有很好的自適應性。Prophet模型[19]能把時間序列分解成不同的成分,其中趨勢項成分對于具有長期趨勢性的時間序列預測具有較好的效果,季節項成分對于具有周期性(年、月和星期)的時間序列具有較好的效果。Prophet模型已經應用于時間序列預測領域,例如,2019新冠肺炎的分析和預測[20],以及對LTE(long time evolution)小區流量增長和擁塞預測[21]等。通過觀察,發現基站小區網絡流量數據具有一定周期性,與此同時由于小波分解采用不同的小波基和分解層數對結果影響很大,而且分解效果不如EMD[22]理想,因此本文提出基于EMD/EEMD分解結合Prophet模型對基站小區網絡流量進行預測,其主要過程包括兩步:首先通過EMD/EEMD分解模型對基站小區網絡流量進行分解;其次使用Prophet模型對各個分量進行預測,并累加求和各個分量最終預測值得出預測結果。結合EEMD對網絡流量良好的分解特性,以及Prohpet模型對各分量時間序列準確的預測特性,E-Prophet方法能更好地適應于基站小區網絡流量的長期預測。

本文的主要貢獻為引入Prophet模型到小區流量預測,Prophet模型雖然已被應用于多種時間序列預測中,但還沒有研究將Prophet用于基站小區網絡流量預測。通過真實數據的實驗證明E-Prophet比其他傳統模型具有更好的預測效果。

1 基站小區網絡流量的長周期序列特性

Paxson和Floyd的研究發現[23],小時級以上粗時間粒度的流量行為由于主要受外界因素的影響,不具有自相似性,而是一種非線性復雜的過程。本文研究的基站小區網絡流量數據是按天統計,每天的流量數據為自忙時的流量,所謂自忙時是指當天流量最大的整點時刻。因此基站小區流量是以小時粒度采集,具有非線性特點,而且有時候因為設備或者人為因素,網絡流量在采集過程中可能出現部分缺失值,這也為基站小區網絡流量長期預測帶來很大挑戰。同時,用戶在使用網絡服務過程中受外界因素影響,網絡行為具有一定的規律性和偶然性,因而產生的非線性宏觀網絡流量具有一定的周期性、突發性和偶然性。根據基站小區網絡流量這些特性,網絡流量X(t)可分解為趨勢部分A(t)、周期部分P(t)、突發部分B(t)和隨機部分R(t),如式(1)所示[24]:

Prophet是一個類似GAM(generative additive model)的時間序列模型,模型本身采用加法模型,分別由趨勢項擬合函數、季節項擬合函數、節假日擬合函數和隨機項組成,非常適合具有上述分布特點的網絡流量進行長期預測,具體表現為:Prophet模型趨勢項和季節項能夠分別擬合網絡流量非周期性和周期性的長期變化規律;Prophet模型節假日項能夠對因特殊節日而導致的有規律的網絡流量暴跌或暴增進行擬合;同時如果數據中存在部分缺失片段,傳統自回歸模型如ARIMA則需要人為插入缺失值后才能進行預測,而Prophet能夠根據已有的數據進行擬合,忽略缺失值對模型預測帶來的影響。此外,通過EEMD分解后的流量序列成分較簡單,使用Prophet模型后能達到更好的預測效果。

2 預測流程及方法

2.1 E-Prophet預測流程

基于E-Prophet預測流程方法如圖1所示。首先,對每個基站原始小區網絡流量進行EEMD分解;然后,對各個分量使用Prophet模型進行預測;最后,再對各個分量預測結果進行求和,得到該基站小區網絡流量的最終預測結果。

圖1 E-Prophet的網絡流量預測流程Fig.1 Network traffic forecasting process of E-Prophet

2.2 EMD和EEMD分解

經驗模態分解(EMD)[25]是一種數據處理方法,用于處理非線性和非平穩數據。EMD通過希爾伯特變換將非線性和非平穩時間序列分解為分量子序列,包括多個IMF分量和一個殘差項,而無需任何基函數或濾波函數。

IMF分量需滿足兩個判定條件:第一,在整個數據序列中,極值點的數量與過零點的數量相等或最多相差一個,所謂過零點是曲線經過縱坐標等于零的點。第二,在任一時間點上,由局部極大值點確定的極大值包絡線,和由局部極小值點確定的極小值包絡線的均值為零,即信號需滿足對時間軸的局部對稱性。EMD的步驟如下[26]:

(1)令{x(t)∈X:t=1,2,…,N}表示基站小區網絡流量訓練集時間序列,其中t表示天數。根據時間序列確定所有局部極值,并將所有的極大值和極小值通過三次樣條線(cubic spline line)連接[27]起來構造上包絡線xmax(t)和下包絡線xmin(t)。

(2)上包絡線和下包絡線的均值m(t)由式(2)得出:

(3)從原始時間序列中減去m(t)以獲得分量l(t):

(4)檢查l(t)序列是否滿足上述中作為IMF分量的兩個條件。如果滿足這兩個條件,則用l(t)替換x(t);如果不滿足,則重復步驟(1)~(3),直到l(t)滿足作為IMF分量的兩個判定條件。此時,l(t)為一個IMF分量,令l(t)等于Imf1(t)。通過式(4)從原始流量序列x(t)減去Imf1(t)以得到殘差項r1(t):

然后,將r1(t)作為更新后的新原始流量序列。重復步驟(1)~(3),獲得Imf2(t),Imf3(t),…,Imfn(t)分量,最后得到殘差項序列rn(t)。原始流量序列與各分量之間的關系見式(5):

通過上述過程,原始的基站小區網絡流量序列可以分解為若干個IMF分量和一個殘差項分量。基站小區網絡流量波動性較大,導致在使用EMD分解時容易發生“模式混合”現象,為了解決EMD存在的“模式混合”問題[28],Wu和Huang[29]提出了集合經驗模式分解方法。EEMD的思想是利用白噪聲具有頻率均勻分布的特性,把高斯白噪聲添加到信號中,使信號在不同尺度上具有連續性,從而改變了信號極值點特性,促進抗混分解,有效避免模式混合現象。為此,本文采用EEMD取代EMD來分解流量信號。EEMD分解步驟如下[30]:

(1)初始化EEMD中的參數,如白噪聲幅度。

(2)在初始基站小區網絡流量x(t)中添加M次白噪聲:

其中,wj(t)表示第j次添加白噪聲序列,xj(t)表示第j次添加白噪聲后網絡流量。

(3)通過EMD將添加了白噪聲的網絡流量序列xj(t)分解為n個IMF分量Imfj i(i=1,2,…,n)和殘差項分量之和。

(4)計算添加M次白噪聲后得到流量的IMF平均值,作為最終IMF分量。

2.3 Prophet模型

Prophet使用pyStan開源工具中的L-BFGS(limited memory Broyden-Fletcher-Goldfarb-Shanno)方法[31]進行函數的擬合。L-BFGS是解無約束非線性規劃問題最常用的方法。Prophet模型通過式(10)對時間序列進行擬合:

其中,y(t)∈{Imf1,Imf2,…,Imfn,rn(t)};g(t)為趨勢項函數,適合非周期性序列建模;s(t)為季節項(周、月、季度和年等)函數,用于對周期性變化明顯的序列進行建模;h(t)為某固定時間段(例如節假日等)引起的變化函數;?t表示噪聲項。

本文使用簡單的分段常數函數對趨勢項g(t)進行擬合:

其中,k~Normal(0,5)為流量增長率參數δ(δ∈?S)為調整增長速率的增長率向量,m~Normal(0,5)為偏移量參數。

季節項s(t)通過式(12)來擬合,如果流量數據是以天為單位,那么數據可能存在年周期性和星期周期性。

由于本文中基站小區網絡流量數據的時間跨度小于一年,因此不具有年周期性而具有星期周期性。式(12)中P表示周期,當設定時間序列按照幾天為周期,則設定P等于幾,在此設定按星期為周期,所以將P設為7。N作為低通濾波器參數,對于具有星期周期性的序列,當N設置為3時擬合效果較好[19]。

關于節假日項h(t)的擬合,假如有L個節假日,對于第i個節假日,使用Di表示該節假日所在的一段時間區間,參數κi來表示節假日時間區間Di的影響程度,則h(t)可表示為:

噪聲項?t是一個服從正太分布的一個隨機值。

3 實驗過程

3.1 實驗數據說明

實驗中基站小區網絡流量數據來源于某區域1 000個基站小區網絡流量,單位為KB。流量數據按天統計,每天的流量數據為自忙時的流量。流量數據的時間范圍為2017年9月1日到2018年3月31日,選取2017/9/1—2018/2/28共175天的有效流量數據作為模型的訓練集,選取2018/3/1—2018/3/31共31天的流量數據作為模型的測試集。

3.2 預測性能評估指標

鑒于網絡流量數據數量級較大,本文選擇均方對數誤差根(RMSLE)指標來評價模型預測性能,該指標越小表示預測越準確。

其中,N表示要預測流量的天數,表示網絡流量預測值,yi表示網絡流量真實值;當評價多個小區預測結果時,N為要預測流量的天數與基站小區數量的乘積。

3.3 實驗設置

本文將E-Prophet模型與SARIMA、LSTM、Prophet以及EMD-Prophet四個模型進行對比。Prophet模型如前所述,其他三個模型說明如下:

SARIMA模型:季節性差分自回歸滑動平均模型(SARIMA)通過對時間序列進行變換和擬合來建模。其中ARIMA模型在擬合平穩過程時表現出很強的適用性,同時對于數據的時間趨勢可以進行差分變換,使其轉化為平穩的時間序列數據,相應地得到預測結果后也要進行差分還原。

LSTM模型[32]:LSTM是循環神經網絡的一種類型,它通過記憶長時間的信息來解決長期依賴性問題。LSTM網絡由LSTM單元組成,每個LSTM單元由以下幾個部分組成:(1)一個細胞,(2)一個輸入門,(3)一個輸出門,(4)一個遺忘門。通過對神經網絡設定合理的輸入輸出步長來訓練網絡參數。

EMD-Prophet模型:與E-Prophet模型類似,差別在于利用EMD對基站小區網絡流量進行分解。

以上模型的參數設置為:(1)對于SARIMA模型,通過網格搜索的方式[33]來確定其參數,預測步長設為31天。(2)對于LSTM模型,輸入步長設為18,輸出步長設為3。由于預測時長為31天,通過滑動窗口的方式把預測的3天的數據作為輸入,以此類推,迭代11次預測未來33天數據,并取前31天數據值作為最終預測結果。(3)對于Prophet模型,使用星期周期和月周期參數,預測步長參數為31天。

通過設置以下實驗場景對各種模型進行比較和驗證:場景一,使用EMD和EEMD方法對基站流量進行分解,以此比較兩種方法的流量分解效果;場景二,在單基站長期預測中對各個模型預測性能進行比較,以此觀察不同預測模型的擬合效果;場景三,在多基站長期預測中對各個模型預測性能進行比較,以此來對比不同模型長期預性能;場景四,在缺失數據情況下對不同模型預測性能進行比較,以此分析模型的魯棒性。

實驗環境的硬件配置:Intel?CoreTMi7-6700 CPU@3.40 GHz,22核,64 GB內存。軟件配置為:Python3.7.3,tensorflow1.15,fbprophet0.5,EMD-signal[34]0.2.10。

3.4 EMD/EEMD流量分解效果對比

為了比較EMD和EEMD對于流量分解的效果,隨機從1 000個基站小區選取一個基站作為案例研究。原始基站小區網絡流量數據如圖2所示,圖3和圖4分別表示EMD和EEMD對原始數據流量進行分解的效果。

圖2 某基站原始網絡流量訓練集Fig.2 Raw network traffic training set for base station

圖3 某基站原始網絡流量的EMD分解Fig.3 EMD decomposition of base station’s raw network traffic training set

通過圖5可以看出,原始的網絡流量按星期進行劃分之后,周六、日的采集流量值普遍比其他星期采集的流量值小。通過圖6可得,Imf1分量不同星期流量都比原始分量更加平穩。通過圖7可得,Imf2分量不同星期流量值分布區間有顯著區別。

圖5 某基站原始網絡流量按星期劃分Fig.5 Raw network traffic training set of base station divided by week

通過圖8可得,Imf3分量不同星期對應的網絡流量具有相似的周期性。通過圖9~11可得,其他分量不同星期所對應的網絡流量具有相似的趨勢性,而且不同星期取值呈現一定的按星期周期交換的規律,即不同星期對應的流量大小順序,會隨著星期間隔變化而呈現出一定的周期性。這是因為原始數據流量經過EEMD分解后的各個分量具有一定的平穩性、趨勢性以及按星期周期變化的規律。

圖6 Imf1分量按星期劃分Fig.6 Imf1 components by day of week

圖7 Imf2分量按星期劃分Fig.7 Imf2 components by day of week

圖8 Imf3分量按星期劃分Fig.8 Imf3 components by day of week

綜上可看出,相對于EMD,EEMD能使分解的序列表現出更好的平滑性、平穩性以及趨勢性和周期性,更加適合Prophet模型的擬合。

3.5 單基站不同模型預測結果對比分析

本節對3.4節案例研究中的基站小區使用不同模型進行預測,預測步長為31天,結果對比如圖12所示。

圖9 Imf4分量按星期劃分Fig.9 Imf4 components by day of week

圖10 Imf5分量按星期劃分Fig.10 Imf5 components by day of week

圖11 殘差項分量按星期劃分Fig.11 Residual components by week

圖12 某基站不同模型預測結果對比Fig.12 Comparison of prediction results of different models of base station

由圖12可看出,真實流量值有一定的周期性,而Prophet、EMD-Prophet和E-Prophet能識別這種周期變化的特性和趨勢。SARIMA長期預測結果優于Prophet,但從圖中預測結果看,在長期預測中SARIMA擬合趨于一條直線。由于使用EMD/EEMD分解后的數據平穩性更好,因此結合EMD/EEMD和Prophet模型的預測結果優于Prophet模型。此外,與EMD相比,EEMD避免了因極值點分布不均勻導致的“模式混合”現象,而且分解后的殘差項趨勢性更顯著。因此使用E-Prophet(EEMD+Prophet)預測效果優于EMD-Prophet模型。分別計算上述不同模型預測結果的RMSLE值,如表1所示。由表1可看出E-Prophet模型的預測性能最好。

表1 不同模型預測某基站小區流量的RMSLE值Table 1 RMSLE value of base station cell traffic predicted by different models

3.6 多基站不同模型長期預測結果分析

上節對單基站的預測性能并不能代表模型的整體預測性能,本節對多基站網絡流量進行預測。為此,對875個基站小區流量進行了長期預測。需要說明的是,在1 000個小區中,有些小區具有較多的零值網絡流量,SARIMA無法利用網格搜索找到最佳參數導致無法預測。為方便對比,選取SARIMA能夠預測的所有875個基站小區流量。預測步長范圍為16~31 d。預測結果對比和統計分別如圖13和表2所示。

圖13 多基站不同模型長期預測結果對比Fig.13 Comparison of long-term prediction results of different models for multiple base stations

綜合圖13和表2可以看出,EMD/EEMD結合Prophet的模型在長期預測中優于Prophet、SARIMA和LSTM模型。這是因為EMD和EEMD方法可以把時間序列分解成平穩性和趨勢性更顯著的分量,同時保持原有時間序列的周期特征,最后通過Prophet模型對這些分量進行更準確的預測。

表2 多基站長期預測的RMSLE值對比Table 2 Statistical comparison of long-term forecast RMSLE data for multiple base stations

3.7 魯棒性實驗結果分析

為了驗證E-Prophet模型的魯棒性,對不同模型在缺失數據環境下的預測性能進行對比。選取125個零值數據較多的基站進行實驗,結果見圖14和表3。

圖14 多基站不同模型魯棒性結果對比Fig.14 Comparison of robustness results of different models of multiple base stations

從中可看出,結合EMD/EEMD和Prophet的模型在長期預測中優于Prophet模型、LSTM模型、EMD-Prophet模型。這是因為Prophet模型能通過計算訓練集數據概率分布和周期性來確定相應參數,從而在缺失值較多的小區依然能較好預測。SARIMA對于以上零值較多的基站小區,無法得出預測結果。

4 結語

由于網絡流量具有非線性、非平穩的特點,因此難以準確地進行長期預測。本文提出基于Prophet混合模型的基站網絡流量長期預測方法,通過實驗得出以下結論:(1)EEMD可將流量序列分解為一組平穩或較平滑的分量,適合處理基站小區網絡流量序列;(2)EEMD使得每個IMF分量和殘差項具有清晰的物理含義、IMF分量更平穩,從而使得Prophet模型對每個IMF分量和殘差項有更好的預測效果,并且采用EEMD比采用EMD的預測準確性更高;(3)EMD/EEMD結合Prophet的組合模型在長期預測中比Prophet、LSTM、SARIMA模型的準確性、魯棒性更好,并且E-Prophet優于EMD-Prophet模型。下一步研究工作將探索將概率模型算法和深度學習模型相結合的方法來解決多區域多基站聯合預測的問題。

表3 多基站魯棒性實驗的RMSLE值對比Table 3 Statistical comparison of RMSLE data for multisite robustness experiments

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 精品福利视频导航| 中文字幕免费视频| 亚洲午夜天堂| 亚洲欧美日韩另类| 国产一区二区免费播放| 欧美色综合久久| 国产女人综合久久精品视| 欧美另类视频一区二区三区| 91亚瑟视频| 久久无码免费束人妻| 久久久四虎成人永久免费网站| 美臀人妻中出中文字幕在线| 亚洲视频免费在线看| 一本色道久久88亚洲综合| 91麻豆国产视频| 污视频日本| 波多野结衣第一页| 亚洲精品日产AⅤ| 欧美a网站| 亚洲天堂自拍| 国产精品人成在线播放| 亚洲第一视频网| 日韩黄色大片免费看| 毛片在线看网站| 久久久久青草线综合超碰| 免费午夜无码18禁无码影院| 伊人成人在线| 999国产精品永久免费视频精品久久| 色天堂无毒不卡| 真人高潮娇喘嗯啊在线观看 | 在线观看亚洲精品福利片| 中国毛片网| 浮力影院国产第一页| 老色鬼欧美精品| 亚洲国产成熟视频在线多多 | 一级毛片无毒不卡直接观看 | 欧美成人午夜视频| 中国一级特黄大片在线观看| 91成人试看福利体验区| 不卡无码h在线观看| 亚洲 欧美 偷自乱 图片| 精品亚洲欧美中文字幕在线看 | 婷婷亚洲视频| 中文字幕色站| 另类专区亚洲| 扒开粉嫩的小缝隙喷白浆视频| 亚洲国产91人成在线| 波多野结衣在线se| 亚洲av片在线免费观看| 黄色在线网| 国产制服丝袜91在线| 国产极品美女在线播放| 热re99久久精品国99热| 亚洲AV无码精品无码久久蜜桃| 日韩在线欧美在线| 成人日韩视频| 天堂岛国av无码免费无禁网站| 国产在线一二三区| 老司机aⅴ在线精品导航| 亚洲精品天堂自在久久77| 999精品视频在线| 高清无码手机在线观看| 国产精品露脸视频| 久久精品66| 色亚洲激情综合精品无码视频 | 91精品综合| 国产一区在线视频观看| 亚洲欧美综合精品久久成人网| 美女视频黄频a免费高清不卡| 在线观看欧美国产| 亚洲国产系列| 亚洲精品国产精品乱码不卞| 国产微拍一区二区三区四区| 草逼视频国产| 欧美成人二区| 国产特一级毛片| 在线观看国产精品一区| 亚洲天堂成人| 国产成人亚洲精品蜜芽影院| 青青青伊人色综合久久| 国产一区免费在线观看| 99九九成人免费视频精品|