999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ARIMA—SVM組合模型的移動通信用戶數預測

2014-12-29 00:00:00王佳敏張紅燕
計算機時代 2014年9期

摘 要: 運營商通過分析各時段、各區域的歷史移動通信業務數據,能夠預測未來一段時間的業務量,從而提供面向管理層的決策支持。為準確把握國內移動通信用戶數的波動規律,提高預測精度,通過對2012年1月到2014年2月的26個月忙時移動通信用戶總數和3G用戶數進行分析,采用差分自回歸移動平均模型(ARIMA)對業務量時間序列數據進行線性建模,并采用支持向量機(SVM)對ARIMA模型殘差進行非線性建模,將ARIMA模型與SVM模型組合對忙時移動通信用戶數進行預測,結果表明,ARIMA-SVM組合模型預測精度明顯優于單一模型,發揮了兩種模型各自的優勢。該組合模型是一種切實可行的移動通信業務預測方法。

關鍵詞: 移動通信用戶數; 預測; 時間序列; 差分自回歸移動平均模型; 支持向量機

中圖分類號:TN391.9 文獻標志碼:A 文章編號:1006-8228(2014)09-12-04

Prediction on the number of mobile subscribers based on combined model ARIMA-SVM

Wang Jiamin, Zhang Hongyan

(College of Information Science and Technology, Hunan Agricultural University, Changsha, Hunan 410128, China)

Abstract: In order to forecast the prospective volume of business in the filed of mobile communication and provide decision support to managers, the historical mobile data communications service in every period and region are analyzed. Through investigating the total number of mobile subscribers and 3G users in busy hours from Jan,?2012?to?Feb, 2014, difference autoregressive moving average model (ARIMA) is utilized to carry out a linear modeling for volume of business’s time-series data. Support vector machine (SVM) is applied to perform nonlinear modeling for residual error of ARIMA model. The number of mobile subscribers in busy hours is predicted by combining ARIMA model with SVM model. The results indicate that the combination ARIMA-SVM includes almost all advantages of its compositions and has a higher prediction accuracy then the single model, ARIMA or SVM. Therefore, combination model is a practical prediction method for mobile communication services.

Key words: the number of mobile subscribers; prediction; time series; difference autoregressive moving average model; support vector machine

0 引言

在過去的二十年中,隨著移動通信技術的不斷發展,電信業務已從滿足用戶的溝通需求轉變為滿足用戶的工作、生活、娛樂、交友、消費等多方面的需求。進入3G時代后,用戶不再關注技術和網絡,而是更多地聚焦于內容、應用和體驗方面。移動通信技術的發展趨勢及普及率主要通過通信業務量體現。通信業務預測是通信網絡規劃的基礎和依據,關系到工程建設的投資和規模,以及網絡建成投產后的經濟效益[1]。因此,對某個移動運營商來說,合理的業務預測顯得尤為重要。本文探討移動通信業務預測中的移動用戶數預測。

移動通信用戶數時間序列具有高度不穩定、復雜且難以預測的特性,其數據具有線性和非線性規律,并隱含大量的動態特征,同時又受自變量的影響。目前,用于移動通信用戶數的預測方法主要有:時間序列方法[2]、回歸分析法[3]、神經網絡預測法和支持向量機(Support Vector Machine, SVM)等。基于線性數據的差分自回歸移動平均(Auto Regressive Integrating Moving Average ARIMA)模型融合了時間序列分析和回歸分析的優點,在移動通信業務預測中得到了廣泛的應用。但是,ARIMA模型無法捕捉非線性數據的信息,而現實中的時間序列數據往往表現出更多的非線性特性且含有復雜的噪聲,因此,基于線性模型定階獲得模型階數和基于線性篩選方法保留變量的ARIMA模型,往往并非最優,從而導致預測精度不高[4]。在非線性時間序列預測中,神經網絡模型的產生為移動用戶數的深入研究開拓了新的空間。然而在實際應用中,神經網絡存在隱含層數的選擇、過擬合、泛化性能不強以及局部極小值等問題[5]。基于結構風險最小化的支持向量機SVM,是一種新的機器學習方法,其在非線性時間序列領域取得了良好的預測結果,較好地解決了小樣本、非線性、過擬合、維數災和局部小等問題,且泛化推廣能力優異[6]。一些學者為了有效地利用各種模型的優點,提出了基于著名的M-競爭理論的組合預測方法來進行時間序列的預測研究,實證結果表明,相對于單獨的模型,組合預測模型考慮問題更系統、更全面,因而能夠有效地減少一些環境因素對單個預測模型預測過程的影響,提高預測精度。

針對移動通信用戶數據復雜、難預測且具有線性和非線性規律的特點,本文提出一種基于ARIMA和SVM組合模型的移動通信用戶數預測方法——ARIMA-SVM,ARIMA以一步預測的方式描述歷史的線性關系,SVM以相同方式對ARIMA模型的殘差進行非線性建模。利用ARIMA-SVM組合模型對移動通信用戶數進行預測,驗證組合模型的有效性和可行性。

1 ARIMA-SVM模型

1.1 ARIMA-SVM組合預測原理

⑴ ARIMA模型

ARIMA模型是差分運算和ARMA模型的結合,即擬合的差分平穩序列。對于含有非季節性的時間序列進行建模,可使用ARIMA(p,d,q)模型。它可以通過適當的d階(d為整數)差分運算使序列平穩。ARIMA模型的一般形式為:

其中,{yt}為平穩時間序列;{?t}為白噪聲序列;φi、θj(i=1,2,…,p;j=1,2,…,q)分別是{yt}、{?t}的參數;p為自回歸階數,q為移動平均階數[7]。

⑵ SVM模型

假設有訓練集{xi,yi},其中xi∈RD(xi包含D個特征),i=1,2,…,n是n個D維向量,yi∈R,F={f|RD→R}。SVM線性回歸問題僅與訓練樣本之間的內積運算有關,因此求解過程的復雜度不會隨樣本維數增加而明顯增加,解決了維數災難的問題。對于非線性回歸問題,可以通過非線性函數將原輸入訓練樣本映射到高維特征空間F,并進行線性回歸。訓練樣本xi滿足如下條件:

⑶ ARIMA-SVM組合預測模型

ARIMA與SVM模型分別對線性和非線性模型的處理具有優勢,所以存在優勢互補,二者結合起來進行移動通信用戶數預測,可能收獲較好的結果。首先,建立ARIMA模型來分析時間序列的線性部分; 然后對ARIMA模型的殘差構建SVM 模型,ARIMA和SVM模型的預測值之和即為組合模型的預測值[8]。其原理如圖1所示。

1.2 ARIMA-SVM組合預測步驟

把一組時間序列的數據yt看成由線性自相關結構Lt和非線性結構Nt兩部分組成,即:

yt=Lt+Nt ⑹

具體建模步驟如下:

⑴ 用ARIMA模型對yt進行預測。設預測結果為,序列的殘差為Nt,即:

序列{Nt}中包含了序列yt的非線性關系:

其中,?為隨機誤度。

⑵ 根據步驟⑴得到的殘差序列Nt進行樣本重構得到SVM樣本集,利用SVM對殘差進行預測, 得預測結果為。預測過程如下:

① SVM模型的定階。時間序列通常具有時滯和后效性,當月的殘差不僅與當月的影響因子相關,且與歷史殘差相關,具體與前幾個月殘差相關,需要通過確定最佳時滯階數解決。本文采用模型階數與SVM模型參數一起尋優的方法對變量定階,確定殘差序列的時滯階數。定階過程是:由低階到高階遞增地以SVM進行留一法測試,并以RMSE是否變小標準決定拓展階數與否。對待比較相鄰兩個模型SVM(n)和SVM(n+1),記RMSESVM(n)和 RMSESVM(n+1)分別為SVM(n) 、SVM(n+1)的均方根誤差。若RMSESVM(n)> RMSESVM(n+1),繼續拓階;若RMSESVM(n)≤RMSESVM(n+1),拓階終止,取SVM(n)為定階后模型,n為時滯階數。

② 模型數據的重構和預測。將前n個月的殘差作為SVM的輸入來預測當月的殘差。SVM通過調用LBSVM進行建模[9],采用10折交叉驗證,經gridregression.py自動搜索確定模型最優參數并進行預測,得殘差預測結果。

⑶ 將兩種模型預測的結果相加,可得最后的預測結果{},即:

1.3 參比模型及評價指標

本文采用ARIMA模型、SVM模型以及ARIMV-SVM組合模型進行預測。為了對比各模型的優劣,所有模型均采用一步預測法,即利用多時間尺度一步外推的短時間數據作為預測結果。ARIMA模型預測由SPSS 19.0給出,SVM模型預測采用libsvm軟件,數據重構方式同殘差樣本重構。

為了評價模型預測性能的優劣,使用均方根誤差(Root Mean Square Error RMSE)和平均絕對誤差百分比(Mean Absolute Percentage Error MAPE)作為模型的評價指標[10]。RMSE和MAPE分別定義如下:

(10)

(11)

其中,代表預測值,yi代表真實值,n為預測樣本。RMSE僅適用于同一數據集不同模型間的比較,MAPE可用于不同數據集間的比較。但對同一數據集,如A模型與B模型相比雖然MAPE較大而RMSE較小,則A模型更穩健,因此,RMSE為主要評價指標。

2 ARIMA-SVM在移動通信用戶數預測中的應用

2.1 數據來源

本文中2012年1月~2014年2月忙時的移動用戶總數和3G移動用戶數整理自《中國統計年鑒》郵電通信月報表如表1所示。以2012年7月至2013年8月的數據作為訓練集,2013年9月至2014年2月的六個觀測值作為測試集,來驗證組合模型的有效性。

2.2 移動用戶總數預測過程

2.2.1 ARIMA模型建立

⑴ 歷史數據的平穩化

在SPSS19.0統計分析中繪制移動用戶總數時間序列如圖2所示。分析該時序圖,并結合單位根校驗可知為典型的非平穩時間序列,因此不能直接對其建模,需要對原序列進行差分變換。一階差分變換后仍存在明顯的上升趨勢,二階差分后數據圍繞均值線上下波動(如圖3所示),趨勢變化被消除。所以設定ARIMA模型參數d=2。

⑵ ARIMA模型p、q的確定及預測

借助SPSS19.0構建ARIMA模型, 通過對二階差分序列的自相關圖和偏相關圖分析,并結合不同p,q值下訓練集的RMSE,MAPE,BIC結果,經過比較分析發現,模型ARIMA(0,2,3)擬合效果較好。利用此模型對移動用戶總數進行預測,結果如表2所示。

2.2.2 組合預測模型的建立

通過SVM模型定階可知,移動用戶數殘差的時滯階數為1,即當月移動用戶數的殘差受到前1個月移動用戶數殘差的影響。因此,前1個月移動用戶數的殘差作為SVM的輸入來預測當月移動用戶數的殘差。使用最優參數訓練下的模型對2013年9月至2014年2月移動用戶總數的殘差進行預測,結果如表2所示。

2.2.3 組合模型的驗證結果

根據ARIMA模型得到的預測結果和SVM模型的非線性預測結果,進行簡單相加得到ARIMA-SVM組合模型的預測結果。各模型的預測結果與真實值的比較如表2所示。其驗證樣本(2013年9月-2014年2月)的預測誤差結果如表2。

2.3 3G移動用戶數預測過程

同移動用戶總數模型創建與分析過程。3G移動用戶數二階差分后趨勢變化被消除,所以d=2。通過對二階差分序列的自相關圖和偏相關圖分析,并結合不同p,q值下訓練集的RMSE,MAPE,BIC結果比較,得到移動用戶數序列模型ARIMA(0,2,1)模型。

分別利用該模型和SVM模型對2013年9月至2014年2月的3G移動用戶數進行預測,其中SVM模型序列重構階數為3,預測結果如表2。利用ARIMA-SVM組合模型進行預測,殘差序列樣本重構階數為2,得到預測結果如表2。三種模型預測的均方根誤差(RMSE)和平均絕對誤差百分比(MAPE)的結果如表2。

2.4 結果分析

從表2中可以看出,無論是RMSE還是MAPE,ARIMA模型和SVM模型的結果都比組合模型ARIMV-SVM的要差,主要原因可歸結于它們都不能同時捕捉到移動通信用戶數的線性和非線性特征;而ARIMA-SVM組合模型同單一模型相比,預測精度有了一定的提高,說明組合模型能夠充分利用原始數據中的信息,避免了單一模型的局限性,因此其預測結果是可靠、有效的。

本文中,ARIMA-SVM組合模型預測精度雖有提高,但是差別較小。進一步討論,我們認為主要原因有三:一是移動通信用戶數更多地表現為線性,因此線性的ARIMA模型擬合效果較好,加入SVM方法可以改善小部分非線性預測結果,提高絕對誤差值,但對預測結果影響不大;二是SVM訓練樣本數量較小,加入SVM模型的組合預測模型對ARIMA預測的改善程度有限;三是移動通信用戶數受到人口數、普及率、市場經濟等多因素影響,諸多因素的影響使得擬合效果出現一定誤差。因此單純通過改善預測殘差修正預測結果存在一定的局限性。

3 結束語

移動通信用戶數同時具有線性和非線性特征,由于ARIMA模型和SVM模型對線性和非線性處理各有優勢,但對于復雜的、不穩定的時間序列,單一的模型都不是最優的。因此,采用ARIMA模型對業務量時間序列數據進行線性建模,SVM模型對ARIMA模型殘差進行非線性建模,將ARIMA模型與SVM模型組合對移動業務數據進行預測。通過移動通信用戶數的實證研究表明,組合預測模型在長期預測上的有效性,能夠總體上把握移動通信用戶數的趨勢,達到更準確預測的目的,同時驗證了組合預測模型相比于單一模型更合理、更可靠。ARIMA-SVM模型是一種有效的移動通信用戶數的時間序列預測模型。

近些年來,移動通信用戶數分析和預測逐漸成為一個非常活躍的研究領域。通過對移動用戶總數以及3G移動用戶數的分析及預測,可以推導出2G移動用戶數發展趨勢,如圖4所示。2012年12月作為轉折點,各大運營商皆出現2G移動用戶向3G移動用戶大量轉移的趨勢,3G移動用戶數顯著上升。移動通信用戶數的變化受到人口、普及率和市場經濟等影響,在諸多因素共同作用下,隨著數據通信與多媒體業務需求的發展,2014年,適應移動數據、移動計算及移動多媒體運作需要的第四代移動通信開始興起,移動通信用戶數又將迎來新的變化,其趨勢的變化預示著移動通信將給我們未來的工作和生活帶來深刻的變化。

參考文獻:

[1] 馮毅,曹恒,田元兵.業務量預測建模與分析[J].郵電設計技術,

2008.9:25-30

[2] 常亮.基于時間序列分析的ARIMA模型分析及預測[J].計算機時代,

2011.2:8-10

[3] 陶偉宜.基于回歸方法的移動話務量預測[J].郵電設計技術,2004.5:

29-32

[4] Su-Zhi Zhang,De-Qiang Fan,and Bao-Yan Li. A New User

Search Behavior Forecast Model: ARIMA-SVM Model[A]. Proceedings of 2010 Third International Conference on Education Technology and Training(Volume 5)[C],2010.

[5] 毛健,趙紅東,姚倩倩.人工神經網絡的發展及應用[J].電子設計工程,

2011.24:62-65

[6] 王少軍,劉琦,劉大同等.移動通信話務量多步預測的LS-SVM方法

研究[J].儀器儀表學報,2011.6:1258-1263

[7] 張冉,趙成龍.ARIMA模型在網絡流量預測中的應用 [J].計算機仿真,

2011.2:171-174

[8] 吳虹,尹華.ARIMA與SVM組合模型的石油價格預測[J].計算機仿

真,2010.5:264-326

[9] Chih-Chung Chang and Chih-Jen Lin, LIBSVM:a library for

support vector machines.ACM Transactions on Intelligent Systems and Technology,2:27:1-27:27,2011.

[10] 張立杰,寇紀淞,李敏強等.基于自回歸移動平均及支持向量機的中

國棉花價格預測[J].統計與決策,2013.6:30-33

主站蜘蛛池模板: 日韩人妻精品一区| 成人精品午夜福利在线播放| 香蕉久久永久视频| 国产成人亚洲精品蜜芽影院| 99在线观看视频免费| 沈阳少妇高潮在线| 免费jjzz在在线播放国产| 白丝美女办公室高潮喷水视频| 亚洲无码91视频| 日韩无码一二三区| 精品91视频| 亚洲第一视频网站| 国产91色在线| 99re在线视频观看| jizz在线观看| 欧美不卡视频在线观看| 亚洲精品卡2卡3卡4卡5卡区| 欧美亚洲国产精品久久蜜芽| 91青青草视频| 激情午夜婷婷| 在线精品欧美日韩| 中文无码精品a∨在线观看| 色婷婷亚洲综合五月| 99尹人香蕉国产免费天天拍| 免费xxxxx在线观看网站| 精品三级网站| 成人蜜桃网| 欧美性爱精品一区二区三区| 久久久久国产一区二区| 日韩大乳视频中文字幕| 久久婷婷五月综合97色| 成人年鲁鲁在线观看视频| 91精品aⅴ无码中文字字幕蜜桃| 国产主播在线一区| 99热这里只有成人精品国产| 性欧美久久| 少妇露出福利视频| 波多野结衣一区二区三区88| 无码中字出轨中文人妻中文中| 91精品人妻一区二区| 国产综合欧美| 91欧洲国产日韩在线人成| 中文字幕av一区二区三区欲色| 亚洲狼网站狼狼鲁亚洲下载| 亚洲成人网在线播放| 国产日韩欧美在线视频免费观看| 国产成人乱无码视频| 免费亚洲成人| 亚洲精品成人7777在线观看| 97人人模人人爽人人喊小说| 国产国拍精品视频免费看| 国产自产视频一区二区三区| 精品久久香蕉国产线看观看gif| 六月婷婷综合| 国产毛片基地| 久久亚洲中文字幕精品一区| 波多野结衣亚洲一区| 九九久久精品免费观看| 日韩高清中文字幕| 在线视频精品一区| a级毛片免费在线观看| 久久精品视频一| 亚洲VA中文字幕| 欧美在线视频不卡| 亚洲a免费| 欧美中文字幕在线二区| 久久香蕉国产线看观看式| 五月天在线网站| 亚洲一区二区约美女探花| 精品五夜婷香蕉国产线看观看| 久久久久久久久久国产精品| 色婷婷综合在线| 影音先锋丝袜制服| 97成人在线视频| 国产精品v欧美| 激情国产精品一区| 久久99精品久久久久纯品| 在线一级毛片| 色窝窝免费一区二区三区| 婷婷六月在线| 免费又爽又刺激高潮网址| 精品视频一区在线观看|