黃海,周靈
(1.廣東第二師范學院,廣州510000;2.佛山科學技術學院計算機系,佛山528000)
基于曲線擬合的分組域業務分析模型及算法實現
黃海1,周靈2
(1.廣東第二師范學院,廣州510000;2.佛山科學技術學院計算機系,佛山528000)
對電信移動網絡而言,分組域業務分析模型及算法研究是一個嶄新的領域。基于曲線擬合研究分組域業務分析預測模型;并進行算法設計與實現。同時,利用移動分組域監控系統的實時測量數據,實現分組域業務分析預測原型,進行3G用戶激活附著比、Gn口流量統計的分析和預測。結果表明,利用曲線擬合進行移動分組域的業務分析正確且有效。
分組域;曲線擬合;業務分析;實驗測量;算法模型
隨著移動通信新業務和IP技術的迅猛發展,數據通信和多媒業務在GSM移動通信中日益增多,甚至超過傳統的語音話務量而成為移動通信網的主要承載業務。因此,國際通信標準化組織對電信移動通信網進行了擴展,在傳統電路域(Circuit Switch,CS)的基礎上引入了GPRS、EPC分組域(Packet Switch,PS)。相對CS域而言,GPRS分組交換實現了同一信道由幾個用戶共享,極大地提高了無線資源的利用率,數據通信可以實時在線并按流量計費;EPC系統則以GPRS分組交換技術為基礎進一步演化而來,定位于構建高速率、低延遲、數據PS化、可移植、支持多種無線接入技術的3G移動通信系統新標準[1]。就體系結構而言,移動通信PS域包括2G/3G/4G分組域和EPC(LTE核心網)兩個部分;其中,2G/3G/4G分組域網元包括:服務GPRS支持節點SGSN、網關GPRS支持節點GGSN、HLR、CG;EPC分組域的網元包括:MME、SAE-GW、PCRF、CG等。
傳統GSM通信系統的業務分析離不開話務模型,設立話務模型的目的是統計、分析并預測話務量的現狀和發展,進而進行相關容量等網絡參數規劃。PS域分組交換技術引入通信系統之后,“話務模型”概念改成“業務模型”概念,無法使用傳統的經驗公式或者愛爾蘭查表法來確定PS域的業務量、設備容量和通信業務QoS之間的關系[2]。現有PS域業務模型的建模與規劃,主要是通過實驗室數據,并結合國內外運營商經驗,確定用戶業務模型關鍵參數,基本上是基于用戶的模型,主要包括用戶附著激活比、同時使用業務用戶比例、每使用業務用戶平均流量、用戶平均數據包長等;與設備性能和接口流量無關。因此,分組域業務分析模型的建立與算法實現屬于嶄新的研究領域,沒有成熟的方法和模式,這些新情況、新問題尚待研究。
本文基于曲線擬合研究了PS域業務分析預測模型;并進行算法設計和軟件系統開發;同時,利用移動PS域監控系統的實時測量數據,實現PS域業務分析預測系統的原型;并對特定網元的3G用戶激活附著比、Gn口流量統計進行了分析預測。
業務分析是PS域網絡分析的重要組成部分。數學方面的分析預測方法有很多,進行數據分析預測應該根據應用的不同領域,還要根據當時的實際情況和不同的分析預測要求,在合理分析的基礎上選擇合適的分析預測模型;同時,還有充分考慮各種外圍因素對預測效果的影響。曲線擬合通過建立一個自變量(例如預測對象)與相關隨機變量(例如時間變量)的回歸分析模型,來分析預測相關隨機變量的未來值。如根據歷史數據的觀察與初步分析,尋求某兩個變量之間的合理關系,進而對未來的趨勢和數據進行預測[3]。
定義1給定數據點(xi,yi)(i=0,1,2,3,…,m),存在函數(φ為多項式函數類),使得:

則函數Pn(x)為擬合函數。當擬合函數為多項式時,稱為多項式曲線擬合。
下面,我們將曲線擬合引入到移動PS域業務分析預測模型中,并進行業務數據預測。假設有實驗數據系列(xi,yi),計算曲線擬合多項式函數時,可以先寫出正規方程組,再求解多項式系數序列(a1,a2,…,an),從而得出多項式函數。正規方程組可以用矩陣形式表示如下:

根據移動PS域監控系統的實時測量數據,可以從后臺的網管系統中獲取一段時間內(例如1×24小時、7×24小時、1個月甚至1年內)的實驗測量數據,記為:(xi,yi)(i=1,2,3,…,m),xi、yi表示任意一次的實驗數據,m為實驗次數,即樣本容量。利用這些數據,根據曲線擬合的多項式最優解原理,可以計算擬合多項式的系數序列(a0,a1,a2,…,an)。
例如,假設一次擬合函數如下:

其中Y是預測對象,x是主要影響因素,a0、a1為回歸常數,ε為回歸余項,ε∝N(0,σ2);對矩陣正規方程進行化簡,得到兩個以a0、a1為參數的方程:


求解這個方程組可得系數a0、a1,表示如下:

下面給出算法設計與實現的主要內容,包括數據輸入、輸出、算法主要步驟以及算法實現的數據結構等關鍵問題。
輸入:實驗數據(xi,yi)(i=1,2,3,…,m),指定時間xi+1,xi+2,xi+3等;
輸出:根據指定的時間值輸出對應的預測數據yi+1,yi+2,yi+3等。
主要步驟如下:
步驟1:采集網絡測量數據。包括附著用戶數、激活用戶數、Gn/Gi/GB/IuPS口流量、防火墻會話數等分組域系統運行的關鍵參數,以小時為粒度,從后臺網管系統進行數據采集;
步驟2:數據預處理。將步驟1提取出的各關鍵參數對應的統計數據分別按時間先后順序分別組成n個時間序列,并對時間序列進行異常數據、噪聲點識別消除;
步驟3:獲取預測所需的測量數據。從預處理后的數據表中獲取預測所需的歷史測量數據:(xi,yi)(i= 1,2,3,…,m);
步驟5:求解系數系列(a1,a2,…,an)。相對一次擬合而言,即求解a0、a1:

步驟6:計算確定擬合函數。根據步驟5計算的a0、a1,確定擬合函數Y=a0+a1x;
步驟7:進行數據預測。根據指定的xi+1,xi+2,xi+3等計算對應的預測值yi+1,yi+2,yi+3等。
步驟8:進行網絡容量預測,并分析網絡壓力點。若達到網絡壓力點,啟動相應設備擴容。
算法的實現涉及到一些軟件系統設計與工程方面的問題,有的是軟件系統開發方面的共性問題,在此不討論;有一些是本PS域業務分析和預測算法設計特有的問題,主要有三個方面。
關于網絡測量數據的處理。獲取的歷史測量數據為原始的網管數據集,導入到數據庫中,按照系統功能需求,設計多個表,保存在數據庫表中。不用按大小排序,只需按時間順序保存即可,并進行數據預處理。
關于數據分析和預測的呈現方式,有兩種情況。一是每天只預測業務量忙時的最大值;另一種是按照樣本數據每小時進行一次預測,按照相同時間點的數據系列進行預測,數據誤差相對較小。再從數據庫或者變量中讀取數據,在坐標區域用曲線標示[4]。
從移動分組網監控系統獲得的PS域業務數據,因為個體數據的敏感性,只獲取兩天的統計數據,且僅供本PS域網絡分析預測研究使用[5]。從網管系統獲得的歷史數據內容和存儲方式比較繁雜,經處理后主要包括:測量時間、網元名稱、3G用戶附著數、3G用戶激活數、Gn口流量、GB口流量等。
以Java為開發語言,使用SQL Server作為后臺數據庫,實現了曲線擬合業務模型和算法。利用這個原型系統對PS域業務進行分析預測,主要進行了SGSN網元的3G用戶激活附著比、Gn口流量統計兩個方面的分析,具體實驗結果如圖1、圖2所示。繪制的曲線圖是PS域3天的網絡分析數據(用紅色虛線分開表示),橫坐標的前兩天(2×24小時)為歷史數據分析,第三天(1×24小時)為未來數據預測。
從圖1可以看出,3G用戶激活附著比符合移動網絡PS域的歷史實際情況。在每天的凌晨3-5時為最小值,白天10-18時比較穩定,為全天的最大值;函數值全天在0.25-0.4之間變化,忙閑時規律明顯,并根據前兩天的歷史測量數據預測了的第三天的3G用戶激活附著比業務量。對于Gn口的流量統計,可以從圖2進行類似分析。

圖1 3G用戶激活附著比圖

圖2 Gn口流量統計圖
本文研究了基于曲線擬合的PS域業務分析及預測模型;并進行了算法設計和軟件系統開發。同時,利用移動PS域監控系統的實時測量數據,實現了PS域業務分析預測系統的原型,進行了3G用戶激活附著比、Gn口流量統計的分析和預測。結果表明,利用曲線擬合進行PS域移動通信業務的分析與預測是有效的,應該進一步研究和在線實驗測試。
[1]TS 23.401.General Packet Group Service(GPRS)Enhancements for Evolved Universal Terrestrial Radio Access Network(E-UTRAN)Access[S],LTE,2009,06.
[2]劉增基,鮑民權,邱智亮編著.交換原理與技術[M].人民郵電出版社,2014.8.
[3]袁野,孫迪科,張榮.網絡融合背景下的移動分組域網絡負荷指標關聯模型研究[J].移動通信,2015.1.
[4]Ling Zhou,De-feng Zhang.Least Energy-Consumption Real-Time Routing Algorithm Based on Event Sensitive Node Set[J].Journal of Communications,2014,07.
[5]中國移動通信有限公司.2G/3G/4G融合核心網統一標準模型[S],2014.12.
Model and Algorithm for Capacity Analysis in Packet Switch Based on Curve Fitting
HUANG Hai1,ZHOU Ling2
(1.Guangdong University of Education,Guangzhou 510000;2.Department of Computer Science and Technology,Foshan University,Foshan 528000)
To the mobile telecommunications networks,capacity model and algorithm design for packet switch is a new research field.Studies the capacity analysis model for packet switch based on curve fitting and develops its prediction algorithm.At the same time,the prototype system for capacity analysis and data prediction is achieved by using real-time measuring data from monitoring and control system of mobile telecommunications networks.Analysis and prediction experiments are done about 3G subscriber ratio and rate of flow in Gn port. The experiment results show that it is correct and efficient to use curve fitting to design capacity model and algorithm for packet switch in mobile telecommunications networks.
Packet Switch;Curve Fitting;Capacity Analysis;Experiment;Algorithm Model
廣東省教育廳青年創新人才資助項目(No.2015KQNCX109)
1007-1423(2016)23-0016-04DOI:10.3969/j.issn.1007-1423.2016.23.004