黃金福



摘要:文章主要針對中國電信LTE用戶網頁瀏覽感知KQI和無線側KPI之間進行相關性分析,得到二者之間的關聯,以達到后期通過優化對應KPI能快速提升KQ[的目的。
關鍵詞:LTE;用戶感知;KQI;KPI
隨著移動互聯網業務迅猛發展,傳統的關鍵績效指標(Key Performance Indicators,KRD無法精確反映用戶真實業務感知的問題日益凸顯。部分空口、終端、結構化編程(Structured Programming,SP)、核心側等問題均可引發用戶感知問題,卻無法通過網絡KPI和路測獲取,成為網絡痛點。運營商各自針對移動互聯網主流業務搭建了評估體系,為每項業務設計了多個反映用戶不同方面的業務感知關鍵質量指標(Key Quality Indicators,KQI),建立了一整套基于大數據分析的移動互聯網用戶感知評估體系[1]。
本文主要對中國電信KQI感知指標網頁瀏覽指標和KPI指標之間進行關聯分析,嘗試得到二者之間的線性關系,以達到后期對KQI感知指標快速分析、通過優化對應的關鍵KPI指標快速提升KQI。
1KQI和KPI篩選提取
KQI聚焦于終端用戶關注的業務層面,用戶使用網絡的業務體驗指標,而KPI主要是運營商關注的網絡層面水平。
本次關聯分析中,KQI指標選取網頁瀏覽業務的網頁首包時延。網頁首包時延是指終端用戶發起瀏覽請求到請求服務器回復第一個Http200ok報文所經歷的時間,反映的是從終端側和目標服務器側之間的網絡響應水平。
本次KQI和KPI關聯分析的KPI僅為無線偵1JKPI指標,相關KPI指標數量很多,可歸為覆蓋、容量、干擾、保持性和完整性五大類。本文重點針對覆蓋、容量、干擾進行分析(見表1)。
2分析數據源獲取
本次用戶感知KQI與KPI的分析數據源主要有兩個,VMAX及移動感知APP統計話單
數據提取主要基于中興通信VMAX大數據分析系統,為了提高KQI和KPI的匯聚效果,本次篩選采用傳輸控制協議(Transmission Control Protocol,TCP)有線建鏈時延和TCP無線建鏈時延,統計福州地區所有小區的TCP時延,將TCP有線建鏈時延大于80ms的小區篩除掉。按照選定的KQI和KPI,分別統計這些小區的網頁首包時延,無線側KPI指標,統計時間為5月某一周數據,得到選定時間內選定區域的KQI和KPI的數據表。
考慮到KQI與KPI都是一個統計值,且影響用戶感知的因素非常多,除了無線側影響外,傳輸、核心網、服務器等均會對感知帶來影響,所以也提取了電信的移動感知APP上報的話單級別的數據進行統計,統計時間段為5月份可擴展標記語言(extensible Markup Language,XML)話單記錄。
3關聯分析過程
采用機器學習的分析思路,對各元素之間的數據關系進行最大程度的擬合,對采集到的數據進行分組,一部分作為擬合數據源,一部分作為評估數據,通過機器學習數據源得到估計函數,使用評估數據對估計函數進行誤差分析,通過算法調優減小誤差,如果誤差在可接受范圍內,則認為評估是有效的,即得到了準確的數據關系。
KQI和KPI數據提取完成后,進行了數據的初步預處理,將一些明顯異常的噪聲點篩選出來,一些NULL值的數據,網頁首包時延明顯低于正常值的異常點進行篩選,得到的待歸一化的數據。根據采樣點的數據分布情況,采用線性函數轉換方法進行歸一化,歸一化公式為:
同一類別指標由于是相互關聯的,內部采用加權處理,
配置的權重如表2所示。
采用通用的線性模型把特征x配上對應的權重彡之后相加,最大程度接近目標y(x),通過機器學習大量的數據,訓練得出數據關系,采用測試數據進行測試,在誤差可接受的情況下,認為得出的關系可靠。本文采用嶺回歸的回歸方法,嶺回歸是一種專用于共線性數據分析的有偏估計方法[34],與一般的線性模型比較,優勢在于嶺回歸預測出來的圖線的方差比較小,振幅略小。
本文采用Python編程語言實現數據清洗、歸一化、機器學習和誤差分析部分,選取訓練樣本數21988,檢驗樣本數4398,3項指標覆蓋、容量、干擾分別為x2,x3,目標
首包時延為y(x)外通過嶺回歸機器學習法得到:
針對該學習結果,采用如下誤差函數進行評估:
得到誤差為0.04,所以可以認為該結果是可靠的;從權重的重要性上看,覆蓋、容量和干擾中,容量對首包時延影響最大,其次是干擾。
4網頁打開時延與關鍵KPI關聯性分析結果
覆蓋、容量和干擾中,容量對首包時延影響最大,其次是干擾。網頁瀏覽KQI與關鍵覆蓋KPI指標(RSRP,信號與干擾加噪聲比(Signalto Interferenceplus NoiseRatio,SINR))呈正相關。
(1)網頁打開時延隨著RSRP的惡化也呈現變差趨勢,當RSRP小于-104dBm時,首包時延將超過1.2s,首屏時延將超過3s,且后面的首屏惡化趨勢將更加陡峭、明顯。(2)網頁打開時延隨著RSRP的向好也呈現向好趨勢,當RSRP大于-86dBm時,首屏時延、首包時延變化波動己很小,己趨于穩定,首包時延在1s左右,而首屏時延在2.5s左右。(3)網頁打開時延隨著SINR的向好也呈現向好趨勢,當SINR低于7dB左右時,首屏時延、首包時延惡化趨勢比較明顯。
5結語
經過以上分析,網頁打開時延與關鍵覆蓋KPI指標正相關,當RSRP低于-104dBm時,網頁打開時延惡化明顯,當RSRP大于-86dBm時候,網頁打開時延趨于穩定;SINR值低于7dB時,網頁打開時延惡化趨勢較為明顯。因此,當LET的RSRP優于-104,SINR值優于7dB時,將會大大提升用戶的網頁瀏覽感知,可以作為對重要區域或VIP客戶的優化參考目標。
[參考文獻]
[1]陳森,陳超,張小勇,等基于大數據分析的移動互聯網用戶感知評估系統[J].電信科學,2015(4):148-155.
[2]CHENS,CHENC,ZHANGXY,etal. Evaluation system of mobile internet use rexperience based on big dataanalysis[J].Telecommunications Science,2015(5):7.
[3]米歇爾.機器學習[M].曾華軍,張銀奎,譯北京:機械工ik出版社,2003.
[4]哈林頓.機器學習實戰[M].李銳,譯北京:人民郵電出版社,2017.endprint