李宏輝,劉林華,李海彬/Li Honghui,Liu Linhua,Li Haibin
(1.中國聯合網絡通信有限公司內蒙古自治區分公司 內蒙古010010;2.中國聯合網絡通信有限公司網絡技術研究院 北京100048;3.中國聯合網絡通信有限公司網建部 北京100048)
隨著數據流量的增加、內容的增多、應用的豐富,移動互聯網用戶正呈現出爆發式增長的趨勢并逐漸步入大數據時代。運營商擁有海量的用戶通信數據,通過對OSS 側和BSS 側數據的挖掘,從用戶、業務、終端等不同角度對網絡運行數據進行多緯度分析,支撐網絡的規劃和建設。
基于KPI 指標的網絡問題分析及規劃方法主要聚焦“網絡本身”,對端到端的用戶體驗關注不夠。移動互聯網大數據時代更應聚焦“用戶體驗”,聚焦“人”的分布和活動。本文將以某省為例,通過對移動用戶上網流量詳細記錄(flow detail record,FDR)數據的挖掘分析,探索使用基于用戶分布和用戶感知的規劃方法,實現網絡能力與市場需求的精準匹配。
(1)移動用戶上網流量詳細記錄數據
提取一周本地和外省漫入2G、3G的FDR。提取的FDR 數據字段見表1 所列。
(2)用戶簽約信息數據
提取最近用戶簽約及賬單信息,信息字段見表2所列。
(3)MR 數據
提取近一周的7×24 h小區級(含室分)的所有載波全業務周期性MR 數據,7×24 h 內MR 數據采集數量小于1 200 次的小區不納入統計分析。MR 數據需要包括統計時間、小區ID、小區經緯度、RSCP 分布區間等信息。

表1 FDR 數據字段

表2 提取的用戶簽約及賬單數據字段
(4)用戶投訴數據
提取近半年經優化部門分析后的用戶有效投訴數據,包括投訴點經緯度、投訴原因、投訴次數。
3.1.1 高ARPU 值用戶分布
通過統計分析,某省近幾個月的3G用戶平均ARPU 值在100 元左右,因此將某省高ARPU用戶定義為月消費200 元以上的用戶。將用戶簽約及賬單信息表中的“IMSI 號碼”字段與本地網FDR 數據信息表中的“IMSI”字段關聯,篩選出“6月出賬金額≥200 元”的用戶,并對相同小區下的用戶做去重處理,分析出一周忙時平均小區下的高ARPU用戶分布情況。高ARPU用戶分布區域如圖1所示,用戶分布統計見表3所列。

圖1 高ARPU 值用戶分布

表3 高ARPU用戶分布統計
覆蓋規劃策略: 建議在LTE 建網初期,優先對≥30 個高ARPU用戶分布的小區進行規劃建設;密切關注≥10 個高ARPU用戶分布小區的3G MR弱覆蓋問題。
3.1.2 高流量用戶分布
高數據流量用戶是指數據流量使用排名在前30%的用戶。通過對本地網FDR 數據的一周忙時平均數據流量統計分析,篩選出數據業務流量在前30%的用戶及地理分布(LAC+CI),再對小區下的用戶進行去重處理,分析出一周忙時平均小區下的高流量用戶分布情況。高流量用戶分布統計見表4 所列,用戶分布區域如圖2所示。

表4 高流量用戶分布統計

圖2 高流量用戶小區分布
覆蓋規劃策略: 建議在LTE 建網初期,優先對≥20個高數量流量用戶的小區進行規劃建設;優先解決≥20 個高流量用戶分布小區的3G MR 弱覆蓋問題。
3.1.3 高價值用戶分布
高價值用戶定義為:用戶簽約信息為鉆、金、銀等級的VIP用戶。
高價值用戶小區定義為:鉆、金、銀等級的VIP用戶分布的數量≥30 個用戶的小區。
將用戶簽約及賬單信息表中的“IMSI 號碼”字段與本地網FDR 數據信息表中的“IMSI”字段關聯,篩選出“用戶等級=鉆、金、銀”的用戶,并對相同小區下的用戶做去重處理,分析出一周忙時平均小區下的高價值用戶分布情況。高價值用戶分布統計見表5 所列,用戶分布區域如圖3所示。

表5 高價值用戶小區統計
通過對高價值用戶小區的MR 弱覆蓋統計分析,市區、縣城、鄉鎮、行政村場景中的重要用戶小區弱覆蓋分別占了各自場景弱覆蓋小區29%、18%、3%、6%的比重。
覆蓋規劃策略:建議在LTE 建網初期,優先對高價值用戶小區進行規劃建設;優先解決高價值用戶小區的3G MR 弱覆蓋問題。
3.1.4 外省漫入用戶分布
通過分析一周平均忙時外省漫入2G、3G的FDR數據,并對相同小區下的用戶做去重處理,得出外省漫入用戶的分布統計結果。外省漫入的用戶分布統計見表6 所列,用戶分布區域如圖4所示。

表6 外省漫入用戶場景分布統計
通過對漫入用戶分布和3G網絡覆蓋進行對比分析,無3G 覆蓋而承載在2G網絡下的3G 漫游用戶所占各場景的比重如圖5所示。
覆蓋規劃策略:在旅游季節,該省的2G、3G網絡承載了大量外省漫游用戶,漫入的3G用戶占該省3G數據業務使用用戶總數的14%,對全國3G網絡的品牌形象有較大影響;外省漫入用戶主要分布在市區和行政村,其次是道路,在行政村有71%的外省漫入3G用戶無3G網絡覆蓋。
建議如下:
①對行政村漫游用戶聚集的區域(2G小區下的3G用戶≥20)進行3G網絡規劃,優先考慮U900 建設方案。
②對通往重要景區(漫游用戶聚集度較高的區域)的交通路線進行3G網絡全覆蓋規劃,優先考慮U900 建設方案。

圖3 高價值用戶分布

圖4 外省漫入用戶分布

圖5 無3G網絡覆蓋的外省漫入3G用戶比重
③在LTE 建網初期對重要景區(3G小區下的漫游用戶數≥60)進行規劃建設。
3.1.5 投訴用戶分布
用戶投訴能直接反映用戶的感知和用戶需求。通過對用戶投訴的區域位置、業務類型、主要問題以及投訴的用戶等級進行分析,制定相應的網絡覆蓋規劃和容量規劃策略,不僅能提升用戶感知,而且能根據用戶需求和用戶等級匹配相應的網絡能力。
通過對該省用戶投訴數據中 “投訴的用戶號碼”和用戶簽約信息數據中的“手機號碼”關聯,匹配用戶等級,并以此分析不同等級投訴用戶的分布。
由于覆蓋原因所引起的不同等級投訴用戶分布如圖6所示。

圖6 不同等級投訴用戶分布
該省VIP用戶的投訴占51%比重,其中,鉆石用戶投訴占2%、金牌用戶投訴占44%、銀牌用戶投訴占5%。通過MR 數據與投訴用戶分布的對比分析,投訴區域主要集中在市區,主要原因為深度覆蓋不足,其中居民住宅小區內的投訴占大部分比重。
覆蓋規劃策略:城區深度覆蓋不足是引起用戶投訴的主要原因,尤其是居民住宅小區內VIP用戶對深度覆蓋的訴求。從建設成本以及覆蓋有效性角度考慮,建議對住宅區、城中村、校園、商業區等多排多棟建筑群場景采用室內室外綜合的方式進行規劃,優先解決VIP用戶聚集度較高的住宅小區深度覆蓋問題。
3.1.6 終端分布
通過分析本地網一周忙時平均FDR 數據,對相同小區下的用戶做去重處理,對應該用戶的IMEI 號和地理位置(LAC+CI),可以得出不同能力的終端分布情況,見表7 所列。

表7 全省分場景的不同能力終端滲透率統計
該省U900 終端滲透率達到78%,DC 達到24%,LTE 為12%。從全省整體情況來看,DC 和LTE終端的滲透率不高,在一定程度上會影響用戶對感知速率的體驗;農村3G用戶U900 終端滲透率超過70%,所以在終端支持度方面,具備U900網絡建設推廣條件。
在3G、4G 數據時代,用戶感知提升到了前所未有的高度,全球主流運營商普遍認識到用戶感知是當前網絡規劃和建設的核心問題,用戶體驗的滿意度將極大地影響終端用戶對網絡的忠誠度。
用戶的業務使用體驗與使用中的感知速率直接相關。基于用戶感知的規劃方法將增加保障用戶良好業務使用的感知速率指標,并建立小區級的業務類型、目標速率、可承載用戶數之間的用戶感知模型關系,根據確立的小區級用戶感知模型來進行網絡覆蓋規劃和容量規劃。
3.2.1 相關的計算方法
用戶感知模型的建立及分析以FDR 為數據源,下面將對各種涉及的指標及計算方法、規則進行說明。
①小區用戶單業務平均速率:小區在某統計時間段內,使用某種業務的平均用戶下行速率。
小區用戶單業務平均速率=average(統計時段內各時間切點時的小區用戶單業務平均速率),每10 min 取1 次切點。
時間切點時的小區用戶單業務平均速率=average(n1用戶在該時間切點時某業務速率,n2用戶在該時間切點時某業務速率,……)。
②小區用戶綜合平均速率:小區在某統計時間段內,包含各種業務的平均每用戶下行速率。
小區用戶綜合業務平均速率= average(統計時段內各時間切點時的小區用戶綜合平均速率),每10 min 取1 次切點。
時間切點時的小區用戶綜合平均速率=average(n1用戶在該時間切點時各業務速率之和,n2用戶在該時間切點時各業務速率之和,……)。
③用戶單業務保障速率:為保證用戶良好體驗,需提供給用戶的各種業務速率。
④用戶平均業務并發數:小區在某統計時間段內,用戶平均并發使用不同業務的數量。
用戶平均業務并發數=average(統計時段內各時間切點時的用戶平均業務并發數),每10 min 取1 次切點。
時間切點時的用戶平均業務并發數= average(n1用戶在該時間切點時使用不同業務數量,n2用戶在該時間切點時使用不同業務數量,……)。
⑤平均并發用戶數:小區在某統計時間段內,并發使用業務的平均用戶數量。
小區平均并發用戶數= average(統計時段內各時間切點時的平均并發用戶數),每10 min 取1 次切點。
⑥小區用戶目標綜合平均速率:Σ(單業務保障速率×目標業務時長占比)×用戶平均業務并發數。
3.2.2 用戶感知模型建立方法
用戶感知模型以小區級為顆粒度進行建模,大體分為3 個步驟,如圖7所示。

圖7 用戶感知模型建模步驟
(1)識別業務類型
通過對FDR 數據分析,某省3G 數據業務主要類型有網頁瀏覽、流媒體、即時通信、文件下載、E-mail、P2P 業務。
(2)分析業務特征
通過對FDR 數據分析,某省3G 各類型數據業務時長及流量占比情況見表8 所列。
目前最主要的業務為網頁瀏覽,占業務總時長的66%和總流量的43%;即時通信占業務總時長的17%,但流量只占了3%的比例;流媒體也是重要業務,其時長雖只占業務總時長的8%,但貢獻了42%的流量;文件下載時長占比5%,產生了11%的流量占比。
從業務時長和業務流量方面綜合考慮,該省Top4的業務為網頁瀏覽、即時通信、流媒體和文件下載業務。
(3)匹配小區的用戶目標速率和承載用戶能力
用戶單業務保障速率的設定采用滾動和相對方式。統計分析現網目前主要業務的平均速率,并根據現網業務實際平均速率設定主要業務的保障速率。某省主要業務(Top4)保障速率設定見表9 所列。
匹配小區的用戶目標速率和承載用戶能力,建立小區級的用戶感知模型,某省感知模型示例見表10 所列。
小區用戶目標綜合平均速率=Σ(單業務保障速率×目標業務時長占比)×用戶平均業務并發數。
小區可承載用戶數=小區用戶綜合平均速率≥小區用戶目標綜合平均速率情況下,小區可承載的平均并發用戶數。
3.2.3 基于用戶感知模型的網絡覆蓋和容量規劃
(1)覆蓋規劃
基于用戶感知模型的覆蓋規劃流程如圖8所示。
通過分析一周忙時FDR 數據,某省速率不達標小區統計情況見表11 所列,其中的弱覆蓋問題小區與該省MR 數據對比分析,結果基本一致。
(2)容量規劃
可利用用戶感知模型進行小區級的容量規劃或者進行資源配置,其思路如下:WCDMA 載頻配置=小區吞吐率需求/小區實際能提供的吞吐率能力,其中:小區吞吐率需求=預測的小區目標用戶數(小區并發用戶數)×小區用戶目標綜合平均速率; 或者WCDMA載頻配置=預測小區用戶數/小區模型所能承載的用戶數。當WCDMA 載頻配置>3 時,可考慮LTE 建設。
容量規劃配置見表12 所列。

表8 全省3G 各類型數據業務時長及流量占比

表9 某省主要業務保障速率

表10 小區級用戶感知模型

表11 某省速率不達標小區統計

圖8 基于用戶感知模型的覆蓋規劃流程

表12 容量規劃配置
在移動互聯網時代,用戶將更為關注對業務的使用體驗,這將給運營商無線網絡規劃方法及建設方式帶來新的挑戰。傳統的僅基于KPI 指標的規劃方法不能滿足移動互聯網大數據時代以“KPI指標”為基石、以“人”為核心、以“用戶感知”為導向的網絡資源配置需求。本文基于FDR 大數據,從高ARPU用戶、高流量用戶、高價值用戶以及漫游用戶和終端幾方面對用戶的分布進行了分析,并給出了相應無線網絡規劃策略建議。此外,本文還通過對FDR 大數據分析,探討了小區級的用戶感知模型建立方法和基于感知模型的網絡覆蓋規劃和容量規劃方法。
1 Holma H,Toskala A.UMTS中的WCDMA:HSPA 演進及LTE(第5 版).楊大成譯.北京:機械工業出版社,2008
2 王曉龍.WCDMA網絡專題優化.北京:人民郵電出版社,2011
3 Pbilipp K Janert .數據之魅:基于開源工具的數據分析.黃權,陸昌輝,鄒雪梅等譯.北京:清華大學出版社,2012
4 謝希仁.計算機網絡(第5 版).北京:電子工業出版社,2008