999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林及地理圍欄的千兆寬帶用戶規(guī)模預(yù)測

2023-06-21 17:44:23車維崧祁靜白文其
現(xiàn)代信息科技 2023年1期
關(guān)鍵詞:用戶

車維崧 祁靜 白文其

摘? 要:針對公眾住宅小區(qū)千兆寬帶用戶規(guī)模不確定導(dǎo)致預(yù)覆蓋OLT設(shè)備投資建設(shè)不精確的現(xiàn)狀,提出了一種基于隨機森林算法及地理圍欄進行小區(qū)千兆用戶規(guī)模預(yù)測的方案。方案使用小區(qū)場景圍欄完成地理數(shù)據(jù)、房地產(chǎn)中介數(shù)據(jù)與運營商數(shù)據(jù)的匹配,通過小區(qū)內(nèi)樓宇棟數(shù)、住戶數(shù)、房屋出租均價、運營商寬帶用戶數(shù)等指標對小區(qū)千兆用戶規(guī)模進行預(yù)測。對比實驗證明,使用隨機森林算法進行千兆用戶規(guī)模預(yù)測具有較高的準確性。

關(guān)鍵詞:隨機森林;地理圍欄;千兆寬帶;用戶預(yù)測

中圖分類號:TP18 文獻標識碼:A? 文章編號:2096-4706(2023)01-0061-03

Prediction of Gigabit Broadband Subscriber Scale Based on Random Forest and Geo-fencing

CHE Weisong1, QI Jing2, BAI Wenqi2

(1.Beijing Telecom Planning & Designing Institute Co., Ltd., Beijing? 100048, China;

2.China United Network Communications Group Co., Ltd., Beijing? 100033, China)

Abstract: In light of the current situation of inaccurate investment and construction in pre-coverage OLT equipment due to the uncertainty of the scale of gigabit broadband subscriber in public residential quarters, this paper proposes a scheme for gigabit subscriber scale prediction based on Random Forest algorithm and Geo-fencing. The scheme uses the Geo-fencing of the residential area to complete the matching among geographical data, real estate agency data and operator data, and predicts the scale of gigabit subscriber through indicators such as the number of buildings in the residential area, the number of households, the average house rental price, and the number of operators' broadband subscribers. The comparative experiments prove that the Random Forest algorithm has higher accuracy in predicting the scale of gigabit subscribers.

Keywords: Random Forest; Geo-fencing; gigabit broadband; subscriber prediction

0? 引? 言

近年來,隨著“寬帶中國”“雙千兆網(wǎng)絡(luò)協(xié)同發(fā)展行動計劃”等國家寬帶接入發(fā)展指導(dǎo)意見的提出,千兆寬帶覆蓋規(guī)模不斷擴大,公眾用戶寬帶接入速率不斷提升。截至2022年5月底,1 000 Mbps及以上接入速率的固定互聯(lián)網(wǎng)寬帶接入用戶達5 591萬戶,比21年末凈增2 135萬戶[1],千兆用戶規(guī)模提升明顯。

另一方面,受三大運營商競爭加劇及寬帶“提速降費”等因素影響,固定互聯(lián)網(wǎng)寬帶業(yè)務(wù)收入增長緩慢、總體收入趨于穩(wěn)定。目前國內(nèi)住宅小區(qū)基本均已完成FTTH(Fibre To The Home)接入,千兆寬帶建設(shè)的主要成本為OLT(Optical Line Terminal)設(shè)備改造升級。目前國內(nèi)主流設(shè)備廠家10G PON(Passive Optical Network) OLT設(shè)備單PON造價約為2 500元至3 000元不等,按照10G PON OLT單端口可承載20戶用戶進行測算,已完成FTTH覆蓋的住宅小區(qū)進行千兆升級僅OLT設(shè)備升級成本就在10萬至20萬左右。鑒于OLT升級成本較高、由于芯片短缺導(dǎo)致OLT到貨周期較慢等因素,對小區(qū)預(yù)期發(fā)展的千兆用戶規(guī)模進行測算,有助于提升設(shè)備升級改造的精準性、減少改造投資,實現(xiàn)千兆建設(shè)降本增效。

針對以上分析,本文提出了一種采用隨機森林算法及地理圍欄信息對小區(qū)內(nèi)千兆寬帶用戶規(guī)模進行預(yù)測的方案。通過使用小區(qū)地理圍欄完成房地產(chǎn)中介數(shù)據(jù)與運營商網(wǎng)絡(luò)數(shù)據(jù)的關(guān)聯(lián),通過小區(qū)內(nèi)樓宇棟數(shù)、住戶數(shù)、房屋出租單位面積均價、出租單位套數(shù)均價及某運營商寬帶用戶數(shù)等指標對小區(qū)千兆用戶規(guī)模進行預(yù)測。通過預(yù)測結(jié)果指導(dǎo)千兆OLT升級改造規(guī)劃及建設(shè),提升設(shè)備升級改造的精準有效性。

1? 基于地理圍欄的小區(qū)多源數(shù)據(jù)關(guān)聯(lián)

為實現(xiàn)小區(qū)千兆規(guī)模預(yù)測,需獲取小區(qū)多維價值屬性信息。由于數(shù)據(jù)來源渠道不同,同一住宅小區(qū)在互聯(lián)網(wǎng)地圖、中介數(shù)據(jù)及通信運營商自有數(shù)據(jù)中,名稱、地址描述方式、經(jīng)緯度坐標等信息均可能存在差異。對不同數(shù)據(jù)來源渠道的小區(qū)名稱及地址信息進行關(guān)聯(lián),往往涉及較為復(fù)雜的數(shù)據(jù)清洗及NLP(Natural Language Processing)過程,且關(guān)聯(lián)匹配的準確率一般不高。目前各渠道數(shù)據(jù)基本均含有經(jīng)緯度信息,但由于采用坐標系(WGS84、GCJ02、BD09等)不同及定位地點存在差異,往往同一小區(qū)在不同數(shù)據(jù)來源中的經(jīng)緯度位置存在一定差別,為實現(xiàn)基于經(jīng)緯度坐標的多源數(shù)據(jù)精準關(guān)聯(lián),需要引入地理圍欄信息作為媒介。

地理圍欄(Geo-fencing)是基于位置服務(wù)的一種特殊應(yīng)用[2],主要用于地理區(qū)域的網(wǎng)格化及精確化管理。目前各類互聯(lián)網(wǎng)地圖及地理服務(wù)提供商具備各種類型及渠道來源的地理圍欄信息。每條記錄一般包含圍欄對應(yīng)的場景名稱、分類、邊界頂點經(jīng)緯度坐標等信息。

使用地理圍欄作為住宅小區(qū)的標識,將中介數(shù)據(jù)、運營商數(shù)據(jù)、樓宇數(shù)據(jù)等含有經(jīng)緯度的POI信息統(tǒng)一轉(zhuǎn)換為WGS84坐標系后投影至地圖上,對處于同一小區(qū)地理圍欄中的各類數(shù)據(jù)進行歸集,多源數(shù)據(jù)關(guān)聯(lián)流程如圖1所示。最終可以獲得小區(qū)內(nèi)樓棟數(shù)、住戶數(shù)、房屋出租單位面積均價、房屋出租單套均價、某運營商寬帶用戶總數(shù)、簽約帶寬分布等信息作為千兆用戶規(guī)模測算的輸入特征。使用地理圍欄匹配多源數(shù)據(jù)可以降低不同坐標系轉(zhuǎn)換對匹配結(jié)果的擾動,在某地市進行驗證實驗,結(jié)果顯示使用地理圍欄進行多源數(shù)據(jù)匹配,多源數(shù)據(jù)均為同一小區(qū)數(shù)據(jù)的準確率達到88.16%,而基于名稱及地址信息的匹配準確率僅為69.79%。

2? 基于隨機森林的千兆寬帶用戶規(guī)模預(yù)測

對住宅小區(qū)千兆寬帶用戶規(guī)模進行預(yù)測的主要目的是通過預(yù)測結(jié)果確定小區(qū)上聯(lián)綜合接入點OLT預(yù)留的10 G PON口數(shù),由于單PON口用戶數(shù)與分光器分光比、分光方式均有關(guān),所以并不需要計算千兆用戶占比的具體數(shù)值,僅需對其規(guī)模量級進行預(yù)測即可。同時,由于不同城市經(jīng)濟發(fā)展水平、用戶上網(wǎng)習(xí)慣、單一運營商市場滲透率均存在差異,需要對不同城市分別建立分析模型。

基于上述分析,首先選取一地市內(nèi)業(yè)務(wù)發(fā)展基本成熟、用戶規(guī)模穩(wěn)定的小區(qū)計算其千兆用戶占比均值及標準差,記均值為μ、標準差為σ、小區(qū)千兆寬帶用戶占比為x。x一般服從期望為μ、方差為σ2的正態(tài)分布。基于正態(tài)分布將小區(qū)千兆寬帶用戶占比分為低、較低、一般、較高及高5類,具體分類規(guī)則如表1所示,通過該處理將千兆用戶規(guī)模預(yù)測轉(zhuǎn)化為分類問題。

隨機森林算法是近年來常用的集中學(xué)習(xí)算法之一[3],隨機森林通過對多棵決策樹進行集成,一般通過bagging方式進行學(xué)習(xí),可采用投票或均值等方法獲得集成后輸出,整體算法對異常值及噪聲有較強的魯棒性。使用隨機森林進行分類的模型如圖2所示。

隨機森林模型對分類數(shù)據(jù)的平衡性有一定要求,由于隨機森林建造時對訓(xùn)練樣本進行隨機抽樣,對于不平衡樣本會進一步加劇其不平衡性,進而使決策樹模型對不平衡樣本分類效果欠佳的缺點被進一步放大。將分布轉(zhuǎn)化為類型的千兆用戶規(guī)模是典型的非平衡樣本,為降低樣本分布對分類結(jié)果的影響,采用SMOTE(Synthetic Minority Oversampling Technique)[4]方法進行訓(xùn)練,SMOTE方法訓(xùn)練時在少數(shù)類樣本及其K近鄰類樣本之間的連線上產(chǎn)生新的少數(shù)類樣本,進而平衡各分類樣本規(guī)模,減少不平衡樣本及對隨機森林的影響。

3? 實驗及結(jié)果分析

3.1? 數(shù)據(jù)預(yù)處理

采用某運營商北方某城市數(shù)據(jù)作為實驗數(shù)據(jù),該市共有住宅小區(qū)1 600余個,剔除某運營商新覆蓋、未覆蓋、無數(shù)據(jù)區(qū)域及小區(qū)內(nèi)寬帶用戶小于10戶簽約帶寬分布可能隨機性較強的小區(qū),剩余包含完整有效數(shù)據(jù)的小區(qū)樣本657個。

657個有效小區(qū)樣本中千兆寬帶用戶占比均值μ=0.165 7、σ=0.047 8,其中分類為低的樣本18個、較低樣本142個、一般的樣本414個、較高樣本73個、高樣本10個。隨機抽取20%的樣本作為測試樣本,剩余526個樣本作為訓(xùn)練樣本集,訓(xùn)練時采用了SMOTE方法進行抽樣。以住宅小區(qū)內(nèi)樓宇總棟數(shù)、總戶數(shù)、每平方米出租均價、每戶出租均價、某運營商寬帶用戶總數(shù)5個特征作為輸入特征,以千兆寬帶用戶占比作為預(yù)測的輸出特征。

3.2? 隨機森林模型超參數(shù)設(shè)置

由于隨機森林的子樹規(guī)模及樹深度對隨機森林的分類能力有較大影響,為確定超參數(shù)的最優(yōu)配置方案通過網(wǎng)格搜索方法進行了探索,在訓(xùn)練樣本集上對子樹規(guī)模及樹深度的各種匹配方案進行了10折驗證,結(jié)果如圖3所示,可以看到當樹深度為5、子樹規(guī)模為50、樹模型訓(xùn)練過程中每次節(jié)點分割時均考慮2個特征時訓(xùn)練樣本集10折驗證的分類準確率最高,達到80.80%。

3.3? 實驗結(jié)果及分析

將基于隨機森林模型的訓(xùn)練集分類準確率及測試集分類準確率與SVM、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯分類、多元分類器線性分類器進行對比,所有涉及超參數(shù)的分類算法均通過在訓(xùn)練集上對主要超參數(shù)進行了網(wǎng)格搜索,對比結(jié)果如表2所示。可以看到不同分類算法在訓(xùn)練樣本集上的分類準確率均在80%左右,不同模型之間沒有明顯差異,而在測試樣本集上隨機森林模型明顯高于其他模型達到80.91%,對比實驗證明隨機森林算法在千兆寬帶用戶規(guī)模預(yù)測問題上具有更強的泛化能力。

3.4? 特征重要性分析

通過隨機森林使用各特征的樹節(jié)點平均減少不純度對各特征的重要性進行對比,不純度減少的權(quán)重為與其關(guān)聯(lián)的訓(xùn)練樣本數(shù)量[5]。各特征重要性如表3所示。可以看到小區(qū)每平方米出租均價、某運營商寬帶用戶總數(shù)、總戶數(shù)是相對較為重要的3個輸入特征,可將其歸集為小區(qū)高檔程度、運營商滲透率及用戶總規(guī)模3個分析維度,該結(jié)果提示在運營商小區(qū)價值分析中應(yīng)加強對相關(guān)維度數(shù)據(jù)的搜集及關(guān)注程度。

4? 結(jié)? 論

本文提出了一種基于隨機森林算法及地理圍欄進行小區(qū)千兆用戶規(guī)模預(yù)測的方案,該方案通過小區(qū)場景圍欄完成房地產(chǎn)中介與運營商數(shù)據(jù)的關(guān)聯(lián)匹配并將其作為輸入特征對小區(qū)寬帶用戶規(guī)模進行預(yù)測,通過實驗證明使用隨機森林算法的預(yù)測準確率高于其他算法。通過樹節(jié)點不純度減少程度確定小區(qū)每平方米出租均價、某運營商寬帶用戶總數(shù)、總戶數(shù)是較為重要的輸入特征,為通信運營商千兆規(guī)劃建設(shè)及營銷重點區(qū)域選擇提供了參考依據(jù)。

參考文獻:

[1] 中華人民共和國工業(yè)和信息化部.2022年1-5月份通信業(yè)經(jīng)濟運行情況 [EB/OL].https://www.miit.gov.cn/gxsj/tjfx/txy/art/2022/art_84d43f3ff32c457dabf66dcedfa7996f.html.

[2] 鞠明山.地理圍欄技術(shù)發(fā)展現(xiàn)狀及網(wǎng)絡(luò)信息安全問題探究 [J].江西通信科技,2018(3):39-41.

[3] 呂紅燕,馮倩.隨機森林算法研究綜述 [J].河北省科學(xué)院學(xué)報,2019,36(3):37-41.

[4] CHAWLA N V,BOWYER K W,HALL L O,et al. SMOTE:Synthetic Minority Over-Sampling Technique [J].Journal of Artificial Intelligence Research,2002,16:321-357.

[5] 喬健,諸佳慧,嚴康桓.基于隨機森林CART特征選擇改進算法的電信客戶流失預(yù)測模型 [J].電信工程技術(shù)與標準化,2022,35(3):78-82.

作者簡介:車維崧(1990—),男,漢族,北京人,助理工程師,碩士,研究方向:寬帶政企接入網(wǎng)絡(luò)規(guī)劃;祁靜(1988—),女,漢族,北京人,工程師,碩士,研究方向:寬帶政企接入網(wǎng)數(shù)字化運營;白文其(1977—),男,滿族,北京人,高級工程師,本科,研究方向:傳輸及寬帶網(wǎng)絡(luò)技術(shù)。

收稿日期:2022-08-03

猜你喜歡
用戶
雅閣國內(nèi)用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應(yīng)用
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 国产综合欧美| 亚洲国产日韩一区| 国产高颜值露脸在线观看| 久久婷婷色综合老司机| 欧亚日韩Av| 久久人人妻人人爽人人卡片av| 国产精品一区二区久久精品无码| 亚洲欧美在线综合图区| 亚洲精品自在线拍| 国产丝袜一区二区三区视频免下载| 激情无码视频在线看| 国产9191精品免费观看| 激情无码视频在线看| 毛片免费视频| 日韩二区三区无| 亚洲妓女综合网995久久| 国产打屁股免费区网站| 亚洲日韩精品无码专区97| 日韩麻豆小视频| 日韩天堂视频| 国产精品女同一区三区五区| 91久久偷偷做嫩草影院电| 亚洲三级a| 亚洲天堂区| 亚洲天堂视频网| 日本午夜影院| 日韩美女福利视频| 国产第一页亚洲| av在线5g无码天天| 性69交片免费看| 欧美国产在线看| 91av成人日本不卡三区| 成人国产免费| h网站在线播放| 影音先锋丝袜制服| 九九热免费在线视频| 亚洲欧洲AV一区二区三区| 婷婷综合亚洲| 婷婷色在线视频| 欧美日本在线观看| 伊人成人在线| 精品偷拍一区二区| a网站在线观看| 在线国产资源| 国产精品久线在线观看| 97久久免费视频| 精品久久高清| 久热re国产手机在线观看| 亚洲无码高清免费视频亚洲| 99re这里只有国产中文精品国产精品 | 亚洲—日韩aV在线| 99人妻碰碰碰久久久久禁片| 日韩毛片基地| 欧美日韩综合网| 国产办公室秘书无码精品| 日韩人妻精品一区| 精品伊人久久久香线蕉| 在线观看国产精品一区| 欧美亚洲国产精品第一页| 国产91无码福利在线| 91欧美在线| 园内精品自拍视频在线播放| 四虎影视国产精品| 欧美伊人色综合久久天天| 91精品国产丝袜| 国产va在线观看| 97在线观看视频免费| 99久久亚洲综合精品TS| 岛国精品一区免费视频在线观看| 国产噜噜在线视频观看| 成年网址网站在线观看| 99草精品视频| 91区国产福利在线观看午夜| 久久综合国产乱子免费| 91无码视频在线观看| 99热这里只有免费国产精品| 欧美97欧美综合色伦图| 91亚洲国产视频| 永久成人无码激情视频免费| 日韩欧美国产中文| 无码福利日韩神码福利片| 色综合激情网|