龍克樹 楊鑫 楊靖
摘要:文章研究目的是將機器學習的前沿技術(shù)應用于通信行業(yè)的基站退服預測模型當中,大幅提高預測精度,降低人工維護成本。本文首先介紹了運營商基站當前的維護現(xiàn)狀及預測退服的必要性,然后對lightgbm算法進行了介紹,最后以告警類型、數(shù)量、時間等作為模型基礎(chǔ)進行退服預測,具有較高的實用價值。
關(guān)鍵詞:機器學習;基站;退服預測
隨著人民生活水平不斷提高,通信行業(yè)的高速發(fā)展,各運營商為提升服務質(zhì)量不斷加快自身基站建設,服務體驗確實得到了優(yōu)化,但帶來的設備故障維護成本也隨著增加,特別是與基站退服方面相關(guān)的監(jiān)控設備型號眾多、告警類別繁雜、告警次數(shù)頻繁,維護人員無法在海量的告警數(shù)據(jù)中獲取有效價值信息。
(一)運營商基站退服告警現(xiàn)狀
目前各大運營商均擁有基站跨域設備監(jiān)控系統(tǒng),系統(tǒng)每日產(chǎn)生海量告警數(shù)據(jù),基站設備告警和故障維護以簡單的“閾值線”判斷為依據(jù),以工單派發(fā)、人為核實作為主要形式,因各類告警頻繁、無序、關(guān)系復雜等原因,維護人員無法在故障真正來臨前進行維護、勘察。
(二)運營商基站退服預測重要性
基站告警數(shù)據(jù)的分析、管理、應用是維護工作質(zhì)量提升的參考依據(jù),如能充分挖掘海量歷史告警數(shù)據(jù)的關(guān)聯(lián)關(guān)系,通過機器學習模型構(gòu)建、特征分析、模型訓練等流程判斷出即將發(fā)生如“小區(qū)不可用告警”或“網(wǎng)元鏈接中斷”等核心故障現(xiàn)象。
基站退服預測問題實際可轉(zhuǎn)化基于時序數(shù)據(jù)的二分類問題,機器學習中有眾多分類、關(guān)聯(lián)分析算法,如決策樹C4.5、Apriori、FP-growth、Lightgbm等。
本研究采用的是LightGBM算法,它是一種基于Histogram(直方圖)的決策樹算法,是對GBDT(GradientBoostingDecisionTree,梯度提升決策樹)的高效實現(xiàn),采用損失函數(shù)的負梯度作為當前決策樹的殘差近似值,用于擬合新決策樹,算法通過采用基于梯度的單邊采樣、互斥特征捆綁等方式大幅提高了算法精度,加快了訓練速度,同時還降低了訓練時所需存儲,是目前機器學習領(lǐng)域最為主流的算法之一。
(一)基站數(shù)據(jù)預處理
為提高模型訓練精準度及訓練速度,需要對原始基站告警數(shù)據(jù)進行數(shù)據(jù)觀察和預處理,具體過程包括數(shù)據(jù)最大值、最小值、中位數(shù)、均值等進行查看,數(shù)據(jù)去重、填充、排序等特殊處理,原始數(shù)據(jù)僅包括告警開始時間、基站名稱、類型三個字段。
(二)模型特征工程
在模型訓練開始之前,需先進行特征工程構(gòu)建,研究通過告警時間、基站告警類型、基站告警數(shù)量、告警關(guān)系等維度構(gòu)建模型特征。
告警時間維度包括:告警發(fā)生的年、月、日、時、分、秒、上午、中午、下午、晚上、是否周末、月上旬、月中旬、月下旬等;
基站告警類型包括:RRU類、傳輸類、電源類、基站設備類、時鐘源類、數(shù)據(jù)配置類、天饋類等;
基站告警數(shù)量包括:距離目標日前1-N天的告警次數(shù)、故障次數(shù)、告警天數(shù)、故障天數(shù)、單日平均告警次數(shù)、異常類告警數(shù)、射頻類告警數(shù)、BBU告警數(shù)、RHUB告警數(shù)等。
(三)預測模型構(gòu)建
本研究使用的當前機器學習當中的LightGBM算法對樣本數(shù)據(jù)的基站退服情況進行預測分析,模型構(gòu)建過程包括數(shù)據(jù)核查、預處理,創(chuàng)建特征,訓練集、驗證集、測試集構(gòu)建,模型訓練,網(wǎng)格搜索參數(shù)調(diào)優(yōu)等,圖4.1是模型構(gòu)建流程圖,如下:
(四)模型評估及參數(shù)調(diào)優(yōu)
LightGBM可通過指定部分超參數(shù)來優(yōu)化預測效果及訓練速度,具體包括控制參數(shù)、核心參數(shù)、度量參數(shù)等。
當模型參數(shù)取值如表4.1所示時,經(jīng)過5次交叉驗證,模型訓練集的對數(shù)損失率是18.45%,auc達到85.65%;校驗集的對數(shù)損失率是18.45%,校驗集auc達到85.78%,模型準確率達到92.38%,模型精確度取到最大值0.8231,即此模型可在一定條件下有效預測基站退服。
上述研究表明模型通過基站告警發(fā)生的時間、類型、數(shù)量、告警間關(guān)聯(lián)關(guān)系等維度數(shù)據(jù)預測未來某一時段基站發(fā)生退服的概率值,讓廣大員工從海量、無效的告警中得到最有價值的信息,提高了維護效率,實現(xiàn)用戶的無故障感知使用,切實提升品牌服務質(zhì)量,降低潛在用戶投訴風險。
參考文獻:
[1]石少民.數(shù)據(jù)挖掘在移動基站退服故障預測中的研究[D].新疆大學,2019.
[2]杜麗英.基于決策樹的C4.5算法[J].輕工科技,2013,29(10):59+117.
[3]阮超凡.移動基站告警數(shù)據(jù)處理分析系統(tǒng)的設計與實現(xiàn)[D].大連理工大學,2016.
[4]邢紅梅,陳欣,王慧.基于LightGBM模型的文本分類研究[J].內(nèi)蒙古工業(yè)大學學報(自然科學版),2020,39(01):52-59.
龍克樹,男,中國移動通信集團貴州有限公司,工程師;楊鑫,男,中國亞信科技有限公司,工程師;楊靖,女,中國移動通信集團貴州有限公司,工程師。