班雪飛 倪峰 周瑋 馬占婕 孫忠巖



DOI:10.19850/j.cnki.2096-4706.2024.01.020
收稿日期:2023-05-24
摘? 要:伴隨三網融合的深入開展以及智慧物聯網技術的發展,家庭寬帶加互聯網電視已成為新的智慧家庭入口。為了解決互聯網電視業務質量監測手段在時序上的先天滯后無法先于用戶發現隱患故障的問題,通過引入神經網絡LSTM算法實現數據注智業務運維能力,聚焦EPG業務服務質量,從業務歷史波動識別異常并做出預測預警,實現EPG業務質差隱患識別和預測,隱患發現時長縮短至0.5小時,隱患識別及時率和準確率均在90%以上。
關鍵詞:互聯網電視;EPG業務質量;LSTM算法;隱患預測
中圖分類號:TP391? 文獻標識碼:A? 文章編號:2096-4706(2024)01-0099-05
Application Research on Prediction of Hidden Dangers in Internet Television EPG Business Based on LSTM Neural Network Algorithm
BAN Xuefei, NI Feng, ZHOU Wei, MA Zhanjie, SUN Zhongyan
(China Mobile Inner Mongolia Co., Ltd., Hohhot? 010010, China)
Abstract: With the deepening of the integration of the triple play and the development of smart Internet of Things technology, home broadband and internet television have become a new entry point for smart homes. In order to solve the problem of congenital lag in the timing of internet television business quality monitoring methods that cannot detect hidden faults before users, a LSTM neural network algorithm is introduced to achieve data injection intelligence business operation and maintenance capabilities. It focuses on the quality of EPG business services, identifies anomalies from business historical fluctuations and making predictive early warnings, and achieves the identification and prediction of EPG business quality hidden dangers. The length of hidden dangers discovery time is reduced to 0.5 hours, and the timely and accurate rates of hidden danger identification are above 90%.
Keywords: internet TV; EPG business quality; LSTM algorithm; prediction of hidden dangers
0? 引? 言
2021年全國互聯網電視(OTT)用戶10.83億,交互式網絡電視(IPTV)用戶超3億[1],互聯網電視用戶規模已進入存量經營的穩健階段,已從流量經營轉變為質量經營,需要不斷提升用戶業務感知,達成提升留存促進活躍的目的。
電子節目單(Electronic Program Guide, EPG)是用戶訪問互聯網電視的入口,EPG業務質量優劣對用戶業務感知起到非常關鍵的作用,質量經營需要重點關注EPG業務質量監測。
目前運營商已建立了較為完善的監控體系,采集了海量的EPG體驗數據,形成多維度的監控指標,但監控指標繁多,人工運維無法及時發現異常,也難以確定異常原因[2]。伴隨著業務形態的持續發展,運維部門需要考慮和研究如何實現自動化、智能化快速準確地識別EPG隱患,避免出現大面積故障問題。
1? 現狀和解決思路
1.1? 現狀
互聯網電視特殊的業務模式導致在對EPG內容源的服務質量監控上有明顯的滯后性。EPG相關業務需要頻繁更新和調整以適應業務和市場發展需求,比如EPG版本更新、熱門視頻資源更新、EPG模塊更新等,業務調整過程中產生的潛在隱患問題造成的影響往往隨著活躍用戶量增加后才顯現出來,同時當前對EPG業務的監測手段主要依靠日志分析,伴隨數據處理的延遲使得在EPG業務保障的時效性較差,對隱患故障的檢測和發現嚴重滯后,無法及時或先于用戶發現隱患故障。
1.2? 解決思路
圍繞EPG業務的質差識別和故障分析手段,雖然有數據處理平臺提供海量數據處理和閾值告警,可以基于固定規則產生告警但經過人為調試的故障告警信息并不是很準確,只有固定的“數”缺乏動態的“智”。隨著人工智能的興起,深度學習和神經網絡等人工智能技術在智能預測與決策領域得到廣泛發展[3]。
在神經網絡算法選擇方面,本次研究選用長短期記憶網絡(Long Short-Term Memory, LSTM)算法,文獻[4]提供了多種典型時間序列模型的實驗對比并驗證了LSTM預測模型在故障時間序列分析中具有很強的適用性和更高的準確性[4]。
輸入以EPG門戶訪問過程中產生的可以表征EPG業務質量波動的數據,進行算法訓練,預測EPG業務關鍵指標未來N個周期結果。同時基于關鍵指標最近歷史7個周期的加權平均值,將預測結果與加權平均值進行偏差對比,根據預測值和設定閾值偏差情況輸出互聯網電視EPG業務是否發生質差隱患的預測結果,實現EPG質差隱患預警并聯動業務主管部門進行問題排查與修復,減少大面積故障的發生,形成感知-分析-決策-執行的閉環模式,助力互聯網電視業務自保障、自監控、自修復和自優化能力建設。
2? 手段實現與驗證
以采集機頂盒用戶使用過程以及體驗信息為原始數據,利用大數據處理手段對EPG業務維度關鍵指標提煉與匯總,以匯總后的EPG業務維度關鍵指標作為輸入,輸出EPG業務質量預測結果。關鍵處理流程經歷數據采集與指標提煉、搭建環境引入LSTM算法模型、預測值與期望偏差管理、預測結論輸出與預警四個環節。如圖1所示。
2.1? 數據采集與指標提煉
對機頂盒軟探針上報各類數據的清洗入庫,提取EPG業務服務器IP維度關鍵指標如EPG響應成功率、EPG響應時延,按照5分鐘/10分鐘/15分鐘等不同粒度的N周期(N≥7)數據進行模型訓練數據輸出。
2.2? 實驗環境與LSTM算法模型
實驗環境:服務器采用云主機,CPU20核心,內存32 GB,存儲空間1 TB。操作系統為Ubuntu 16.04 LTS,開發環境部署Python 3.6,使用Keras 2.2.0搭建神經網絡及使用TensorFlow 1.10.0后端張量運算軟件包。
算法模型:采用LSTM算法模型,它是一種時間遞歸神經網絡(RNN),它可以學習時間序列中的長短期信息,尋找其變化模式,在一些時序信號預測方面獲得較好的效果。它的主要結構包含一組記憶單元和三種門結構(輸入門、遺忘門、輸出門),用于控制歷史信息的使用[5]。
LSTM神經網絡的邏輯結構如圖2所示。
ft表示遺忘門的輸出,遺忘門決定上一步傳遞過來的信息中有哪些信息需要進行丟棄。
輸入門由兩部分組成:第一部分使用了sigmoid激活函數,輸出為it;第二部分使用了tanh激活函數,輸出為 。
輸入門和遺忘門的輸出相結合,構成了LSTM的長期狀態信息Ct輸出門則決定了當前神經元的輸出ot和將要傳遞給下一步的短期隱藏狀態信息ht,輸出結果則利用上一時刻的短期狀態、長期狀態值和當前輸入值的保留部分得到[6]。主要實現步驟及關鍵式[7]如下:
1)遺忘門決定需要從輸入的記憶單元中丟棄哪些信息,算式如下:
(1)
2)第二步是要決定將哪些信息存儲在記憶單元中,算式如下:
(2)
(3)
3)第三步更新記憶單元,將記憶單元Ct-1更新為Ct,算式如下:
(4)
4)最后基于當前記憶單元決定輸出,算式如下:
(5)
(6)
2.3? 數據歸一化處理
讀取連續多個10分鐘粒度周期互聯網電視EPG業務維度包含兩類關鍵指標的數據并進行數據歸一化處理,減小輸入的特征數據間數量級差別較大導致的模型預測誤差,提升模型精度[8]。EPG內容源指標特征采用的離差標準化(Min-Max Normalization),對原始各個特征值作線性變換,歸一化后數據的取值范圍在[0,1]之間。轉換函數如下:
(7)
其中,max表示一段樣本特征數的最大值,min表示該段樣本特征數據的最小值,x表示本段樣本的當前值,xn表示經過歸一化后的特征數據。
對前述樣例數據歸一化后,根據歸一化后的排序,在[0,1]區間上基本符合正態分布。如圖3所示。
圖3? 某段樣例數據歸一化處理結果
選擇雙向LSTM神經網絡模型(Bidirectional, LSTM),構建神經網絡層,配置輸入層維度(input_shape)、選擇sigmoid作為激活函數、設定輸出層維度等;設定學習率(Lr)進行編譯,損失函數采用均方差損失函數(Mean Square Error),使用梯度下降算法,通過求解導數找出目標函數值在多維度解空間內能夠產生最大變化的方向,并向該方向以一定的步長靠攏,達成目標函數下降或上升的目的,遞歸性地獲取最小偏差模型[9];設定樣本分組數、訓練次數、屏顯模式等,輸出并完成預測數據處理。關鍵參數設置如表1所示。
2.4? 預測值與動態期望偏差管理
經過LSTM算法計算的預測值,首先進行數據校正,使其及滿足過程約束又與測量值的偏差平方和最小以供使用[10]。利用3σ準則進行約束,確保預測結果的偏差符合正態分布。以EPG請求成功率指標為例,基于連續3月歷史數據統計均值為98.3,標準差為±0.8,基于3σ準則,預測值的上下限落在95.9~100.7之間時,表示預測數據可用。若偶有預測值偏離3σ準則,則重新進行預測,若預測值連續7次均偏離3σ準則,則需要調整LSTM算法參數,重新建模進行預測。
動態期望值采用最近連續7個周期實際發生的指標的加權平均數()來表示,如式(8)所示:
(8)
其中,x1為最新周期的指標值,x7為距最新周期之前的第7個周期的指標值;w為對應周期指標的權重,w1的權重為40%,w2的權重為20%;w3的權重為15%,w4的權重為10%,w5、w6、w7的權重均為5%。即最近兩個周期的指標對動態期望值影響最大。
若預測的EPG業務服務器IP維度各關鍵指標與動態期望值的偏差為正向偏差(即預測指標值優于動態期望值),則不產生預警信息;若預測的EPG業務服務器IP維度關鍵指標的任一指標值與動態期望值負向偏差≥3%或連續三個周期均為負向偏差且偏差值之和≥3%,則產生業務源存在質差隱患預警信息。
預測值與動態期望偏差預警模型如圖4所示,指標預測預警觸發記錄如圖5所示。
2.5? 預測結果分析
根據訓練驗證集0.2設定,利用20%數據用于驗證,準確度平均指標選用MSE函數,根據指標驗證情況,預測EPG請求成功率指標MSE均方誤差為0.788 7,EPG請求成功率指標預測值和實際值偏差較小;預測EPG響應時延指標MSE均方誤差為10.740 2,由于時延類指標受網絡波動影響較大,因此EPG響應時延指標預測值和實際值偏差屬于正常。MSE評估情況如表2所示。
2.6? 場景部署實現
采用微服務的API方式部署,使用Docker容器化方式進行版本發布,客戶端調用本地數據處理平臺完成批量預處理,將計算結果實時抽取至業務邏輯層進行邏輯計算并生成預測和判斷結果,最后由功能實現層通過HTTP接口將預測和判斷結果返回并呈現。
3? 方案成效
本研究通過引入LSTM深度學習算法,對EPG業務關鍵KPI指標進行預測,并引入動態期望偏差對預測結果進行預警管理,提升預測結果可靠性。
在工具和手段提升方面,改變監控手段由“被動”監測變“主動”預測,先于用戶發現EPG業務隱患的問題。由單純依賴人工識別和判斷隱患故障變為基于真實用戶數據的AI預測為主、人工識別為輔的智能化提升。
在效率提升方面,當EPG業務存在隱患時,基于現網真實數據的反映,可在3個數據上報周期內基于指標的變化做出相應的預測,隱患發現時長由1~6小時縮短至0.5小時,隱患識別及時率和準確率均在90%以上。
互聯網電視EPG業務隱患落地效果對比如表3所示。
4? 結? 論
本研究主要聚焦互聯網電視EPG業務隱患預測場景,參考自動駕駛網絡理念,引入AI算法實現對傳統互聯網電視業務運維能力注智,對現有的監控保障手段進行升級。通過對關鍵指標的智能化處理實現對互聯網電視業務源故障的預測和干預,完善了互聯網電視用戶業務感知管理手段,較好地支撐了業務運維數智化轉型建設。
參考文獻:
[1] 國家廣播電視總局規劃財務司.2021年全國廣播電視行業統計公報 [EB/OL].(2022-04-25).https://www.nrta.gov.cn/art/2022/4/25/art_113_60195.html.
[2] 譚曉敏,方艾,金鐸,等.IPTV用戶體驗異常的自動化檢測 [J].電信科學,2019,35(7):159-164.
[3] 余樂安.基于人工智能的預測與決策優化理論和方法研究 [J].管理科學,2022,35(1):60-66.
[4] 王鑫,吳際,劉超,等.基于LSTM循環神經網絡的故障時間序列預測 [J].北京航空航天大學學報,2018,44(4):772-784.
[5] 黃林,王電鋼,劉蕭,等.基于LSTM的網絡流量預測方法 [J].計算機應用研究,2020,37(S1):264-265+272.
[6] 任藝柯.基于改進的LSTM網絡的交通流預測 [D].大連:大連理工大學,2019.
[7] 楊星鑫,呂澤均.基于LSTM的無人機軌跡識別技術研究 [J].現代計算機,2020(5):18-22+25.
[8] 龐悅,趙威,張雅楠,等.基于深度學習的LSTM的交通流量預測 [J].單片機與嵌入式系統應用,2019,19(3):72-75.
[9] 程肖冰,曹麗婷,李蘇建.基于混合優化神經網絡的零售銷量預測 [J].統計與決策,2022,38(6):185-188.
[10] 李九龍,周凌柯.基于“3σ法則”的顯著誤差檢測 [J].計算機與現代化,2012(1):10-13.
作者簡介:班雪飛(1978—),女,漢族,內蒙古烏蘭
察布人,工程師,碩士,研究方向:互聯網和傳輸新技術;倪峰(1993—),男,滿族,內蒙古赤峰人,工程師,碩士,研究方向:大數據和人工智能新技術;周瑋(1984—),男,漢族,內蒙古呼和浩特人,高級工程師,碩士,研究方向:移動通信系統領域OSS系統規劃、建設和項目管理;馬占婕(1983—),女,漢族,內蒙古巴彥淖爾人,高級工程師,本科,研究方向:互聯網、資源管理、人工智能;孫忠巖(1980—),女,蒙古族,遼寧大連人,高級工程師,碩士,研究方向:移動通信領域項目方案規劃、建設和管理。