徐建偉
(中海油信息科技有限公司湛江分公司,廣東 湛江 524000)
隨著通信網絡的不斷發展,網絡可靠性和故障預測變得越來越重要。故障的發生會對用戶造成嚴重影響,因此提前預測和預防故障變得至關重要。本研究旨在研究不同的網絡故障預測技術,提供了一種基于數學方法的模型來評估它們的性能。文章采用了多種模型,包括線性回歸、指數回歸、支持向量機回歸、神經網絡等,引入了深度神經網絡與自編碼器。此外,還使用連續時間馬爾可夫鏈分析來提供對網絡可靠性的額外洞察。
本文研究了不同的預測技術,利用數學方法制定了各種瞬態分析模型。為了比較這些技術的性能差異,研究使用了標準化均方根誤差(Normalized Root Mean Squared Error,NRMSE)來計算誤差。NRMSE是一種常用的度量方法,它將各個殘差匯總為一個單一的預測準確性指標。NRMSE具有明顯的優勢,因為它是均方根誤差(RMSE)的無量綱形式,允許比較具有不同單位的RMSE,從而提高了實用性[1]。計算NRMSE的方法是:

回歸模型用作與其他模型進行比較的基準,以評估其他技術的表現。這些模型涉及2個變量:故障發生次數(用n表示)和以小時為單位的故障間隔時間(用τn表示)。數據被分為訓練數據(占總數據的3/4)和測試數據(占總數據的1/4)。在MATLAB中,使用曲線擬合工具從訓練數據生成了以下方程[2]:
τn=0.003454·n+2.246
指數回歸與線性回歸類似,但它旨在將數據擬合成具有形式f(x)=a·eb·x的指數函數,而不是線性函數。同樣,利用MATLAB中的曲線擬合工具,從訓練數據生成的方程是:
τn=2.304·e0.001161·n
支持向量機(Support Vector Machines,SVM)是一種基于統計學習理論的模型,它將空間中的點映射到一個更高維度的空間,通過超平面來分割這個空間。盡管超平面是線性的,但SVM可以利用該技巧來使用非線性函數,將輸入映射到高維度空間[3]。SMATLAB中使用SVM回歸,實現了線性epsilon不敏感SVM(E-SVM)回歸或L1損失。它訓練數據的預測變量和觀測響應值。SVM尋找一個函數f(x),它的偏差與每個訓練點x的觀測響應值yn不超過epsilon值ε,即:
?n:0≤αn≤C

而二進制粒子群算法[6],速度更新公式不變,含義有所變化。狀態空間中的每一個粒子的位置xid值為0或1,選擇哪個則取決于vid的大小,即速度為位置取值的概率。分兩種情況:① vid較大,xid較大概率取1,較小概率取0;② vid較小,xid較大概率取0,較小概率取1。
其中,G(xn,x)是核函數。在MATLAB中,線性SVM回歸的核函數是:
而對于高斯或RBF回歸,核函數是:
G(x1,x2)=exp(-|x1-x2|2)
人工神經網絡(Artificial Neural Networks,ANN)是一種處理單元,接收輸入并生成輸出。每個神經元分配相關權重給每個輸入,可以調整這些權重強度[4]。神經元對輸入求和并計算輸出,可以數學表示為:
Output=f(i1w1+i2w2+i3w3+…+bias)
本文使用MATLAB中的2個應用程序:神經網絡擬合工具和神經網絡時間序列工具。這2個應用程序將數據分為70%訓練值、15%驗證值和15%測試值的集合,每次重復3次,取平均誤差。除了不同的神經元數量外,還嘗試了2種不同的算法:Levenberg-Marquardt和Bayesian Regulation。結果顯示最成功的組合是神經網絡具有20個神經元,使用Levenberg-Marquardt進行訓練。神經網絡擬合工具構建了1個2層的前饋網絡,具有1個sigmoid函數作為激活函數[5]。
自編碼器函數在MATLAB中使用,使用默認的10個神經元的隱藏層。自編碼器在測試數據上進行訓練,然后轉化為神經網絡。在測試數據上測試此網絡以計算NRMSE和RMSE。自編碼器的訓練過程基于成本函數的優化,該成本函數測量輸入x與其在輸出x^處的重建之間的誤差。向量x∈D_x被映射到z∈D(1)通過:

其中,上標(2)表示第二層。h(2):Dx→Dx是解碼器的傳遞函數,W(2)∈Dx×D(1)是權重矩陣,b(2)∈Dx是偏置向量。這是一個層的數學表示,但對于自編碼器的其他層,數學仍然相同。
連續時間馬爾可夫鏈分析可以提供對蜂窩網絡狀態的額外洞察,因為它是無記憶的,只有過去故障的關鍵部分由轉移概率捕獲,故障間隔時間服從指數分布[6]。
對于連續時間馬爾可夫鏈分析,網絡只能存在于2個狀態中:健康和次優。故障間隔時間的μ值是1/(均值)。在這種情況下,μ值為0.38625。維護時間的λ值以類似的方式計算,為0.01589。使用這些值,可以計算發生器矩陣Q和速率矩陣R。兩狀態系統的計算如下:
利用這2個矩陣,可以執行各種瞬態分析。CTMC的行為由Kolmogorov微分方程描述,可以使用生成矩陣Q找到。然后,可以通過P(T)=P(0)×eQ(Γ)來獲得概率向量,其中P(0)是初始概率向量。本文采用均勻化方法,因為它導致更高效的計算并具有更高的準確性[7]。使用此方法,可以計算概率向量:
其中,P^是概率轉移矩陣,求和可以根據誤差公式進行截斷:
使用了誤差值為0.0001。概率轉移矩陣形成了本文中使用的3個性能矩陣的計算基礎。第一個是占用時間,通過以下矩陣形式計算:
其中,pij(t)是轉移概率矩陣P的元素。
第二個是首次通過時間,這是系統從最佳狀態過渡到次優狀態所需的預期時間。這使用以下方程:


模型的結果總結如表1所示。結果表明,除了使用自編碼器的深度神經網絡外,大多數模型在預測測試數據上的故障間隔時間方面都取得了相對相似的成功。NRMSE顯著提高的結果表明,自編碼器比所有其他技術都具有更好的故障預測效果。

表1 模型測試結果
CTMC分析提供了整個網絡可靠性的關鍵信息。可以根據新值調整這些分析,計算占用時間、首次故障發生時間和穩態分布的新預期時間[9]。網絡從健康狀態切換到不健康狀態的概率非常高。12小時后,系統處于不健康狀態的概率為95%。一天后,次優狀態的值保持在0.9605不變。基于這些概率值,制定了一個模型,使用了75%的閾值水平來表示故障發生。模型每隔4小時檢查1次,為期1周,預測準確度為27/42,即64.29%。該模型避免了導致最多損害的二型錯誤。在一個月內(31天),網絡平均只會在健康狀態下度過1.3天,在次優狀態下度過29.7天。這表明,網絡需要采取更好的主動方法,以減少故障發生的次數,提高客戶的質量。首次通過時間計算為2.589小時,與平均故障間隔時間2.589小時一致,因為CMTC分析基于2個變量都遵循指數分布的事實。在其壽命內,網絡只會在健康狀態下度過3.95%的時間,而將在次優狀態下度過96.05%的時間。這突顯了大規模密集化的事實,因此,迫切需要具有在5G蜂窩網絡中可靠運行所需的故障預測能力的主動自愈技術,以在訂戶受到影響之前提前預測網絡故障[10]。
本研究通過比較不同的網絡故障預測技術以及應用數學方法構建的模型,為提前預測和預防網絡故障提供了重要的參考。深度神經網絡與自編碼器在預測效果上表現出色,而線性模型性能較差,突顯了網絡故障數據的復雜性。此外,連續時間馬爾可夫鏈分析提供了有關網絡可靠性的重要信息,強調了需要更主動的方法來減少故障次數。這項研究對于網絡運營和維護領域有著重要的實際意義,有助于提高網絡的穩定性和用戶體驗。未來的研究可以進一步改進模型,以更準確地預測網絡故障,探索更多先進的預測技術。