張運鋒
(廣州城建職業學院,廣東 廣州 510900)
中國電信網2021年報告指出,我國網民規模已經近10億人,互聯網范圍已經擴大到72.4%,手機上網規模擴大到9.8億人[1-2],逐步實現了數字化社會發展,隨著新冠疫情的暴發,線上辦公、線上授課及線上交易等層出不窮,網絡運行保證了企業、社會的正常發展與穩定運行。隨著網絡數量的復雜程度逐漸增加,網絡故障發生概率也逐漸提升,因此,網絡故障診斷對于穩定計算機網絡的發展具有重要意義[3-4]。
傳統的計算機故障診斷方法主要包括專家診斷等人工方式,但是現階段其已經無法滿足大范圍計算機網絡故障的需求,因此,亟需人工智能網絡技術進行計算機故障診斷[5]。BP(Back Propagation)神經網絡是目前應用場景最多,較為廣泛的人工神經網絡之一[6]。基于BP神經網絡,可實現對其他行業輸出進行預測效果分析,上述研究對于計算機網絡故障診斷的預測分析都起到了重要的推動作用。雖然神經網絡可以解決一些復雜的、非線性映射問題,但是它也存在一些缺點,如過擬合、容易陷入局部最優解及收斂速度慢等問題,因此,利用遺傳算法、粒子群和蟻群算法等用于優化初始權重和閾值,更有利于提高模型學習效率并進行全局優化[7-9]。
本研究基于遺傳算法優化建立GA-BP神經網絡預測模型,并與傳統的BP預測模型訓練前后的精度、預測誤差進行對比分析,研究結果對于計算機故障診斷的整體管理措施調整及決策具有重要的指導意義。
在進行試驗數據采集時,考慮到不同的計算機故障類型與數據本身的均衡性,本研究共進行了24天、共210 h的數據采集,計算機故障采集信息如表1—2所示。
表1 計算機故障信息采集表
表2 計算機數據采集情況
遺傳算法優化BP神經網絡計算流程如下:
(1)首先導入數據,并對數據進行預處理;(2)其次,初始化種群并計算個體適應度值,進行種群選擇、交叉、變異,并進行迭代,(3)最后,滿足迭代條件后找到最優位置,計算最優權值閾值,重新帶入BP網絡種,進行訓練和預測分析。
(1)
GA是目前應用最為廣泛的一種求解優化問題的自適應啟發式的搜索算法,它模仿了自然界的“物競天擇,優勝劣汰”的生物進化機制,算法步驟如下。
(1)確定神經網絡拓撲。
(2)獲得初始種群:通過對輸入層進行數據預處理,設置種群數量,主要包括網絡模型的權值及閾值。
(3)適應度函數F的設置公式為:
(2)
(4)選擇運算:選擇操作是指通過一定概率從原始種群中選出優秀樣本,通過繁殖產生下一代樣本數據,個體選擇的概率為:
(3)
其中Fi為個體I的種群適應度值,N為種群數量。
(5)交叉運算:交叉運算是指從種群中隨機選擇兩個樣本,通過交換和組合,產生適應性強的新個體,兩個個體ak、al在j處交叉操作如式(4)和(5):
akj=akj(1-b)+alj
(4)
alj=alj(1-b)+akj
(5)
(6)變異運算:通過種群變異可以保持種群的多樣性,從種群中隨機選取一個個體,選取個體的一部分進行變異操作,從而產生更好的個體。個體ai在j處發生變異,形成一個新的個體aij如式(6):
(6)
其中amax、amin為aij的邊界條件,r2為隨機數,g是迭代次數,Gmax是最大進化次數。
(7)計算新生成種群中個體的適應度函數。如果適應度函數滿足要求或進化次數達到最大值,則進化完成。
(8)通過GA優化,給BP網絡初始權重和閾值,滿足終止條件后得到預測結果。
為定量評估GA優化的神經網絡預測模型的有效性和準確性,采用指標RMSE(均方根誤差)、MAE(平均絕對誤差)和MAPE(平均絕對百分比誤差)評估模型,計算公式如下:
(7)
(8)
(9)
對2種預測模型的預測結果進行量化,并利用模型評價指標對模型進行對比分析(見表3)。與傳統的BP預測模型相比,GA-BP模型的誤差都有所降低,說明GA-BP模型預測精度提升。
表3 BP神經網絡和GA-BP神經網絡模型預測性能分析
不同模型的預測誤差分布如圖1所示,X軸代表實測值與預測值之間的誤差值,Y軸表示訓練集的預測樣本。以分布誤差為0的分界線,向兩端擴散增大,0軸表示真實值與預測值結果一致,越接近0,代表預測值與實測值的差值越小,模型的預測精度越高。從圖1可以看出,與BP模型相比,GA-BP預測模型的誤差直方圖誤差接近0的個數更多且誤差更小,其他組合模型在零區間分布數量較小,誤差較大,說明模型預測精度較低。
圖1 不同神經網絡模型預測誤差分布
(1)與傳統神經網絡模型預測相比,利用遺傳算法優化后的BP神經網絡預測模型,對BP神經網絡模型的隱層節點數和學習率進行優化,克服了傳統神經網絡模型參數選擇的盲目性和不確定性,提高了搜索精度、收斂速度和模型的預測穩定性。
(2)將BP預測模型和GA-BP神經網絡模型進行計算機網絡故障預測分析,GA-BP在計算機網絡故障預測比其他神經網絡模型表現出更好的預測性能。經過不斷迭代訓練,GA-BP網絡模型的預測精度R2達到0.96;與傳統的BP預測模型相比,GA-BP模型的RMSE降低了67.41%,MAPE降低了67.58%,MAE降低了67.73%,預測值與試驗值之間的擬合程度價高。這一研究結果為計算機網絡故障的預測提供一種新的思路和方法。
(3)在本研究中,通過遺傳算法優化的BP神經網絡應用于計算機網絡故障預測,預測結果更為準確。除遺傳算法優化神經網絡的外,今后會更加注重不同模型的對比,以便對不同模型之間的預測性能進行對比分析,將更有利于對計算機故障發生實施動態調控與技術決策。