林春暉,農蘭鈺
(中國鐵塔股份有限公司百色市分公司,廣西 百色 533000)
自動化運維技術作為一種新的解決方案,廣泛應用于5G網絡,旨在提高網絡的管理效率、降低運維成本,并提升網絡性能和用戶體驗。自動化運維技術的發展與5G網絡的特點緊密相連。5G網絡具有更高的傳輸速率、更低的時延和更大的連接密度,其包括大量的設備、復雜的拓撲結構和海量的數據流量。文章研究內容將有助于推動5G網絡的自動化運維技術的發展,并為網絡管理和維護提供新的解決方案。通過引入自動化運維技術,將進一步改善5G網絡的管理效率和性能,為5G網絡的可持續發展提供技術支持。
自動化運維技術是通過運維工具或平臺,處理信息技術(Information Technology,IT)基礎設施和業務應用日常任務、運維流程的自動化的一種技術[1]。自動化運維技術利用計算機系統和軟件工具,將人為介入的運維操作轉化為自動化的腳本或指令,并通過預設規則和流程來執行和管理這些操作,從而提高效率和降低運行風險,促進運維組織的成熟和各種能力的升級。
第一,5G網絡由多種技術組成,包括傳統的無線通信、云計算、邊緣計算以及物聯網等。使得網絡規模龐大且異構性增加,提高了網絡管理復雜性。自動化運維技術需要能夠適應不同類型和品牌的設備、協議和接口,統一管理和調度整個網絡。第二,5G網絡支持更多的服務和應用,故障發生的風險也相應增加。自動化運維技術需要具備快速故障定位和修復能力,以減少故障對服務造成的影響。這需要建立全面的故障診斷模型和智能的自動化修復機制。
自動化運維系統通過監控設備、傳感器、網絡流量等途徑收集大量的運維數據,包括設備狀態、性能指標、日志信息等。在數據采集過程中,需要考慮數據的實時性和一致性。數據采集完成后,需要進行數據清洗、去噪和預處理等工作,以確保數據的準確性和可用性[2]。自動化運維數據包含了大量的特征變量。在建模過程中,需要通過特征提取和選擇從原始數據中提取有用的特征,并去除冗余或無關的特征。該方式可以減少模型的復雜性,提高建模的效率和準確性。特征提取是從原始數據中提取有用的特征變量,通常通過數學和統計方法實現。表示特征提取的過程的公式為
式中:X為原始數據;Y為提取得到的特征變量;f(·)為特征提取函數。
特征選擇是從提取得到的特征變量中選擇最具有代表性和相關性的特征,去除冗余或無關的特征。表示特征選擇的過程公式為
式中:Z為經過特征選擇后的特征變量;g(·)為特征選擇函數。
通過式(2),可以將特征提取和特征選擇過程表示為一系列函數的組合,從原始數據中提取有用的特征,并去除冗余或無關的特征。這樣可以減少建模過程中考慮的特征數量,簡化模型的復雜度,提高建模的效率和準確性。
機器學習算法在5G網絡中的故障診斷和預測方面有廣泛的應用,通過機器學習算法,可以根據歷史數據和實時監測數據,構建故障診斷模型。這些模型可以自動分析和識別各類故障事件,并識別故障的類型、位置和嚴重程度。例如,可以使用分類算法,如決策樹、支持向量機等,將故障數據與已知故障模式進行比對,來進行故障診斷。5G網絡故障診斷和預測中使用的歷史數據和實時監測數據如表1所示。

表1 5G網絡故障診斷和預測中使用的歷史數據和實時監測數據
由表1可知,時間戳列顯示了數據采集的時間,設備狀態列表示設備的工作狀態,性能指標列提供了一些重要的指標數據,日志信息列提供了關于設備工作的記錄。使用5G網絡中的歷史數據和實時監測數據,可以使用機器學習算法構建故障診斷模型。通過對這些數據進行特征提取、預處理和訓練,還可以使用分類算法,如決策樹、支持向量機等來自動分析和識別故障事件。
機器學習算法可以幫助進行故障原因分析,即找出導致系統故障的具體原因。通過分析各種運維數據和日志信息,結合機器學習算法的特征選擇和解釋能力,可以推斷出導致故障的特定條件或事件。實現故障原因分析的下一步是訓練一個機器學習模型,從特征集合中找到故障根因。可以使用監督學習算法構建模型,其中樣本包括故障發生期間的數據和相應的故障根因標簽。訓練模型的公式可以表示為
式中:M為訓練得到的機器學習模型;X為特征向量集合;Y為標簽(即故障根因)。
訓練好機器學習模型后,可以使用該模型對新的故障數據進行預測和推斷,找出導致系統故障的具體原因。該過程的公式為
式中:R為推斷得到的故障根因;I(·)為模型推理或推斷過程,用于將模型M應用于輸入的新數據X,并返回推斷結果R;M為訓練得到的機器學習模型;X為新的故障數據特征向量。
機器學習算法可以借助運維數據和日志信息,進行故障原因分析,并推斷出導致系統故障的具體原因。這樣可以幫助運維人員快速定位問題,并采取適當的措施修復故障,提高系統的可靠性和服務的質量。
智能化運維系統設計與實施方案是為了提高5G網絡的管理和維護效率,實現自動化、智能化的運維管理[3]。在系統架構設計方面,能夠利用機器學習算法,基于歷史數據和實時監測數據,構建一個預測模型。這個模型會根據用戶的當前環境和應用需求,預測資源需求量。例如,可以使用深度學習的循環神經網絡循環神經網絡(Recurrent Neural Network,RNN)模型,輸入之前的狀態信息和當前的用戶數據,預測下一時刻用戶需要的資源量。在構建資源需求預測模型時,可以使用深度學習的RNN模型。RNN是一種適用于序列數據的神經網絡模型,非常適合用于預測未來的資源需求量。
假設有一組歷史數據,包含用戶的當前環境和應用需求及相應的資源需求量。將這些數據組織成一個時間序列,其中每個時間步表示一個特定的時間點。對于每個時間步,模型的輸入包括之前的狀態信息和當前的用戶數據。
針對RNN模型,表達式為
式中:ht為當時時間步的隱藏狀態;xt為當前時間步的輸入數據;Whh、Whx分別為隱藏狀態和輸入數據的權重矩陣;bh為偏置項;f(·)為激活函數。
RNN模型能夠根據之前的狀態信息和當前的用戶數據,生成一個隱藏狀態ht。該隱藏狀態可以看作模型在當前時間步維護的記憶信息,反映了過去時間步的輸入數據和狀態信息。在RNN模型的輸出層添加一個全連接層,并使用適當的激活函數,如線性或Sigmoid函數進行轉換,從而得到一個預測值,即用戶未來的資源需求量[4]。通過建立和訓練模型,使其具備預測用戶未來資源需求的能力。模型的預測能力可以進一步用于故障診斷和預測。通過監測網絡的實時數據,結合用戶數據和環境數據,模型可以及時識別可能出現的故障,并提前采取措施避免故障發生,從而降低網絡故障率。自動化運維網絡故障檢測數據如圖1所示。

圖1 自動化運維網絡故障檢測數據
由圖1可知,通過應用自動化運維技術,故障發生數量明顯減少,網絡故障率得到了顯著降低。這說明自動化運維技術能夠有效診斷和預測故障,并提前采取措施避免潛在問題的發生[5]。需要注意的是,具體的結果可能會因實驗設置和場景不同而有所差異。在實際的應用場景中,應考慮更多的潛在因素,并持續監測和改進預測模型,以確保其在實際運行中的準確性和可靠性。
文章主要研究面向5G網絡的自動化運維技術。該技術能夠有效提高運維效率、降低故障率、增強網絡可靠性以及改善用戶體驗,對于5G網絡的可持續發展至關重要,為構建更強大、更穩定的5G網絡奠定了堅實基礎。未來,自動化運維技術將引入更多智能網絡管理機制,如網絡切片、自適應資源分配和動態路由等,以提供個性化、靈活且高效的網絡服務。