王際惟
[摘 ?要]隨著信息網絡的發展,為人們的日常工作生活帶來了新的體驗,但由于發展過于快速,也產生了管理以及維護困難的情況。無法對通信網絡進行有效的管理,網絡安全性開始受到威脅。在通信網絡發生故障時,有告警相關性可以進行故障分析,工作人員進行針對性修復,提高了工作效率。本文就將針對通信網絡中的告警相關性做簡單的分析,從告警相關性的概念簡述其在通信網絡中的重要性,并就目前在實施過程中的問題做簡單陳述。
[關鍵詞]通信網絡 ?告警相關性 ?網絡故障 ?網絡管理
中圖分類號:TN915.07 文獻標識碼:A 文章編號:1009-914X(2016)23-0148-01
通信網絡系統擁有強大的基礎,其具有規模大、結構復雜、高度分布以及異構性的特點。正是因為通信網絡系統涵蓋的范圍廣,所以在管理方面有所難度,隨著網絡的發展這一難度正在逐步的增加。一般操作時,先由告警相關性進行相關的分析,極具經驗的工程師再根據分析結果進行故障原因的告警對故障進行原因排查。由故障排查的流程可以看出,告警相關性起到了非常重要的作用,所以有必要針對其進行深入研究。
一 有關告警相關性的介紹
在通信網絡的管理中,功能產生了異常就被稱之為故障,也就是告警事件產生的原因。針對眾多的告警時間進行相關性的分析,將有助于找到出現故障所在。
1.1 概念
告警事件可以簡單的稱作是提前的預警,是管制的部分在有危機的事件時向外發出的一種警報,也就是說有告警事件不一定就會有故障產生。如果在網絡中產生的故障,那么告警事件就會是一系列的,需要專門人員對告警事件進行分析,并不是所有的告警都是因為故障所在,相關性的分析在這里起到至關重要的作用。決定著找出網絡故障的時間,以及最終的解決辦法。
告警相關性分析就是針對眾多的告警進行合并和轉化,將有利用價值的多條告警信息有規律的整合成一條涵蓋很多信息的告警內容。在告警中能明確的故障產生的原因,并以此確定發生故障的位置。
1.2 用途
告警相關性一般用于兩個階段,分別是:網絡故障定位階段和告警過濾階段。
(1)網絡故障定位階段
在進行網絡故障處理時,一般需要經過三步:告警相關性分析、故障定位、故障驗證。而前兩步又被統稱為故障定位階段,兩者是順承關系。通過告警相關性的分析,提出各類有關網絡故障的假設,再通過第三步的驗證確定最終的故障原因。告警相關性擁有一定的類型規則,網絡管理人員熟練的掌握其內容,就可以針對分析做出有力的判斷,減少不必要的勞動輸出。
(2)告警過濾階段
產生的告警事件有很多都是非故障性的告警,針對這一類的告警內容,可以通過告警相關性分析進行有效的過濾,主要保留下故障根本原因的報警,降低網絡管理人員的工作強度,提高工作效率。
二、目前告警相關性工作中出現的問題
在實際的網絡故障實踐中,告警相關性的分析并沒有理想中的那么樂觀。由于網絡故障受到的告警事件過多,導致在高興相關性分析中產生了困難。在告警相關性分析中針對出現的問題進行分析,得出以下方面:
2.1 告警事件頻發方面
在告警相關性分析中,最令網絡人員頭疼的就是告警事件頻發的情況,眾多的信息堆積在一起,不利于故障的分析。而造成這一情況的原因有兩個,分別是設備故障帶動整個系統錯亂以及設備故障自身間歇性發作。
(1)設備故障牽一發動全身以及
網絡故障的產生是持續性的,在整個網絡系統中出現故障對每一個關聯的環節都產生影響,多個網絡部件同時發出不同告警事件的情況;如果設備中某一個部件產生了故障,那么有可能在每一次重啟該服務器時,都會發出告警事件;網絡中的部件發生了故障,順著整個網絡系統,都有可能會跟隨發出同樣的告警事件。
(2)告警事件頻發故障本身自發性的發作
在產生了網絡故障后,故障的本身會不間斷發作,所以在每次故障發作時都會產生告警事件;網絡中多個故障同時,那么不同的故障可能會發出眾多告警事件,就會造成告警事件的潛在重疊。
2.2 網絡模型方面
在進行告警相關性的分析之前,需要針對現有的網絡進行模型的搭建,如果建設的網絡模型過于簡單,網絡的構件無法滿足網絡的需求,就會在未知的網絡構件部位產生故障,進而發出告警事件。由于無法確定具體的部位故障,所以在告警相關性分析時就會浪費很多的時間和精力。
2.3 數據傳輸方面
告警相關性分析的前提是獲取所有的告警事件,但在實際應用過程中,由于網絡傳輸中斷,接收器不敏感等情況的出現,導致告警事件傳輸不完整,無法保證告警相關性分析的結果,增加了故障成本的輸出。
2.4 網絡動態方面
在一個真實的通信網絡中,網絡是一個不斷發展不斷改變的狀態,所以理想狀態下的告警相關性分析反饋,很有可能因此設備數據的變化以及網絡的瞬時結構發生改變,從未導致告警相關性的規則發生變化,無法確保分析的結果。
三、常見的告警相關性的處理方式
告警相關性的方法和算法包括:基于范例的推理、基于規則的相關性、模糊的邏輯、貝葉斯網絡、編碼方式、人工神經網絡、以及數據挖掘。選取呢一種計算方式需要根據實際的網絡情況,進行提前的規則設定。一般基于規則的處理方式多用于配置結構較常規化,不易發生改變的網絡中;基于范例的推理方式則是在原有實例的基礎上繼續進行分析,較適合較簡單的網路系統;基于編碼的處理方式則是對時間進行預處理,減低了告警事件的復雜性;貝葉斯網絡處理方式是通過固定的計算方式進行,具有一定的工作效率,但在計算時的概率問題還是行業內待解決的難題;人工神經網絡的方式擁有較強的自學性,但在前期的神經網絡培養需要投入較大的經歷;數據挖掘的方法是目前最推崇的解決方式,其可以自發進行告警相關性規則的挖掘,可以適應更快更好的網絡系統,并針對網絡做出變化。
【總結】因為通信網絡系統涵蓋的范圍廣,所以管理的難度大,在應對意外故障修復時更加困難。告警相關性分析可以針對眾多的告警進行合并和轉化,明確的故障產生的原因,并以此確定發生故障的位置。在實際應用過程中,告警相關性也產生了諸多問題,針對不同的問題需要通過改變分析算法的方式進行改善。隨著網絡維護的需要,告警相關性分析也將具備輔佐管理人員找出故障原因的性能。
參考文獻
[1]鄧歆,孟洛明. 告警相關性分析模型在通信網故障診斷中的應用[J]. 北京郵電大學學報,2006,03:66-69+85.
[2]黃滌. 電力通信網告警相關性分析模塊的設計與實現[D].北京郵電大學,2014.
[3]杜曙光. 電信網絡告警相關性分析方法研究[D].華僑大學,2005.
中國科技博覽2016年23期