王林



摘要:中國的發展正高歌猛進,信息時代的到來也迎來了信息通訊,甚至發展到了通訊網絡告警。網絡上的信息通訊給人們在生活上、學習上、工作上都帶來了許多的便利,但是凡是都有優缺點,萬事都有利弊面。信息通訊網絡告警帶給人們便利的同時,也給人們帶來了告警信息量大而針對告警的有效解決措施低下的問題。為此,本文章在大數據分析的基礎上對通信網絡告警存在的一系列問題提出了優化的策略。
關鍵詞:告警;通信網絡告警;閃斷震蕩;大數據分析;優化;
引言:隨著通訊網絡的產生,告警系統也面世了。為了更好地去管理告警系統并幫助大眾,發現通信網絡告警存在的一系列問題。據報道,某省15年加上寬帶、傳輸等其他設備,網絡的規??涨褒嫶蠖襆ET基站數已經上升到10萬以上。根據網絡的拓撲結構來看,一個節點發生故障可能會影響多個節點,這時候告警就受到了影響。這樣的情況會致使:一、有用的網絡信息會被大量的告警風暴埋沒;二、這不僅讓告警信息更加繁瑣還增加了挑選甄別的工作量;三、一條告警信息不能反映多條告警信息之間的邏輯性,沒有辦法對故障進行快速的定位;四、同時或者長時間的上報告警信息,會導致信息堆積,系統癱瘓。
所以,針對上面的大量問題,不能只是對業務人員的工作能力進行提高,也不能僅僅去優化智能監控系統,而是從根源上遏制住告警風暴的“咽喉”并且提高告警風暴的工作能力及其眾多告警信息之間的邏輯關系。
一、告警的概念、分類及層次
(一)告警的概念
當設備故障時,監控系統將此故障情況發出告警信號。所有的故障都有聲光告警和文字提醒。告警的時候,監控單元的紅色警告燈會亮,蜂鳴器會發聲,并且遠端的系統監控中心會收到告警的信息。
(二)告警的分類
告警系統一般按照故障嚴重與否分為緊急告警和非緊急告警這兩大類,其中還包括其他的告警,比如空調設備告警、電力室設備告警、無人值守局開門告警、外線電纜故障告警等等。
(三)告警的層次
告警的層級分為列架告警、總告警、機架(柜)告警三大層級。如圖:
二、通信網絡的概念及其網絡結構
(一)通信網絡的概念
通信是人與人之間通過多媒體進行的信息的交流與溝通的傳遞。網絡是用物理連接將一個個個獨立的工作站點或主機連在一起,組成的數據鏈路。通信網絡是指將各個獨立的設備進行物理連接,實現人與計算機、計算機與計算機、人與人之間進行信息交換的方法,從而達到交流通信和資源共享的目的。
(二)通信網絡的網絡結構
根據計算機基礎課程,可以知道這些網絡拓撲結構就像是串聯的小燈泡一樣,一個壞掉,其他的也都不能通電。所以這個告警信息就很有必要解決定位的問題,當發生故障時,告警信息可以定位到故障來源于那個網源,這樣解決起故障來就又省去了不少的麻煩。
三、通訊網絡告警優化策略
實施通信警告優化策略的三個層級有:綜合網管側、網源設備側、和廠家網管側。為優化綜合網管側,對異構多元的告警進行標準處理,并且進行跨廠家、跨專業的告警工作的優化;為優化網源設備側,告警優化工作想從上報機制和告警處罰機制的研究著手;為了優化廠家網管側,告警優化工作針對告警相關聯機制作出跨網源的細粒度的工作。摘要中提到,要優化通訊網絡告警整個系統,不僅要從業務人員著手,也要對系統本身進行優化。首先,為了從硬件上防止告警工作產生故障和問題,為避免通訊網絡告警系統出現問題,工作人員要及時排查維修。其次,網管和業務人員要嚴格遵守自己的工作,嚴守自己的崗位,對收到的告警信息進行排查病解決各種故障,這要求通訊網絡告警系統的工作人員業務水平要高,對自己的工作負責人;再者,為了從“軟件”上避免網絡告警系統出現問題,文章提出以下解決方案。
(一)屏蔽無需關注的告警
在通信網絡告警系統的工作中,系統不能保證發出的每一個告警信號和接收到的每一個告警信息都是有用的而且會讓整個系統的執行性提高,系統不能辨別哪些告警信息比較重要,需要優先上報;又或者哪些告警信息比較無用,對于網管來說,幾乎可以忽略。為了防止告警風暴致使整個系統中的信息堆積和系統癱瘓以及重要的告警信息被淹沒在海量的垃圾信息中,針對于沒有必要去關注的告警信息,進行屏蔽。
通過正確嚴謹的判斷和評估,甄選其中的垃圾告警直接屏蔽。告警屏蔽的屏蔽規則如下:若在綜合網管側屏蔽告警信息,對于其告警工作并沒有任何的優化,所以選擇方案時要珍重;若在網源設備側屏蔽告警信息,不會有日志記錄,之后也無法再查看;若在廠家網管側屏蔽告警信息降低網管的工作量的同時還能減少無用告警的上報。
(二)延遲或抑制閃斷震蕩類的告警
閃斷告警就是這個告警持續的時間很短,亮紅燈的時間和蜂鳴聲響起的時間都非常的短。震蕩告警就是這個告警信號持續時間很長。
延遲或抑制閃斷震蕩類的告警的規則就是:根據一個告警信號延續的時間長短判斷是否延遲或者抑制。例如有一些網源的網絡連接出現了問題,網絡變差,進不了網站,而通信網絡系統檢測到一些小故障,正上報發出告警信號的時候,電腦系統自動修理了該障礙,那么這樣的狀況就不需要再麻煩業務人員,而告警信號已經送出去,只是紅色信號燈也沒有亮很久,就轉瞬間亮了一下,蜂鳴器也沒有響很久,那樣的話,通信網絡告警系統就可以自動將這種信息延遲,等到業務員把重要的告警信息處理完再來看看這個故障是因為什么出現的,或者直接屏蔽掉不需要業務員花費時間來修理一臺正常的通信網絡機器。
對于震蕩類的告警信息,也需要系統去自動監測,這個震蕩類信息值不值得業務員專門去查看修理,然后上報信息。
(三)對各個網源采取智能的連接手段進行告警優化
上文中提到了通信網絡的拓撲結構的分類,有總線型網狀的拓撲結構、環形網狀的拓撲結構、星型網狀的拓撲結構。見下圖:
上圖為通信網絡拓撲結構的三種結構。
由圖可見,若把這每個網絡拓撲結構的圖都看成是一個電路的話,不難看出每張圖都是一個串聯電路,大家都知道串聯電路的特點,那么無論是哪一種網絡的拓撲結構都是不允許任何一個網源出故障的,只要有其中一個網源出了故障,其他的網源也不能正常的工作,接著,所有的節點都會發出告警信號上報網管,這就導致短時間內告警信息增多且量大,這時候,如果只有故障的網源發送告警信息不僅能夠避免告警風暴的發生,而且還可以對發生故障的網源進行定位,業務工作人員、監督人員以及網管都能夠第一時間鎖定故障機器去修理。
所以這第三個通信網絡告警優化策略就是設計一種智能連接的系統,給所有的網源系統都安裝上,當一個節點出現故障的時候,發送一條告警信息。
(四)針對告警風暴進行的優化策略
告警,是網管最關注的工作。網絡管理員要通過告警來對故障進行運維。有一種極端的告警現象,就是由于不能確定的各種原因,系統同時并且長時間的向網管告警,這會導致告警風暴的發生。容易致使信息堆積,系統癱瘓。
為了防止告警風暴的發生,并且在告警風暴發生時,系統可以及時的作出反應,將風暴帶來的危害降到最低。系統可以有多個網管來對告警信息進行整合處理,當然這不是最佳的解決方案,但卻是最笨的。當然,在國外也有許多公司機構專門研究出了一些系統,針對屏蔽,延遲,抑制告警信息來減少告警量。
四、結束語
隨著通信網絡的發展,告警成為運營網絡管理必不可少的工具。并且在今后的發展中,網絡規模越來越大,隨之而來的告警量也今非昔比。為了讓通信網絡更加快速的發展,為了減輕監控以及網管的壓力,必然要研究探討如何處理告警量越來越大的問題。這篇文章介紹了什么是告警,什么是通信網絡以及其三大拓撲結構,更重要的是針對通信網絡告警優化提出了很多方法,例如如何去處理大量的告警信息的同時預防通信網絡告警帶來的“大風暴”,以及如何提高告警信息的有用性,如何篩選更加值得運維和網絡管理員關注的信息以及屏蔽、延遲、抑制一些垃圾告警信息,并且明確了如何處理風暴告警對故障源頭的定位,方便運維快速找到故障源并進行修理,以便系統能夠持續提供服務。
參考文獻:
[1] 袁靜,李大偉,陸紹雯,等.智能監控應用平臺告警關聯大數據分析算法研究[J].電信工程技術與標準化,2019,032(005):80-84.
[2] 林斌,王磊.試論大數據分析在移動通信網絡優化中的應用[J].黑龍江科技信息,2018,000(018):78-79.
[3] 高楊.試論大數據分析在移動通信網絡優化中的應用[J].通訊世界,2018,341(10):113-114.
[4] 沈維捷,卞龍江,張行建,等.基于大數據技術的質量信息分析評價及電商化采購質量管控策略應用研究[J].現代管理,2019,9(5):6.