樊靜 林初善 廖曉閩 李彬
1. 61345部隊,陜西 西安 710100;2. 西安通信學院,陜西 西安 710106
基于數據挖掘的光傳送網故障管理系統構建
樊靜1林初善2廖曉閩2李彬2
1. 61345部隊,陜西 西安 710100;2. 西安通信學院,陜西 西安 710106
光傳送網是信息網的基礎平臺,光傳送網故障管理系統是對光網絡故障進行監測和定位的重要手段,對信息寬帶網的安全保障體系建設起重要作用。本文將數據挖掘技術引入光傳送網構建故障管理系統,首先分析了傳統光傳送網故障管理系統的局限性,詳細介紹了數據挖掘的基本方法和一般過程,在此基礎上,探討了在光傳送網故障管理系統中實施數據挖掘的流程,建立了基于數據挖掘的光傳送網故障管理系統,最后總結了該系統的優越性。
數據挖掘;光傳送網;故障管理;專家系統
隨著WDM光傳輸技術的飛速發展,網絡容量越來越大,光傳送網由點到點網絡、環網逐步向網狀網演變,這勢必增加了網絡故障的復雜性,由于網絡故障導致的影響越來越嚴重,對光傳送網故障管理系統的要求也越來越高。數據挖掘技術作為一個新興的、多學科交叉的應用領域,它的出現為自動和智能地把海量的數據轉化為有用的信息和知識提供了手段,在光網絡的故障管理領域引入數據挖掘技術,可以彌補傳統光傳送網故障管理系統的不足,從而有效提高光網絡的故障管理水平和能力。
光傳送網故障管理系統的功能是在光傳送網發生故障的情況下,確定故障的確切位置和發生原因,為網絡的后續管理提供依據[1]。傳統光傳送網故障管理系統的局限性主要體現在以下幾方面:
(1)目前光傳送網的網絡管理通常是由各自獨立的網元管理系統(EMS)來完成,其告警信息分別顯示,這使得光傳送網的故障管理變得非常復雜,只能采用人工方式,依靠具有豐富經驗的網絡維護人員來完成。但通常情況下,經驗豐富的“專家級”維護人員數量畢竟有限,且人工診斷往往費時費力,并且不能在線進行。
(2)由于故障的傳遞性、監測機制的不完善以及故障監測和故障傳遞之間的時差,使得故障管理在光傳送網中成為一個難點和重點。進行故障管理不僅需要一套復雜的算法,而且節點處理信息時必須考慮故障傳遞與信息傳遞的時差問題,這樣就增加了實現的復雜性,而且也難以滿足時效性要求[2]。
(3)目前主要都是由專家憑借在實踐中總結出來的經驗知識進行故障管理,但是專家的經驗知識畢竟有限,不可能對所有問題都能進行正確全面的解答,必然存在知識獲取的“瓶頸”問題和知識的“窄臺階效應”問題[3]。
為了克服傳統光傳送網故障管理系統的局限性,應該采取一種系統化和自動化更高的方法來設計故障管理系統,數據挖掘(Data Mining)就是一種較為有效的方法。數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際數據中,提取隱含在其中的、人們事先不知道的、但又是有用的信息和知識的過程。它是一門涉及面很廣的交叉學科,包括機器學習、神經網絡、數據庫、粗糙集、模糊數學等相關技術。
現有的數據挖掘方法很多,數據挖掘的分類方法也很多,按挖掘的知識類型來分類,可以分為以下幾類:
(1)關聯分析。關聯分析就是從大量的數據中發現項集之間的聯系,其目的是以規則的形式給出隱藏在數據間的相互關系。給定一個數據項集,一個數據記錄根據用戶指定的支持度和置信度,關聯分析可以推出數據項間的相關性。
(2)分類分析。分類的目標首先是對訓練數據進行分析,使用數據的某些特征屬性,給出每個類的準確描述,即分類規則,然后利用這些描述,對數據庫中的其他數據進行分類。分類器的構造方法有決策樹方法、統計方法、神經網絡方法、機器學習方法和粗糙集方法等。
(3)聚類分析。與分類分析方法不同,聚類分析是在沒有給定劃分類的情況下(如沒有預定的分類表、沒有預定的類目),根據信息相似度進行信息聚集的方法。聚類分析中的每個訓練樣本的類標記都是未知的,可以采用不同的算法進行分析,所以對于相同的記錄集合可能有不同的劃分。
(4)時序演變分析。時序演變分析與關聯分析類似,都是挖掘數據間的聯系,但時序演變分析的側重點在于分析前后數據間的關系。
(5)孤立點分析。孤立點是指與數據的一般行為或模型不一致的數據對象。大部分數據挖掘方法將孤立點作為噪聲去除,但在一些應用中,罕見的數據可能比正常出現的數據更有用。例如,在故障管理系統中,孤立點可能預示著故障狀態?;谟嬎銠C的孤立點探測方法有三類:統計學方法、基于距離的方法和基于偏差的方法[4]。
數據挖掘是從數據中提取模式并轉化為人們可理解的形式的過程,其基本步驟包括:業務理解、數據理解、數據清洗和預處理、建立模型、提取模式、模式評價和實施,圖1描述了這些步驟以及它們之間的關系。

圖1 數據挖掘的一般過程
光傳送網故障管理系統的一個研究重點是在收集到原始告警后,如何從大量的原始告警中有效區分出正常行為和故障行為,以及如何自動有效地生成故障規則,并建立一個完備的知識庫。數據挖掘中許多算法可以解決這方面的問題,例如關聯分析算法、時序演變分析算法和分類分析算法等。
圖2所示為光傳送網故障管理系統的數據挖掘過程。具體描述如下:首先采集監測到的原始告警并將之預處理成包含特定屬性的告警庫,例如連續性丟失(LOC)、路徑蹤跡失配(TIM)、凈荷類型失配(PLM)和前向/后向缺陷指示(FDI/BDI)等;然后在訓練數據庫中,使用關聯分析算法處理這些告警,可以得到各種告警和故障之間的關系,使用時序演變分析算法處理這些告警,可以得到各種告警之間的時序關系,利用這兩種算法得到的關聯規則和序列規則,可提取出正常行為模式,建立故障行為監測模型,把檢驗數據庫中的數據輸入到故障行為監測模型中,將檢驗結果與期望結果進行比較,并對模型進行改進;最后將利用故障行為監測模型過濾出的故障行為建成故障行為庫,采取上述同樣方法,利用分類分析算法對故障行為進行分類,提取出分類規則,建立起故障類型與定位模型,從而對未來故障行為進行預測,并確定故障原因與位置。

圖2 光傳送網故障管理系統的數據挖掘過程
為了彌補傳統光網絡故障管理系統的局限性,需要引入三大模塊構建光傳送網故障管理系統:數據挖掘模塊、故障管理模塊和專家系統模塊。數據挖掘模塊主要負責采用數據挖掘算法自動地對預處理后的數據進行挖掘,提取出故障管理規則,建立數據挖掘模型,從而解決了知識獲取的“瓶頸”問題和“窄臺階效應”問題,使系統具有自動性;故障管理模塊一方面利用規則庫中的關聯規則、序列規則區分出正常行為和故障行為,另一方面利用分類規則對故障進行監測和定位,這些過程都是在線自動進行,在一定程度上解決了時差問題,使系統具有時效性;專家系統模塊利用數據挖掘模塊擴充其故障知識庫,并利用推理機應用這些知識進行推理,將最后結果明確地表達給用戶,使系統具有智能性[5-7]。如圖3所示。

圖3 基于數據挖掘的光傳送網故障管理系統框架
本文設計的光傳送網故障管理系統可以充分彌補傳統光傳送網故障管理系統的局限性,利用數據挖掘技術從大量的告警數據中自動產生精確的適用的管理模型,并用挖掘出的規則擴充知識庫,解決了知識獲取的“瓶頸”問題和“窄臺階效應”問題,采用專家系統模塊中的推理機可以利用知識進行推理,解決實際問題。該系統首次將數據挖掘技術引入光傳送網故障管理領域,充分發揮了數據挖掘與專家系統的優勢,具有自動性、時效性和智能性,是保證光網絡生存性的重要手段,在光網絡故障管理領域具有突出的優越性和廣泛的應用前景。
[1]林綿鋒,劉雪原,顧畹儀,等. 光傳送網的故障管理. 光通信研究. 2000(6):16-21
[2] 顧畹儀. 光傳送網. 北京:機械工業出版社. 2003
[3] 李運爽. 混合型專家系統的設計及其在材料設計中的應用. 河北工業大學碩士研究生學位論文. 2005:8
[4]蘇新寧,楊建林,江念南,等. 數據倉庫與數據挖掘. 北京:清華大學出版社. 2006
[5] 劉濤. 基于專家系統的人才評價系統的研究和實現. 山東科技大學碩士研究生學位論文.2005:12-14
[6] 王金磊. 數據挖掘技術在網絡入侵檢測中的應用研究. 鄭州大學碩士研究生學位論文. 2005:22-24
[7] 駱霞武,景旭文. 基于數據挖掘的故障智能診斷系統研究. 機械設計與制造. 2005(3):58-60
10.3969/j.issn.1001-8972.2011.08.064