摘要:提出了運用神經網絡確定權值的方法,將網絡告警信息的三個主要屬性作為神經網絡的輸入,通過樣本的訓練來確定神經網絡的連接權,從而識別網絡告警的權值。這種權值確定法既體現了專家的經驗知識,又能夠隨著網絡拓撲的變化更新連接權。建模及仿真結果表明,與其他權值確定方法相比,神經網絡方法更加實用和有效。
關鍵詞:加權關聯規則; 通信網告警相關性分析; 神經網絡; 連接權
中圖分類號:TP301文獻標志碼:A
文章編號:1001-3695(2008)05-1440-02
隨著通信網的迅速發展和通信業務的擴展,網絡的故障管理也就顯得至關重要。利用數據挖掘技術中的關聯規則挖掘對網絡告警信息進行相關性分析,從而查找故障的根源是目前研究的熱點。關聯規則挖掘算法[1~3]最早是由Agrawal等人提出來,其算法思想是要找出不同數據之間的關聯性。這正適合通信網告警相關性分析的研究。現有的關聯規則挖掘算法大多是將數據庫中的記錄看成平等的,即各個項目具有相同的權值,然而通信網告警數據的特點是告警通常由很多屬性構成,告警級別是其中表征告警嚴重程度的一個主要度量;告警設備所處的節點度數不同,對網絡產生的影響也會不同。在關聯規則挖掘時不能簡單地將各項告警記錄之間的關系看做是平等的。為了解決這個問題,可以綜合考慮影響告警屬性的各種因素,為告警信息分配相應的權值,采用加權關聯規則挖掘算法來進行通信網告警相關性分析。加入了權值,就可以挖掘出更多重要信息,而去除一些并不重要的告警信息,從而增加挖掘的效率,減少挖掘的數據空間。權值的分析本身就是一個難點,而且通信網是一個拓撲結構動態變化的網絡,告警的權值要能夠反映網絡動態變化的特性。
一般告警權值是依靠網絡專家的經驗來確定的,但是在現代通信網的條件下,告警數量成千上萬,網絡變化錯綜復雜,單單依靠人力是不可能很好地解決,所以就迫切需要一種既能夠體現專家的經驗知識又能夠適應復雜的通信網特點的權值識別方法。文獻[4]提出了一種加權關聯規則挖掘算法的思想。其算法是基于購物籃分析的,項目集中各項權值可以由物品的價格和利潤等很直觀的因素決定。但是這種方法并不適合通信網告警權值的確定。因為其權值是由很多因素決定的,有些因素并不好定量分析,而且各個因素對網絡的影響程度也不相同,不能直接使用已有的加權關聯規則挖掘算法。文獻[5,6]提出了層次分析法來確定告警權值,但是其中的參考因素太客觀,不能很好地處理告警權值,而且在網絡拓撲發生變化時必須重新確定權值,不能夠參照以前的經驗知識,就使得權值的更新變得非常復雜。
本文采用神經網絡的方法將影響網絡告警的因素作為神經網絡的輸入。通過樣本學習來訓練連接權,使得神經網絡的連接權可以存儲網絡的信息。其中既包括告警屬性這樣的客觀因素,又包括專家經驗這樣的主觀因素,能夠快速有效地確定權值。如果網絡的拓撲信息發生變化,還可以對連接權進行更新,通過更新算法的研究,使得告警可以充分體現網絡動態變化的特點,具有很強的實時性。
1應用神經網絡確定告警權值
神經網絡的基本思想是從仿生學的角度模擬人腦神經系統的運作方式,使機器具有人腦那樣的感知、學習和推理能力。在神經網絡中,記憶的信息存儲在連接權上,通過反復訓練,可以在下一次輸入信息時,通過連接刺激相應的神經元,從而達到自動識別的目的。雖然在數據挖掘中對權值的分析已有了一些研究成果,但是自動識別的效果都不是很理想。本文引入神經網絡中的一神經元前饋模型即感知機模型來對告警權值進行學習和識別,最后通過仿真來說明運用神經網絡確定告警權值的優勢。
本文設計中影響網絡告警權值的因素有三個,神經網絡的輸出是告警的權值,所以只需要一個神經元就可以完成識別功能,可以用神經網絡中的感知機模型來完成(圖1)。
感知機模型是一種具有權值元素的前饋網絡,通常由感知層、連接層和反應層構成。其中感知層由輸入元素組成。感知層至連接層的連接權值初始值固定為1,在學習過程中這個權值不變化;連接層至反應層的連接權是通過學習來確定的。通常這些連接權在初始化時取[-1,1]區間內的隨機值,在學習階段根據學習規則并利用輸入/輸出模式不斷調整,使之在一定的輸入時有期望的輸出。
在這個模型結構中需要確定三個參數,即輸入端的定量描述、神經網絡的連接權和神經網絡的傳輸函數。
1)神經網絡的向量表示
2仿真及分析
仿真輸入預處理后的通信網告警數據,其告警信息屬性由多個因素組成,選用單神經元的前饋神經網絡模型來確定告警權值(圖3)。輸入分別選用對通信網影響最大的包括告警設備的節點度數、告警級別、告警類型在內的三個屬性;輸出為每條告警信息的權值。通過對專家經驗知識即樣本的訓練,得到神經網絡的連接權值,建立好神經網絡模型后,就可以判定告警權值了。
告警相關性分析確定權值的神經網絡設計過程中,確定傳輸函數是最后也是關鍵的一步。在本文設計中,根據告警數據的特點選取傳輸函數為飽和線性函數:
f=0n<0n0≤n≤11n>1
仿真選取兩個典型網絡NSFNET 和CERNET的10~50條告警的典型權值對神經網絡的連接權進行訓練。最后的告警連接權值趨于穩定,表明訓練完成(圖4)。
分別利用神經網絡方法和層次分析法對事務數據庫中的告警項進行加權,然后采用加權Apriori算法[4]挖掘加權頻繁項集。程序是在AMDProcessor 2800+,內存512 MB,Windows XP環境下用Java語言實現的,使用Java 5.0對程序進行編譯。圖5是兩種加權方式下不同的最小加權支持度產生的加權頻繁項目集個數的比較。
從仿真結果可以看出:隨著最小加權支持度的增加,神經網絡方式下加權頻繁項目集個數下降得更緩慢。因為這種加權方式可以較好地參照專家的經驗知識,又能夠體現不同網絡節點度的告警信息的差別,所以在不同的最小加權支持度下能挖掘出加權頻繁項集,比層次分析法的識別性要強很多。
3結束語
加權關聯規則挖掘是適合于通信網告警相關性研究的一個重要的方法,告警權值的確定關系到挖掘的效果。本文通過理論分析,采用了前饋神經網絡模型來確定通信網的告警權值,并且根據告警信息的特點對神經網絡進行
建模。通過對實際網絡告警數據典型樣本值的訓練,得到了有穩定連接權值的神經網絡模型。仿真結果表明,應用神經網絡來確定告警權值,既能夠體現專家的經驗知識,又可以使權值的確定充分體現告警的屬性,而且在網絡拓撲變化時可以快速動態地確定和調整權值,使得加權關聯規則挖掘更加科學、有效。
參考文獻:
[1]AGRAWAL R, IMIELINSKI T, SWAMI A. Database mining: a performance perspective[J]. IEEE Trans on Knowledge and Data Engineering, 1993,5(6):914-925.
[2]AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules[C]//Proc of the 20th VLDB Conf. 1994.
[3]AGRAWAL R, MANNILA H, SRIKANT R, et al. Fast discovery of association rules[C]//Proc of Knowledge Discovery and Data Mi-ning.[S.l.]: MIT Press, 1996.
[4]CAI C H, FU A W C, CHENG C H, et al. Mining association rules with weighted itemsets[D].[S.l.]:Department of Computer Science and Engineering, 1998.
[5]歐陽繼紅,王仲佳,劉大有.具有動態加權特性的關聯規則算法[J].吉林大學學報:理學版, 2005,43(3):314-319.
[6]肖海林,李興明.層次分析法在通信告警加權關聯規則挖掘中的應用研究[J].電信科學,2006,22(11):36-39.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”