王珂



摘 要
文章通過對比不同種類的預測模型,找到一種能夠適合預測寬帶網絡故障的方法。文中使用動態神經網絡和自回歸移動平均法來預測非線性系統,并對結果進行比較,并得到了比較滿意的結果。對于每個測試用例,相關參數都進行了調整以適應相應的精度要求。
【關鍵詞】網絡故障 神經網絡 自回歸移動平均法 非線性系統
1 引言
寬帶電信網絡現已經大規模的市場化,雖然網絡服務的質量一直在不斷提高,但是網絡故障的不斷發生,仍然是電信運營商所必須關注的問題。網絡故障最常見的表現是:服務完全中斷,下行帶寬低,無法訪問網站,撥打VoIP電話時的噪音,無法建立一個電話呼叫等。最能夠反映網絡服務質量的參數是MTBF(發生故障之間的平均時間),減少故障的發生也就是提高發生故障之間的平均時間是運營商對于網絡改進的重點。國內外的運營商也正在開發中運營支持系統和業務支持系統,目的為了分析大量來自網絡的可用數據。但是由于服務復雜度,較長的平均服務時間和更多終端設備的實例,與傳統的電話網絡相比,寬帶接入網絡的平均故障間隔時間(MTBF)比傳統的非寬帶網絡低2-6倍,也就是是說網絡故障發生的頻率遠高于傳統的電話網絡。另一方面,網絡的復雜性使得難以準確地診斷可能會導致更高的重復數的問題故障。同時在用戶被引入通過感知和報告故障的隨機分量的數量和復雜性的增加,一個寬帶網絡中發生的故障可以看作是一個時間序列。時間系列描述寬帶故障的特點是事件發生的隨機性,事件復雜性以及事件數量龐大,這就使得到的時間序列具有較高的過程噪聲。由于監視系統的不完善性,時間序列中的噪聲是必然是很多沒有觀察到的變量所導致的。監視系統的不完善性表明其預警的模糊性,不準確性,同時也可能導致在某些特定的網絡故障事件發生時,無法預警。通過測量噪聲的水平,我們確定了模型中所需的變量和其復雜度。描述時間序列有兩個相關的變量,即平穩性和線性、非線性。描述寬帶網絡的時間序列是由于其特性,即高水平的波動多引起的非平穩性所決定的。在系統中的變量都是線性的和非線性的,一個時間序列的線性/非線性決定哪種模型會更有效地預測時間序列的結果,最終確定的最終實施的最佳模式。線性的時間序列可以使用自回歸模型,例如ARMA或ARIMA來描述,而非線性的時間序列則更適合用神經網絡的非線性激活函數來描述。本文的目的是為了找到最合適的模型來描述它表征的系統。
2 一個網絡故障時間序列實例
為了動態跟蹤和預測的故障發生,我們將故障的數量作為一個時間序列。它被認為是一個隨機序列而不是確定性的序列,也就是說未來的結果只能進行估計,而不能夠精確計算。數據收集的頻率依賴于時間序列的性質和邏輯,也就是說結果依賴于所描述的現象。采樣的頻率利用每天,每周,每月和每年的時間序列。運營管理中,對于寬帶故障的短期預測是必不可少的,而長期的預測是與戰略和長期規劃相關。此外,正確選擇的數據采集頻率有助于確定數據的周期性。寬帶故障有兩個清晰可辨的周期性,每天每周一次。故障發生模式本質上是動態的,并隨著時間和季節的變化。每日樣本反映住宅及商業客戶的工作活動以及之后形成每周模型。本文對每10分鐘,每小時,每天,每周序列進行了分析,為實際應用提供了足夠的選擇。圖1顯示了一個例子系列描述的是故障發生在10分鐘的時間間隔,采樣的總時間為2000分鐘。一般情況下,該序列具有可識別的形式,然而像諸如如核心網元發生故障或雷雨可以顯著影響曲線的形狀和扭曲,使其不可識別。
3 神經網絡模型
人工神經網絡由于其十分強的自適應、自學習功能,因此經常用來預測不同種類的時間序列。人工神經網絡是一個以有向圖為拓撲結構的動態系統,它通過對連續或斷續式的輸入作狀態響應而進行信息處理。是一個高度復雜的非線性動力學系統,不但具有一般非線性系統的共性,更主要的是它還具有自己的特點,比如高維性、神經元之間的廣泛互連性以及自適應性或自組織性等。
3.1 感知器神經網絡
MLP網絡是神經網絡中研究的一個重點,它們具有很強的分類能力,它能解決模式分布非常復雜的分類問題。它由三部分組成:一組感知單元(源節點)組成輸入層、一層計算節點的隱含層、一層計算節點的輸出層。第一層的激活函數為對數s形函數,第二層激活函數為線性函數。如圖2所示。
3.2 BP神經網絡
BP神經網絡是1986年由Rumelhart和McCelland為首的科學家小組提出,是一種多層前向型網絡。其神經元的傳遞時S型函數,輸出量為0-1的連續量,它可以實現輸入到輸出的任意非線性映射。BP神經元的傳輸函數為非線性函數,常用的函數為losig函數和tansig函數,輸出層則采用線性函數purelin。如圖3所示。
3.3 NARX神經網絡
NARX神經網絡即Jordan神經網絡是一個能表示動態系統的網絡,它把輸入也反饋到網絡的輸出,這就使加入的狀態反饋反映到網絡的動態性能中。我們的想法得到進一步提高在非線性自回歸網絡與外部輸入,輸出的數據是保存在延遲存儲器線。Jordan網絡的輸出值存儲在網絡本身的狀態變量中,而NARX網絡中,他們存儲在延遲矢量中。如圖4所示。
3.4 ARIMA 模型
ARIMA模型全稱為差分自回歸移動平均模型,是由博克思和詹金斯于70年代初提出的一著名時間序列預測方法。所謂ARIMA模型,是指將非平穩時間序列轉化為平穩時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現值和滯后值進行回歸所建立的模型。ARIMA模型根據原序列是否平穩以及回歸中所含部分的不同,包括移動平均過程(MA)、自回歸過程(AR)、自回歸移動平均過程(ARMA)以及ARIMA過程。ARIMA模型的基本思想是:將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現在值來預測未來值。模型如下圖公式所示。
4 數據分析和對比
通過使用均方根誤差和判定系數,對比實際的數據和預測的數據來估算預測模型的準確性。
圖5和圖6是對LRN模型和NARX模型預測的結果與實際數據的對比,從圖形可以直觀看出,這兩個模型具有相對可靠地準確性。
5 結束語
本文的主要目的是比較不同的預測方法對于寬帶網絡故障的短期和長期預測。研究的結果表明動態遞歸神經網絡優于靜態神經網絡。此外,傳統的預測方法,ARIMA無法實現神經網絡的準確性預測,這證實了在電信網絡中大多數故障的非線性特征的假說。未來的改進方向是應用動態內存模型,像NARX和LRN模行,調節相應的網絡參數,另外識別和輸入參數的引入,也將有利于提高模型的準確性。
參考文獻
[1]陸寧云,何克磊,姜斌,呂建華.一種基于貝葉斯網絡的故障預測方法[J].東南大學學報自然科學版,2012,42:87-91.
[2]艾紅,周東華.動態系統的故障預測方法[J].華中科大學學報:自然科學版,2009,37:222-225.
[3]吳昕慧.基于神經網絡的鐵路客運量優化預測[J].計算機仿真,2010(10):168-170.
[4]李楠,曾興雯.基于EMD和神經網絡的時間序列預測[J].西安郵電學院學報,2007(01):51-54.
[5]汪遠征,徐雅靜.多元平穩時間序列ARIMAX模型的應用[J].統計與決策,2007(18):132-135.
[6]張德豐.MATLAB 神經網絡應用設計(第2版)[M].北京:機械工業出版社,2012.
[7]周開利,康耀紅.神經網絡模型及其MATLAB仿真程序設計[M].北京:清華大學出版社,2005.