夏靖波,柏駿
(1.廈門大學 嘉庚學院,福建 廈門 363105;2.空軍工程大學 信息與導航學院,陜西 西安 710077)
基于相關向量機的網絡運行質量評估方法
夏靖波1,柏駿2
(1.廈門大學 嘉庚學院,福建 廈門 363105;2.空軍工程大學 信息與導航學院,陜西 西安 710077)
為一致、穩定地評估網絡運行質量并克服基于SVM(Support Vector Machine)評估方法在訓練過程中存在的參數難以確定、過擬合等問題,提出了基于RVM(Relevant Vector Machine)的網絡運行質量評估方法。該方法利用RVM對灰色模糊綜合評估方法得到的網絡運行質量評估值進行訓練,構建基于RVM的網絡運行質量評估模型。實驗分析表明,該模型獲得的網絡運行質量評估值與通過灰色模糊綜合評估得到的運行質量評估值的平均絕對誤差僅為1.61%,而且優于基于SVM的網絡評估方法。
網絡態勢感知;運行態勢感知;鏈路權重;運行質量評估
網絡運行質量評估是網絡態勢感知的關鍵技術之一。網絡態勢是指由各種網絡設備運行狀況、網絡行為以及用戶行為等因素所構成的整個網絡的當前狀態和變化趨勢[1],這就要求態勢感知模型能夠以一致的評估標準、穩定的評估結果反映網絡整體狀態,因此一致性和穩定性是網絡態勢評估必須具備的因素。一方面,綜合評估的無量綱化處理與其他數據有關,可能導致同一組指標樣本數據得到不同的評估結果,難以保證評估的一致性;模糊評估的專家評價過程受專家主觀因素的影響,難以保證評估的穩定性[2]。另一方面,將機器學習方法引入到網絡性能評估中可有效解決上述兩個問題,但是神經網絡訓練過程中可能收斂于局部極小,而支持向量機又存在參數難以確定、過擬合等問題。因此,基于以上考慮,本文將RVM學習方法引入到網絡態勢感知領域中。
相關向量機(Relevant Vector Machine,RVM)[3]是一種新的機器學習方法,其決策形式與SVM相同,通過引入稀疏貝葉斯學習理論,不僅使其具備了SVM避免過學習的優點,且極大地減少了核函數的計算量,還彌補了SVM存在的稀疏性不強、計算量大、核函數必須滿足Mercer條件以及需人為憑經驗確定參數等不足。因此,與SVM相比,RVM更稀疏,計算時間更短,更適用于在線分析處理數據。目前RVM已被廣泛應用于故障預報[4]、網絡流量分類[5]等領域中,取得了良好的效果。
根據以上分析,提出了一種基于相關向量機的網絡運行質量評估方法。該方法利用灰色模糊綜合評估方法構造出來訓練樣本集訓練評估模型ModelRVM,然后實時采集態勢指標作為評估模型的輸入,得到鏈路運行質量評估結果。
在監督學習中,給定一組輸入樣本向量X={xn}Nn-1,其中N為樣本的個數,對應的目標輸出t={tn}Nn-1,在回歸問題中,tn可以是任意值,在分類問題中,tn是類別標號(二元分類時可以是0或1)。
RVM采用了與支持向量機相同的決策形式:

其中K(x,xn)是選用的核函數,{ωn}Nn-1代表不同的權重,εn是噪聲,假設其服從均值為零,方差為τ-1的高斯分布。
同時引入了貝葉斯概率模型來解釋噪聲對預測結果的影響,這樣不僅能很好地解決了SVM中誤差參數難以確定的問題,還獲得了預測結果概率的能力,這也是RVM的核心概念。有貝葉斯概率:

為了使w中大部分元素為0,參數w服從零均值的高斯先驗分布:

注意這里每一個權值ωn都獨立地對應一個參數αn。
根據貝葉斯準則進行推理,有

2.3.2 膀胱灌注化療和免疫治療 TURBT術后腫瘤復發率高,小部分NMIBC患者會進展為MIBC。原位癌患者單純行TURBT不能解決術后高復發率和疾病進展問題[11]。推薦所有NMIBC患者進行術后輔助性膀胱灌注治療。

通過不斷地迭代,以逼近?MP及σ2MP。其中大部分?i趨近無限大,對應的ωi則為零;少量的ωi穩定趨于有限值,對應xi的即為相關向量(Relevant Vectors)。
應用回歸方法中解決分類問題的Logistic模型:

有結果預測概率:

基于相關向量機的網絡運行質量評估方法利用RVM對灰色模糊綜合評估方法得到的網絡運行質量評估值進行訓練,構建基于RVM的網絡運行質量評估模型。該方法描述如下:
步驟1按照選定的態勢指標采集樣本數據集data;
步驟2利用灰色模糊綜合評估方法構造訓練樣本數據data_train和 測 試 樣 本 數 據data_test,有,其中fij為態勢指標,ei為運行質量評估值;
步驟4利用測試樣本檢驗評估模型,若無效則重復步驟3;
步驟5以時間間隔T采集態勢指標輸入評估模型ModelRVM,輸出鏈路運行質量評估結果。
美國教育科研網Abilene網絡是典型的互聯網絡,具有很強的代表性。因此,本文以美國教育科研網Abilene骨干網絡拓撲為例,利用NS2仿真軟件,搭建網絡模擬平臺,其最大鏈路帶寬為9.6 Gb/s,最小鏈路帶寬為2.4 Gb/s,如圖1所示。為盡量模擬現實網絡,兩兩節點之間以隨機的方式相互通信,產生Exponential、Pareto以及CBR流量。

圖1 Abilene骨干網絡拓撲Fig.1 Backbone network topology of abilene
文中所用數據采自節點4和節點6之間的鏈路,仿真時間為60 s,以時間間隔T=1 s采集每條鏈路上的傳輸延時、延時抖動、包損失率、吞吐量和帶寬利用率等數據。
3.1訓練樣本集
選取傳輸延時(Delay(s))、延時抖動(Jitter(s))、包丟失率(Loss Ratio(%))、吞吐量(Thruput(Gb/s))以及帶寬利用率(Bandwidth Availability Ratio(%))作為運行態勢指標,將前10 s數據作為訓練樣本,通過灰色模糊綜合評估方法得到該鏈路在某一時刻的運行質量評估值,部分數據如表1所示。

表1 訓練樣本集部分樣本Tab.1 Part of the training sample set
灰色模糊綜合評估方法[6]步驟如下:
步驟1無量綱化處理。上述指標中傳輸延時、延時抖動、包丟失率為成本型指標,吞吐量為效益型指標,帶寬利用率為區間型指標(帶寬利用率在[0.3,0.7]區間為最佳)。為了消除指標間由于量綱不同而帶來比較上的困難,根據文獻[15]對上述指標進行處理。
步驟2指標權重確定。通過灰色關聯分析確定指標關聯度,有各個指標權重A=(α1,α2,…,αm)。
步驟3模糊關系矩陣構造。采用三角形隸屬函數[16],評估評語為優秀、良好、合格、差、很差。則根據表2有第i個被評對象xi中第j個指標uj對應第k個等級vk的隸屬度rjk(i),最終可求得模糊關系矩陣R(i)=(rjk(i))m×n。

表2 5類評語對應的隸屬函數Tab.2 The membership function according to five kinds of comments
步驟4模糊評估結果計算。根據模型對指標權重序列A和模糊關系矩陣R(i)進行模糊運算,即

選取歸一化后的bk(i)中的最大值所對應的評語作為最終評語。
步驟5鏈路運行質量評估。將評語集按照V=[90,80,60,50,30]進行量化。最后綜合得分表達式記為:

3.2評價結果
根據上述灰色綜合模糊評估方法求得前10 s各鏈路的運行質量評估值,并將其作為訓練樣本構建RVM運行質量評估模型ModelRVM。從第 11 s開始,將每s獲取的14條鏈路上的5項態勢指標作為評估模型ModelRVM的輸入,輸出相應鏈路運行質量評估值。結果如圖2所示,從圖中可以發現,通過網絡運行態勢感知模型能夠較為準確地感知網絡運行態勢,并呈現出較好的一致性與穩定性。

圖2 RVM評估方法與其他方法的比較Fig.2 The comparison between RVM and the other methods
為了進一步比較RVM與SVM[]在網絡運行質量評估方面的性能,利用上述訓練樣本構建基于SVM的運行質量評估模型,選定γ=0.001及C=500以達到最佳模型效果,并生成網絡運行評估結果如圖2所示。通過比較可以發現,RVM模型得到的評估值與期望值 (通過灰色模糊綜合評估方法得到的評估值)更為接近,鮮有明顯的偏差,二者的平均相對誤差(MAPE)為1.61%,低于SVM模型與期望值的2.52%,因而在準確性方面要略優于SVM模型。另外,RVM的訓練過程更簡便,無需人為設置參數,而SVM訓練過程中懲罰因子C的選取需憑經驗或通過參數尋優確定。此外,RVM模型的評估時間僅為10-4s,實時性較好,可在線評估網絡運行質量。
相較于傳統網絡評估方法對網絡性能局部、靜態的評價,網絡運行態勢是一個全局、動態的過程,更加強調網絡的整體運行狀態及其變化趨勢。網絡運行質量評估是網絡運行態勢感知的關鍵技術,現有的評估方法難以保證一致、穩定的評估網絡運行質量。基于此,文中提出了基于RVM的網絡運行質量評估方法。仿真實驗證明了文中所提方法的有效性。
[1]龔正虎,卓瑩.網絡態勢感知研究[J].軟件學報,2010,21 (7):1605-1619.
[2]徐海東,李冶文,宋俊德,等.基于神經網絡的UTRAN網絡質量綜合評價[J].北京郵電大學學報,2005,28(4):41-44.
[3]Tipping M.Sparse bayesian learning and the relevance vector machine[J].Journal of Machine Learning Research,2001,1 (1):211-244.
[4]胡昌華,王兆強,周志杰,等.一種RVM模糊模型辨識方法及在故障預報中的應用[J].自動化學報,2011,37(4):503-512.
[5]柏駿,夏靖波,趙小歡,等.基于RVM的網絡流量分類方法研究[J].電子科技大學學報:自然科學版,2014,43(2): 241-246.
[6]鐘贇,夏靖波,吳吉祥,等.基于灰色關聯的網絡性能模糊評估[J].空軍工程大學學報:自然科學版,2014,15(3):76-79,84.
[7]溫祥西,孟相如.基于支持向量機和云模型的網絡健康狀態評估[J].北京郵電大學學報,2012,35(1):10-14.
Network running quality evaluation method based on relevant vector machine
XIA Jing-bo1,BAI Jun2
(1.Tan Kah Kee College,Xiamen University,Xiamen 363105,China;2.School of Information and Navigation,Air Force Engineering University,Xi’an 710077,China)
To evaluate network running quality coincidently and steadily and overcome the problem of evaluation method based on Support Vector Machine(SVM)during the process of training,a network running quality evaluation method based on Relevant Vector Machine(RVM)is proposed.The method uses the network running quality evaluation result from a grey fuzzy comprehensive evaluation method by RNM to train,and builds the model of network running quality evaluation based on RVM.Experiment studies illustrate that,the mean absolute deviation of network running quality evaluation result between this model and grey fuzzy comprehensive evaluation method is only 1.61%,which is much better than the network evaluation method based on SVM.
network situation awareness;running situation awareness;link weight;running quality evaluation
TN91
A
1674-6236(2016)02-0121-03
2015-03-29稿件編號:201503423
陜西省自然科學基礎研究計劃項目(2012JZ8005)
夏靖波(1963—),男,河北秦皇島人,教授。研究方向:網絡管理和網絡測量。