曹瑞彤,曹 旭
(中國聯合網絡通信集團有限公司 北京100033)
隨著通信產業的發展,用戶所感受到的業務體驗越來越重要。研究表明,僅2 s的服務時延就可能帶來點擊量3.75%的損失以及用戶滿意度4%的下降,給業務提供商和運營商造成巨大的損失。隨著網絡規模和復雜程度的不斷增長,簡單地對網絡關鍵性能指標(KPI)進行分析已經無法有效評估用戶真實的服務體驗。因此,自適應性更強的帶有自主學習功能的智能網管受到越來越多的關注。
保障業務用戶體驗的核心難點之一是對服務體驗的準確評估。目前,服務質量(quality of service,QoS)是廣泛采用的一種業務體驗評估方式。然而當前對于QoS的定義依然模糊,由于研究角度不同,不同的標準組織對于QoS的定義也不盡相同,ITU、ISO、IETF對于QoS進行了各不相同的定義,使得具體應用這些標準對QoS評估遇到很大的困難。
目前,對于業務QoS的評估一般可以分為主觀評估方法和客觀評估方法兩種。主觀評估方法通過用戶直接對服務進行打分實現對QoS的評估,可以獲得較為可靠的結果,但由于不同的評估者可能存在較大差異,為了避免用戶評價隨機性的影響,需要較大的樣本數量才能獲得合理的評估結果,這大大增加了QoS評估的時間和成本;客觀評估方法通過對比網絡KPI實現對業務QoS的評估,是目前運營商進行業務質量評估的常用方法。但由于不同地區的網絡環境和業務承載區別較大,同一套QoS評估方法無法普遍適用于不同地區的網絡,也給運營商的業務質量管理帶來新的挑戰。
智能網管的目標就是通過對采集樣本的自主學習,準確評估各種環境、業務特點的網絡所承載的業務帶給用戶的確切體驗,并可以針對環境和業務變化做出自適應調整,降低網絡管理過程中人為因素的影響,從而提升運營商的網絡管理水平。
本文針對這一要求提出了一種基于支持向量機的業務QoS評估方法,該方法通過對小樣本的統計學習獲取業務QoS的判別模式,從而實現自適應的QoS判決。通過對一組實際VoIP業務樣本進行分析對比,驗證了本文所提方法的準確性。
機器學習是智能網管中的核心技術,目前已經廣泛應用于生產和生活的多個領域。通過機器學習,系統可以在錯誤時實現自我校正,通過經驗改善自身的性能甚至自動獲取和發現需要的知識。對于這類問題,機器學習的任務就是通過對一些給定樣本的學習,推理出QoS分類的定量準則。由于實際中的QoS分類面帶有高度的非線性,準確學習到QoS分類需要大量樣本和較高的學習難度。從實用性來考慮,QoS評估的機器學習過程就是在準確性和學習難度之間進行折中。
為了解決上述問題,引入近似正確(probably approximately correct,PAC)學習的概念,不再需要機器學習到零誤差的評估,只對評估錯誤大小進行限制。或者說,只需要機器學習到大概正確的QoS評估方式,這樣就較好地滿足了準確性與學習難度的折中。
更嚴格來說,考慮樣本集合X上包含的一種概念C,QoS評估的過程就是推導假設空間H。任取ε、δ滿足0<ε<1/2、0<δ<1/2,若QoS評估的結果以至少1-δ的概率輸出,假設h∈H并使Perror(h)<ε,則認為QoS評估過程通過PAC學習得到結果C。如圖1所示,對于一組樣本數據,符號“+”和“-”表示業務的QoS需求得到滿足的正例和反例。機器學習的目標是輸出一個可行的分類,使得其對于樣本的劃分錯誤率盡可能低,或者對目標概念進行PAC學習。

圖1 近似正確學習示意
從而可以得到QoS評估所需要的樣本數量的估計值,即在給定準確性參數ε、δ時,所需QoS評估的樣本數量m需要滿足下列條件:

從式(1)可以看到樣本數量與QoS評估準確性之間的關系。在實際應用中,樣本數據的取得總是受限的。為了在訓練樣本數量有限的情況下,取得較好的評估效果,尋找一種可以適用于小訓練樣本的機器學習手段顯得十分重要。在第3節中,將通過引入支持向量機的思想提升小樣本條件下的QoS評估性能。
電信業務QoS評估的主要困難就是由于缺乏有效手段獲得用戶的真實業務體驗,導致用來學習的樣本數量較少。為了解決這一困難,引入支持向量機的思想。支持向量機是建立在統計學習理論上的一種機器學習方法,其目的是在樣本數量有限的情況下,通過樣本向高維空間的映射簡化問題,并獲得更好的假設推廣能力。
將樣本視為n維實空間中的點,就可以通過n-1維的超平面對樣本進行分類,對于業務QoS評估問題,設模式集為X∈{ωi,i=1,2},即:若xi∈ω1,認為業務體驗滿足用戶需求;若xi∈ω2,認為業務體驗不滿足用戶需求。

兩類分類樣本距界面的距離為1/||ω||,如圖2所示。在圖2中,兩條虛線間的距離為不同類型訓練數據之間的最小距離,支持向量機的學習目標是找到最優的分類面使1/||ω||最大。對于最優分類面,支持向量就是分類間隔邊緣的訓練樣本點。

圖2 最優分類面示意
在實際情況中,業務的QoS分類面更可能是非線性的。為了使用支持向量機方法,可以通過采用非線性的內積核函數增強支持向量機的表征能力,即通過空間變換的方式將非線性空間中的樣本變換到線性空間中處理。實現這一空間變換的方法是采用內積函數,即x=(x1,…,xn)→Φ(x)=Φ1(x),…,Φn(x)),d 圖3 空間變換示意 在實際情況中,業務的QoS 分類面是高度非線性的,同時可以利用的訓練樣本數量十分不足,在這種情況下,為了實現對QoS的準確評估,可以采用支持向量機的方法,即對于輸入數據X={x1,x2,…,xn},構造變換函數K(xi,xj),得到變換矩陣如下: 顯然,K是對稱矩陣,可以用正交矩陣V實現對角變換K=VΛVT。變換后對角線上的元素分別對應K的特征值λi,每個對角元λi對應矩陣V的第i列,矩陣K的元素可以寫為: 這樣就實現了輸入函數的Hilbert空間映射變換,并增強了函數表示的非線性,此過程如圖4所示。 圖4 支持向量機的工作流程 這樣,就可以對輸入參數進行空間變換,提高系統的表征能力,從而實現對QoS的評估。為了適應業務QoS評估需求的多樣性,本系統采用高階可再生的高斯核函數對樣本數據進行空間變換。 為了對本文所提方法進行驗證,采用實際網絡中的VoIP業務樣本進行系統的性能驗證。目前,語音質量通用的評定方法是基于MOS(mean opinion score)值,這是ITU-T提出的語音業務質量的評價體系,即對語音質量給出1~5分的評分,參考評分標準見表1。 通常情況下,MOS值低于3分時,認為通話質量較差,即業務的QoS不能滿足用戶需求。從實際角度出發,終端的信道情況、無線資源管理方式、射頻性能等因素都可能對語音的MOS評分造成影響。本文忽略這些因素對于語音質量的影響,即認為語音質量只與可以監測到的網絡性能參數相關。 表1 MOS值分類說明 為了驗證本文所提方案的性能,選取3 000個路測VoIP業務的樣本數據,通過該業務的信號強度、接收誤碼率、業務傳輸時延、業務傳輸抖動4個參數對該業務的用戶體驗進行評估。認為MOS值大于3分的樣本是滿足用戶業務需求的樣本,而小于3分的樣本則沒有滿足用戶業務需求。采用支持向量機對樣本進行分類,結果如圖5所示。在圖5中,為了便于呈現,只對傳輸時延和傳輸抖動的業務用戶體驗進行分類。可以看到,支持向量機給出的分類面呈現明顯的非線性,表明支持向量機具有較好的非線性分類能力。 圖5 采用支持向量機的分類結果 將樣本數據分為10組,與采用固定參數閾值的QoS評估方案進行對比。固定分類的QoS評價方法認為,當出現下列任一情況時,用戶的語音業務體驗無法保障:RSS低于-107 dBm;誤碼率(BER)大于2%;時延大于2 000 ms;抖動大于500 ms。將兩種算法進行對比,結果如圖6所示。 從圖6中可以看到,傳統方法沒有考慮參數間的相關性,對于QoS評估的準確性較差;采用支持向量機的QoS評估方法,可以較大地提高QoS評估的準確性。雖然對于VoIP業務而言,用戶實際感受到的服務質量并不完全取決于網絡參數,然而實踐表明,采用支持向量機的QoS評估方法可以達到90%左右的評估準確率,已經基本滿足運營商對于用戶服務質量評估的需求,同時也證明本文所提方案已經具有一定的實用價值。 圖6 和固定分類方法的性能對比結果 隨著網絡運營業務種類和數量的不斷增長,保障用戶感受到的服務體驗已經成為運營商競爭力的核心。為了有效保障用戶體驗,客觀準確地評估用戶實際獲得的業務服務質量已經成為網絡管理的重要挑戰。然而,如何自適應地實現在各種實際網絡環境中的業務QoS評估還沒有一套成熟的解決方案。本文基于這一背景,將機器學習的思想引入網絡管理領域,首先分析了網絡管理中QoS評估的機器學習模型,繼而提出了一種基于支持向量機的QoS評估方法,最后給出了實際系統的實現方案并進行了方案驗證及對比。本文的研究成果對未來發展智能網絡管理系統有較強的參考和借鑒意義。 1 ITU-T Recommendation G.1000.Quality of Service:a Famwwork and Definitions,2011 2 趙其剛,王建成,彭虎.NGN運營網絡及其QoS問題.成都:西南交通大學出版社,2008 3 Ingo S,Andreas C.Support Vector Machines.Springer-Verlag,New York,2008 4 RFC2990.Next Step for IP QoS Architecture,2000 5 RFC3260.New Terminology and Clarifications for Diffeserv,2009
4 本文方案的驗證與比較
4.1 QoS評估系統的設計方案



4.2 與傳統方法的比較


5 結束語
