王再見 董育寧 湯萍萍 楊凌云 張 暉
?
使用改進K-SVD的網絡多媒體業務QoS類識別
王再見*①董育寧②湯萍萍①②楊凌云①②張 暉②
①(安徽師范大學物理與電子信息學院 蕪湖 241000)②(南京郵電大學通信與信息工程學院 南京 210003)
該文基于網絡多媒體業務QoS(Quality of Service)特征特點,提出網絡業務QoS類識別算法。探索了新的多媒體業務QoS類劃分模式,在QoS分類的基礎上,可以通過將具有相同或相似QoS需求特征的業務流聚集生成聚集流。聚集流劃分使用較少的QoS特征,借助聚集流可以在合理的粒度上區分多媒體業務。該文從QoS特征出發分析了聚集流識別的特點,利用網絡多媒體業務典型QoS特征的稀疏性,使用改進K-SVD(Kernel Singular Value Decomposition)進行字典學習,實現網絡多媒體業務QoS類識別。實驗結果表明,該文算法比現有方法具有更高的QoS類識別準確性。
異構網絡;網絡多媒體;QoS;稀疏表示;業務流識別;字典訓練

目前典型的網絡業務識別包括:基于貝葉斯網絡[14]、基于HMM (Hidden Markov Model)[15]和基于支持向量機(Support Vector Machine, SVM)[16]的業務識別算法。上述業務流識別/分類算法針對特定的業務或協議,不適合基于QoS類的區分。受啟發于文獻[17,18],本文提出一種基于模版的K-SVD 網絡多媒體業務QoS類識別算法。算法采用K-SVD高效地解決優化問題,在字典學習過程中利用稀疏碼(Sparse Coding -SC)學習字典,降低特征的維度,提高識別準確度。
本文其余的內容安排如下:第2節深入分析QoS典型特征,并選擇新的特征,第3節給出新的QoS類定義,第4節詳細描述基于修正K-SVD的網絡業務QoS類識別框架,第5節是實驗結果和分析,最后是結論。
由于目前尚未發現將不同多媒體業務按QoS類別劃分的數據庫,本文使用Wireshark[19]在校園環境中捕獲目前網絡中流行的多媒體業務作為基本數據集,結合統計工具針對不同特性展開深入分析。部分特征統計信息如表1所示。
為了更直觀地理解,本文選取歸化后的上行/下行鏈路帶寬對數值顯示在圖1中(其中橫坐標是下行鏈路歸化帶寬對數,縱坐標是下行鏈路歸化帶寬對數)。由圖1可見,整個點的分布可明顯地劃分為6個區域。分析表明,區域1由廣播/多播視頻會議、可視電話和在線視頻組成,它們采用廣播或多播模式;區域2由BBC 和CCTV網站視頻組成,它們采用HTTP模式傳輸視頻內容;區域3由Xunlei、 BitTorrent 和Emule組成,它們基于P2P模式提供分享視頻服務,不過上行數據較少,下行數據較大,從本地站點看,似乎類似于支付少量費用的交易行為;區域4由Sopcast, TVAnt, Skype, VoD, PPlive, Coolstreaming, SinaLive, PPStream 和PPMate業務組成,它們也采用P2P模式,與區域3中的業務相比,上行數據較大,從行為上看,像以物易物的交易行為;區域5由ICQ, QQ 和MSN組成,這類型業務共同的特點是具有很強的交互性;區域6由多種在線游戲組成,這類業務的上/下行業務數據量都很小(在啟動前業務已預裝了很多數據,比如電子地圖等),游戲中玩家主要是提交指令,大量的計算由游戲服務器和本地客戶機完成。
盡管目前存在的典型多媒體業務數量龐大,由圖1中不同區域的業務分布,似乎可以依據相似的QoS特征劃分為數目較少的QoS類別。本文依據在圖1中6個區域,概括地劃分為6類:廣播視頻 (Broadcast Video, BDV)、網頁視頻(Web Video, WV)、購買型視頻(Trade Style Video, TSV)、以物易物型視頻(Barter Style Video, BSV)、交互視頻(Interactive Video, IV)和游戲類(Game Class, GC)。
這6種QoS類上/下行歸化速率值分布如圖2所示,其相應的對應關系見表2。由圖2(a)可見6種QoS類上/下行歸化速率值跨度較大,為了顯示得更加清晰,我們將其中幾個距離較近的QoS類分布用子圖畫出。由圖2(b)可見,BDV與WV距離明顯。圖2(c)為TSV, BSV和IV 3個類別的上/下行歸化速率值分布示意圖,由圖可見3類業務分布區域相對集中。圖2(d)為WV, TSV和GC 3個類別的上/下行歸化速率值分布示意圖,GC類別區分明顯,WV和TSV雖相距較近,但也有差異。

圖1 所有業務上/下行歸化速率對數值分布

表1 Youku video部分統計信息示例

圖2 6種QoS類上/下行歸化速率值分布
表2新QoS類定義

區域聚集流類具體業務例子下行速率上行速率其它描述 1廣播視頻(BDV)廣播視頻會議、可視電話、在線視頻等業務中小上/下行速率分布較密集、比值較小 2網頁視頻(WV)BBC, CCTV等網頁視頻業務大較小上/下行速率分布的跨度最大、比值較小 3購買型視頻(TSV)Xunlei, BitTorrent, Emule, Fileguri電驢等視頻業務較大中上/下行速率分布的跨度較大,比值居中 4以物易物型視頻(BSV)電視螞蟻、Sopcast, Skype, PPStream, PPlive, PPMate等視頻業務較大大上行速率分布的跨度最大,下行速率較穩定,上/下行速率的比值分散 5交互視頻(IV)QQ, MSN等視頻業務中中上/下行速率分布較密集,上/下行速率值相近 6游戲類(GC)多人網絡交互游戲等業務小小上/下行速率分布較分散,上/下行速率值都較小
BDV類所屬業務上/下行速率的特點是分布較集中,產生的數據總量不大。WV類業務常由HTTP服務器提供,通過嵌入在網頁中的對象瀏覽。該模式下每個鏈接僅僅處理一個請求。由于用戶請求業務是只需要少量的指令,且不用向別的用戶提供業務內容,HTTP服務器收到請求后持續傳輸視頻內容,內容越大傳輸的就越多。網頁視頻用戶只要傳輸少量請求信息,服務器就會源源不斷地發送視頻內容,類似視頻常常是電影、電視劇等,數據量較大,由于該類視頻容量差異較大,所以對下行速率需求的跨度較大。
TSV類業務常常同時啟動多個TCP鏈接,同時為多個P2P節點雙向傳輸數據。多個任務常常同時執行,有較長的傳輸時間。該類業務常采用P2P模式,在下載資源的同時上傳自身資源,不過上傳的數據較少。BSV 類業務具有典型的P2P實時業務特征,此類業務節點在接收數據的同時也向其它節點提供數據。該類業務能通過使用變速率方式保證QoS以滿足用戶體驗質量。IV類業務用戶交互過程中等待時間不易過長,業務對延遲時間敏感。數據是雙向對稱傳輸,上/下行速率斜率的變化范圍很小,反映該類型業務特征分布穩定。
GC 類業務既可能采用C/S模式也可能采用混合P2P模式,不同類型的業務雖然特征不盡相同,但在上/下行速率需求上具有一致性。該類由于大量計算由服務器和本地客戶端完成,服務器只是向玩家提供計算結果,而玩家只需向服務器傳輸指令和要求,大量場景和視頻畫面在本地生成,需要傳輸的數據量較少。
基于修正K-SVD的網絡業務QoS類識別算法流程可劃分為兩個模塊(圖3):特征處理模塊和稀疏表示模塊。
(1)特征處理模塊:
(a)獲取訓練數據集合。捕獲流行的23種多媒體業務作為基本數據集。
(b)特征提取。本文基于Wireshark獲取DSCP (DiffServ Code Point)值、包到達絕/相對時間、源/目的IP地址、源/目的端口、協議、包大小、累積字節數和包詳細描述等60種屬性,并針對采集到的數據進行預處理。選取對應特征出現的最大值歸化相應特征的全部數據,用統計后的相對值區分不同業務類型,具體的歸化公式如式(1):

這里, ,為數據集業務總數,取值為1時表示上行數據,取值為2時表示下行數據,為業務的實際取值,為其歸化后的取值。
(c)尺度不變特征變換(Scale-Invariant Feature Transform, SIFT)。為了降低網絡噪聲對QoS參數取值的影響,本文對提取后的特征用SIFT描述子刻畫,本質是在不同的尺度空間上查找特征關鍵點,并計算出方向。實現步驟如下:(i)尺度空間極值檢測;(ii)確定每個候選位置和尺度;(iii)基于局部的梯度方向,分配給每個關鍵點位置一個或多個方向;(iv)在每個關鍵點周圍的鄰域內,在選定的尺度上測量局部的梯度,并將這些梯度變換成一種表示,允許比較大的局部形狀的變形。

基于文獻[5],QoS類的稀疏表示問題可以通過求解下面用于字典重構的新目標函數完成。

(3)基于修正K-SVD的網絡業務QoS類識別步驟如下:
步驟1 依據聚類結果,針對每個模板業務類別,選取同類別聚集流業務共同作為模版集;
步驟2 基于文獻[5],以模板業務作為檢測業務,通過徑向基函數(Radial Basis Function-RBF),計算檢測業務和參考集業務的相似度;
步驟3 基于文獻[5],生成業務的最終表示以用于分類;
步驟4 用線性SVM作為分類器進行識別。

表3實驗配置參數

模板集大小字典大小稀疏度 2010018
由圖4可見,本文方法在所有方法中識別準確率最好。這是由于Na?ve Bayes, HMM和SVM方法需要學習,其識別性能受學習階段的訓練數據集影響,過于依賴特定的特征,造成相同QoS類別中的不同業務識別效果并不一樣[17]。K-NN算法是一種在分類過程中實現學習的監督分類方法,雖然沒有單獨的學習階段,但由于該算法只計算“最近的”鄰居樣本,在分類過程中識別性能同樣受訓練集樣本影響,尤其當某一業務類別的樣本量很大時,數量并不能影響運行結果。而在QoS類區分中,屬于不同QoS類的業務可能使用相同的協議,如BDV、TSV和BSV都可能采用P2P模式;且屬于相同QoS類別的業務也可能采用不同的協議,如GC既可以使用P2P也可以用C/S模式。網絡動態本質更加劇了業務QoS特征的波動,給準確依賴特定模式識別業務所屬QoS類別造成困難。不同業務識別誤差的存在降低了Na?ve Bayes, HMM, SVM和K-NN在識別QoS 類時的整體效果。例如,BitTorrent和eDonkey都屬于TSV類別,但是Na?ve Bayes對BitTorrent有更好的識別效果,而識別eDonkey業務的效果較差;SVM雖然對BitTorrent和eDonkey業務有好的識別效果,但識別PPlive業務的效果較差;HMM可以較好地識別PPStream,但是識別Sopcast的效果不佳。類似的情況在K-NN中同樣存在。
當上述典型算法用于區分QoS類時,識別效果差的業務會降低算法整體的識別效果。如IV中業務的特征分布較為集中,所以識別準確度較高,但由于典型分類方法常把其看作其它類型的P2P業務(如BSV中的業務),部分降低了區分準確度;GC類業務在5種分類方法中都有較高的識別準確度,這是由于游戲業務在上/下行速率需求特征上與其它5類業務的區別較大。也從側面證明游戲類業務應該單獨劃分為一個QoS類別。本文方法所選取的上/下行速率較好地反映了多媒體業務QoS的本質特征,滿足QoS類區分的4個基本要求,有利于提高多媒體業務QoS類區分性能。
圖5-圖7給出了5種方法在6種QoS類型業務在精確率、召回率和F1-測度值指標上的對比。由圖5中可見,本文方法在精確率上明顯高于其它4種典型區分方法,這是由于本文算法選取的特征具有較好的魯棒性,降低了網絡動態性所帶來的特征分散性所造成的影響,提高了區分的精確性。這在BDV, TSV, BSV和WV業務的區分中尤為明顯。而典型業務區分方法由于對特征分布的變化考慮不足,造成誤判,增大FP(False Positives)值,從而導致精確性降低。比如,區分WV和TSV業務時,則有較多WV業務被區分為TSV業務,同時也有TSV業務被區分為WV業務。同理,本文方法在召回率(圖6)上也有較明顯的改善,綜合了精確率和召回率的結果F1-測度值也較高,這也說明實驗結果比較理想。尤其值得注意的是,雖然5種分類方法對GC類業務識別精確率一致,但Na?ve Bayes, HMM, SVM 和K-NN方法中,部分QoS區分特征過于分散的業務被區分為其它種類業務,導致在召回率和F1-測度值指標上低于本文方法。


圖4 業務識別方法在識別準確度上的對比

圖5 5種方法在精確率指標上的對比

圖6 5種方法在召回率指標上的對比

圖7 5種方法在F1-測度值指標上的對比
本文首先分析了目前典型QoS模型和業務識別方法中使用的區分特征,介紹了典型多媒體業務QoS特征研究的最新進展和典型業務流識別算法,研究了多媒體業務典型QoS特征的稀疏性。依據新選擇QoS特征的顯著差異定義了新的QoS類,并與現有QoS分類進行了對比。然后從QoS特征出發分析了網絡業務QoS類識別的特點,結合多媒體業務典型QoS特征的局部性所帶來的稀疏性,針對聚集流的區分,基于模版改進K-SVD進行字典學習,完成業務的稀疏表示,實現準確高效的QoS類識別。最后給出了與典型識別方法的對比結果。
[1] 王再見, 董育寧, 張暉, 等. 一種異構網絡多媒體業務QoS類彈性映射方法[J]. 電子與信息學報, 2013, 35(3): 709-714. doi: 10.3724/SP.J.1146.2012.00890.
WANG Zaijian, DONG Yuning, ZHANG Hui,. An elastic QoS class mapping method for multimedia traffic in heterogeneous wireless networks[J].&, 2013, 35(3): 709-714. doi: 10.3724/ SP.J.1146.2012.00890.
[2] 王再見, 董育寧, 張暉, 等. 一種基于改進隱馬爾可夫的多媒體業務分類算法[J]. 電子與信息學報, 2015, 37(2): 499-503. doi: 10.11999/JEIT140340.
WANG Zaijian, DONG Yuning, ZHANG Hui,. A multimedia traffic classification method based on improved hidden Markov model[J].&, 2015, 37(2): 499-503. doi: 10.11999 /JEIT140340.
[3] 董育寧, 王再見, 房曙光, 等. 多媒體通信業務流識別與分類方法綜述[J]. 南京郵電大學學報(自然科學版), 2013, 33(3): 35-44.
DONG Yuning, WANG Zaijian, FANG Shuguang,. Survey of methods for traffic identification and classification in multimedia communications[J].(), 2013, 33(3): 35-44.
[4] WANG Zaijian, DONG Yuning, and WANG Xinheng. A dynamic service class mapping scheme for different QoS domains using flow aggregation[J]., 2015, 9(4): 1299-1310. doi: 10.1109/JSYST.2014.2351825.
[5] WANG Zaijian, DONG Yuning, SHI Haixian,. Internet video traffic classification using QoS features[C]. 2016 the International Workshop on Computing, Networking and Communications (CNC), Hawaii, USA, 2016: 1-6. doi: 10.1109/ICCNC.2016.7440599.
[6] MUHAMMAD M, GIAMBENE G, and COLA T. QoS Support in SGD-based high throughput satellite networks[J]., 2016, 15(12): 847-849. doi: 10.1109/TWC.2016.2615618.
[7] KAZEMI R, BOLOURSAZ M, SEYED M E,. Capacity bounds and detection schemes for data over voice[J]., 2016, 65(11): 8964-8977. doi: 10.1109/TVT.2016.2519926.
[8] PRASETYA S, RAHMAT B, and SUSANTO E. Quality of service improvement with 802.11e EDCA scheme using enhanced adaptive contention window algorithm[C]. 2015 IEEE International Conference on Communication, Networks and Satellite (COMNESTAT), Bandung, Indonesia, 2015: 80-85. doi: 10.1109/COMNETSAT.2015.7434292.
[9] FENG Kaiten, SU Wunci, and CHEN Chunyu. Comprehensive performance analysis and sleep window determination for IEEE 802.16 broadband wireless networks [J]., 2016, 15(1): 74-91. doi: 10.1109/TMC.2015.2409881.
[10] SUZNJEVIC M and MATIJASEVIC M. Trends in evolution of the network traffic of massively multiplayer online role-playing games[C]. 2015 13th International Conference on Telecommunications (ConTEL), Pirsa, Australia, 2015: 1-8. doi: 10.1109/ConTEL.2015.7231199.
[11] MARKOVICH N and KRIEGER U. Statistical analysis and modeling of peer-to-peer multimedia traffic[J]. LNCS, 2011, 5233: 70-97. doi: https://doi.org/10.1007/978-3-642-02742- 0_4.
[12] LIU Feng and LI Zhitang. A measurement and modeling study of P2P IPTV applications[C]. 2008 International Conference on Computational Intelligence and Security, CIS,08, Suzhou, China, 2008: 114-119. doi: 10.1109/CIS.2008. 112.
[13] FARAHBAKHSH R, CRESPI N, CUEVAS á,. Understanding the evolution of multimedia content in the internet through bittorrent glasses[J]., 2013, 27(6): 80-88. doi: 10.1109/MNET.2013.6678931.
[14] ZHANG Jun, CHEN Chao, XIANG Yang,. Internet traffic classification by aggregating correlated Naive Bayes predictions[J]., 2013, 8(1): 5-15. doi: 10.1109/TIFS.2012. 2223675.
[15] MAHESHWARI S, MAHAPATRA S, KUMAR C,. A joint parametric prediction model for wireless internet traffic using Hidden Markov Model[J]., 2013, 19(6): 1171-1185. doi: 10.1007/s11276-012- 0525-1.
[16] JING Ning, YANG Ming, CHENG Shaoyin,. An efficient SVM-based method for multi-class network traffic classification[C]. 2011 IEEE 30th International Performance Computing and Communications Conference (IPCCC), Orland, Florida, USA, 2011: 1-8. doi: 10.1109/PCCC.2011. 6108074.
[17] FINSTERBUSCH M, RICHTER C, ROCHA E,. Asurvey of payload-based traffic classification approaches[J].&, 2014, 16(2): 1135-1156. doi: 10.1109/SURV.2013.100613.00161.
[18] LI Qun, ZHANG Honggang, GUO Jun,. Reference-based scheme combined with K-SVD for scene image categorization [J]., 2013, 20(1): 67-70. doi: 10.1109/LSP.2012.2228852.
[19] GOLD S. Hacking on the hoof[J]., 2012, 7(3): 80-83. doi: 10.1049/et.2012.0313.
[20] XU Yanbo, SIOHAN O, SIMCHA D,. Exemplar-based large vocabulary speech recognition using k-nearest neighbors[C]. 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Queensland, Australia, 2015: 5167-5171. doi: 10.1109/ICASSP.2015.7178956.
[21] ZHANG Jun, CHEN Chao, XIANG Yang,. Classification of correlated Internet traffic flows[C]. 2012 IEEE 11th International Conference on Trust, Security and Privacy in Computing and Communications (TrustCom), Liverpool, England, UK, 2012: 490-496. doi: 10.1109/TrustCom.2012. 105.
王再見: 男,1980年生,博士,副教授,研究方向為無線多媒體通信、異構網絡端到端QoS保證技術、多媒體大數據.
董育寧: 男,1955年生,博士生導師,教授,研究方向為多媒體通信與信息處理.
湯萍萍: 女,1981年生,博士生,講師,研究方向為多媒體通信與信息處理.
Network Multimedia QoS Class Recognition Based on Improved K-SVD
WANG Zaijian①DONG Yuning②TANG Pingping①②YANG Lingyun①②ZHANG Hui②
①(,,241000,)②(,,210003,)
According to QoS characteristics of network multimedia service, this paper proposes a algorithm of network multimedia QoS class recognition. This paper studies new multimedia traffic QoS class division mode. According to new QoS classes defined, Flow Aggregation (FA) can be formed by gathering multimedia traffic flows with similar QoS characteristics. Network multimedia QoS class recognition prefers fewer QoS features by FA, and it is possible to divide network multimedia traffics in suitable granularity based on FA. This paper analyzes the property of FA recognition from QoS perspective, uses improved K-SVD (Kernel Singular Value Decomposition) to learn dictionary by using the sparse representation of typical QoS characteristics of network multimedia traffics, and presents a network multimedia QoS class recognition method. Experiment results show that the proposed recognition method can achieve more accurate QoS class recognition than previous methods.
Heterogeneous networks; Network multimedia traffic; Quality of Service (QoS); Sparse representation; Traffic recognition; Dictionary learning
TP393
A
1009-5896(2017)12-3023-07
10.11999/JEIT170133
2017-02-17;
2017-10-01;
2017-10-27
通信作者:王再見 wangzaijian@ustc.edu
國家自然科學基金(61401004,61271233, 61471203), 2016年安徽省高校領軍人才引進與培育計劃項目(gxfxZD2016013),安徽師范大學博士科研啟動基金(2016XJJ129)
: The National Natural Science Foundation of China (61401004, 61271233, 61471203), The Plan of Introduction and Cultivation of University Leading Talents in Anhui (gxfxZD2016013), The Startup Project of Anhui Normal University Doctor Scientific Research (2016XJJ129)
1)http://skype.gmw.cn/
2)http://iptv.cntv.cn/
3)PPLive是一款互聯網上視頻直播的P2P網絡電視
4)PPStream是集P2P直播點播于一身的網絡電視軟件
5)http://www.sopcast.cn/
6)http://tvants.en.softonic.com/
7)http://www.cntv.cn/
8)http://www.bittorrent.com/
9)http://www.qq.com/
10)http://dl.xunlei.com/
11)http://www.sopcast.cn/