邵壯豐,許洪東,周 俊,徐超仁
(1.中國電信股份有限公司廣東分公司網絡監控維護中心 廣州 510081;2.中國電信股份有限公司廣東分公司網絡運營部 廣州 510081)
隨著三網融合的演進,IPTV業務已成為電信運營商一個重要的發展業務,截至2012年底,廣東IPTV用戶超過300萬,當前廣東IPTV用戶規模和平臺規模都走在國內外前列。由于IPTV是一個很復雜的服務應用,運營IPTV業務對于電信網絡中日益復雜的應用服務是一個巨大的挑戰。為了保證服務質量,保障網絡結構的最優化,中國電信股份有限公司廣東分公司(以下簡稱廣東電信)不僅鞏固自身網絡建設,使之處在行業前列,也從IPTV業務服務質量角度出發,不斷提高IPTV業務競爭力。本文從廣東電信IPTV端到端架構、體驗指標體系、質量監控系統建設和在生產實踐中使用情況四大部分,闡述了在提升IPTV體驗質量的方法和效果。筆者使用SQM系統對全網IPTV業務質量進行了長達一年的監測,挖掘并解決系列影響廣東IPTV業務質量的“疑難雜癥”,實現IPTV業務質量優良率從94.9%提升至97.8%。
用戶端觀看的IPTV業務經由頭端節目源輸出、IPTV平臺服務器處理、網絡傳輸承載、終端接入和機頂盒解碼播出,其業務質量和這些環節息息相關,歸納了4個主要影響IPTV服務質量的因素,其可導致IPTV畫面質量變差。
·網絡側:可傳輸的視頻流總量最終由接入網上配置的帶寬限制,若帶寬需求的增長超過鏈路最大容量,會使數據分組被丟失,并最終造成屏幕畫面質量出現缺陷。運維數據統計發現,網絡擁塞、路由異常是影響IPTV業務體驗質量最主要的因素,約占所有影響業務質量的70%。
·平臺側:流媒體服務器異常,如網卡流量超負荷、應用服務異常導致CPU或內存超限,影響服務器端的發流。運維數據統計發現,平臺側影響IPTV業務服務器質量的比例占所有影響業務質量因素的14%。
·終端側:機頂盒解碼能力不足或緩沖區太小導致視頻流上溢。
·節目源:編碼器異常、節目源制作異常,導致節目源信號失真。
上述影響因素中,網絡側和平臺側的影響最大,網絡側和平臺側的影響,在實際的測量上,體現為終端機頂盒收到的視頻流數據分組缺失、亂序、時延等,故可通過測量傳輸層分組丟失和抖動的程度衡量IPTV業務視頻播放質量的優劣[1,2]。
業界對傳輸層媒體流傳輸指標(MDI)測量[1,3,4],用以表示預期的IPTV視頻質量,即最終的用戶服務質量。MDI結合抖動與數據分組丟失情況,判斷網絡傳輸優質視頻的能力,而不考慮編碼方法。MDI測量可作為一種診斷工具或質量指標使用,以監測網絡對IPTV節目視頻流到達時間及數據分組丟失敏感的信息。媒體流傳輸指標測量是遍及整個網絡的連續測量,而且可以在視頻源與機頂盒(STB)之間的任意點進行測量。MDI的兩個關鍵因素如下。
(1)延遲因數
延遲因數(DF)是在每個媒體流數據分組末端,觀察到的媒體數據到達和媒體數據送出之間的最大時間差。它假定送出速率為恒定位速率數據流的標稱恒定信息流速率或者為可變速率媒體流數據分組數據的分段計算信息流速率。DF是在計算間隔上流速失衡的最大觀測值。此緩沖媒體數據以byte為單位,通過表示為在標稱信息流速率條件下將該數據送出(或填入)所需的時間(單位為ms)得出DF。
(2)媒體丟失率
媒體丟失率(MLR)可以簡單定義為每秒鐘丟失的或非正常的媒體數據分組數量。對非正常數據分組的檢測非常重要,因為許多設備往往不對接收到的數據分組重新進行排序,而直接將其發送到解碼器。任何數據分組丟失(即出現非零MLR時)都會對視頻質量帶來不利影響,并造成視覺失真或異常以及不均勻的視頻回放。
在實際的應用中,由于流媒體有些使用TCP承載,分組丟失有重傳;在機頂盒處,可進行緩沖整流后再把流媒體數據分組送解碼器,因此在實際應用中,測量劣化的MDI(DF和MLR)值,有時難以直觀顯示IPTV業務視頻質量畫面是否對用戶視覺和聽覺感官有直接影響,因此需要在MDI可測數據的基礎上建立一個簡化的、直觀的衡量IPTV視頻質量的標準。廣東電信采用VMOS(video mean opinion score)直觀衡量IPTV視頻質量,VMOS是視頻質量的一種評價標準,分值為0~5,分值越高質量越好,反之越差。分值2和3是一個分界點,3表示“還可以”,2表示“勉強”,廣東電信現網VMOS值臨界點折中取2.5,小于2.5的記為質量差。
VMOS的算法記為:VMOS值=基準分-質量劣化扣分。其中,基準分由編碼參數、分辨率、碼流波動參數計算得到;扣分項由傳輸層MDI(DF和MLR)分組丟失次數、視頻不同位置的分組丟失的不同影響、視頻幀的損傷比率、錯誤傳播范圍等計算得到。VMOS值每秒計算一個值,得到每秒視頻質量優劣,將直觀的畫面質量用VMOS量化衡量。實測VMOS值對應圖像質量舉例如圖1所示。

圖1 實測VMOS值對應圖像情況
可以認為VMOS是定義瞬時(1 s)的IPTV視頻質量,實際上,衡量用戶使用IPTV業務,是需要考慮一個時間統計周期維度,如1 h、1天、1周或1月中質量的優劣,因此,對統計周期內視頻質量定義如下。
在統計周期中,定義可用率=100%-(統計周期播放視頻出現質量差(VMOS<2.5)的時間(s)總和/統計周期播放視頻總時長)×100%,若可用率≤95%,則記該用戶在統計周期中視頻質量差,反之則視頻質量優良。
舉例:忙時(20:00-21:00),用戶張三,看了49 min視頻,其中178 s出現VMOS≤2.5,則該用戶可用率=100%-178/(49×60)×100%=93.9%,因此認為該用戶忙時出現視頻質量差。如果某分公司忙時有1 200個用戶出現質量差,忙時有60 000個用戶觀看過,則認為該分公司質量率=1 200/60 000×100%=2.0%。
為使系統的部署符合集約化運維和節能減排的原則,經過充分研究和論證,廣東IPTV服務質量監控(SQM)系統基于VMOS原理,采用B/S架構部署。同時SQM探針采用和現網流媒體服務器(HMS)合設的模式,且每個SQM探針規劃不超過50 Mbit/s的帶寬資源占用,確保既能達到IPTV質量監測的目標又不影響HMS自身性能和無需新購置獨立硬件探針需求。
截至2012年9月,在廣東IPTV省中心、地市區域和地市邊緣節點分布式部署了2 000多臺軟件探針,用于檢測HMS側 節 目 源VMOS值;同 時,在 現 網200多 萬EC1308和EC2108系列機頂盒部署了軟件探針,采集機頂盒處的VMOS值,整合得出全網的IPTV業務體驗質量,系統已于2011年底在全省21家分公司推廣使用。
使用SQM系統,在IPTV質量發現異常時進行告警,平臺管理員及時干預處理故障,在IPTV用戶報障前先行解決問題以保障用戶體驗質量,體現了SQM系統在IPTV運營中主動運維的成效。
例1:SQM系統在發現分公司IPTV質量差用戶比例偏離全省平均水平,較異常時,自動進行告警,監控部門通知IPTV管理員確認并解決問題。如2012年9月9-15日,廣東電信通過SQM系統發現并解決5例故障,見表1。
例2:使用SQM系統,統計全省質量差用戶,分析速率不達標數據,下發分公司針對性開展端口速率、線路質量整治,持續提升用戶體驗質量。
2011年9 月份以來,全省開展針對互視業務不達標端口速率整治、承載網網絡配置優化、平臺優化等一系列專項整治工作,廣東IPTV視頻質量優良率從2011年94.9%提升至2012年9月份的97.8%,整治效果較明顯,如圖2所示。
2012年8-9 月,SQM系統監測顯示廣東全省互視視頻質量周平均優良率在97%~98%;珠三角片區地市視頻質量靠前、整體質量較穩定;粵西、粵北地市視頻質量波動略大,如圖3所示。
IPTV是一種端到端業務,涉及終端機頂盒、承載網、CDN平臺、頭端播控系統和節目源多個環節。由于各環節由不同的廠商提供設備技術方案,IPTV端到端缺乏有效的業務質量統一監控手段,無法進行高效的用戶故障投訴處理和質量運維預警,影響了IPTV業務發展。本文提出IPTV服務質量監控指標體系,并在廣東建設IPTV SQM系統,在生產實踐中,利用SQM系統對現網IPTV質量進行了一年多的監測,挖掘并解決系列影響廣東IPTV業務質量的“疑難雜癥”,使廣東IPTV業務質量優良率從94%提升至97.8%,實際證明了SQM系統的有效性以及對IPTV業務質量提升有較大的作用。計劃未來把EPG操作的響應、頻道切換響應速度等系列用戶體驗質量指標逐步納入SQM系統統一監控,推動IPTV業務體驗質量進一步提升。

表1 SQM系統主動運維案例

圖2 2011-2012年廣東IPTV視頻質量變化趨勢

圖3 2012年8-9月廣東各地市IPTV視頻質量優良率
1 陳玉花,張治中,杜西亞.IPTV測試儀測試指標提取方案研究.電視技術,2009(2)
2 李穎姝.IPTV服務視頻質量客觀評估方法的研究.武漢理工大學碩士學位論文,2009
3 RFC4445.A Proposed Media Delivery Index(MDI),2006
4 Schwarz H,Marpe D,Wiegand T.Overview of the scalable video coding extension of the H.264/AVC standard.IEEE Transactions on Circuits and Systems for Video Technology,2007,17(9):1103~1120