摘 要:為提高網絡直播視頻的用戶體驗效果,本文運用貝葉斯判別和多項式回歸等方法研究關鍵影響因素(初始緩沖時延和卡頓時長)與網絡側變量的關系。結果顯示端到端環回時間越長,對初始緩沖峰值速率要求越高;播放階段平均下載速率對單次卡頓時長的影響顯著。由此對網絡視頻傳輸建設提出了改進意見。
關鍵詞:用戶體驗;網絡側變量;貝葉斯判別;多項式回歸
中圖分類號:TP37;TP183 文獻標識碼:A 文章標號:2096-4706(2018)12-0049-05
Network Transmission Construction and User Experience Improvement in
Live Broadcasting Platform Based on Data Analysis
ZHANG Yuqi1,WU Yenan1,HE Yingyu2
(1.Hangzhou Normal University Jing Hengyi Honors College,Hangzhou 310036,China;
2.Hangzhou Normal University Science College,Hangzhou 310036,China)
Abstract:In order to improve the user experience effect of network live video,this paper uses Bayesian discriminant and polynomial regression to study the relationship between the key factors (initial buffer delay and Carton time) and network side variables. The results show that the longer the end-to-end loop time and the higher the initial buffer peak rate is required,and the average download rate in the playback stage has a significant effect on the single-shot Katon time. Therefore,improvements are proposed for the construction of network video transmission.
Keywords:user experience;network side variables;Bayesian discriminant;polynomial regression
0 引 言
智能移動終端的技術不斷發展更新,使得網絡直播這一新興的傳播方式在當下獨占鰲頭。然而許多直播視頻在緩沖階段和播放過程中存在著各種問題,使得用戶的觀看體驗不佳,直播平臺也難以推廣?,F有資料表明,視頻播放中斷率和初始緩沖時長是最影響用戶體驗的兩個因素[1,2]。研究者們致力于分析網絡視頻的時延敏感性,并研究視頻播放中斷概率的影響因素。如熊永華等運用了隨機預測和馬爾科夫預測對視頻緩沖時延進行預測[3];李曉龍等基于排隊理論得到了視頻播放中斷概率與初始播放緩沖時延以及視頻播放速率等參數的關系[4]。但上述方法往往需要收集大量數據且計算繁復,分析過程與方法也較為復雜,不具有廣泛的應用性。
本文根據一系列包含視頻參數的數據,運用多項式回歸和貝葉斯判別等方法,研究用戶體驗評價變量(如卡頓時長占比、初始緩沖時延)與網絡側變量(如播放階段平均下載速率、端到端環回時間、初始緩沖峰值速率)之間的關系,從而對直播視頻網站的網絡傳輸建設提出改進意見。
1 視頻播放階段
卡頓時長占比是指在視頻播放過程中,除去初始緩沖階段的暫停外,播放時多次出現卡頓的時間總和與視頻總播放時長的比值,其取值為0~1之間的任意數;卡頓次數是指視頻播放過程中出現暫停的次數。通過經驗公式推導得到卡頓時長占比p與卡頓次數n、單次卡頓時長tc以及視頻播放階段的總時長tn的關系:p=tb/tn=n×tc/tn。
1.1 卡頓次數
本文選取貝葉斯(Bayes)判別法[5]考察影響卡頓次數的因素。假設隨機變量的集合U={A1,A2,…,Am,C},其中C是類別變量,其取值范圍是C={C1,C2,…,Cn};A1,A2,…,Am是特征變量,ai是特征Ai的取值,i=1,2,…m。于是,待判別樣本xi={a1,a2,…,am}屬于類別Cj的概率為:
當時,認為樣本xi屬于類別Ch。
本文選取的屬性變量為初始緩沖峰值速率v、端到端環回時間te、播放階段平均速率va;類別變量為卡頓次數,共分為2、3、4、5次四個類別。因此,判別函數可簡記為一個關于卡頓次數和三個網絡側變量之間的映射n=F(va,v,te)。
在卡頓次數大于1的2668組數據中,選取前1800組作為貝葉斯判別的訓練樣本,隨機選取剩余數據中的90條數據作為測試樣本(共3組測試樣本)。我們認為測試數據與實際數據差距在±1次的誤差內,考慮接受此測試數據,即判定為與實際數據吻合,如表1所示。
由于篇幅原因,此處僅展示測試樣本1(正確率為83.33%)。結果顯示測試樣本2的正確率為83.33%,測試樣本3的正確率為90.00%,以上三組測試數據的平均正確率為85.56%。
1.2 單次卡頓時長
現在考慮另一個影響卡頓時長占比的關鍵性因素——單次卡頓時長。初始緩沖峰值速率是視頻播放前初始緩沖階段數據下載速率的峰值。所獲數據中,視頻播放前的初始緩沖數據量大致為定值,對后續視頻加載的影響可看作一個常量。因此,在研究視頻卡頓時長占比的過程中,初始緩沖峰值速率不作為卡頓比的自變量進行探討。
端到端環回時間[6]代表了網絡因素導致的時延,是一個基于TCP的通信中的重要性能指標,其大小會影響TCP啟動速度,但目前暫無研究表明它在穩定數據流的情況下會對視頻播放階段的卡頓時間產生直接影響。播放階段的平均下載速率是視頻在后續播放過程中數據下載的平均速率。如果把播放和緩沖比喻為一個簡單的追及問題,那么當緩沖的速率趕不上播放的速率時,視頻就會出現卡頓現象,終端利用卡頓的時間緩沖下載數據量,使之能與播放的速率匹配,視頻得以繼續播放。因此,播放階段平均下載速率是影響視頻卡頓的重要因素。
單次卡頓所需下載數據總量sp可表示為sp=tr×k,其中K表示視頻碼率,tr表示單次卡頓重播放門限。二者均屬于視頻參數,本文選取的數據中tr=2.7s,k=2934kbps。單次卡頓所需下載數據總量下載完成時,視頻便可結束卡頓,繼續播放。單次卡頓時長tc可表示為:tc=,其中表示卡頓時數據下載平均速率。分別考慮用反例函數和推廣后的反比例函數對單次卡頓時長與播放階段的平均下載速率va進行擬合,函數形式依次為:。
數值模擬結果如圖1所示,檢驗結果如表2所示。
其中,Sstalling表示視頻的卡頓得分,p表示卡頓時長占比。當視頻的卡頓時長占比在0.2及以上時,視頻卡頓得分恒為1分,可知此時用戶體驗非常不佳。當視頻的卡頓時長占比小于0.13時,用戶對卡頓的感知較卡頓時長占比位于0.13至0.23之間時更敏感,卡頓得分隨著卡頓時長占比的提升急劇下降。
2 初始緩沖階段
初始緩沖階段可分為數據解析階段和數據下載緩沖階段兩個子階段,三者關系如圖3所示。視頻解析階段[7]的時長與視頻服務平臺及終端設計原理有關,通常為端到端環回時間的某個倍數。視頻下載階段的時長可以表示為所需初始緩沖數據量與初始數據下載速率之比。其中,初始緩沖峰值速率[8]是指視頻初始緩沖階段達到的最大順時速率(周期100ms),與緩沖數據量、端到端環回時間、當時當地無線鏈路能力以及無線負載能力相關。是視頻下載階段時長的最為關鍵的決定因素之一。
2.1 初始緩沖時延
初始緩沖階段需要下載的數據量Sa可表示為視頻碼率與初始緩沖量的乘積Sa=4k。本文選取的數據中初始緩沖量均為4s(時間量),視頻碼率與上一節相同,即k=2934 kbps。數據下載階段的時長tl可以表示為所需初始緩沖數據量與初始數據下載速率之比,即。初始數據下載速率的主要影響因素包括視頻在初始緩沖階段的峰值下載速率v和視頻播放階段的平均下載速率va,將三者之間的映射關系設為。因此,初始緩沖時延t與三個網絡側變量的關系可表示如下:
其中,視頻解析階段時長tu表示為端到端環回時間te的某個倍數,即tu=q·te。
本文先后選取了指數函數、推廣的指數函數、對數函數與推廣的對數函數等對進行擬合,發現R2都小于0.3,說明擬合優度均不佳。因此,為將錯綜復雜的非線性問題轉化為易于分析和求解的線性問題,本文選取多項式回歸[9]實現變量之間的轉化,從而可對初始緩沖時延進行預測。多項式回歸相較于其他的回歸分析方法有一個顯著的優點,它可以依次增加x項的次數,逐步逼近實測點。通過觀察模擬效果和誤差分析以達到最好的效果[9],本文分別選取了線性函數()、二次多項式函數()與三次多項式函數( )對初始階段平均下載速率進行回歸分析。觀察發現,在逐步增加多項式次數的同時,雖然擬合優度在逐漸提高,但多項式的項數也在逐漸變高,隨之帶來的是計算量的急劇增加。當選取三次多項式時,三次項的次數均在10-8~10-11之間,與二次項系數平均相差了4個數量級,其影響可忽略不計;且其擬合優度與二元二次多項式相比并沒有顯著的提升,故本文選取二元二次多項式描述初始數據下載速率,如表3所示。
其中,Sloading表示視頻緩沖得分,t表示初始緩沖時延。當初始緩沖時延大于9.7s時,視頻緩沖得分維持在最低分1分,說明此時用戶感知的初始緩沖時延超過最大承受限度;當視頻的初始緩沖時延小于9.7s時,視頻緩沖得分與初始緩沖時延成反比例函數關系。影響視頻緩沖得分的主要網絡指標是視頻初始緩沖峰值速率和端到端環回時間。初始緩沖峰值速率低會導致下載速率受限,數據下載極端時延大。端到端環回時間長會導致視頻業務解析交互時延增大。
3 檢驗分析與誤差分析
3.1 檢驗分析
聯合顯著性檢驗(Joint Hypotheses Test)是通過聯合假設檢驗[10](F檢驗)完成的,其本質是檢驗所有解釋變量整體對被解釋變量影響的顯著程度。F-statistic取值愈大,意味著解釋變量對被解釋變量的聯合影響愈強,二者的相關性愈強。由表4可得,Adjusted R-squared值為0.7706。此外,發現回歸方程聯合假設檢驗(F-test)的結果F-statistic值為5.995×104,且p-value:<2.2×10-16,認為所有解釋變量聯合影響被解釋變量的作用非常顯著。
3.2 誤差分析
此外,將擬合數據(預測值)與實際數據(真實值)進行誤差分析,從有效數據中隨機選取300組,對初始緩沖時延的真實值與預測值進行比較,如圖5與表5所示。由于頁面有限,表5中僅展示其中30組數據。可以發現,其相對誤差的均值為0.0855s,絕對誤差的均值為6.7035%,均屬于可接受范圍。
4 結 論
本文運用貝葉斯判別對卡頓次數進行預測,選取推廣的反比例函數對卡頓時長進行建模,并采用二次多項式函數對初始緩沖階段的平均下載速率進行數學表述,由此得到了初始緩沖時延、卡頓時長占比這兩個影響用戶體驗的關鍵因素與三個網絡側變量(初始緩沖峰值速率、播放階段平均下載速率、端到端環回時間)之間的關系。可知影響視頻緩沖得分的主要網絡側變量是視頻初始緩沖峰值速率和端到端環回時間。影響初始緩沖峰值速率的因素有無線網絡覆蓋、系統規格、終端傳輸能力、空口負載瞬時和邊緣無線網絡干擾等。影響端到端環回時間的因素有無線網絡系統規格、系統負載、終端處理時延、基站傳輸時延、網元轉發時延和網絡視頻服務器響應時間等。影響視頻卡頓得分的主要網絡側變量是視頻的卡頓時長占比,其影響因素包括無線網絡邊緣覆蓋率、區域用戶數量與容量之間的平衡。
研究發現端到端環回時間數值越大,信令交互階段時間越長,留給數據下載緩沖階段的時間越短,對初始緩沖峰值速率要求越高。同時,播放階段平均下載速率對單次卡頓時長的影響顯著,提高播放階段平均下載速率可減少卡頓次數,降低單次卡頓時長。因此,為了提高用戶體驗,直播平臺可以通過提升區域內高峰值速率覆蓋比例來提高平均下載速率。
參考文獻:
[1] Florin Dobrian,Vyas Sekar,Asad Awan,et al. Under-standing the impact of video quality on user engagement [J].ACM SIGCOMM Computer Communication Review,2011,41(4):362-373.
[2] DE P T,JOSEPH W,MARTENS L,et al. Quantifying the influence of rebuffering interruptions on the user's quality of experience during mobile video watching [J].IEEE Transactions on Broadcasting,2013,59(1):47-61.
[3] 熊永華.基于TCP的實時流媒體自適應傳輸策略及其應用研究 [D].長沙:中南大學,2009.
[4] 李曉龍.無線環境下多媒體傳輸服務質量研究 [D].合肥:中國科學技術大學,2014.
[5] 馬達.基于貝葉斯的判別理論及其算法實現 [D].北京:中國地質大學(北京),2011.
[6] 趙飛龍,梅杓春,余輪.移動通信網的QoE測量及其量化方法 [J].電子測量與儀器學報,2010,24(3):230-236.
[7] 王冼,廖振松,胡玉祥.4G視頻業務用戶感知評估體系研究 [J].信息通信,2015(3):230-231.
[8] 陳楚雄,柯江毅,覃道滿.視頻業務體驗評估和優化提升探討 [J].郵電設計技術,2017(2):17-23.
[9] 付凌暉,王惠文.多項式回歸的建模方法比較研究 [J].數理統計與管理,2004(1):48-52.
[10] 劉明.線性回歸模型的統計檢驗關系辨析 [J].統計與信息論壇,2011,26(4):21-24.
作者簡介:張雨琪(1997.03-),女,漢族,浙江杭州人,本科在讀。研究方向:應用數學;通訊作者:何穎俞(1973.12-),女,漢族,浙江建德人,講師,博士。研究方向:應用數學。