999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于自適應分段廣延指數模型的IPTV用戶點播行為

2018-05-25 06:37:00陳步華陳戈梁潔
電信科學 2018年5期
關鍵詞:用戶模型

陳步華,陳戈,梁潔

(中國電信股份有限公司廣州研究院,廣東 廣州 510630)

1 引言

近年來,隨著互聯網應用的快速發(fā)展和網絡技術的不斷提升,流媒體技術得到了快速的發(fā)展,使得視頻點播業(yè)務占據了大量的網絡帶寬。為了降低網絡傳輸壓力以及減少帶寬限制帶來的影響,用戶請求的視頻內容在經由緩存服務器時會被緩存。當用戶對一個視頻發(fā)起訪問請求時,如果其內容已經存儲在緩存服務器中,就可以不從遠端的源站獲取視頻而直接從緩存服務器中獲取,從而達到降低網絡流量的效果,起到降低網絡運營成本的作用[1]。然而,緩存服務器的存儲空間以及配套資源是有限的,并且過度部署緩存服務器會造成資源和成本的浪費。因此,在視頻內容多樣性以及用戶請求并發(fā)性的條件下,優(yōu)化緩存服務器的系統(tǒng)配置,構建高性能低成本的視頻點播系統(tǒng)是非常必要的。基于這種現狀的考慮,由于用戶對不同視頻對象的訪問情況總是存在一定的傾向性,因此,研究視頻訪問的用戶行為能夠分析出什么類型的內容需要存儲在緩存服務器以及存儲這些內容需要占用多少存儲資源等,從而改善存儲資源分配不合理造成的緩存資源不足或者浪費。目前,用戶訪問行為研究的一項重點工作就是視頻的訪問熱度。

視頻訪問熱度代表了用戶對系統(tǒng)中視頻文件的觀看訪問情況,可以根據用戶對視頻的訪問次數來刻畫視頻訪問熱度。將視頻訪問熱度具體描述為:在一段時間里,對各個點播視頻的用戶訪問次數進行統(tǒng)計,并對所有視頻按照其對應的用戶請求次數降序排序,則一個點播視頻的訪問熱度即該視頻的位序[2]。

網絡協議電視(internet protocol television,IPTV)以網絡協議為基礎,面向電視終端,通過寬帶網向用戶提供交互式視頻業(yè)務[3],而利用IPTV視頻點播服務的訪問熱度進行深入分析和準確建模,對視頻內容的緩存策略設計是十分重要的。因此,改進基于視頻熱度的擬合曲線的擬合優(yōu)度就成了改善緩存策略的關鍵。

在對流媒體用戶點播行為的建模研究中,崔華杰[4]采用 Zipf模型進行回歸擬合視頻的訪問熱度,后來Guo等人[5]指出Zipf模型無法準確擬合某些自然現象具有的特征,同時,驗證了廣延指數(stretched exponential,SE)分布模型更適合刻畫實際系統(tǒng)視頻訪問請求次數的分布。廣延指數模型最早是由德國物理學家Kohlrausch于1847年提出的。對于其應用,Laherrere等人[6]率先提出,廣延指數模型可用于具有重尾現象的自然和社會經濟現象的描述中。后來,Guo等人[5]將廣延指數模型用于對流媒體系統(tǒng)的研究中,并對比了 Zipf模型的不足之處。因此,對于只采用一種曲線函數回歸擬合一段時間內系統(tǒng)中所有的點播視頻訪問數據難以獲得優(yōu)良的擬合效果,并且對于最常用的曲線擬合求解方法最小二乘法,也有一定的局限性。

因此,本文在對現有IPTV用戶視頻點播行為的數學模型進行調研的基礎上,應用回歸分析方法,并以廣延指數分布為建模基礎,提出了一種自適應分段廣延指數(ASSE)模型,用來進行IPTV視頻點播行為的模型構建,并提高了視頻訪問熱度模型曲線的擬合優(yōu)度。

2 視頻訪問熱度模型的構建

回歸分析是由英國著名生物學家兼統(tǒng)計學家Francis Galton[7]在研究人類遺傳問題時提出來的,用來確定兩種或兩種以上變量間的具體依賴關系,是建模和分析數據的重要工具。回歸分析通過直線或曲線來擬合一些數據點,使得這些數據點到直線或曲線的距離最小[8]。回歸屬于機器學習中有監(jiān)督學習的范疇,擬合得出的對應曲線稱為回歸曲線。用戶行為分析也是回歸分析擬合應用的重點之一。本節(jié)從點播視頻的用戶的角度出發(fā),利用回歸分析,主要針對視頻點播中的用戶訪問行為進行建模與分析,建立系統(tǒng)內一段時間對各視頻訪問次數的排序和用戶對這些視頻的訪問次數情況之間的函數關系模型。

本文提出的 ASSE模型以廣延指數分布為基礎,并根據設定的誤差閾值β來自適應地分段建模,并滿足分段曲線建模的連續(xù)性要求。本節(jié)將詳細介紹基于 ASSE方法的視頻訪問熱度模型的構建過程。

2.1 互補累積概率的計算

本文將擬合視頻位序與視頻訪問互補累積概率之間的關系曲線,其中,互補累積概率的計算方法具體如下:在一個n部IPTV點播視頻的系統(tǒng)中,對n部視頻的訪問概率由高到低排序,依次表示為p(1),p(2),…,p(n),則其對應的互補累積概率為:

本文選取從中國電信某省 IPTV系統(tǒng)日志中提取的部分數據,視頻總數為70 000部,分別統(tǒng)計每一部視頻的訪問次數,并計算每一部視頻的訪問概率,再按概率高低依次排序,得出所需要的一串訪問概率序列p(1),p(2),…,p(70 000);然后,根據式(1)計算出視頻點播行為的互補累積概率Pc(1),Pc(2),…,Pc(70 000)。

2.2 基礎擬合函數的處理

本文采用廣延指數分布函數作為基礎模型來擬合流媒體系統(tǒng)中用戶訪問點播視頻的情況。廣延指數分布的互補累積概率分布函數(complementary cumulative distribution function,CCDF)表示為:

其中,x代表視頻位序,Pc(x)代表互補累積概率,x0和c表示兩個常量參數,其中x0被稱為尺度參數,c被稱為廣延參數或形狀參數。對式(2)取兩次對數的通用表達式為:

根據式(3)進行坐標轉換,簡化為線性回歸函數模型,如式(4)所示:

其中,Y=ln[-lnPc(x)],X=lnx,b=-clnx0,x=1, 2, 3,…,n。

2.3 擬合曲線自適應分段

如第2.2節(jié)所述,本文采用廣延指數函數作為曲線擬合的基礎模型。但是,只采用一種函數擬合視頻位序與視頻訪問互補累積概率之間的關系,通常要求自變量與因變量之間有基于該函數的很強的依賴關系,否則,較難得到準確的擬合結果[9]。因此,可以通過將實際數據分成若干組,然后對每組數據再進行擬合的方法提高擬合的精度。擬合線段的條數可以根據具體的工程需求,人工進行設定,也可以采用其他分段方法。本文采用給定一個誤差閾值,若連續(xù)兩次誤差平方和高于該閾值,則停止該線段擬合的計算,由此來自適應地確定分段數。具體如下:設定一個誤差閾值β,若某數據點A及其下一個數據點B的擬合值和實際值之間的誤差平方和均高于該閾值(連續(xù)兩次誤差平方和高于該閾值)則停止該線段擬合的計算,并開始下一段曲線的擬合。

由此,根據閾值誤差閾值β,自適應地將實際數據分為m段,對每一段求解的方程如下:

由于曲線分段點處往往不能滿足擬合曲線的連續(xù)性[10]需求,如圖1所示。而且,目前用于解決分段擬合曲線連續(xù)性問題的方法均存在局限性。本文給出了一種帶約束條件的最優(yōu)化方案,即在曲線的分段點處,令上一擬合線段的最后一個擬合坐標值,一定落在下一條擬合線段上,作為約束條件。即對于式(5)的每一段的回歸模型(即m段曲線模型),令每一段曲線的分段點處的擬合值(X*,Y*)作為該擬合線段的起始點,即滿足式(6):

圖1 分段點處擬合值不連續(xù)示意

并且在該約束條件下,通過最小二乘法求解出該擬合線段的最優(yōu)參數c,進而可得b,則將式(5)作為每一段的回歸模型,結合式(6),可得:

其中,(X1*,Y1*), (X2*,Y2*),…, (X*m-1,Y*m-1)分別為第1段,第2段,…,第m?1段擬合曲線最后一個擬合點處(分段點)的擬合值。由此,實現了分段點處滿足一階連續(xù)的分段曲線擬合,直到所有分段點對應的擬合線段按照此方法建模求解出對應的每一段擬合線段對應的最優(yōu)參數(c1,b1),(c2,b2),(c3,b3),…,(cm,bm)。至此,建模完成,并且所有數據擬合完畢。

3 實驗設計與結果

3.1 實驗設置

在 IPTV業(yè)務的發(fā)展和運營過程中,IPTV系統(tǒng)已經積累了海量用戶行為數據。中國電信某省的IPTV系統(tǒng)每天產生近1 TB的數據文件,內容包括用戶收視行為日志、系統(tǒng)運行日志等[11],為對視頻點播用戶的行為進行建模,從中提取部分數據,包括視頻總數70 000部,訪問的規(guī)律基本滿足“二八定律”。基于如此龐大的用戶群體及其大量的真實用戶記錄,可以看出對IPTV CDN用戶的行為建模具有足夠的代表性與意義。

3.2 仿真結果與分析

因不同視頻數量下的 ASSE模的擬合情況均類似,因此,本文不再給出其他不同視頻數量下的ASSE模型回歸擬合結果。

3.2.1 ASSE模型在不同分段數下的擬合結果

實驗采用(X,Y)坐標系,并通過坐標轉換,令Y=ln[?lnPc(x)],X=lnx,其中,x代表視頻位序,Pc(x)代表互補累積概率。同時,設定不同閾值β進行自適應分段擬合。圖3給出了自適應分段數量(segment)分別為3、5、7、10的情況下,每天用戶對點播視頻的典型訪問情況建模結果如圖2所示。通過ASSE模型與實際數據擬合結果對比,可以看出,分段數越高,擬合的吻合程度越高。在分段數≥7的情況下,擬合結果與實際數據具備優(yōu)良的一致性。

3.2.2 ASSE模型與SE模型擬合結果對比分析

在構建模型的過程中,對模型的優(yōu)劣評估是十分重要的。本節(jié)將通過仿真結果對比本文提出的自適應分段廣延指數(ASSE)模型與廣延指數(SE)模型的優(yōu)劣。考慮到分段數不宜過多,并且要兼顧擬合精度,因此,本文選擇在分段數為7時,將提出的ASSE模型與SE模型的建模結果進行對比。對比結果如圖3所示。

如圖3所示,在分段數為7時,提出的ASSE模型比傳統(tǒng)的SE模型更符合實際數據的分布。實際數據、SE模型以及ASSE模型擬合出的互補累積概率如圖4所示。

圖5為實際數據、SE模型以及ASSE模型擬合結果之間的絕對誤差。實驗結果表明,對于絕大多數數據點的擬合誤差,本文提出的 ASSE模型的擬合誤差小于SE模型。尤其是對于大約前5 000部訪問熱片,SE模型擬合的誤差遠大于ASSE模型。擬合誤差越大,就越會導致用戶訪問流量的錯誤估計,進而導致對緩存設備的并發(fā)流量服務能力估計錯誤,并對緩存設備的系統(tǒng)并發(fā)服務能力配置有很大影響。此外,為了盡可能提高系統(tǒng)資源的利用率,對于訪問概率不同的視頻,會依據訪問概率而設定該視頻的緩存時間,通常來說,訪問概率高的視頻常常比訪問概率低的視頻的設定的緩存時間要長一些。所以,在對用戶視頻訪問行為預測中,擬合精度對視頻緩存的保留時間有著很大影響,進而影響預緩存策略。因此,本文提出的 ASSE模型由于提升了用戶訪問情況的擬合精度,對服務器的系統(tǒng)配置和熱片內容的預緩存策略的改善十分重要。

圖2 用戶對點播視頻的典型訪問情況建模結果

圖3 兩種模型的建模結果與實際數據的對比

圖4 互補累積概率擬合結果

圖5 兩種模型的建模的誤差結果的對比

此外,可以通過標準的檢驗方法來定量評估實際數據與回歸模型的擬合程度,擬合優(yōu)度是一種用來檢驗實際數據是否符合某個回歸擬合模型的統(tǒng)計方法[12]。因此,采用擬合優(yōu)度檢驗來檢驗本文提出的ASSE模型,并與SE模型進行進一步對比,由此來判斷模型的擬合效果,這兩種模型擬合的檢驗結果見表1。

表1 ASSE和SE擬合模型檢驗結果

由于R2越靠近1,表示實際樣本數據越靠近擬合模型,即擬合優(yōu)度越高。因此,從表1中可以看出,ASSE模型的擬合優(yōu)度0.994 8髙于SE模型的擬合優(yōu)度0.980 9。由此進一步說明,本文提出的ASSE模型不僅提高了曲線擬合的精度,并且與實際數據具有良好的一致性。基于此,本文提出的ASSE模型比SE模型更適合對IPTV用戶點播行為進行建模,并且能夠優(yōu)化系統(tǒng)配和改善視頻調度與緩存策略。

4 結束語

IPTV服務的發(fā)展趨勢是面向更龐大的用戶群和存儲更巨大的視頻數據,并為用戶提供更優(yōu)質的視頻體驗。在這種趨勢下,IPTV服務所面臨的主要挑戰(zhàn)是如何優(yōu)化IPTV CDN的系統(tǒng)性能,并同時降低部署與運營成本。為優(yōu)化 IPTV CDN系統(tǒng)的配置與性能,用戶行為分析是極其重要的一步。

本文利用提出的ASSE模型和SE模型分別對IPTV視頻點播用戶行為進行回歸擬合和對比分析,驗證了本文提出的ASSE模型不僅能夠更好地擬合出用戶視頻點播的熱度分布,并能夠為優(yōu)化IPTV CDN系統(tǒng)配置、改善視頻調度與存儲策略提供重要的指導作用。

參考文獻:

[1]張旺俊.Web緩存替換策略與預取技術的研究[D].合肥: 中國科學技術大學, 2011.ZHANG W J.Research on Web cache replacement strategy and prefetching technology[D].Hefei: University of Science and Technology of China, 2011.

[2]夏琰.基于實際用戶行為分析的緩存研究[D].合肥: 中國科學技術大學, 2011.XIA Y.Research on caching based on actual user behavior analysis[D].Hefei: University of Science and Technology of China, 2011.

[3]韋樂平.三網融合與 IPTV的發(fā)展和挑戰(zhàn)[J].電信科學,2006, 22(7):1-5.WEI L P.Triple-play and the development and challenges of IPTV[J].Telecommunications Science, 2006, 22(7):1-5.

[4]崔華杰.大型直播與點播IPTV系統(tǒng)的用戶行為分析[D].廣州: 中山大學, 2013.CUI H J.Dissecting user behaviors for a simultaneous live and VOD IPTV system[D].Guangzhou: Sun Yat-sen University,2013.

[5]GUO L, TAN E, CHEN S, et al.The stretched exponential distribution of internet media access patterns[C]//Twenty-Seventh ACM Symposium on Principles of Distributed Computing, PODC 2008, August 18-21, Toronto, Canada.New York:ACM Press, 2008: 283-294.

[6]LAHERRèRE J, SORNETTE D.Stretched exponential distributions in nature and economy: “fat tails” with characteristic scales[J].The European Physical Journal B - Condensed Matter and Complex Systems, 1998, 2(4): 525-539.

[7]趙晨陽, 翟少丹.高爾頓與相關理論的產生[J].西北大學學報:自然科學版, 2008, 38(4):680-684.ZHAO C Y, ZHUO S D.Galton and the invention of correlation[J].Journal of Northwestern University: Natural Science Edition, 2008, 38(4): 680-684.

[8]李祖亮.基于數學建模的經濟變量線性回歸統(tǒng)計預測研究[J].中國校外教育, 2011(2):142-142.LI Z L.Research on statistical prediction of linear regression of economic variables based on mathematical modeling[J].Education for Chinese After-School, 2011(2):142-142.

[9]賈丹華, 王潤潤, 王鵬.電信套餐資費預演中客戶量的預測方法研究[J].電信科學, 2011, 27(8): 25-32.JIA D H, WANG R R, WANG P.Research on prediction method of the amount of customers in Telecom services tariff preview[J].Telecommunications Science, 2011, 27(8): 25-32.

[10]呂游, 劉吉臻, 趙文杰, 等.基于分段曲線擬合的穩(wěn)態(tài)檢測方法[J].儀器儀表學報, 2012, 33(1): 194-200.LV Y, LIU J Z, ZHAO W J, et al.Steady-state detecting method based on piecewise curve fitting [J].Chinese Journal of Scientific Instrument, 2012, 33(1): 194-200.

[11]方艾, 張玉忠, 徐雄, 等.基于MapR的IPTV用戶收視行為分析的方案與實踐[J].電信科學, 2017, 33(2): 138-143.FANG A, ZHANG Y Z, XU X, et al.Scheme and practice of IPTV user viewing behavior analysis based on MapR[J].Telecommunications Science, 2017, 33(2): 138-143.

[12]王重, 劉黎明.擬合優(yōu)度檢驗統(tǒng)計量的設定方法[J].統(tǒng)計與決策, 2010(5): 154-156.WANG C, LIU L M.Setting method of statistics for goodness of fit[J].Statistics and Decision, 2010(5): 154-156.

猜你喜歡
用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 国产在线第二页| 欧美精品在线观看视频| 国产日韩欧美视频| 国产精品内射视频| 福利一区三区| 中文字幕第1页在线播| 国产成人你懂的在线观看| 国产精品欧美激情| 亚洲V日韩V无码一区二区| 亚洲欧美精品日韩欧美| 日本精品中文字幕在线不卡| 无遮挡一级毛片呦女视频| 国产成人高精品免费视频| 国产青榴视频| 国产精品成人免费视频99| 亚洲a免费| 国产精品无码一区二区桃花视频| 91外围女在线观看| 国产成人区在线观看视频| 国产精品尤物在线| 中文字幕亚洲综久久2021| 国产91线观看| 国产福利不卡视频| 亚洲精品成人片在线播放| 久久性视频| 亚洲香蕉伊综合在人在线| 久久亚洲美女精品国产精品| 伊人久久大香线蕉综合影视| 久久国产精品嫖妓| 狠狠v日韩v欧美v| 五月丁香在线视频| 免费毛片在线| 国产毛片不卡| 亚洲人成人伊人成综合网无码| 亚洲国产在一区二区三区| 青青青国产视频| 亚洲AV成人一区国产精品| 欧美成人午夜视频| 伊人久久青草青青综合| 久久男人视频| 谁有在线观看日韩亚洲最新视频| 欧美成人怡春院在线激情| 国产精品女熟高潮视频| 丝袜国产一区| 极品国产一区二区三区| 伊人福利视频| 亚洲一区二区三区国产精华液| 日本午夜三级| 亚洲三级电影在线播放| 亚洲成aⅴ人片在线影院八| 超级碰免费视频91| 精品国产三级在线观看| 亚洲侵犯无码网址在线观看| 2019年国产精品自拍不卡| 在线五月婷婷| 白丝美女办公室高潮喷水视频 | 国产成人禁片在线观看| 五月激情婷婷综合| 国产成人精品高清在线| 啪啪免费视频一区二区| 国产成人亚洲欧美激情| 欧洲亚洲欧美国产日本高清| 亚洲精品日产精品乱码不卡| 制服丝袜在线视频香蕉| 亚洲欧洲日韩综合色天使| 国模粉嫩小泬视频在线观看| 国内a级毛片| 精品国产女同疯狂摩擦2| 欧美国产综合色视频| 久久久久青草线综合超碰| 成人国产小视频| 毛片久久久| 又猛又黄又爽无遮挡的视频网站| 波多野结衣一区二区三区四区| 97色婷婷成人综合在线观看| 久久婷婷五月综合色一区二区| 国产白浆在线观看| 国产女人在线视频| 波多野结衣无码中文字幕在线观看一区二区| 日韩第一页在线| 欧美午夜视频在线| 亚洲AⅤ无码国产精品|