999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于預測度量值的IPTV用戶行為規則預測算法

2016-11-20 02:55:42汪敏娟嵇正鵬呂超
電信科學 2016年5期
關鍵詞:分類特征用戶

汪敏娟 ,嵇正鵬 ,呂超

(1.江蘇省公用信息有限公司,江蘇 南京210006;2.中國電信股份有限公司智慧家庭運營中心,江蘇 南京210006;3.中國電信股份有限公司江蘇分公司,江蘇 南京210003)

基于預測度量值的IPTV用戶行為規則預測算法

汪敏娟1,2,嵇正鵬3,呂超1.2

(1.江蘇省公用信息有限公司,江蘇 南京210006;2.中國電信股份有限公司智慧家庭運營中心,江蘇 南京210006;3.中國電信股份有限公司江蘇分公司,江蘇 南京210003)

提出了一種符合用戶行為的,基于海量IPTV用戶特征數據,對IPTV用戶進行分群和規則提取的算法模型。首先提出了符合用戶點播使用行為的IPTV用戶分群的描述維度,即通過基礎屬性描述用戶分群、通過點播行為描述用戶分群變化趨勢。然后提出了預測度量值的概念,對用戶分群的穩定性進行描述,并提出了對穩定的用戶分群提取點播行為概率的算法。最后通過大量的IPTV運營數據對算法模型進行了驗證分析。

IPTV;點播行為;等價類劃分;信息熵;預測度量值;規則提取

1 引言

IPTV(internet protocol television,網絡協議電視)是以網絡協議為基礎,面向電視終端,通過寬帶網向用戶提供交互式電視及增值服務的業務[1,2]。在業務的發展和運營過程中,IPTV平臺已積累了海量用戶特征屬性數據。這些數據是在用戶辦理業務和使用業務過程中積累的、對用戶基本信息和使用信息的描述。用戶特征屬性數據蘊含了豐富的用戶行為信息。如何在這些海量的信息中提取出有意義的用戶行為特征,用于有效地指導IPTV業務運營與服務,已成為當前研究的熱點問題。用戶行為特征的預測算法研究,無論對于運營商,還是對于用戶,都具有很高的經濟價值和實際意義。

國內外很多學者、運營機構對于IPTV用戶行為特征預測進行了研究。目前的研究工作主要通過計算用戶與內容的關聯關系、學習用戶興趣標簽、用戶聚類等角度展開。參考文獻[3]基于用戶聚類的關聯推薦算法,利用皮爾曼相關系數和斯皮爾曼相關系數來確定IPTV用戶群與內容之間的偏好關系;參考文獻[4]提出從業務的用戶使用場景出發,結合用戶標簽加強推薦的針對性;參考文獻[5]將一種單蟻群聚類應用于IPTV用戶群偏好分析中,解決了用戶偏好發現問題;參考文獻[6]提出了在沒有先驗知識的情況下,利用生態位理論計算IPTV服務之間的“競爭系數”,從而選取更為符合期望的服務的方法。上述工作都對利用IPTV用戶特征屬性信息進行用戶分類、通過用戶分類進行行為預測提供了有效解決方式。

在IPTV的實際運營過程中發現,用戶的特征屬性數據可分為基礎屬性和點播行為兩類。基礎屬性是描述用戶基本特征的數據(如所在地區、職業、產品套餐類型等);點播行為是在運營過程中產生的,隨著用戶使用業務而動態變化的數據(如平均消費值、最常收看的頻道類型等)。

用戶的點播行為是從無到有、不斷變化的,而往往具有相同基礎屬性的用戶在點播行為上表現出了一定的共性。另外,由于用戶使用IPTV業務均經歷了從陌生到熟悉的使用習慣培養過程,故處于不同狀態階段的用戶特征屬性數據對行為特征預測的貢獻是不同的。可見應該從已趨于穩定狀態的用戶群體中獲取行為特征,這樣得到的規則較為貼近實際運營情況。而目前從上述角度進行研究的工作較少。

為此,從研究某些IPTV用戶群是否適宜于進行用戶行為預測入手,建立了一種全新的IPTV用戶行為特征預測算法模型。首先利用IPTV用戶的基礎屬性對用戶進行基本分類,而后對每個基本分類中用戶的點播行為是否已經趨于穩定進行觀測。對于用戶點播行為已趨于穩定的用戶進行基本分類,計算出分類中點播行為出現的概率數據,利用此概率數據對IPTV用戶的行為進行預測。通過對實際運營應用數據的分析與比較,提出的算法模型有效地提升了IPTV用戶行為預測的準確性和用戶行為預測的計算效率。

2 IPTV用戶基本分類與預測度量值

2.1 IPTV用戶基本分類模型

研究的IPTV用戶行為特征預測算法模型,是以用戶特征屬性信息為基礎進行知識學習的計算模型。首先基于對用戶在各基礎屬性上的取值,通過等價關系運算來對IPTV用戶進行等價劃分,每個等價劃分對應一個用戶基本分類。

設 IPTV 用戶集合為 U={u1,u2,…,un}。設集合 T 為用戶的基礎屬性集,D為用戶點播行為集。T、D均為元素有限的已知集合,且T∩D=。

設 fj=U→Vj,(1≤j≤m)為用戶屬性取值判定函數,則f(ui,tj)=υij表示用戶ui在屬性tj下的屬性取值為υij,f(U,tj)=Vj表示用戶集合U在屬性tj上的取值集合。

設關系RT表示兩個用戶在基礎屬性集T上等價,即?ui∈U,uj∈U(1≤i≤n,1≤j≤n,且 i≠j),使?tk∈T,f(mi,tk)=f(mj,tk)。

定義 1 集合 Xi={uj|(ui,uj)∈Rt}為 IPTV用戶群的一個基本分類。

即在IPTV用戶集合U中,存在若干獨立的用戶,其在用戶基礎屬性集T上等價。那么通過關系RT可將IPTV用戶分為若干基本分類:{X1,X2,…,Xm},(m≤n)。

基于上述定義對IPTV用戶進行基礎分類劃分的算法模型如圖1所示。通過對IPTV用戶核心基礎屬性值與已知各IPTV用戶基本分類在核心基礎屬性上的取值相比較,在取值函數上取值相同的,即可將用戶劃分到該基本分類中。不斷地重復上述過程,即可不斷地根據用戶基礎屬性的取值來建立用戶基本分類。

2.2 基本分類的預測度量值

通過把IPTV用戶劃分為若干個基本分類后,即可開始對各分類在運營過程中的變化情況進行觀測。在參考文獻[7,8]中提出,在IPTV運營過程中,絕大多數的用戶會經歷從對業務不熟悉到逐漸形成自己使用習慣的過程。即大多數用戶使用了一定時期IPTV業務后,其對業務的使用習慣一般會停留在一個穩定的、有規律的狀態附近。但如何來確定某一個用戶基本分類已經趨于穩定,我們借鑒Shannon等人在參考文獻[9-11]提出的經典信息熵概念:任何信息都存在冗余,冗余的大小與信息微觀的不確定性有關。而信息熵就是用來描述信息源不確定程度的概念,即熵值越大,其不確定性越大;熵值越小,其確定性越大。

在對IPTV用戶的預測過程中,對于已經趨于穩定的用戶基本分類,其用戶體現同類型點播行為的可能性越大。本文提出的預測度量值,就是利用信息熵的概念,對每個基本分類中海量的用戶點播行為進行概率計算,用于判定當前的用戶基本分類是否已經趨于確定。

設通過第2.1節的理論對IPTV用戶集U劃分得到的用戶基本分類為{X1,X2,…,Xn}。在某一個基本分類 Xi中,設其點播行為集 D={d1,d2,…,dl},由于點播行為是變化的,故在基本分類中,每個用戶在相同的點播行為上取值可能不同。設基本分類Xi中所有用戶在屬性dj上的取值組成取值集合 Vj={υj1,υj2,…,υjs}。設 P(υjk)表示在基本分類 Xi中,點播行為dj的取值為υjk的概率。

依據信息熵的計算法則,定義IPTV用戶基本分類點播行為的信息熵如下。

定義2 某IPTV用戶基本中分類點播行為dj的信息熵為:

圖1 IPTV用戶基本分類劃分算法模型

H(dj)描述了某一個點播行為的不確定性。它通過其所有可能取值的變化情況來描述該屬性當前的狀態。對于一個IPTV用戶基本分類來說,其預測度量值為其包含的所有點播行為信息熵之和。

IPTV用戶基本分類的預測度量值為:

H(Xi)在傳統的對信息變化描述的基礎上,通過對IPTV用戶基本分類中點播行為變化情況的匯總,來表示當前分類整體點播行為的不確定性。

使用預測度量值表示在一個IPTV用戶的基本分類中,其所有用戶的點播行為是否已趨于穩定狀態。預測度量值越大,表示該分類中的用戶行為仍處于較為混亂的狀態,意味著該分類暫時無法用于用戶預測;預測度量值越小,表示該分類中的用戶行為已趨于穩定,意味著該分類已形成了一類用戶行為的描述。即隨著用戶逐步形成自己的使用習慣后,其點播行為雖仍在不斷變化,但已趨于某一種規律。

IPTV用戶基本分類預測度量值算法具體如下。

在算法偽代碼中,count(υjk)表示在點播行為dj的所有取值中,υjk出現的次數。|Xi|表示集合Xi的勢。

3 IPTV用戶行為規則分析

得到每個IPTV基本分類對應的預測度量值后,對低于預設閾值的基本分類,認為其已基本趨于穩定。在IPTV業務運營過程中,可根據當前各基本分類預測度量值實際取值和運營經驗來預設閾值。一般來說,在一定時間周期內,某個用戶基本分類的預測度量值停留在一個較低的取值區間且沒有發生較大范圍的波動時,可認為其已趨于穩定。

在趨于穩定的用戶基本分類Xi中,用戶在基礎屬性上等價,在點播行為上取值不同,但保持了一定的變化規律。因此可通過對基本分類Xi中IPTV用戶基礎屬性取值與點播行為取值的統計關系來得到某一類IPTV用戶的行為特征。

設點播行為集 D={d1,d2,…,dl},?dj∈D 的取值集合 f(Xi,dj)={υj1,υj2,…,υjs}。

則:

其中,count(υjk)表示在用戶基本分類 Xi中用戶點播行為 dj取值為 υjk的數量;|Xi|表示用戶基本分類 Xi的勢,即基本分類Xi中包含的用戶數量。

上述規則可按如下方式進行描述:在基本分類Xi中,有P的概率會發生dj=υjk的事件。

IPTV用戶基本分類的點播行為預測算法如下:

4 實驗分析

對N市12個月內IPTV用戶的行為進行了預測實驗。數據包括了N市IPTV用戶的基礎屬性和第1-12個月的點播行為數據。具體數據見表1。

首先根據用戶的基礎屬性對用戶進行分類,計算其預測度量值,并通過對已趨于穩定的用戶基本分類進行用戶行為特征預測,并將預測結果與12月的實際點播行為情況進行比對,以驗證預測規則的準確性。

按照提出的用戶基本分類算法,將N市分成了30余個用戶基本分類,針對各分類計算其1-11月的預測度量值。表2是N市用戶基本分類取值范圍的情況。從表2中可以看到,用戶基本分類的預測度量值處于一個“兩頭小、中間大”的狀態,即部分基本分類已趨于穩定、少量分類處于大量變化階段、多數用戶分類處于由不穩定到穩定的變化過程中。

表1 IPTV用戶特征屬性集

表2 N市用戶基本分類11月預測度量值情況

選取了預測度量值最小的3個基本分類、預測度量值最大的1個基本分類。其預測度量值1-11月份的變化情況如圖2所示。從圖2中可以看到,通過11個月的運營,用戶基本分類A、B、C的預測度量值已逐步由較高的取值降低到一個平緩的取值范圍,但也存在用戶基本分類D,其預測度量值始終處于不斷變化的狀態。

通過對上述用戶基本分類的走訪,發現用戶基本分類D中的絕大多數用戶屬于集體宿舍、賓館等形態的用戶。用戶流動性大、使用人群不固定,故其預測度量值始終處于一個變化的范圍。而對于基本分類A、B、C來說,其絕大多數IPTV業務用戶為普通家庭用戶,通過一段時間的業務使用,其使用習慣已逐漸趨于穩定,月均消費額、最常觀看的直播頻道、點播標簽等運營特征數據均已處于一個穩定的范圍內。

對于已趨于穩定的用戶基本分類A、B、C,可通過其特征屬性進行用戶行為特征的預測。通過IPTV用戶的預測算法,提取用戶基本分類 A、B、C中的行為規則,并將預測的規則與這3個基本分類在12個月的實際點播行為進行對比,用于驗證預測規則的準確性。對比情況見表 3。

從表3可以看到,3個用戶基本分類點播行為的預測值和實際值的誤差率都在8%以內,能夠有效地為運營人員針對不同的用戶基本分類進行有針對性的運營提供數據基礎。

圖2 N市部分IPTV用戶基本分類預測度量值變化情況

表3 預測規則與實際規則對比分析

5 結束語

提出了一種符合IPTV業務特征的分類及行為分析算法,結合實際運營經驗將IPTV用戶特征屬性劃分為基礎屬性和點播行為,利用基礎屬性對用戶進行分類,利用點播行為描述各用戶分類的變化情況,當用戶分類變化趨于穩定時,計算該基本分類中用戶的基礎屬性與點播行為之間的概率關系,并將該概率關系輸出為行為規則,用于指導IPTV業務運營。通過對實際運營數據的分析,本文提出的預測算法明顯地提升了IPTV用戶預測的準確性,也降低了IPTV用戶分類、行為規則提取的計算開銷。

在后續的工作中,需對IPTV用戶的特征屬性分類提出更為精確的劃分標準,并優化對IPTV用戶基礎屬性分類算法和計算規則的約定,進而通過大規模數據統計規律來優化對用戶點播行為信息熵、預測度量值的閾值估算方法。

[1]韋樂平.三網融合與IPTV的發展和挑戰[J].電信科學,2006,22(7):1-5.WEI L P.Triple-play and the development and challenges of IPTV[J].Telecommunications Science, 2006,22(7):1-5.

[2]XIAO Y,DU X,ZHANG J,HU F,et al.Internet protocol television (IPTV):the killer application for the next-generation internet [J].IEEE Communications Magazine,2007,45(11):126-134.

[3]KIM M W,SONG W M,SONG S Y,et al.Convergence and hybrid information technology [M].Berlin:Springer,2012:409-416.

[4]朱映波,刁建偉,康波.基于標簽對家庭IPTV業務個性化推送 機 制 的 用 戶 體 驗 優 化 研 究 [J]. 電 信 科 學 ,2014,30(7):113-120.ZHU Y B,DIAO J W,KANG B.User experience optimization researchbased on labelofIPTV households personalized pushmechanism [J].Telecommunications Science,2014,30(7):113-120.

[5]曹三省,孟靜,杜懷昌,等.蟻群聚類算法在IPTV用戶群偏好分析中的應用[J].中國傳媒大學學報(自然科學版),2009,16(1):33-37.CAO S X,MENG J,DU H C,et al.Ant clustering algorithm in the application of IPTV user group preference analysis [J].Journal of Communication University of China (Natural Science Edition),2009,16(1):33-37.

[6]SEOL H,PARK G,LEE H.Demand forecasting for new media services with consideration of competitiverelationships using the competitive bassmodeland the theory ofthe niche [J].TechnologicalForecasting& SocialChange,2012,79 (7):1217-1228.

[7]HELD G.Understanding IPTV[M].NewYork:ACM Press,2006.

[8]JIM J.Analysis of the IPTV increment service development strategy[J].Science&Technology Innovation Herald,2014.

[9]SHANNON C E.A mathematical theory of communication:mathematical theory of computation[M].New York:McGraw-Hill,1974:3-55.

[10]LIANG J,SHI Z,LI D,et al.Information entropy,rough entropy and knowledge granulation in incomplete information systems[J].International Journal of General Systems,2006,35(6):641-654.

[11]VALLé R.Information entropy and state observation of a dynamical system [C]/International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems,June 20-24,1987,Eindhoven,Netherlands.Berlin:Springer-Verlag,1987:403-405.

A rules extraction algorithm for IPTV customers forecasting based on the forecasting entropy measurement

WANG Minjuan1,2,JI Zhengpeng3,LV Chao1,2
1.Jiangsu Public Information Co.,Ltd.,Nanjing 210006,China 2.Smart Home Operation Center of China Telecom Co.,Ltd.,Nanjing 210006,China 3.Jiangsu Branch of China Telecom Co.,Ltd.,Nanjing 210003,China

An algorithm model conformed to the user behavior,based on the massive IPTV user characteristic data which extract rules and classify IPTV users was proposed.First,IPTV user group description dimension in accordance with the user on demand was put forward.Namely,the user group could be described by basic property and trend of user behavior could be described by users’demand behavior.Then the concept of prediction measurement was put forward,the stability of user group was described,and an algorithm which extracted demand behavior probability on stable user group was proposed.At last,the algorithm model was verified and analyzed by massive IPTV operation data.

IPTV,demand behavior,equivalent class,information entropy,prediction measurement,rule extraction

TP181

A

10.11959/j.issn.1000-0801.2016153

2016-03-22;

2016-05-15

汪敏娟(1975-),女,江蘇省公用信息有限公司副總經理,中國電信股份有限公司智慧家庭運營中心副主任、高級工程師,主要研究方向為IPTV運營規律、視頻承載網絡規劃、知識學習。

嵇正鵬(1964-),男,中國電信股份有限公司江蘇分公司企業發展部主任、教授級高級工程師,享受國務院特殊津貼,主要研究方向為多媒體網通信技術、視頻運營、數據挖掘。

呂超(1985-),男,江蘇省公用信息有限公司、中國電信股份有限公司智慧家庭運營中心工程師,主要從事大數據平臺開發、數據運營與維護工作。

猜你喜歡
分類特征用戶
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 久久国产精品嫖妓| 五月婷婷欧美| 67194亚洲无码| 免费高清a毛片| 日韩精品毛片人妻AV不卡| 亚洲欧美精品一中文字幕| 日韩无码视频网站| 国产精品一线天| 成人国产精品网站在线看| 国产麻豆福利av在线播放| 国模沟沟一区二区三区| 免费高清毛片| 欧美中文一区| 欧美日韩国产精品va| 中文字幕自拍偷拍| 国内嫩模私拍精品视频| 亚洲最新地址| 国产亚洲高清在线精品99| 日本久久久久久免费网络| 在线一级毛片| 国产欧美专区在线观看| 久久不卡国产精品无码| 欧美精品1区| 精品黑人一区二区三区| 国产综合无码一区二区色蜜蜜| 欧美啪啪一区| 精品国产黑色丝袜高跟鞋| 亚洲综合狠狠| 国产JIZzJIzz视频全部免费| 欧美成人怡春院在线激情| 久久无码免费束人妻| 国产精女同一区二区三区久| 91综合色区亚洲熟妇p| 亚洲欧美综合在线观看| 99在线视频精品| 国产精品视频系列专区| 国内精品视频| 欧美另类精品一区二区三区| 亚洲日本中文字幕天堂网| 国产精品伦视频观看免费| 日韩精品一区二区深田咏美| 欧美色视频日本| 91精品免费久久久| 91青青在线视频| 亚洲欧美日韩另类在线一| 丁香五月亚洲综合在线 | 福利姬国产精品一区在线| 国产精品lululu在线观看| 伊人久久久大香线蕉综合直播| 最近最新中文字幕在线第一页 | 呦女精品网站| 国产一区二区影院| 99999久久久久久亚洲| 中国丰满人妻无码束缚啪啪| 第一区免费在线观看| 精品国产美女福到在线不卡f| 91精品专区国产盗摄| 亚洲欧美日韩中文字幕在线| 91九色国产porny| 久久久噜噜噜| 免费aa毛片| 亚洲国产欧洲精品路线久久| 日日碰狠狠添天天爽| 亚洲视频欧美不卡| 一本久道热中字伊人| 99精品在线视频观看| 免费人成视频在线观看网站| 中文字幕永久在线看| 麻豆a级片| 亚洲一区二区三区国产精品 | 日本三级精品| 美女视频黄频a免费高清不卡| 自拍偷拍欧美日韩| 欧美人与性动交a欧美精品| 国产精品成人免费综合| 18禁高潮出水呻吟娇喘蜜芽| 久久久噜噜噜久久中文字幕色伊伊| 久久久久无码国产精品不卡| 四虎亚洲国产成人久久精品| aaa国产一级毛片| 国产手机在线小视频免费观看 | 亚洲日本中文字幕天堂网|