999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于預測度量值的IPTV用戶行為規則預測算法

2016-11-20 02:55:42汪敏娟嵇正鵬呂超
電信科學 2016年5期
關鍵詞:分類特征用戶

汪敏娟 ,嵇正鵬 ,呂超

(1.江蘇省公用信息有限公司,江蘇 南京210006;2.中國電信股份有限公司智慧家庭運營中心,江蘇 南京210006;3.中國電信股份有限公司江蘇分公司,江蘇 南京210003)

基于預測度量值的IPTV用戶行為規則預測算法

汪敏娟1,2,嵇正鵬3,呂超1.2

(1.江蘇省公用信息有限公司,江蘇 南京210006;2.中國電信股份有限公司智慧家庭運營中心,江蘇 南京210006;3.中國電信股份有限公司江蘇分公司,江蘇 南京210003)

提出了一種符合用戶行為的,基于海量IPTV用戶特征數據,對IPTV用戶進行分群和規則提取的算法模型。首先提出了符合用戶點播使用行為的IPTV用戶分群的描述維度,即通過基礎屬性描述用戶分群、通過點播行為描述用戶分群變化趨勢。然后提出了預測度量值的概念,對用戶分群的穩定性進行描述,并提出了對穩定的用戶分群提取點播行為概率的算法。最后通過大量的IPTV運營數據對算法模型進行了驗證分析。

IPTV;點播行為;等價類劃分;信息熵;預測度量值;規則提取

1 引言

IPTV(internet protocol television,網絡協議電視)是以網絡協議為基礎,面向電視終端,通過寬帶網向用戶提供交互式電視及增值服務的業務[1,2]。在業務的發展和運營過程中,IPTV平臺已積累了海量用戶特征屬性數據。這些數據是在用戶辦理業務和使用業務過程中積累的、對用戶基本信息和使用信息的描述。用戶特征屬性數據蘊含了豐富的用戶行為信息。如何在這些海量的信息中提取出有意義的用戶行為特征,用于有效地指導IPTV業務運營與服務,已成為當前研究的熱點問題。用戶行為特征的預測算法研究,無論對于運營商,還是對于用戶,都具有很高的經濟價值和實際意義。

國內外很多學者、運營機構對于IPTV用戶行為特征預測進行了研究。目前的研究工作主要通過計算用戶與內容的關聯關系、學習用戶興趣標簽、用戶聚類等角度展開。參考文獻[3]基于用戶聚類的關聯推薦算法,利用皮爾曼相關系數和斯皮爾曼相關系數來確定IPTV用戶群與內容之間的偏好關系;參考文獻[4]提出從業務的用戶使用場景出發,結合用戶標簽加強推薦的針對性;參考文獻[5]將一種單蟻群聚類應用于IPTV用戶群偏好分析中,解決了用戶偏好發現問題;參考文獻[6]提出了在沒有先驗知識的情況下,利用生態位理論計算IPTV服務之間的“競爭系數”,從而選取更為符合期望的服務的方法。上述工作都對利用IPTV用戶特征屬性信息進行用戶分類、通過用戶分類進行行為預測提供了有效解決方式。

在IPTV的實際運營過程中發現,用戶的特征屬性數據可分為基礎屬性和點播行為兩類。基礎屬性是描述用戶基本特征的數據(如所在地區、職業、產品套餐類型等);點播行為是在運營過程中產生的,隨著用戶使用業務而動態變化的數據(如平均消費值、最常收看的頻道類型等)。

用戶的點播行為是從無到有、不斷變化的,而往往具有相同基礎屬性的用戶在點播行為上表現出了一定的共性。另外,由于用戶使用IPTV業務均經歷了從陌生到熟悉的使用習慣培養過程,故處于不同狀態階段的用戶特征屬性數據對行為特征預測的貢獻是不同的。可見應該從已趨于穩定狀態的用戶群體中獲取行為特征,這樣得到的規則較為貼近實際運營情況。而目前從上述角度進行研究的工作較少。

為此,從研究某些IPTV用戶群是否適宜于進行用戶行為預測入手,建立了一種全新的IPTV用戶行為特征預測算法模型。首先利用IPTV用戶的基礎屬性對用戶進行基本分類,而后對每個基本分類中用戶的點播行為是否已經趨于穩定進行觀測。對于用戶點播行為已趨于穩定的用戶進行基本分類,計算出分類中點播行為出現的概率數據,利用此概率數據對IPTV用戶的行為進行預測。通過對實際運營應用數據的分析與比較,提出的算法模型有效地提升了IPTV用戶行為預測的準確性和用戶行為預測的計算效率。

2 IPTV用戶基本分類與預測度量值

2.1 IPTV用戶基本分類模型

研究的IPTV用戶行為特征預測算法模型,是以用戶特征屬性信息為基礎進行知識學習的計算模型。首先基于對用戶在各基礎屬性上的取值,通過等價關系運算來對IPTV用戶進行等價劃分,每個等價劃分對應一個用戶基本分類。

設 IPTV 用戶集合為 U={u1,u2,…,un}。設集合 T 為用戶的基礎屬性集,D為用戶點播行為集。T、D均為元素有限的已知集合,且T∩D=。

設 fj=U→Vj,(1≤j≤m)為用戶屬性取值判定函數,則f(ui,tj)=υij表示用戶ui在屬性tj下的屬性取值為υij,f(U,tj)=Vj表示用戶集合U在屬性tj上的取值集合。

設關系RT表示兩個用戶在基礎屬性集T上等價,即?ui∈U,uj∈U(1≤i≤n,1≤j≤n,且 i≠j),使?tk∈T,f(mi,tk)=f(mj,tk)。

定義 1 集合 Xi={uj|(ui,uj)∈Rt}為 IPTV用戶群的一個基本分類。

即在IPTV用戶集合U中,存在若干獨立的用戶,其在用戶基礎屬性集T上等價。那么通過關系RT可將IPTV用戶分為若干基本分類:{X1,X2,…,Xm},(m≤n)。

基于上述定義對IPTV用戶進行基礎分類劃分的算法模型如圖1所示。通過對IPTV用戶核心基礎屬性值與已知各IPTV用戶基本分類在核心基礎屬性上的取值相比較,在取值函數上取值相同的,即可將用戶劃分到該基本分類中。不斷地重復上述過程,即可不斷地根據用戶基礎屬性的取值來建立用戶基本分類。

2.2 基本分類的預測度量值

通過把IPTV用戶劃分為若干個基本分類后,即可開始對各分類在運營過程中的變化情況進行觀測。在參考文獻[7,8]中提出,在IPTV運營過程中,絕大多數的用戶會經歷從對業務不熟悉到逐漸形成自己使用習慣的過程。即大多數用戶使用了一定時期IPTV業務后,其對業務的使用習慣一般會停留在一個穩定的、有規律的狀態附近。但如何來確定某一個用戶基本分類已經趨于穩定,我們借鑒Shannon等人在參考文獻[9-11]提出的經典信息熵概念:任何信息都存在冗余,冗余的大小與信息微觀的不確定性有關。而信息熵就是用來描述信息源不確定程度的概念,即熵值越大,其不確定性越大;熵值越小,其確定性越大。

在對IPTV用戶的預測過程中,對于已經趨于穩定的用戶基本分類,其用戶體現同類型點播行為的可能性越大。本文提出的預測度量值,就是利用信息熵的概念,對每個基本分類中海量的用戶點播行為進行概率計算,用于判定當前的用戶基本分類是否已經趨于確定。

設通過第2.1節的理論對IPTV用戶集U劃分得到的用戶基本分類為{X1,X2,…,Xn}。在某一個基本分類 Xi中,設其點播行為集 D={d1,d2,…,dl},由于點播行為是變化的,故在基本分類中,每個用戶在相同的點播行為上取值可能不同。設基本分類Xi中所有用戶在屬性dj上的取值組成取值集合 Vj={υj1,υj2,…,υjs}。設 P(υjk)表示在基本分類 Xi中,點播行為dj的取值為υjk的概率。

依據信息熵的計算法則,定義IPTV用戶基本分類點播行為的信息熵如下。

定義2 某IPTV用戶基本中分類點播行為dj的信息熵為:

圖1 IPTV用戶基本分類劃分算法模型

H(dj)描述了某一個點播行為的不確定性。它通過其所有可能取值的變化情況來描述該屬性當前的狀態。對于一個IPTV用戶基本分類來說,其預測度量值為其包含的所有點播行為信息熵之和。

IPTV用戶基本分類的預測度量值為:

H(Xi)在傳統的對信息變化描述的基礎上,通過對IPTV用戶基本分類中點播行為變化情況的匯總,來表示當前分類整體點播行為的不確定性。

使用預測度量值表示在一個IPTV用戶的基本分類中,其所有用戶的點播行為是否已趨于穩定狀態。預測度量值越大,表示該分類中的用戶行為仍處于較為混亂的狀態,意味著該分類暫時無法用于用戶預測;預測度量值越小,表示該分類中的用戶行為已趨于穩定,意味著該分類已形成了一類用戶行為的描述。即隨著用戶逐步形成自己的使用習慣后,其點播行為雖仍在不斷變化,但已趨于某一種規律。

IPTV用戶基本分類預測度量值算法具體如下。

在算法偽代碼中,count(υjk)表示在點播行為dj的所有取值中,υjk出現的次數。|Xi|表示集合Xi的勢。

3 IPTV用戶行為規則分析

得到每個IPTV基本分類對應的預測度量值后,對低于預設閾值的基本分類,認為其已基本趨于穩定。在IPTV業務運營過程中,可根據當前各基本分類預測度量值實際取值和運營經驗來預設閾值。一般來說,在一定時間周期內,某個用戶基本分類的預測度量值停留在一個較低的取值區間且沒有發生較大范圍的波動時,可認為其已趨于穩定。

在趨于穩定的用戶基本分類Xi中,用戶在基礎屬性上等價,在點播行為上取值不同,但保持了一定的變化規律。因此可通過對基本分類Xi中IPTV用戶基礎屬性取值與點播行為取值的統計關系來得到某一類IPTV用戶的行為特征。

設點播行為集 D={d1,d2,…,dl},?dj∈D 的取值集合 f(Xi,dj)={υj1,υj2,…,υjs}。

則:

其中,count(υjk)表示在用戶基本分類 Xi中用戶點播行為 dj取值為 υjk的數量;|Xi|表示用戶基本分類 Xi的勢,即基本分類Xi中包含的用戶數量。

上述規則可按如下方式進行描述:在基本分類Xi中,有P的概率會發生dj=υjk的事件。

IPTV用戶基本分類的點播行為預測算法如下:

4 實驗分析

對N市12個月內IPTV用戶的行為進行了預測實驗。數據包括了N市IPTV用戶的基礎屬性和第1-12個月的點播行為數據。具體數據見表1。

首先根據用戶的基礎屬性對用戶進行分類,計算其預測度量值,并通過對已趨于穩定的用戶基本分類進行用戶行為特征預測,并將預測結果與12月的實際點播行為情況進行比對,以驗證預測規則的準確性。

按照提出的用戶基本分類算法,將N市分成了30余個用戶基本分類,針對各分類計算其1-11月的預測度量值。表2是N市用戶基本分類取值范圍的情況。從表2中可以看到,用戶基本分類的預測度量值處于一個“兩頭小、中間大”的狀態,即部分基本分類已趨于穩定、少量分類處于大量變化階段、多數用戶分類處于由不穩定到穩定的變化過程中。

表1 IPTV用戶特征屬性集

表2 N市用戶基本分類11月預測度量值情況

選取了預測度量值最小的3個基本分類、預測度量值最大的1個基本分類。其預測度量值1-11月份的變化情況如圖2所示。從圖2中可以看到,通過11個月的運營,用戶基本分類A、B、C的預測度量值已逐步由較高的取值降低到一個平緩的取值范圍,但也存在用戶基本分類D,其預測度量值始終處于不斷變化的狀態。

通過對上述用戶基本分類的走訪,發現用戶基本分類D中的絕大多數用戶屬于集體宿舍、賓館等形態的用戶。用戶流動性大、使用人群不固定,故其預測度量值始終處于一個變化的范圍。而對于基本分類A、B、C來說,其絕大多數IPTV業務用戶為普通家庭用戶,通過一段時間的業務使用,其使用習慣已逐漸趨于穩定,月均消費額、最常觀看的直播頻道、點播標簽等運營特征數據均已處于一個穩定的范圍內。

對于已趨于穩定的用戶基本分類A、B、C,可通過其特征屬性進行用戶行為特征的預測。通過IPTV用戶的預測算法,提取用戶基本分類 A、B、C中的行為規則,并將預測的規則與這3個基本分類在12個月的實際點播行為進行對比,用于驗證預測規則的準確性。對比情況見表 3。

從表3可以看到,3個用戶基本分類點播行為的預測值和實際值的誤差率都在8%以內,能夠有效地為運營人員針對不同的用戶基本分類進行有針對性的運營提供數據基礎。

圖2 N市部分IPTV用戶基本分類預測度量值變化情況

表3 預測規則與實際規則對比分析

5 結束語

提出了一種符合IPTV業務特征的分類及行為分析算法,結合實際運營經驗將IPTV用戶特征屬性劃分為基礎屬性和點播行為,利用基礎屬性對用戶進行分類,利用點播行為描述各用戶分類的變化情況,當用戶分類變化趨于穩定時,計算該基本分類中用戶的基礎屬性與點播行為之間的概率關系,并將該概率關系輸出為行為規則,用于指導IPTV業務運營。通過對實際運營數據的分析,本文提出的預測算法明顯地提升了IPTV用戶預測的準確性,也降低了IPTV用戶分類、行為規則提取的計算開銷。

在后續的工作中,需對IPTV用戶的特征屬性分類提出更為精確的劃分標準,并優化對IPTV用戶基礎屬性分類算法和計算規則的約定,進而通過大規模數據統計規律來優化對用戶點播行為信息熵、預測度量值的閾值估算方法。

[1]韋樂平.三網融合與IPTV的發展和挑戰[J].電信科學,2006,22(7):1-5.WEI L P.Triple-play and the development and challenges of IPTV[J].Telecommunications Science, 2006,22(7):1-5.

[2]XIAO Y,DU X,ZHANG J,HU F,et al.Internet protocol television (IPTV):the killer application for the next-generation internet [J].IEEE Communications Magazine,2007,45(11):126-134.

[3]KIM M W,SONG W M,SONG S Y,et al.Convergence and hybrid information technology [M].Berlin:Springer,2012:409-416.

[4]朱映波,刁建偉,康波.基于標簽對家庭IPTV業務個性化推送 機 制 的 用 戶 體 驗 優 化 研 究 [J]. 電 信 科 學 ,2014,30(7):113-120.ZHU Y B,DIAO J W,KANG B.User experience optimization researchbased on labelofIPTV households personalized pushmechanism [J].Telecommunications Science,2014,30(7):113-120.

[5]曹三省,孟靜,杜懷昌,等.蟻群聚類算法在IPTV用戶群偏好分析中的應用[J].中國傳媒大學學報(自然科學版),2009,16(1):33-37.CAO S X,MENG J,DU H C,et al.Ant clustering algorithm in the application of IPTV user group preference analysis [J].Journal of Communication University of China (Natural Science Edition),2009,16(1):33-37.

[6]SEOL H,PARK G,LEE H.Demand forecasting for new media services with consideration of competitiverelationships using the competitive bassmodeland the theory ofthe niche [J].TechnologicalForecasting& SocialChange,2012,79 (7):1217-1228.

[7]HELD G.Understanding IPTV[M].NewYork:ACM Press,2006.

[8]JIM J.Analysis of the IPTV increment service development strategy[J].Science&Technology Innovation Herald,2014.

[9]SHANNON C E.A mathematical theory of communication:mathematical theory of computation[M].New York:McGraw-Hill,1974:3-55.

[10]LIANG J,SHI Z,LI D,et al.Information entropy,rough entropy and knowledge granulation in incomplete information systems[J].International Journal of General Systems,2006,35(6):641-654.

[11]VALLé R.Information entropy and state observation of a dynamical system [C]/International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems,June 20-24,1987,Eindhoven,Netherlands.Berlin:Springer-Verlag,1987:403-405.

A rules extraction algorithm for IPTV customers forecasting based on the forecasting entropy measurement

WANG Minjuan1,2,JI Zhengpeng3,LV Chao1,2
1.Jiangsu Public Information Co.,Ltd.,Nanjing 210006,China 2.Smart Home Operation Center of China Telecom Co.,Ltd.,Nanjing 210006,China 3.Jiangsu Branch of China Telecom Co.,Ltd.,Nanjing 210003,China

An algorithm model conformed to the user behavior,based on the massive IPTV user characteristic data which extract rules and classify IPTV users was proposed.First,IPTV user group description dimension in accordance with the user on demand was put forward.Namely,the user group could be described by basic property and trend of user behavior could be described by users’demand behavior.Then the concept of prediction measurement was put forward,the stability of user group was described,and an algorithm which extracted demand behavior probability on stable user group was proposed.At last,the algorithm model was verified and analyzed by massive IPTV operation data.

IPTV,demand behavior,equivalent class,information entropy,prediction measurement,rule extraction

TP181

A

10.11959/j.issn.1000-0801.2016153

2016-03-22;

2016-05-15

汪敏娟(1975-),女,江蘇省公用信息有限公司副總經理,中國電信股份有限公司智慧家庭運營中心副主任、高級工程師,主要研究方向為IPTV運營規律、視頻承載網絡規劃、知識學習。

嵇正鵬(1964-),男,中國電信股份有限公司江蘇分公司企業發展部主任、教授級高級工程師,享受國務院特殊津貼,主要研究方向為多媒體網通信技術、視頻運營、數據挖掘。

呂超(1985-),男,江蘇省公用信息有限公司、中國電信股份有限公司智慧家庭運營中心工程師,主要從事大數據平臺開發、數據運營與維護工作。

猜你喜歡
分類特征用戶
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 国产一级毛片在线| 国产特级毛片aaaaaaa高清| 欧美亚洲一区二区三区导航| 国模粉嫩小泬视频在线观看| 情侣午夜国产在线一区无码| 国产欧美日韩综合在线第一| 在线a网站| 国产精品视频a| 成人日韩精品| 久久超级碰| 亚洲91精品视频| 欧美日本在线一区二区三区| 亚洲最大福利视频网| 日韩AV无码一区| 91亚瑟视频| 色偷偷av男人的天堂不卡| 国产精品视频导航| AV不卡在线永久免费观看| 亚洲精品国产精品乱码不卞| lhav亚洲精品| 中文字幕色站| 国产网站黄| 成年片色大黄全免费网站久久| 毛片大全免费观看| 综合网久久| 五月天香蕉视频国产亚| 亚洲国产成人精品青青草原| 久久黄色影院| 不卡无码网| 在线观看热码亚洲av每日更新| 中文字幕日韩欧美| 色悠久久久久久久综合网伊人| 色婷婷在线播放| 国产欧美日韩18| 久久精品aⅴ无码中文字幕| 亚洲资源站av无码网址| 国产亚洲精品91| 毛片久久久| 男女性午夜福利网站| 99在线视频免费观看| 日韩精品无码一级毛片免费| 国产精品成| 狠狠色丁香婷婷| 国产精品成| a亚洲视频| 久久久久亚洲av成人网人人软件| 丰满的少妇人妻无码区| 麻豆国产在线观看一区二区| 91麻豆国产视频| 欧美一区二区人人喊爽| 亚洲欧美成人| 国产欧美在线观看一区| 亚洲欧洲自拍拍偷午夜色无码| 热99精品视频| 国产网友愉拍精品| 色综合婷婷| 国产一区免费在线观看| 日韩黄色大片免费看| 大陆国产精品视频| 国产精品黄色片| 精品亚洲国产成人AV| 日本成人精品视频| 久久免费成人| 免费国产高清视频| 亚洲欧美日韩中文字幕一区二区三区| 999精品免费视频| 99久久免费精品特色大片| 天堂成人av| 麻豆精品久久久久久久99蜜桃| 国产欧美日韩专区发布| 午夜老司机永久免费看片 | 亚洲日韩精品伊甸| 国产精鲁鲁网在线视频| 国产在线一区视频| 亚洲成人黄色在线观看| 国产一级片网址| 亚洲综合色婷婷中文字幕| 免费看美女毛片| 国产欧美日韩91| 欧美一级夜夜爽| 不卡的在线视频免费观看| 在线观看欧美精品二区|