999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于標(biāo)簽對(duì)家庭IPTV業(yè)務(wù)個(gè)性化推送機(jī)制的用戶體驗(yàn)優(yōu)化研究

2014-02-28 06:12:22朱映波刁建偉劉勝強(qiáng)
電信科學(xué) 2014年7期
關(guān)鍵詞:關(guān)聯(lián)規(guī)則內(nèi)容

朱映波,刁建偉,康 波,劉勝強(qiáng)

(1.中國(guó)電信股份有限公司數(shù)字音樂運(yùn)營(yíng)中心 廣州510810;2.中國(guó)電信股份有限公司廣東研究院 廣州510630)

1 引言

愛音樂卡拉OK已成為中國(guó)電信IPTV業(yè)務(wù)中最受歡迎且發(fā)展最快的增值業(yè)務(wù),其遙控器的操作方式帶來更高的人機(jī)交互成本,迫切需要業(yè)務(wù)系統(tǒng)進(jìn)行主動(dòng)的內(nèi)容推送機(jī)制。不同于基于PC、手機(jī)等個(gè)人終端的業(yè)務(wù),卡拉OK作為一種家庭業(yè)務(wù),服務(wù)器端對(duì)用戶主體的家庭客戶身份認(rèn)定與客戶端即時(shí)使用者的個(gè)體用戶身份之間存在明顯的信息不對(duì)稱,若直接使用傳統(tǒng)的推薦算法基于家庭客戶數(shù)據(jù)計(jì)算推薦規(guī)則,則當(dāng)規(guī)則作用于個(gè)體的家庭成員時(shí),往往造成即時(shí)使用者收到適合其他家庭成員的推薦內(nèi)容,直接造成用戶體驗(yàn)度降低。

另一方面,一些推薦算法,如關(guān)聯(lián)規(guī)則、協(xié)同式過濾等,當(dāng)用于實(shí)際業(yè)務(wù)時(shí),本身也隱藏一些無數(shù)理邏輯錯(cuò)誤但卻不完全吻合用戶體驗(yàn)的地方,比較典型的如內(nèi)容缺少點(diǎn)播記錄造成無法輸出推送規(guī)則的“冷啟動(dòng)”問題、傾向于優(yōu)先推薦熱門內(nèi)容的“馬太”效應(yīng)。這些都需要根據(jù)具體的業(yè)務(wù)情況進(jìn)行逐一修正和處理。同時(shí),在卡拉OK業(yè)務(wù)嚴(yán)格的內(nèi)容審核過程中產(chǎn)生了優(yōu)質(zhì)的內(nèi)容標(biāo)簽數(shù)據(jù),具有定義準(zhǔn)確、結(jié)構(gòu)化程度高、數(shù)據(jù)完整無缺失等特點(diǎn),是優(yōu)化家庭客戶個(gè)性化推送規(guī)則的寶貴資源。

針對(duì)以上問題和背景,設(shè)計(jì)卡拉OK業(yè)務(wù)的推送機(jī)制優(yōu)化工作流程如下。

(1)選擇關(guān)鍵標(biāo)簽:計(jì)算不同標(biāo)簽對(duì)用戶選擇歌曲的影響力,選取關(guān)鍵標(biāo)簽確保對(duì)優(yōu)化工作的針對(duì)性,并提升計(jì)算效率。

(2)選擇符合業(yè)務(wù)使用情景的基礎(chǔ)推薦算法:從用戶體驗(yàn)出發(fā),結(jié)合客戶端的推送應(yīng)用場(chǎng)景,選擇與用戶行為最吻合的基礎(chǔ)推薦算法。

(3)結(jié)合標(biāo)簽數(shù)據(jù)的推送機(jī)制進(jìn)行優(yōu)化:包括對(duì)IPTV個(gè)性化推薦中的家庭客戶身份認(rèn)定不對(duì)稱性問題的解決、關(guān)聯(lián)規(guī)則本身馬太效應(yīng)的克制、無關(guān)聯(lián)規(guī)則歌曲的規(guī)則補(bǔ)漏。

2 關(guān)鍵標(biāo)簽的選取

針對(duì)用戶選擇歌曲這一特定行為,篩選對(duì)其影響顯著的關(guān)鍵標(biāo)簽,以確保標(biāo)簽對(duì)用戶歌曲選擇行為的解釋能力,同時(shí)剔除冗余標(biāo)簽,以避免數(shù)據(jù)相關(guān)性對(duì)內(nèi)容相似度算法精確性造成的不利影響。該工作分為兩個(gè)階段:計(jì)算不同標(biāo)簽對(duì)用戶選擇歌曲行為的效用大小;利用相關(guān)性檢驗(yàn)剔除冗余標(biāo)簽,選出關(guān)鍵標(biāo)簽簇。

卡拉OK內(nèi)容審核的標(biāo)簽體系共有11個(gè)大類130個(gè)標(biāo)簽項(xiàng),表1是部分內(nèi)容的示例。

2.1 測(cè)度不同標(biāo)簽對(duì)用戶選擇歌曲的效用值

確定標(biāo)簽權(quán)重的方法有定量和定性兩大類。定性方法主要有Delphi法和AHP(analytic hierarchy process,層次分析)法等,定量方法包括變異系數(shù)法、因子分析及響應(yīng)模型判定等。定量方法相對(duì)客觀,但結(jié)果的經(jīng)濟(jì)意義模糊,且很容易受樣本數(shù)據(jù)結(jié)構(gòu)的影響,并不一定反映用戶的真實(shí)心理認(rèn)知;而Delphi法更適用于戰(zhàn)略性決策,對(duì)打分的專家的能力要求很高,且工作流程十分繁瑣(需經(jīng)多輪反復(fù)達(dá)成一致意見)。比較而言,集合專家意見的半定量分析法——層次分析法最適合該研究情景。在該研究中只需考慮各標(biāo)簽對(duì)用戶選擇歌曲影響力的大小,故只需建立單層模型,過程簡(jiǎn)介如下。

(1)建立權(quán)重判斷矩陣

為了保證得到權(quán)重的客觀性,筆者在確定權(quán)重時(shí)請(qǐng)到多位音樂專家及業(yè)務(wù)運(yùn)營(yíng)管理人員就各類標(biāo)簽對(duì)用戶選擇歌曲的影響力大小進(jìn)行評(píng)判,沿用了AHP創(chuàng)始人Saaty T L提出的1~9分的比例標(biāo)度法作為依據(jù)給出分值。專家團(tuán)隊(duì)對(duì)各標(biāo)簽進(jìn)行兩兩比較,給出它們相對(duì)重要性的判斷值,全部n個(gè)標(biāo)簽經(jīng)過兩兩判定之后,形成一個(gè)比較判斷矩陣B,如下:

其中,bij為標(biāo)簽相對(duì)于標(biāo)簽的重要度。

表1 卡拉OK歌曲標(biāo)簽表(部分)

(2)計(jì)算單準(zhǔn)則條件下標(biāo)簽的權(quán)重系數(shù)

運(yùn)用特征根法(eigenvalue method,EM)計(jì)算該權(quán)重系數(shù),并將其歸一化為各標(biāo)簽對(duì)用戶選擇歌曲的權(quán)重向量。對(duì)于判斷矩陣B,計(jì)算滿足BW=λmaxW的特征根與特征向量。其中,λmax為B的最大特征根,W為對(duì)應(yīng)于λmax的正規(guī)化特征向量,W的分量Wi即相應(yīng)標(biāo)簽i單排序的權(quán)值。

(3)進(jìn)行一致性檢驗(yàn)

為了保證所得權(quán)重的合理性及正確性,在計(jì)算權(quán)重向量后,應(yīng)對(duì)每個(gè)判斷矩陣進(jìn)行一致性檢驗(yàn),無法通過一致性檢驗(yàn)的矩陣,反饋給打分者對(duì)標(biāo)簽分值進(jìn)行適當(dāng)修改。一致性檢驗(yàn)系數(shù)CR為:

其中,一致性指標(biāo)CI可表示為:

RI為平均隨機(jī)一致性指標(biāo),由Saaty T L給出,見表2。

當(dāng)CR≤0.1時(shí),一般認(rèn)為該判斷矩陣具有滿意的一致性;當(dāng)CR>0.1時(shí),則認(rèn)為該判斷矩陣不具有一致性,應(yīng)該調(diào)整判斷值,直到通過一致性檢驗(yàn)。

(4)實(shí)際的計(jì)算結(jié)果

綜合各專家打分,得到結(jié)果矩陣(見表3),其中原始的1~9分值被平均后轉(zhuǎn)化為小數(shù)。

計(jì)算出的最大特征根λmax=12.08,對(duì)應(yīng)的特征向量為(0.33 0.35 0.54 0.120.30 0.38 0.37 0.26 0.10 0.06 0.07)。一致性檢驗(yàn)系數(shù)CR=0.107,基本通過一致性檢驗(yàn)。可以看到,對(duì)用戶選擇歌曲的行為而言,歌曲影響年代(0.54)、音樂風(fēng)格(0.38)和音樂心情(0.37)是效用值最高的3個(gè)標(biāo)簽,在實(shí)際業(yè)務(wù)運(yùn)營(yíng)中必須優(yōu)先考慮。

2.2 剔除冗余標(biāo)簽

標(biāo)簽體系中可能存在的高相關(guān)性會(huì)對(duì)后繼的相似度計(jì)算等應(yīng)用的準(zhǔn)確性產(chǎn)生顯著影響,并加大計(jì)算量,因此需要進(jìn)行測(cè)量并剔除冗余標(biāo)簽。由于標(biāo)簽數(shù)據(jù)多為離散的列名變量,在計(jì)算相關(guān)系數(shù)時(shí)不宜采用常規(guī)的皮氏或斯氏系數(shù),宜采用專門用于測(cè)量列名變量獨(dú)立性的χ2卡方檢驗(yàn),其統(tǒng)計(jì)量的計(jì)算式如下:

其中,nij為標(biāo)簽1的第i水平與標(biāo)簽2的第j水平交叉的樣本頻數(shù),而eij為對(duì)應(yīng)的期望頻數(shù),計(jì)算式如下:

表2 平均隨機(jī)一致性指標(biāo)

表3 歌曲標(biāo)簽比較判斷矩陣

在大樣本下,該統(tǒng)計(jì)量服從自由度為(r-1)×(c-1)的卡方分布,其中r表示標(biāo)簽1的水平數(shù),c表示標(biāo)簽2的水平數(shù)。通常在0.05的置信度水平下拒絕兩個(gè)標(biāo)簽相互獨(dú)立的零假設(shè),判定二者有明顯的關(guān)聯(lián)性,即P(x≥χ2)<0.05。

以音樂心情為例,計(jì)算各心情標(biāo)簽(共計(jì)17個(gè))兩兩比較的卡方獨(dú)立檢驗(yàn)統(tǒng)計(jì)量的截尾概率,最終獲得表4的矩陣(截尾概率越小,代表對(duì)應(yīng)的兩項(xiàng)標(biāo)簽關(guān)聯(lián)性越高)。

表4中大量的數(shù)值很小,提示很多標(biāo)簽之間是非獨(dú)立的。結(jié)合專家意見進(jìn)行整理以后,獲得如下幾個(gè)關(guān)鍵的標(biāo)簽集中代表音樂心情,見表5。

由此獲得最能代表歌曲嗓音類型特點(diǎn)的6個(gè)變量,從而降低后繼推送規(guī)則計(jì)算中的計(jì)算量。類似地,諸如音樂風(fēng)格等有復(fù)選結(jié)構(gòu)的標(biāo)簽項(xiàng)也采用相同的方式進(jìn)行處理。

3 符合業(yè)務(wù)使用情景的個(gè)性化推薦算法的選擇

個(gè)性化推薦算法是個(gè)性化推薦機(jī)制的核心,目前主流的方法有基于內(nèi)容相似度的推薦和基于行為相似用戶的推薦,后者又可分為協(xié)同式過濾和關(guān)聯(lián)規(guī)則,兩種算法簡(jiǎn)要介紹如下。

3.1 典型關(guān)聯(lián)規(guī)則算法

關(guān)聯(lián)規(guī)則挖掘就是發(fā)現(xiàn)數(shù)據(jù)集中項(xiàng)集之間有趣的關(guān)聯(lián)或相互聯(lián)系,是數(shù)據(jù)挖掘領(lǐng)域的一個(gè)重要分支。設(shè)I={i1,i2,…,im}是項(xiàng)的集合,D是數(shù)據(jù)庫事務(wù)的集合,每個(gè)事務(wù)T是不同項(xiàng)的集合,使得T哿I。設(shè)A是一個(gè)項(xiàng)集,事務(wù)T包含A,當(dāng)且僅當(dāng)A哿T。關(guān)聯(lián)規(guī)則是形如A圯B的蘊(yùn)含式,其中A奐I,B奐I,并且A∩B=。規(guī)則A、B在事務(wù)集D中成立,具有支持度support和置信度confidence,support=(A圯B)=P(A∩B);confidence=(A圯B)=P(B|A)。同時(shí)滿足最小支持度閾值(min_sup)和最小置信度(min_conf)的規(guī)則,就可作為輸出的強(qiáng)關(guān)聯(lián)規(guī)則。

表4 歌曲標(biāo)簽卡方獨(dú)立檢驗(yàn)結(jié)果矩陣

表5 關(guān)鍵歌曲標(biāo)簽的卡方獨(dú)立檢驗(yàn)顯著性水平矩陣

關(guān)聯(lián)規(guī)則的挖掘過程分為兩步:生成所有頻繁項(xiàng)集,項(xiàng)集的出現(xiàn)頻率不小于min_sup;由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,規(guī)則必須同時(shí)滿足min_sup和min_conf。

關(guān)聯(lián)規(guī)則的一個(gè)關(guān)鍵問題是對(duì)生成規(guī)則的選取,主要通過各種對(duì)規(guī)則重要性的度量如支持度support和置信度confidence,選擇最優(yōu)規(guī)則。

3.2 典型協(xié)同式過濾算法

協(xié)同過濾算法是個(gè)性化推薦中應(yīng)用最廣泛的方法,基于鄰居用戶的興趣愛好預(yù)測(cè)目標(biāo)用戶的興趣偏好。先使用統(tǒng)計(jì)技術(shù)k-NN(nearest-neighbor,最近鄰)算法,尋找與目標(biāo)用戶有相同喜好的鄰居,然后根據(jù)目標(biāo)用戶鄰居的偏好產(chǎn)生向目標(biāo)用戶的推薦。算法包括如下3個(gè)階段。

(1)表示

輸入數(shù)據(jù)通常可以表示為一個(gè)m×n的矩陣形式,即項(xiàng)目評(píng)估矩陣R,m是用戶數(shù),n是項(xiàng)數(shù),rij是第i個(gè)用戶對(duì)第j項(xiàng)的評(píng)估值,這樣的評(píng)估值可以有幾個(gè)等級(jí)。矩陣R可表示為:

(2)鄰居形成

基于協(xié)同過濾技術(shù),推薦系統(tǒng)的核心是為當(dāng)前用戶尋找最相似的“最近鄰居”集,即對(duì)一個(gè)用戶,要產(chǎn)生一個(gè)根據(jù)相似度大小排列的“鄰居”集合U={u1,u2,…,uS},u不屬于U,從u1到uS,按與u的相似度sim(u,ui)從大到小排列。用戶之間的相似性測(cè)度可使用Pearson相關(guān)度方法和目前常用的夾角余弦計(jì)算方法。確定鄰居用戶有兩種方法:一是根據(jù)預(yù)先確定的相似性閾值,選擇相關(guān)性大于閾值的作為鄰居用戶;二是根據(jù)預(yù)先確定的鄰居數(shù)k,選擇相關(guān)性最大的前k個(gè)用戶作為鄰居用戶。

(3)產(chǎn)生推薦

“最近鄰居”集產(chǎn)生后,可計(jì)算用戶對(duì)任意項(xiàng)的興趣度和推薦集。設(shè)定用戶u和相應(yīng)的已選項(xiàng)集Iu,則任意項(xiàng)t對(duì)用戶u的效用值uu,t計(jì)算如下:

其中,ru是用戶u對(duì)所有項(xiàng)的平均評(píng)價(jià)分值,ui是“最近鄰居”集中的用戶,sim(u,ui)是用戶u和用戶ui之間的相似度,ri,t是用戶ui對(duì)項(xiàng)t的評(píng)估值,ri是用戶ui對(duì)所有項(xiàng)的平均評(píng)價(jià)分值。按照效用測(cè)度值的高低即可產(chǎn)生用戶的推薦集。

3.3 基于用戶體驗(yàn)和使用場(chǎng)景選擇基礎(chǔ)推薦算法

卡拉OK業(yè)務(wù)作為一種電視業(yè)務(wù),只能使用遙控器進(jìn)行人機(jī)交互,導(dǎo)致用戶交互成本較高。對(duì)于需要用戶打分的協(xié)同式過濾算法來說,要用戶對(duì)大多數(shù)歌曲進(jìn)行打分顯然會(huì)增大用戶的操作成本,影響用戶操作的流暢性進(jìn)而降低用戶體驗(yàn),也更容易造成用戶對(duì)項(xiàng)目評(píng)估矩陣R的高度稀疏,進(jìn)而影響推薦的效果。相比之下,關(guān)聯(lián)推薦由于無需用戶主動(dòng)打分的環(huán)節(jié),實(shí)施的難度相對(duì)較小,但同樣存在“冷啟動(dòng)”的問題,即內(nèi)容在無點(diǎn)播記錄的情況下,無法完成推送規(guī)則的計(jì)算,為彌補(bǔ)關(guān)聯(lián)規(guī)則的這一漏洞,可使用基于內(nèi)容相似度的推送機(jī)制,本文建立的關(guān)鍵標(biāo)簽選取機(jī)制已經(jīng)為相似度計(jì)算提供了良好的數(shù)據(jù)基礎(chǔ)。

在卡拉OK業(yè)務(wù)中選擇關(guān)聯(lián)規(guī)則而非協(xié)同式過濾的另一個(gè)重要原因是基于用戶使用場(chǎng)景——為降低用戶操作成本,提升用戶交互流暢性,最好的推薦時(shí)機(jī)是在用戶點(diǎn)選或播放某首歌時(shí),這不同于以商品銷售為目的的電商網(wǎng)站(綜合用戶所有的購買記錄再向其推薦最吻合的貨品),優(yōu)先考慮的是人機(jī)交互操作的流暢性,對(duì)算法的要求是與當(dāng)前內(nèi)容的高關(guān)聯(lián)性。從這個(gè)場(chǎng)景出發(fā),關(guān)聯(lián)規(guī)則無疑比普通的協(xié)同式過濾更為適用。

4 內(nèi)容推送機(jī)制的優(yōu)化

4.1 對(duì)家庭客戶身份認(rèn)定不對(duì)稱的解決方案

卡拉OK是基于IPTV的家庭業(yè)務(wù),用戶唯一標(biāo)識(shí)是寬帶ID代表的家庭客戶,而家庭客戶的使用數(shù)據(jù)涵蓋了家庭不同成員的點(diǎn)播記錄,尤其是老中青三代和男女家庭成員在內(nèi)容偏好、點(diǎn)播行為上的差異顯著,而即時(shí)使用業(yè)務(wù)并感知推薦效果的又是作為個(gè)體的家庭成員。因此,基于家庭客戶數(shù)據(jù)計(jì)算的個(gè)性化推薦規(guī)則極易將不同成員偏好的歌曲錯(cuò)位推薦,致使即時(shí)使用業(yè)務(wù)的家庭成員接收到不需要的歌曲推薦,如老年人點(diǎn)唱紅歌之后卻收到兒歌的推薦,或兒童點(diǎn)唱兒歌之后被推薦流行歌曲等大相徑庭的推薦效果,嚴(yán)重影響用戶體驗(yàn)感知和操作的流暢性。

由于服務(wù)器端很難直接認(rèn)定業(yè)務(wù)即時(shí)使用者的家庭成員身份,一個(gè)替代方法是先選取影響用戶選擇權(quán)重大的標(biāo)簽對(duì)歌曲進(jìn)行分隔,并藉此對(duì)用戶點(diǎn)播記錄進(jìn)行分類處理,再在各個(gè)分類數(shù)據(jù)集上逐個(gè)運(yùn)行關(guān)聯(lián)規(guī)則,從而獲取該分類的個(gè)性化推送規(guī)則,避免差異太大的歌曲之間的錯(cuò)位推薦。

對(duì)分隔標(biāo)簽個(gè)數(shù)的選擇是此處的一個(gè)難點(diǎn),如果分隔標(biāo)簽太多,則造成內(nèi)容被過度切割,每一類的記錄數(shù)過少而不能產(chǎn)生足夠的推送規(guī)則;如果分隔標(biāo)簽太少,則無法將用戶作為個(gè)體的音樂偏好切割開來。在實(shí)踐工作中,篩選了影響年代、音樂風(fēng)格、音樂心情等對(duì)用戶影響力最大的關(guān)鍵標(biāo)簽維度,基于這些維度完成了歌曲點(diǎn)播記錄的切分。從實(shí)際效果看,基于關(guān)鍵標(biāo)簽切分?jǐn)?shù)據(jù)集計(jì)算的關(guān)聯(lián)規(guī)則能更好地迎合不同家庭成員的個(gè)性化需求。

4.2 對(duì)推送規(guī)則中馬太效應(yīng)的遏制

內(nèi)容點(diǎn)播業(yè)務(wù)的數(shù)據(jù)具有典型的長(zhǎng)尾特征——少量歌曲占據(jù)絕大部分點(diǎn)播量,而大量歌曲則點(diǎn)播量低下,構(gòu)成數(shù)據(jù)分布的長(zhǎng)尾,卡拉OK的歌曲點(diǎn)播量分布如圖1所示。

圖1 卡拉OK歌曲點(diǎn)播量帕累托累進(jìn)曲線

這種長(zhǎng)尾的分布很容易帶來的一個(gè)缺陷是馬太效應(yīng)——熱門愈熱,冷門愈冷。由關(guān)聯(lián)規(guī)則的置信度計(jì)算公式可知,歌曲B越熱門,同其他歌曲A一起被點(diǎn)播的概率P(AB)就越高,分子P(AB)就會(huì)越發(fā)逼近分母P(A),造成置信度P(B/A)虛高,尤其對(duì)點(diǎn)播量并不高的歌曲A更是如此,從而占據(jù)歌曲A推薦列表的前列,進(jìn)而為熱門歌曲帶來更多的點(diǎn)播量,加劇馬太效應(yīng)的發(fā)生,少量熱門歌曲B長(zhǎng)期霸占用戶視聽感官,帶來用戶獲取不到足夠內(nèi)容資源與內(nèi)容資源利用效率低下的矛盾。另一方面,如果關(guān)聯(lián)規(guī)則的前項(xiàng)歌曲A夠熱門(P(A)夠大),則與其他歌曲的交叉集(分子P(AB))也必須夠大才能確保置信度夠高,因此熱門歌曲的關(guān)聯(lián)對(duì)象自然也是比較熱門的歌曲,適合將熱門歌曲單獨(dú)進(jìn)行關(guān)聯(lián)規(guī)則的計(jì)算。針對(duì)這種情況,必須對(duì)關(guān)聯(lián)規(guī)則的計(jì)算進(jìn)行適當(dāng)?shù)恼{(diào)整,以避免馬太效應(yīng)的持續(xù)擴(kuò)大。研究方法如下。

(1)利用點(diǎn)播量的累積帕累托曲線,根據(jù)帕累托經(jīng)典的二八原則(或設(shè)定歌曲對(duì)總點(diǎn)播量的貢獻(xiàn)閾值),作為劃分熱門與非熱門歌曲的依據(jù)。選取2012年12月的歌曲點(diǎn)播數(shù)據(jù)計(jì)算其累計(jì)概率,發(fā)現(xiàn)點(diǎn)播量最高的1167首歌曲占據(jù)總點(diǎn)播量的80%,而這只占總歌曲數(shù)量(15 697首)的7.4%,可將其定義為熱門歌曲與非熱門歌曲的拐點(diǎn)。

(2)利用拐點(diǎn)分割歌曲點(diǎn)播記錄為熱門歌曲和非熱門歌曲,在已經(jīng)計(jì)算出的關(guān)聯(lián)推薦規(guī)則中,從規(guī)則后項(xiàng)上區(qū)分熱門歌曲和非熱門歌曲分割歌曲的關(guān)聯(lián)推薦規(guī)則集合,使非熱門歌曲的關(guān)聯(lián)推薦規(guī)則的后項(xiàng)優(yōu)先推薦其他非熱門歌曲,而熱門歌曲的關(guān)聯(lián)推薦規(guī)則優(yōu)先推薦其他熱門歌曲。

4.3 無關(guān)聯(lián)規(guī)則歌曲的規(guī)則補(bǔ)缺

無關(guān)聯(lián)規(guī)則的情形產(chǎn)生于以下幾種情況:

·歌曲無點(diǎn)播次數(shù)——冷門歌曲和新歌;

·歌曲關(guān)聯(lián)規(guī)則的置信度和支持度達(dá)不到設(shè)定的閾值;

圖2 卡拉OK內(nèi)容推送機(jī)制流程

·規(guī)則后項(xiàng)數(shù)量達(dá)不到客戶端頁面預(yù)留的推薦內(nèi)容個(gè)數(shù)。

對(duì)于這些歌曲,如果不提供推送內(nèi)容或統(tǒng)一提供相同的推薦內(nèi)容,都難免影響用戶體驗(yàn),因此針對(duì)這部分歌曲,可通過歌曲標(biāo)簽數(shù)據(jù)計(jì)算發(fā)掘與其風(fēng)格相似的歌曲并進(jìn)行補(bǔ)充推送。在實(shí)踐工作中,篩選了關(guān)鍵標(biāo)簽并剔除了相關(guān)性高的冗余標(biāo)簽,為距離的測(cè)量提供了良好的數(shù)據(jù)基礎(chǔ)。目前常用的相似度計(jì)算式有如下幾種。

皮爾遜相關(guān)系數(shù):

夾角余弦:

歐式距離:

由于標(biāo)簽統(tǒng)一為0-1型數(shù)據(jù),無需數(shù)值的歸一化處理,故直接使用歐式距離進(jìn)行計(jì)算,結(jié)合前文計(jì)算出的標(biāo)簽影響力權(quán)重,加權(quán)的歐式距離公式如下:

5 內(nèi)容推送機(jī)制設(shè)計(jì)思路

結(jié)合業(yè)務(wù)處理流程和各個(gè)難點(diǎn)問題的解決,設(shè)計(jì)出卡拉OK內(nèi)容推送機(jī)制流程,如圖2所示。

在這一過程中,最基礎(chǔ)的環(huán)節(jié)是分類內(nèi)容點(diǎn)播記錄的關(guān)聯(lián)規(guī)則計(jì)算以及基于標(biāo)簽的歌曲相似度計(jì)算,其余環(huán)節(jié)是基于用戶體驗(yàn)對(duì)規(guī)則計(jì)算結(jié)果的優(yōu)化。該機(jī)制采用離線計(jì)算的方式,由獨(dú)立于系統(tǒng)的外部服務(wù)器定期更新,不會(huì)對(duì)現(xiàn)網(wǎng)運(yùn)營(yíng)系統(tǒng)造成負(fù)擔(dān)。

6 針對(duì)家庭客戶的智能推薦的前景展望

中國(guó)電信愛音樂卡拉OK業(yè)務(wù)作為首個(gè)由基地集約運(yùn)營(yíng)的全國(guó)性IPTV增值業(yè)務(wù),采用本智能推薦算法后,明顯提升了用戶對(duì)推薦內(nèi)容的點(diǎn)播次數(shù),業(yè)務(wù)發(fā)展呈現(xiàn)良好的態(tài)勢(shì)。從長(zhǎng)期來看,技術(shù)的發(fā)展和用戶行為習(xí)慣的變化將推進(jìn)個(gè)性化推送機(jī)制的持續(xù)完善,主要的改進(jìn)方向集中在以下3個(gè)方面。

(1)對(duì)家庭用戶細(xì)分的進(jìn)一步思考

該研究中對(duì)家庭成員點(diǎn)播記錄的區(qū)隔是采用了重點(diǎn)標(biāo)簽的交叉分割,但統(tǒng)一劃分標(biāo)準(zhǔn)的選取可能帶來對(duì)小眾用戶需求不同程度的忽視,后續(xù)研究中可考慮采用無監(jiān)督的用戶點(diǎn)播內(nèi)容標(biāo)簽數(shù)據(jù)的高維聚類方法,以獲取更為全面的家庭客戶分類結(jié)果。

(2)對(duì)基于用戶行為和內(nèi)容標(biāo)簽的推送規(guī)則的進(jìn)一步融合

該研究雖然分離了熱門與非熱門歌曲,降低了馬太效應(yīng)的影響,但完全將熱門歌曲與非熱門歌曲隔離,并非十全十美的設(shè)計(jì)。一個(gè)優(yōu)化的設(shè)想是,結(jié)合歌曲之間的用戶點(diǎn)播關(guān)聯(lián)度和內(nèi)容本身的標(biāo)簽相似性,提供既有用戶行為關(guān)聯(lián),也具有歌曲相似性的推送機(jī)制,并在這兩種方式之間取得一定的平衡。

(3)推送機(jī)制的進(jìn)一步個(gè)性化

每個(gè)用戶的內(nèi)容偏好是不同的,但如果考慮每個(gè)用戶的個(gè)性化偏好,勢(shì)必導(dǎo)致計(jì)算成本的大量增加。一個(gè)可以替代的方法是在已經(jīng)計(jì)算出的推送規(guī)則中,根據(jù)每個(gè)用戶自身的標(biāo)簽偏好(單用戶標(biāo)簽分布重心(均值)),二次計(jì)算與每首被推薦歌曲之間的空間距離,繼而按照這個(gè)距離對(duì)推薦歌曲進(jìn)行重新排序。

1 覃亮,王喜成.層次分析法在制造業(yè)電子商務(wù)網(wǎng)站評(píng)價(jià)中的應(yīng)用.桂林電子工業(yè)學(xué)院學(xué)報(bào),2006(1):74~75

2 余力,劉魯.電子商務(wù)個(gè)性化推薦研究.計(jì)算機(jī)集成制造系統(tǒng),2004,10(10)

3 奉國(guó)和,梁曉婷.協(xié)同過濾推薦研究綜述.圖書情報(bào)工作,2011,55(16)

4 陳萌,楊成,王歡等.交互式電視中個(gè)性化推薦系統(tǒng)的研究.電視技術(shù),2012,36(14)

5 徐淮杰,張二芬.基于關(guān)聯(lián)規(guī)則與奇異值分解的音樂推薦系統(tǒng).電子設(shè)計(jì)工程,2013,21(1)

猜你喜歡
關(guān)聯(lián)規(guī)則內(nèi)容
內(nèi)容回顧溫故知新
撐竿跳規(guī)則的制定
“苦”的關(guān)聯(lián)
數(shù)獨(dú)的規(guī)則和演變
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
主要內(nèi)容
臺(tái)聲(2016年2期)2016-09-16 01:06:53
語言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
主站蜘蛛池模板: 午夜日韩久久影院| 全部毛片免费看| 国产性生交xxxxx免费| 色偷偷男人的天堂亚洲av| 中文字幕伦视频| julia中文字幕久久亚洲| 欧美伊人色综合久久天天| 国产真实乱了在线播放| 婷婷综合色| 亚洲天堂区| 色综合天天操| 欧洲成人在线观看| 免费aa毛片| 永久在线播放| 爽爽影院十八禁在线观看| 国产精品自在在线午夜| 国产精品污污在线观看网站| 亚洲日韩高清无码| 国产亚洲精品自在久久不卡| 高清无码手机在线观看| 亚洲第一天堂无码专区| 亚洲日本中文字幕乱码中文 | 日韩av无码DVD| 国产9191精品免费观看| 国产精品综合久久久| 国产成人一级| 亚洲国产精品日韩欧美一区| 伊人网址在线| 久久国产精品嫖妓| 欧美有码在线观看| 国产精品久久久久久久久久98| 五月婷婷精品| 国产精品第| 亚洲天堂网在线观看视频| 亚洲天堂777| 伊人五月丁香综合AⅤ| 国产日韩欧美视频| 久久精品国产国语对白| 福利在线一区| 久久久久青草大香线综合精品| 亚洲精品无码在线播放网站| 国产主播在线一区| 在线免费亚洲无码视频| 四虎亚洲精品| 第一区免费在线观看| 99久久精品国产综合婷婷| 99九九成人免费视频精品| 亚洲av综合网| 国产精品夜夜嗨视频免费视频| 欧美国产日韩在线观看| 怡红院美国分院一区二区| 国产欧美日韩va| 亚洲浓毛av| 国产一区二区三区免费观看| 日本午夜精品一本在线观看| 99热免费在线| 亚洲电影天堂在线国语对白| 免费看一级毛片波多结衣| 中文字幕在线观看日本| 久久人搡人人玩人妻精品一| 久久性视频| 麻豆a级片| 国产波多野结衣中文在线播放| 久久免费视频6| 国产精品一区在线麻豆| 热热久久狠狠偷偷色男同| 毛片网站在线看| 亚洲天堂在线免费| 九九精品在线观看| 99国产精品一区二区| 国产欧美日韩专区发布| 国产女人在线| 亚洲女同欧美在线| 91成人在线免费视频| 一级片一区| 日韩国产精品无码一区二区三区| 国产农村1级毛片| 国产男女免费视频| 成人国产精品一级毛片天堂| 国产免费看久久久| 亚洲成aⅴ人在线观看| 婷婷五月在线|