999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于向量化標簽的視頻推薦算法研究與實現

2020-09-03 02:26:04許良武
無線互聯科技 2020年12期
關鍵詞:用戶模型

許良武

(南京蘇寧軟件技術有限公司,江蘇 南京 210000)

當今互聯網技術迅速發展,信息爆炸時代隨之而來。信息過載導致用戶無法直接從中獲取有效信息,推薦系統應運而生。常見推薦算法包括:基于隱語義模型、基于協同過濾算法、基于圖的推薦[1]。以上3種方法應用廣泛,但也存在不足:(1)新用戶冷啟動問題。(2)復雜興趣推薦問題,如用戶興趣轉移較快時推薦不準。(3)可解釋性差,提取特征多為隱特征,推薦的可解釋性不直觀。

基于標簽的視頻推薦系統架構中,視頻信息包括視頻標題、標簽、分類、視頻簡介、導演演員、評分、評論等。標簽作為視頻信息的高度抽象,通過分析用戶標簽可以精準地挖掘出用戶興趣偏好,從而為用戶推薦滿意的視頻。標簽推薦整體架構如圖1所示。

圖1 標簽推薦整體架構

1 標簽概要

視頻播放平臺上的編輯功能為視頻打上豐富且高質量的標簽,能較好地抽象視頻內容。視頻可用于推薦的內容并不是很豐富,因此,基于標簽推薦就成為一種重要途徑[2]。視頻信息如表1所示。

長視頻通常分為電視劇、電影、少兒、綜藝等眾多類別,本文實驗數據來自視頻播放平臺,在電影和電視劇上實驗。用戶規模選取1.2萬,電影電視劇4 200,近3個月約304萬條播放記錄。主要基于表1中tags和type字段推薦,tags標簽池包含132個標簽。

2 相似度計算

相似度計算在推薦召回中有多種方法,基于標簽的相似度量通常采用Jaccard系數和余弦相似度。

Jaccard系數計算如公式(1)。給定兩個集合的交集與并集的比值,值越大說明相似度越高。若兩個集合任一為空,則相似度為0。

余弦相似度,通過兩個向量夾角的余弦值,衡量兩者相似度[3]。由公式(2)計算:

3 用戶畫像

為了達到千人千面的效果,根據用戶歷史觀看行為,獲得用戶畫像,從而推薦可能感興趣的視頻。tags標簽池132維,而且近3個月人均播放視頻數約253個,因此,構建132維用戶向量能很好地表征用戶興趣偏好。基于標簽的推薦,將用戶觀看歷史所有視頻標簽統計作為用戶對不同類型影片的偏好。

表1 長視頻基礎信息

3.1 熱門標簽降權

用戶標簽向量在相似計算中傾向于熱門標簽,不能充分體現用戶興趣點,因此,借鑒TF-IDF思想對熱門標簽降權[4]。如式(3):

其中,λi為132維標簽各維度的系數,Ni為每個標簽在所有視頻中出現的次數。

3.2 時間衰減

用戶興趣轉移,觀看行為距離當前越近,越能表征用戶真實興趣點,距離當前越久遠,表征用戶興趣點的能力越弱。衰減系數為超參數,根據實驗效果設定。本文實驗選擇衰減系數0.95,衰減周期為一周。

3.3 播放完整度

播放完整度在一定程度上體現了用戶的喜愛程度,用戶畫像采用播放完整度作為不同視頻標簽對用戶畫像的貢獻度。

用戶畫像完整過程:首先,根據時間衰減,計算不同視頻的標簽權重,乘以播放完整度體現對用戶畫像貢獻度的差異,接著將所有觀看歷史標簽累加到132維的用戶標簽向量,再結合各維度系數λi,獲取用戶對不同興趣標簽的偏愛程度,最后,對標簽向量歸一化得到標準化的用戶向量。

4 基于標簽的多路召回

推薦場景主要有“相關推薦”和“猜你喜歡”。“相關推薦”采用主題模型,“猜你喜歡”則采用多路召回,如熱門視頻、用戶協同、個性化推薦、主題模型等多維度兼顧用戶喜好和覆蓋度。

4.1 熱門視頻

長視頻的電影、電視劇等不同類型下,根據近一周視頻播放量、評論數、點贊數綜合評分獲得熱門視頻。

近一周播放量、評論數、點贊數升序排序,分別通過公式(4)映射到[0.5,1]范圍。由公式(5)加權計算綜合評分,根據評分降序排序取TOPN獲得熱門視頻。

其中,score為評分,sort_no為排序序號,size為視頻規模。

其中,totalscore為綜合評分,由播放量、評論數、點贊數評分6∶2∶2加權獲得。

4.2 主題模型

視頻標簽通常3~5個,而標簽池規模達到132個,視頻132維標簽向量化表示計算視頻之間的相似度過于稀疏。因此,采用Jaccard相關系數計算相似度,倒排取TOPN。

例如,3個電影的標簽分別為:A=(動作,愛情,武俠,香港),B=(冒險,動作,驚悚,劇情,歐美),C=(冒險,動作,劇情,大陸)。通過Jaccard系數計算,J(A,B)=0.125,J(A,C)=0.143,J(B,C)=0.5,從而得到B與C更相似。若當前視頻是B,則給用戶推薦順序為C,A。

主題模型基于物品的相似度召回,同時結合導演演員標簽信息,從而獲得相似度較高的視頻。

4.3 用戶協同

用戶協同作為應用最廣泛的推薦算法,尋找相似用戶群,根據群體智慧推薦,通常可獲得一些相似度不高,但能讓用戶驚喜的推薦效果,拓展用戶的興趣范圍[5]。本文基于多標簽的用戶畫像向量,通過余弦相似度、度量不同用戶的相似度,并排序得到近鄰集合,將近鄰用戶歷史播放視頻聚合統計,按觀看次數,倒排取TOPN,最終過濾目標用戶已觀看視頻。

最近鄰用戶規模過小,無法體現集體智慧效果,規模過大又趨于熱點視頻。因此,近鄰規模的選擇對用戶協同至關重要。本文選擇近一周播放歷史作為預測集,近3個月播放記錄除預測集外均為訓練集。近鄰規模從50起,按50間隔遞增,不同近鄰數情況下計算的準確率和召回率,如圖2所示。

圖2 最近鄰數K對用戶協同效果的影響

從準確率和召回率曲線來看,用戶規模較小時準確率和召回率均較低,當近鄰規模增加時兩指標均有較大提升,當用戶規模達到400附近時準確率最高,此后開始逐漸下降,而召回率在500左右達到最高,后續維持在一定水平,當規模超過800緩慢下降。通過準確率和召回率指標綜合權衡,選擇近鄰數為400效果最佳。

4.4 個性化推薦

基于上述用戶畫像向量,同時,將視頻表示為132維歸一化向量,采用余弦相似度計算用戶與視頻之間的相似度。本文采用向量矩陣運算如圖3所示,用戶矩陣為N行132列,視頻向量轉置得到132行M列,矩陣相乘獲得N行M列矩陣,用戶向量和視頻向量均為歸一化向量。因此,最終的N×M矩陣為N個用戶分別與M個視頻之間的相似度,根據相似度取TOPN,過濾評分較低的視頻,得到用戶的個性化推薦列表。

5 排序模型

多路召回為粗排策略,極大地縮小了推薦結果集,從多個角度覆蓋用戶的興趣,但不同召回集之間排列順序未知,因此,需要精排模型獲得統一的排序。

本文采用圖4經典的3層DNN模型[6],基于標簽的用戶畫像向量(132維)、視頻向量(132維)以及上下文(位置、設備類型、網絡類型、播放時間等)信息Embedding方式構成自變量,用戶觀看歷史的播放完整度為因變量,迭代訓練模型,最終將多路召回集構建Embedding特征通過模型預測用戶對每個視頻的播放完整度,倒排取TOPN。

通過DNN模型預測播放完整度,將完整度較高的視頻列表推薦給用戶,兼顧用戶興趣及視頻相似度的同時,盡可能地將高質量視頻推薦給用戶,以此來提升用戶的滿意度和播放時長。

圖3 標簽用戶畫像與視頻向量矩陣運算相似度矩陣

圖4 DNN播放完整度預測模型

6 結語

本文研究和實現基于標簽的視頻推薦系統。多路召回策略后,基于標簽的用戶畫像向量、視頻向量以及上下文信息構建Embedding特征向量,通過3層DNN模型來預測用戶對視頻的播放完整度,根據完整度值取TOPN推薦給用戶。通過融合本文基于標簽的推薦算法,經過一周的線上測試數據發現,UV提升2.3%,PV提升12.6%,人均播放次數提升8.1%,人均播放時長提升15.3%。兼顧用戶興趣和視頻質量,最終獲得令人鼓舞的推薦效果。

猜你喜歡
用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 亚洲中文在线视频| 久久人人97超碰人人澡爱香蕉| 国产国语一级毛片| 亚洲三级视频在线观看| 黄色污网站在线观看| 精品国产91爱| 欧美视频在线观看第一页| 日本人妻一区二区三区不卡影院 | 久久先锋资源| 亚洲国产成人在线| 精品午夜国产福利观看| 动漫精品啪啪一区二区三区| 91福利国产成人精品导航| 中文字幕乱码二三区免费| 欧美日韩一区二区在线免费观看| 欧美午夜在线视频| 亚洲综合一区国产精品| 久久精品最新免费国产成人| 在线观看免费人成视频色快速| 中文字幕在线不卡视频| 青青操国产| 久久成人免费| 色婷婷电影网| 国产麻豆永久视频| 亚洲另类第一页| 超碰aⅴ人人做人人爽欧美 | 青青青国产视频| 欧美日韩一区二区在线播放| 国产粉嫩粉嫩的18在线播放91| 国产精品福利一区二区久久| 91在线国内在线播放老师| 亚洲综合在线最大成人| 九色视频最新网址| 亚洲国产看片基地久久1024| 欧美日韩国产成人高清视频| av午夜福利一片免费看| 亚洲性视频网站| 欧美亚洲香蕉| 五月婷婷中文字幕| 国产精品女主播| 久久天天躁狠狠躁夜夜2020一| 国产在线观看成人91| 亚洲无线一二三四区男男| 91视频免费观看网站| 国产成人亚洲毛片| 国产精品va| 欧美日一级片| 女人18毛片一级毛片在线| 欧美精品成人| 久久久精品久久久久三级| 久热这里只有精品6| 日韩一级二级三级| AV天堂资源福利在线观看| 日韩性网站| 亚洲一区二区黄色| 福利一区在线| 日韩第八页| 色综合天天综合中文网| 久久国产黑丝袜视频| 日韩精品一区二区三区swag| 国产综合无码一区二区色蜜蜜| 日韩123欧美字幕| 手机精品福利在线观看| 欧美日韩一区二区在线播放| 青青草一区二区免费精品| 这里只有精品在线播放| 狠狠ⅴ日韩v欧美v天堂| 99re66精品视频在线观看| 欧美日韩中文字幕在线| 欧洲免费精品视频在线| 国产91熟女高潮一区二区| 福利在线一区| 日韩欧美国产综合| 免费AV在线播放观看18禁强制| 国产毛片片精品天天看视频| 国产日本一区二区三区| 国产不卡国语在线| 国产一国产一有一级毛片视频| 日韩成人午夜| 亚洲天堂日本| 国产一国产一有一级毛片视频| 亚洲第一香蕉视频|