
摘要:本文從分析互動電視業務發展遇到的問題入手,闡述將個性化推薦算法技術引入視頻點播系統的必要性。個性化推薦使用特殊的信息過濾技術,向用戶推薦其感興趣的內容。簡而言之,個性化推薦算法是將用戶的個人喜好與具體的內容特征進行對比,從而響應預測用戶對某些未評分項目的喜好程度。選擇參考功能項基于內容屬性、用戶屬性和情景信息。
關鍵詞:個性化推薦;融合推薦;數據挖掘;自學習能力
0引言
隨著江蘇有線互動電視業務的快速發展,互動電視節目內容進入海量時代。業務部門通過每日更新欄目推薦內容,使用戶可以快速瀏覽到業務部門推薦的節目。但是每個用戶關心的內容是千差萬別的,如何保證用戶能夠從海量內容中準確定位自己需要和感興趣的內容,是關系到用戶體驗和運營商收益的關鍵。因此有必要將一些個性化推薦的算法引入視頻點播系統,用于支撐未來業務運營的發展,更好順應信息技術產業發展趨勢,為搶占市場先機打下有利基礎。
2 個性化推薦算法
智能推薦系統中的個性化推薦通過貝葉斯網絡算法和協同過濾算法。兩種算法均是擴展多種服務類型的業務概率、提高用戶體驗的重要方式。個性化算法賴于用戶數據和歷史數據對用戶喜好進行預測。智能推薦系統可以利用內置的接口API、算法、用戶ID、群組和情景來生成HTTP請求,并發送到智能推薦系統接口引擎。推薦項列表將以JSON格式的HTTP消息返回。系統需要提取項目ID(作為業務需求)并獲取其它相關信息,以將現有層呈現至終端設備,狀態和推薦理由亦將嵌入在返回信息中。
2.1個性化推薦算法概述
根據提取和比較功能項的方式,可將智能推薦系統支持的推薦算法分為兩類:
2基于協同過濾的推薦:推薦給用戶一些與該用戶使用習慣相似的其他用戶喜歡的內容。例如,當用戶在瀏覽影片時,基于協同過濾的推薦系統會根據其瀏覽記錄或歷史購買記錄,分析出與其使用習慣相似的一些用戶,將他們瀏覽和購買的影片推薦給用戶。
2基于模型過濾的推薦:通過分析用戶屬性、內容屬性、用戶購買歷史建立數據推理模型(貝葉斯網絡),根據推理模型計算出該用戶已選擇過的內容相似的內容。例如,當用戶在準備購買影片時,一般總是選擇與之前購買歷史相似的內容,那么推薦系統就會推薦一些相似的內容。
2.2個性化推薦系統特征
支持多種推薦算法(協同過濾、貝葉斯網絡、排名),并提供智能的算法選擇邏輯,可根據用戶屬性和購買歷史等因數自動選擇合適的推薦算法。
提供個人推薦和家庭組成員推薦的支持。在支持個性化推薦的同時,可根據多個家庭成員不同的個人喜好作出群組推薦。例如,當家庭中有多人(父親、母親、子女)同時觀看電視時,系統可綜合多人不同的偏好,返回的推薦列表中將同時涵蓋多人的喜好。
同時應用兩種反饋機制(隱式、顯式)。隱式:用戶的訪問或點播記錄。顯式:用戶對內容的評價。
2.3健壯性和自學習能力
內置異常處理機制和可靠的數據存儲機制保證了個性化推薦引擎的健壯性。推薦系統由于需要進行大量的實時運算,所以采用算法保護和切換機制。可根據不同類型的請求進行算法選擇,保證推薦結果的完整性和精確性。在數據存儲方面推薦系統支持分布式管理,能夠自動維護數據的多個拷貝,并在任務失敗后自動重新部署計算任務。
推薦系統支持自我學習的能力,根據用戶最近的瀏覽、購買行為不斷修正用戶的偏好。有效解決用戶興趣會隨時間發生變化的問題。
2.4個性化推薦算法 – 協同過濾(CF)
協同過濾(Collaborative Filtering,簡稱CF)是一種應用廣泛的推薦算法,其特點是算法能夠基于一些復雜的信息(如質量、品質)作出推薦。支持發散式推薦,可以幫助用戶發現之前從未關注過的內容。系統包含以下兩種協同過濾算法:
基于用戶的協同過濾:根據用戶的評分歷史,找到與用戶有相近愛好的其他用戶,之后把這些用戶感興趣的內容推薦給此用戶。
基于項目的協同過濾:根據用戶的評分歷史,找到與用戶曾經觀看的內容相近的其他內容,并把這些內容推薦給此用戶。與基于用戶協同過濾相比,基于項目協同過濾算法解決了隨著用戶量的不斷增長實時計算量過大的問題。
2.5 個性化推薦算法-貝葉斯網絡(BN)
貝葉斯網絡是一種用于上下文推理的技術,非常適合解決信息分發的概率問題。由于貝葉斯網絡是基于數據推導的特性,所以不像協同過濾算法一樣存在數據稀疏的問題。該算法通過分析用戶瀏覽、點播、評分記錄,并使用貝葉斯網絡預測其對內容的偏好,然后將用戶偏好與內容特征進行匹配計算從而產生內容推薦。該算法的特點是:能夠參照多種屬性為用戶提供更為精確有效的個性化推薦。
正面模型和負面模型推理過程如下(圖1所示):
推薦系統接收個性化推薦請求,推薦系統獲取用戶屬性信息、內容信息、用戶情景信息(例如:觀看時間、觀看人數、情緒等)
推薦系統使用正面負面模型進行數據推理,并對推理結果進行權重距離計算,計算出靠近正面模型的內容權重和遠離負面模型的內容權重。
算出的用戶對內容的偏好概率大小順序生成推薦結果。
3關聯推薦算法
3.1使用余弦相似度的關聯推薦
關聯項目算法是一種基于服務內容屬性的推薦算法。服務項將在余弦相似度基礎上進行比較,并將根據特定項目的相似度進行分類。算法特征:由于事先計算了項目相似度,因此可以實現實時計算。該推薦于終端用戶搜索特定類別或關鍵字時適用。推薦引擎將通過數據庫中的預處理矩陣獲取關聯程序最高的項(由分數決定:1-相同,0-完全無關)。因此,它與終端用戶的登錄狀態不相關。集成人員可以利用內置的接口 API、算法名稱(余弦相似度)、用戶ID、當前內容ID以及跨服務標識來生成HTTP請求,并發送到智能推薦系統接口引擎。推薦項列表將以JSON格式的HTTP消息返回。集成人員可能需要提取項目ID(作為業務需求)并獲取其它相關信息,以將現有層呈現至終端設備。狀態和推薦理由亦將嵌入在返回信息中。
3.2使用關鍵字搜索的關聯推薦
使用關鍵字搜索的關聯推薦基于全文搜索技術,該技術旨在通過將文本內容分解為關鍵字來尋找最為相關的服務內容,并根據反向索引進行搜索。該推薦于終端用戶搜索特定類別或關鍵字時適用。操作員可向用戶推薦關聯的服務內容。集成人員可以利用內置的接口 API、算法名稱(關鍵字)、用戶ID、當前內容ID、跨服務標識以及內容所屬語言來生成HTTP請求,并發送到智能推薦系統接口引擎。推薦項列表將以JSON格式的HTTP消息返回。集成人員可能需要提取項目ID(作為業務需求)并獲取其它相關信息,以將現有層呈現至終端設備。狀態和推薦理由亦將嵌入在返回信息中。
4 結束語
將智能推薦技術引入到視頻點播系統后,方便用戶快速找到自己喜愛的節目,提高了互動電視節目點播量,產生顯著的社會效益和經濟效益。智能推薦技術除了可以應用于視頻點播系統,還可以應用到更多其它廣電業務。
通過與終端管理系統集成,獲取用戶對直播節目的收視習慣的統計和分析,同時結合直播節目的深度EPG信息,可以實現點播、直播、回看節目的融合推薦,如當用戶收看直播節目時,可以向用戶推薦相關聯的點播節目和頻道回看節目,給用戶帶來更好的收視體驗。
通過定制化開發,智能推薦技術還可以為其它廣電業務,如電視商城、電視游戲、電視互聯網等進行內容推薦,具有很好的應用前景。
參考文獻
[1]周虹君,殷復蓮,陳怡婷,周嘉琪,伊成昱.Spark框架下的受眾分群及矩陣分解的推薦算法研究[J].互聯網+健康,2016,20(2):139-141.
[2]張曉陽.基于受眾收視行為分析的電視節目編排策略芻探[J].企業家天地,2011,3(1):187-188.
[3]高肖俊,丁云強.基于用戶收視興趣模型的廣電客戶分群及精確化營銷系統建設[J].視聽界,2016,3(2):1-3.
[4]夏歡.基于組合策略的IPTV節目推薦[D]:[碩士學位論文].昆明:云南大學,2016.
[5]沈建軍.面向互動電視的影視節目推進系統研究與實現[D]:[碩士學位論文].杭州:復旦大學,2012.
作者簡介:
葛雨,男,1983年生,學士,江蘇省廣電有線信息網絡股份有限公司播控中心科長,主要從事VOD、OTT業務運行管理方面的研究,曾參與過省市縣三級播控等江蘇省文化產業引導資金項目、Tvos業務等國家“核高基”項目。
江蘇省廣電有線信息網絡股份有限公司,南京 210018