陳 都,苗 方,金立標,吳 敏
(1.中國傳媒大學 理工學部,北京100024;2.中國國際廣播電臺,北京 100040)
?
廣電智能推薦系統的應用研究
陳都1,苗方1,金立標1,吳敏2
(1.中國傳媒大學 理工學部,北京100024;2.中國國際廣播電臺,北京 100040)
摘要:隨著廣播電視媒體的發展已經進入融合時代,融合媒體要求充分運用新技術、新應用創新傳播方式。為了充分挖掘分析潛在的用戶需求,針對廣電業務的推薦技術越來越受到關注。通過介紹近幾年推薦技術新的發展成果,在廣電推薦系統應用中充分結合媒體融合、時間因素等,建立廣電智能推薦系統的基本構架,提出廣電領域業務的進一步設想和展望。
關鍵詞:智能推薦;用戶行為分析;媒體融合
隨著互聯網應用的普及,海量信息資源的爆炸性增長,當今的世界正處在信息過載的時代。傳統廣電媒體作為大眾信息的主要傳播渠道,在面臨著互聯網媒體挑戰的同時也在日趨深入地與之融合。電視互動性不斷增強,觀眾的參與度大幅提升,原本被動收視的用戶開始更多有目的地“使用”電視所提供的資源與服務。然而隨著影視節目資源數量的指數型增長,內容日趨多樣,面對海量的節目資源,用戶想找到自己需要的內容變得越來越困難。因此需要一種智能的、個性化的廣電節目推薦系統,幫助用戶在信息的海洋中發現自己需要的資源,同時也使內容的生產、傳播更具有目的性和精準性,從而實現價值的最大化。 智能推薦技術應用于電子商務領域起步較早,也已經比較成熟,但是在廣電領域應用智能推薦與之相比有很多不同之處:電子商務中推薦的商品特征多為結構性數據,比較容易獲取并且可以準確描述,例如用戶喜歡的品牌、顏色、款式等。廣電系統中的視音頻素材特征較難提取,非結構化的數據處理比較困難,數據容量大且相似性度量不好定義。此外用戶分層差距較大,用戶反饋信息獲取不便,視頻資源的屬性特征無法直觀地表達用戶的興趣特征等也增大了廣電業務推薦的難度。
1智能推薦系統概述
1.1智能推薦系統的基本框架
智能推薦系統是一種建立在海量數據挖掘的平臺,通過收集并分析用戶大量的行為日志,根據用戶的偏好,推薦具有高度針對性的信息。幫助用戶發現對自己有價值的信息的同時也能讓信息展現在對其感興趣的用戶面前,從而實現信息消費者和信息生產者的雙贏[1]。
圖1是一個智能推薦系統的基本框架圖。
智能推薦系統輸入變量主要分為3個維度:
1)用戶維度,包括人口統計學特征、用戶興趣愛好、用戶行為等。
2)物品維度,包括物品的屬性(關鍵字、特征描述等)、當前熱門程度、平均分等。
3)時間維度,包括季節、觀看時段、時間間隔。
用戶自身興趣和關注點是隨著時間推移不斷變化的,關注用戶近期行為最能體現其目前的興趣,同時物品的熱度也會隨時間發生變化。用戶通過推薦系統給出推薦列表去訪問信息,并將反饋信息傳遞給智能推薦系統。推薦系統能夠實時響應用戶的反饋,個性化地調整推薦列表,從而滿足用戶不斷變化的興趣。
1.2智能推薦系統的核心算法
1)經典推薦算法
智能推薦系統的核心是推薦算法,算法的優劣決定著推薦系統的性能[2]。當前隨著用戶對推薦系統的需求不斷增長,很多經典的推薦算法被廣泛應用。協同過濾(Collaborative Filtering-based)推薦算法主要是利用對用戶歷史行為的分析,尋找具有類似行為或興趣的用戶和其感興趣的物品,找到用戶或物品之間的相關性,然后基于這些相關性進行建議推薦。基于內容(Content-based)推薦算法則不需要用戶對物品的評價,通過分析用戶瀏覽物品的特征,向用戶推薦與這些物品特征相似的物品。這些經典的推薦算法主要研究對象主要是用戶和物品,通過比較二維矩陣中相似度來推薦。這些推薦算法也分別存在一些問題,例如協同過濾推薦存在冷啟動、數據稀疏、新穎性方面表現不佳,而基于內容推薦則存在物品特征較難抽取、計算復雜、無法滿足即時推薦的要求等問題。
2)推薦算法的改進
近幾年隨著應用的推廣和研究的深入,許多新的或者改進的推薦算法被相繼提出。為提高用戶的興趣和物品之間的聯系,引入基于標簽的推薦算法可以深入了解用戶行為,指導并改進推薦系統的推薦質量。文獻[3]總結了國內外基于標簽的推薦研究成果,利用基于圖論、基于聚類的標簽推薦來描述“用戶-標簽-物品”的三元關系,提高了推薦的準確率和新穎度。隨著Web2.0的發展,很多網站都利用Facebook的社交網絡數據給用戶提供社會化的推薦。基于社交網絡的推薦算法受到關注和應用,文獻[4]通過研究社交網絡的社會關系、興趣傳播、信任傳遞、時間等因素,建立社交網絡用戶興趣模型,結合個人興趣和興趣傳播兩方面信息對目標用戶進行準確的推薦,提高了推薦的質量。推薦系統中引入時間維度,讓推薦系統能夠準確預測用戶在某個特定時間的興趣。用戶興趣不斷變化,推薦系統能夠實時響應用戶的新行為,讓推薦列表不斷變化,以此提高推薦效果。文獻[5]提出一種計算用戶評價時間與項目發布時間的時間間隔,根據用戶時間權重值的大小,可以判斷該用戶是積極用戶還是消極用戶,以及用戶對新項目的偏好程度的方法,能夠較好地解決冷啟動問題。文獻[6]先在傳統協同過濾算法的基礎上,通過引入反映人們遺忘規律的艾賓浩斯遺忘曲線,提出一種基于時間效應的改進協同過濾推薦算法,并通過引入時效性集合的概念對數據進行預過濾,提升了推薦的準確度。
廣電業務應用中用戶的偏好矩陣遠遠小于未觀看的物品矩陣,使用基于物品的協同過濾算法會影響推薦系統的性能。基于用戶的協同過濾推薦則主要是給用戶推薦和他興趣相似的其他用戶喜歡的物品。加入時間信息后,相似用戶最近的興趣顯然比很久之前的興趣更加接近被推薦用戶當前的興趣。利用加入時間衰減函數的改進皮爾遜相關系數測出兩個用戶的相似度,時間衰減項越小,代表用戶之間產生這一行為的時間相隔越遠,兩個用戶的興趣相似度就會越小。
因電視的操作交互界面受到限制,推薦數量不宜太多。時間變化的推薦系統里,需要建立的是動態的推薦列表,并且提高推薦的精確性。文獻[7]提出了一種比較物品推薦數量和推薦評分的“數量-分數曲線”,如圖2所示。在“數量-分數曲線”中通過尋找拐點找到劃分推薦評級和推薦數量的最佳平衡點。
2智能推薦系統在廣電業務中的應用
廣播電視媒體的發展已經進入融合時代,生產制作的節目其傳播渠道和呈現方式也不局限于傳統的廣播電視,還包括互聯網、移動終端APP、社交應用等。在融合媒體時代,內容、渠道、用戶三者關系發生了根本的變化。生產制作域的融合和終端傳播域的分化,形成了新型的傳播模式。海量的媒體產品進行匯聚,再分流給多種終端,由用戶根據所需進行個性化配置。用戶希望精準迅速、隨時隨地獲得需要的內容。在整個傳播體系中,用戶占據著主導的地位。隨著用戶需求和傳播渠道的變化,廣電媒體平臺在提供海量內容的同時,還要提供豐富的服務。從服務的角度看,就是要更注重與觀眾的交互,分析掌握觀眾的個性化需求,才能真正把受眾變為用戶。智能推薦是為用戶提供個性化服務的關鍵,也是媒體融合的一個重要體現。
廣電智能推薦系統的智能性體現在主動發現當前或潛在的用戶需求,根據用戶歷史行為記錄的積累分析以及對媒體和應用內容的價值評估和熱度評估,將用戶信息與內容信息進行智能關聯與匹配,預測用戶可能感興趣的內容資源信息。預測分析結果輸出為智能推薦策略,包括共性化內容推薦策略和個性化內容推薦策略。共性化內容包括熱點關注資源、根據收視情況統計出來的預計熱門媒體和應用內容、根據相關媒體宣傳需要與用戶關注情況得出的熱點聚焦內容等,同時也包括運營商推薦內容,如時事要聞、重點推薦等。個性化內容是在用戶歷史行為分析積累的基礎上得出的用戶當前或潛在的內容資源需求。為了準確把握用戶的需求,可用于分析的信息包括用戶基本信息如年齡、性別、愛好等,由用戶行為的統計信息能夠刻畫用戶的收視習慣,由觀看內容信息和社交關系的分析可以獲得用戶的興趣。
廣電的主要應用場景是家庭環境,通過多人家庭用戶的收視行為分析產生對個人的個性化推薦服務一直是廣電推薦業務的難點[8]。融合媒體時代的內容傳播模式是立體的、全方位的,包括大量的用戶互動、參與,如“搖電視”、“伴隨客戶端”等形式,用戶也會通過微信、微博公眾號等方式關注,甚至參加線下活動。因此廣電業務需要構建全方位的信息采集和大數據分析,將傳統廣電渠道和互聯網渠道的數據打通,形成智能化的應用。
廣電智能推薦應用除了形成內容與用戶之間的適配,還需要形成內容與終端的適配。全媒體的業務分別在機頂盒、個人PC、手機、平板PC、互聯網電視等終端呈現。不同的終端對應著不同的發布渠道、傳播過程和展現形式。推薦系統需要識別終端類型與終端能力,建立用戶信息關聯和用戶終端設備可管理機制,實現跨媒體的立體式服務。
針對智能推薦系統在廣電中的應用,設計出廣電智能推薦應用系統架構如圖3所示。
廣電智能引擎推薦系統由如下7個方面組成:
1)用戶與廣電系統的交互接口:智能推薦系統通過該交互接口收集用戶的基本信息和行為記錄,同時用戶可以通過該交互接口獲取個性推薦結果。
2)移動端APP:在移動端方面,設置用戶關聯賬號,用戶可以通過移動端登錄廣電網絡的平臺,訂閱自己喜歡的頻道或者節目,用戶可以隨時隨地獲得心儀的節目推薦和節目預告。用戶行為收集方面,數據的來源不僅限于廣電網絡,用戶通過手機、平板等移動端設備參與互動、評價等活動是獲取用戶個性化信息的關鍵組成部分。利用語義分析等技術處理用戶的主觀評價數據,追蹤用戶分享、轉發到社交應用的信息,可以更準確地把握用戶的偏好和需求。
3)用戶行為數據庫:該數據庫用于存儲用戶在使用廣電和移動端中的各種行為記錄,例如瀏覽記錄、播放記錄、具體的時間長短與播放時段,進行降噪和歸一化工作以及云端存儲,可供深度挖掘的原始數據資源。
4)用戶建模:推薦系統根據用戶注冊信息、歷史行為數據,進行數據挖掘,為用戶建模,例如用戶年齡、職業、愛好、社交網絡關系等,同時也根據推薦對象的相關信息來構造對象模型[9]。
5)第三方信息平臺:視頻節目標簽特征提取也可以通過關聯互聯網的第三方平臺,例如國內的豆瓣、時光網;用戶標簽基于社交網絡,例如微博、微信、博客、QQ,在這些社交網站中,每個用戶都有自己的個性化信息墻,從中提取用戶標簽較為方便。
6)視頻節目資源庫:視頻節目資源數據庫的核心是視頻資源信息采集分類工作。數據采集量大,利用大數據、云計算等技術,通過網絡信息爬蟲抓取,模板建立進行標簽識別,從而抓取到準確的影視元數據。可引入對視頻內容的畫面分析識別,深入挖掘出視頻節目背后具體的對象,例如一些商品、地名、人物等。
7)智能推薦引擎:利用用戶已構建好的模型和視頻資源信息特征作為輸入,通過智能推薦引擎的核心算法,輸出個性推薦列表返回給用戶。考慮到廣電業務中電視節目視頻的數據量龐大,數據相對不夠穩定,內容需頻繁更新,故選擇時間融合基于用戶的協同過濾推薦,引入時間效應,可以保證用戶每天收到的推薦是不一樣的,保持推薦結果的新穎性和多樣性,同時可以控制在一段時間內熱門的視頻節目,防止用戶過于跟風。單一的推薦算法并不能發揮推薦系統應有的效果,可以引入近幾年興起的基于標簽的推薦、基于社交網絡的推薦,提高推薦算法的效率。Netflix從2006年起開始舉辦Netflix Prize推薦算法設計大賽[1],有很多選手綜合采用多種推薦算法去改進推薦結果,得到混合推薦算法,從而達到更好的推薦效果。
3總結與展望
為適應傳統媒體和新興媒體業務融合發展,廣電需要建立開放的、融合的、智能的推薦系統架構。廣電智能推薦系統對內容、渠道、用戶三方面進行統一數據收集、信息管理、深度挖掘,從而識別用戶共性化和個性化需求,承載多樣化媒體業務新形態。同時廣電智能推薦系統存在一些難點,主要包括直播節目元數據關聯、用戶安全隱私、家庭用戶興趣偏好分析等問題。這些難點需要進一步深入研究。
本文設計了針對廣電業務的智能推薦應用系統框架,并對未來的研究方向進行構想。廣電智能推薦系統是家庭智能化的重要組成部分,服務于運營,通過媒體與用戶之間的雙向交流,站在用戶的角度為其提供定制服務。通過媒體融合的應用場景和相關技術,把視頻內容與其背后蘊藏的豐富信息進行深度關聯、精準傳播。通過智能化平臺的建設,識別用戶共性、個性化的需求,利用內容整合、網絡融合,為用戶高效率、高質量、立體化地提供其真正需要的內容服務,以此提高廣電運營在未來的競爭力。
參考文獻:
[1]項亮. 推薦系統實踐[M].北京:人民郵電出版社,2012.
[2]陳萌,楊成,王歡,等. 交互式電視中個性化推薦系統的研究[J].電視技術,2012,36(14):37-40.
[3]易明,鄧衛華.基于標簽的個性化信息推薦研究綜述[J].情報理論與實踐,2011,34(3):126-128.
[4]邢星. 社交網絡個性化推薦方法研究[D]. 大連:大連海事大學,2013.
[5]于洪,李俊華. 一種解決新項目冷啟動問題的推薦算法[J].軟件學報,2015,26(6):1395-1408.
[6]基于時間效應和用戶興趣變化的改進推薦算法研究[D]. 北京:北京郵電大學,2014.
[7]HIROI K,MORITA H. High-accuracy time-variant recommender system with number-score curve[C]// 2014 IEEE Fourth International Conference on Consumer Electronics Berlin (ICCE-Berlin).[S.l.]: IEEE Press,2014:106-110.
[8]李培琳,趙明,王炳飛.廣電家庭用戶個性化推薦的難點和解決思路[J].電視技術,2015,39(18):33-35.
[9]黃喬,尹四清. 網絡電視推薦系統框架及協同過濾算法的研究[J].電視技術,2013,37(9):136-138.
陳都,碩士生,主研信息網絡技術;
苗方,講師,主研寬帶網絡;
金立標,副教授,主要研究方向為數字電視信息網絡技術;
吳敏,中國國際廣播電臺技術管理辦公室主任。
責任編輯:許盈
Study on intelligent recommendation system applied in television broadcasting
CHEN Du1, MIAO Fang1, JIN Libiao1, WU Min2
(1.CommunicationUniversityofChinaFacultyofScienceandTechology,Beijing100024,China;2.ChinaRadioInternational,Beijing100040,China)
Key words:intelligent recommendation; user behavior analysis; media convergence
Abstract:With the development of radio and television media, convergence is coming. New technologies and applications are required to innovate communication ways in the time of convergence. In order to fully tap and analyze the potential needs of customers, intelligent recommendation technology for radio and television is increasingly concerned by people. The results of new recommendation technology are introduced in this paper. In addition, the framework of intelligent recommendation system is established with the consideration of time and media integration. The prospect of radio and television sector are given in the end.
中圖分類號:TP301.6
文獻標志碼:A
DOI:10.16280/j.videoe.2016.01.020
基金項目:科技部國家科技支撐計劃課題(2013BAH36F00)
作者簡介:
收稿日期:2015-11-04
文獻引用格式:陳都,苗方,金立標,等. 廣電智能推薦系統的應用研究[J].電視技術,2016,40(1):102-105.
CHEN D,MIAO F,JIN L B, et al. Study on intelligent recommendation system applied in television broadcasting[J].Video engineering,2016,40(1):102-105.