潘文宇 邢青

摘要:隨著互聯網的發展,個性化推薦系統在各個領域都得到越來越廣泛的應用。本文將豐富的媒體內容元數據與標簽,引入第三方電影/電視劇、直播頻道/欄目等一些的視頻數據作為元數據與標簽,并與自有業務數據打通融合。同時,完善視頻數據中的用戶畫像標簽,為離線分析和線上服務提供支撐,結合用戶標簽和內容標簽,實現客戶精準導流。本文主要研究利用用戶畫像,在視頻領域精準視頻推薦系統的研究。
關鍵詞:用戶畫像;智能推薦;大數據;精準營銷
面對如此多的大數據信息,如何把有用的信息推送給想搜索此類相關信息的客戶,是智能化推薦在大數據領域關注的重點。目前,大數據信息的處理和一些相關信息的推薦的很多,但是做視頻大數據處理并運用這些有用信息做推薦系統的并不多。所以當前,所需的是以海量圖像和視頻為基礎,引入先進的人工智能技術,容器技術、分布式計算、高性能存儲以及機器學習引擎為支撐,搭建的一套面向媒體行業智能標簽、智能推薦、智能媒資、智能審核、智能營銷等智能應用的人工智能平臺。基于此應用系統,可通過對視頻數據的分析對用戶做標簽,運用用戶畫像可精準追蹤用戶搜索需求,并做出系統的推薦。對于大數據信息的智能推薦,主要是以大數據技術為基礎的向用戶提供個性化的數據信息的服務。本文基于“用戶畫像”的視頻精準智能推薦系統對各行各業的推動也起到了巨大的借鑒意義。在各行業創新方面,也給了其他行業許多啟迪思想,也就進一步推動相關行業的發展。
1 相關文獻綜述
對于智能推薦系統針對不同行業它的推薦客戶不一樣,所以在設計推薦系統時,考慮的重點是不一樣的。目前,國內許多學者對智能系統做出了相關的研究。司夢楚等人[1]對電子商務中服裝品類的推薦機制中,從已有推薦系統的基礎上利用Slope One算法提出了CSSO推薦算法。龍虎等人[2]依據大數據時代背景,對大數據人工智能提出了系統架構的思想,這一舉動進一步推進了大數據與人工智能的利用價值。李映坤[3]以用戶畫像為基礎,進一步對標簽體系的建立基本流程做了詳細分析。何文華[4]通過對智慧城市觀念的闡述,進而講述了有關智慧城市廣告的智能推送系統。
以上是對智能推薦系統在各行業的應用,除此之外,也有對視頻大數據下用戶畫像的精準定位。如王正友等人[5]通過建立基于視頻大數據構建用戶畫像,從海量數據中提煉出用戶需求和喜好。王憲朋[6]通過簡述基于視頻大數據是如何構建用戶畫像的,講述了一些操作步驟等。于洪涌[7]根據IPTV的視頻數據推送的需求出發,構建了“離線批處理數據分析+在線流式推薦引擎”架構的推薦系統。
2 大數據驅動的個性化服務智能推薦系統
平臺的架構:整體的架構分為兩個層面,分別為業務應用層、學習引擎層。其中業務平臺層包括智能標簽、智能推薦、用戶畫像、智能媒資、智能審核、智能營銷等。學習引擎層包括圖像識別、視頻結構化分析。整體架構如左圖所示。
2.1 業務平臺層
2.1.1 智能標簽
智能標簽需要對電影、電視劇、欄目、藝人、直播節目等視頻內容進行統一存儲、標志、索引、清洗、建模,形成統一豐富的視頻內容標簽,為用戶標簽、智能推薦、影視劇制作、精細化運營,實現精準營銷,達到數據驅動運營以及指導改善產品功能,提高客戶體驗的效果,更好的優化升級與各項業務的運營。通過Web前端提供內容搜索、內容標簽搜索、藝人搜索、直播節目搜索、數據審核、權限管理等功能。
2.1.2 智能推薦
推薦服務使用機器學習算法結合用戶畫像系統內用戶標簽信息、內容標簽檔案庫內的內容標簽信息和數據倉庫、數據管道內的用戶行為數據為業務提供面向業務的、直接的數據服務支持。具體包括:
(1)推薦引擎模塊:使用用戶標簽信息、內容標簽信息和用戶行為數據建立多種推薦算法,根據用戶標簽信息建立基于用戶標簽的推薦策略。
(2)智能搜索模塊:用戶通過關鍵詞的搜索,后臺引擎可通過用戶的搜索信息進行個性化推薦。
2.1.3 用戶畫像
通過視頻大數據收集的數據,利用數據統計建模和數據挖掘技術,將抽象的客戶信息標簽化,進而進行精準、快速地分析客戶行為特征、消費習慣、需求偏好等重要商業信息,形成客戶360度標簽畫像,使企業能夠全面“理解”客戶,從而實現營銷的智能化、客戶服務的個性化、廣告投放的精準化。具體功能架構分為以下四個子模塊:
(1)數據子模塊:為功能層的實現提供基礎。包含數據倉庫數據、數據集市數據以及挖掘模型。
(2)存儲子模塊:存儲客戶標簽數據、客戶群清單數據等。目前用戶標簽和客戶群數據主要存放在數據集市和實時檢索平臺內。
(3)功能子模塊:包括營銷導航、標簽集市、客戶群集市、標簽生命周期管理和系統管理等。
(4)應用子模塊:在用戶標簽/客戶群的基礎上,提供面向分析應用、面向營銷應用和面向標簽/客戶群運營等應用。
2.1.4 智能媒資
通過人工智能技術支持數字媒體產品的智能化開發,智能迅速跟進、觀察、分析、總結用戶數據和留言,從而獲得用戶反饋,形成基于視頻內容的綜合智能推薦系統。
2.1.5 智能審核
平臺可通過對視頻精準識別和過濾攔截色情視頻、暴恐視頻、涉政視頻、廣告視頻、敏感視頻、違法視頻等,可對以上違規視頻進行攔截。
2.1.6 智能營銷
利用以上對用戶接觸文娛視頻的習慣和喜好(包括地理位置、用戶標簽、用戶活躍度、應用版本、分發渠道、系統版本、運營商、網絡類型)進行數據分析和定位追蹤,獲取用戶畫像,并直接向用戶推薦他們感興趣的信息,當用戶偏好發生改變時,可進行及時修改推送內容,使用戶及時有效地獲取自己想要的內容。
2.2 學習引擎層
2.2.1 圖像識別
根據視頻中出現的圖像,圖片中包括的場景、內容和分為以及特定物體和人物進行識別。對于圖片中包含的具體任務的標志,比如需要關注的政治人物、體育明星等進行識別;識別圖片中出現的物品,對視頻整體描述會有極大輔助作用。
2.2.2 視頻結構化分析
原始的視頻數據屬于一種非結構化的數據,并不能夠直接快速地被計算機讀取并識別。為了讓視頻圖像在智能化文娛領域更好的應用,使用智能視頻分析技術對視頻圖像進行結構化處理。將視頻內容(人、車、物、活動目標)特征屬性自動提取技術,對視頻內容按照語義關系,采用目標分割、時序分析、對象識別、深度學習等處理手段,分析和識別目標信息,組織成可供計算機和人理解的文本信息的技術。主要包括以下內容:
事件拆條:通過智能化技術將已播出的節目拆條成一條條獨立的條目,然后用于豐富和完善新聞資訊節目數據的信息通道,提高節目內容的生產效率以及拆條后的視頻質量。
語音內容提取:支持將音頻文件識別成文字,以文本形式輸出,支持聲紋識別,并支持語音斷點識別。
字幕提取:制定視頻文件,對指定區域的字幕進行識別,識別出文字;支持中文、英文的字幕識別。
3 結語
當今,大數據的發展日新月異,基于用戶畫像的精準推薦系統是對大數據更加高效、更加便捷的利用。用戶畫像在視頻行業得應用實踐以及個性化推薦應用并不是很多,所以針對視頻數據上的用戶畫像是精準營銷的前提和保證。數據挖掘出用戶的偏好和需求是構建用戶畫像的意義所在,只有與時俱進,不斷創新,才能跟上時代的步伐。
參考文獻:
[1]司夢楚,季同同,張春明.服裝智能推薦系統在電商平臺中的應用[J].服裝學報,2019.
[2]龍虎,彭志勇.大數據驅動的個性化服務智能推薦系統研究[J].信息與電腦(理論版),2019(10).
[3]李映坤.大數據背景下用戶畫像的統計方法實踐研究[D].2016.
[4]何文華.智慧超市廣告智能推送系統[J].電子技術與軟件工程,2019(13):249.
[5]王正友,張海迪.大數據時代基于用戶畫像的視頻精準推薦[J].電子商務,2019(10):6265.
[6]王憲朋.基于視頻大數據的用戶畫像構建[J].電視技術,2017,41(06):2023.
[7]于洪涌,邱晨旭,聞劍峰.IPTV視頻個性化推薦方案[J].電信科學,2017,33(12):127135.