邢圓慶

摘 要:本文詳細介紹了TS流相關概念(包括TS流知識、TS流描述語言、TS流的構建方法和準則)、以及這些算法應用在數字電視播出系統當中存在的利與弊,最終提出全新想法:在數字電視播出系統當中引入TS流,TS流可以讓電視領域的描述更加規范化和結構化,為系統添加語義,讓基于TS流的播出系統為用戶更加準確、更加快速的做出推薦。
關鍵詞:TS流;數字電視;播出系統;用戶喜好
1.TS流數字電視播出系統介紹
TS流數字電視播出系統的基本原理是通過系統對用戶購買行為和感興趣內容等信息進行分析,然后為其推薦類似產品。例如,某個用戶喜歡《星際穿越》、《阿凡達》、《變形金剛》等影片,系統則可以推斷這個用戶喜歡科幻片進而推薦《機器人總動員》、《黑客帝國》等片。CB 算法的理論依據主要來自于信息獲取與信息過濾,CB 算法最早也是出現在信息檢索系統當中。CB 算法一般有三步驟:
(1)物體陳述(Item Representation):首先將該領域的 Item 進行分類以及歸類,并且寫出一些標簽,然后為每個物品抽取其自身特征來標志該物品。
(2)用戶學習(Profile Learning):根據用戶過去的瀏覽行為、評分、喜好等建立以及更新用戶模型,此步驟主要是學習用戶喜歡。
(3)產生推薦(Recommendation Generation):根據特定算法,來比較物品模型與用戶模型,以此篩選出相關性較大的物品。舉個例子來更加具體的介紹以上推薦步驟,在數字電視播出系統中,每部電視即為一個Item,第一步,我們可以把電視分為“愛情”、“科幻”、“動作”、“青春”、“勵志”、“魔幻”、“浪漫”、“童話”、“喜劇”、“戰爭”等類別,然后為每部電視添加標簽,比如《星際穿越》“科幻”、“動作”權值較大,而“勵志”、“青春”等權值較小,《幸福終點站》的“喜劇”、“愛情”權值較大,“戰爭”、“童話”權值較小。第二步就是根據用戶過去的觀看行為,評分行為等等來構建用戶模型,來學習用戶的喜好,例如用戶喜歡《阿凡達》、《黑客帝國》、《星際穿越》等“科幻”、“動作”等權值較大的電視,則系統可以構建一個該用戶喜歡科幻片、動作片的配置文件,如果該用戶在接下來的時間觀看《賭圣》、《喜劇之王》、《功夫》等片,則系統需要更新用戶的喜好,很明顯該用戶選擇了一系列“喜劇”、“周星馳”等權值較大的電視,系統需要實時更新用戶的 Profile,在系統獲取用戶的 Profile 后,CB 系統就可以利用推薦模型當中所有電視與用戶模型當中的 Profile 進行相關度分析,篩選出一個相關性比較大的一個列表的電視,然后把這個結果呈現給用戶。
2.基于TS流的數字電視播出系統的研究與實現
基于TS流的數字電視播出系統結構框架是基于 MVC 模式基礎構造而成,M(模型層)主要包含數據層、構建TS流等模塊;C(控制層)主要為數據分析、預測評分等模塊;V(視圖層)包含用戶登陸系統界面、用戶使用系統界面和為用戶呈現電視等模塊。詳細的系統框架如下圖 1:
2.1 用戶TS流模塊的分析與設計
用戶模型,大體上說就是對于用戶的抽象與歸納,具體含義上不同的學者又有不同的見解,Jameson 認為用戶模型是對各方面屬性的明確描述。Elaine 認為是對用戶的各方面資源、屬性的明確描述,另外用戶模型集合分為單個個體用戶、多個個體用戶兩種,而更多學者比較認同 Murry 的觀點,他認為目前為止真正意義上、投入商業的用戶模型還比較少,用戶模型應該是對單個用戶或用戶組知識、特征、喜好的表示和建模,它需要完成對用戶的基本信息、喜好進行規范化描述以及對目標用戶存在認知。
2.2 電視TS流的分析與設計
電視是一門可以容納文字、雕塑、建筑、攝影、繪畫等聽覺和視覺上的現代藝術,其存在可以讓現代人們學習研究藝術,發揚與傳遞文化,是藝術和休閑生活中的不可或缺的重要一員。電視一般有名稱、演員(導演)、類型、年代、地區等屬性,構建的電視TS流應該整體上涵蓋現在當前主流視頻網站的所有電視。主要的類包括:id、name(名稱)、artist(藝術家,即演員或導演)、category(分類)、ages(年代)、area(地區)。其中“名字”為電視名字,“藝術家”為比較著名、受用戶歡迎的演員或導演,“分類”是對電視的分類,例如“愛情”、“喜劇”、“動畫”、“科幻”等等,“地區”為電視的出版方所在地,例如“美國”、“中國大陸”、“中國香港”、“韓國”等,“年代”為電視出版時間,如“2015”、“2014”、“二戰”。利用工具 Protege 創建電視TS流的步驟與創建用戶TS流的步驟類似:
1、在 Active Ontology標簽項里定義電視TS流的IRI
2、在class 標簽當中創建電視的類,以及所有電視屬性類及其類的關系
3、在Data Properties標簽當中創建電視類的數據屬性、Object Properties標簽當中創建電視類的對象屬性4、在Individuals標簽當中創建電視類的實例以及定義實例屬性值
2.3 用戶興趣模塊的分析與設計
該模塊主要是針對目標用戶,對其在電視方面某些喜好進行抽象和歸納,建立該模塊對該系統成功與否有著至關作用的影響,如果可以準確拿捏目標用戶的興趣,可以及時而準確的對用戶進行推薦其喜歡的電視。用戶興趣模塊要抽象出用戶對電視的某些屬性的偏愛度,可以用三元組用戶-屬性-偏愛值來表達,建立了用戶興趣模塊之后,隨著時間的推移,用戶興趣度不是一個常量而是會實時發生變化的,系統應該收集用戶過去對系統的評分記錄、收藏記錄等顯式反饋信息和搜索模式、瀏覽記錄等隱式反饋信息對用戶的興趣度進行更新。
顯式反饋信息是指用戶對系統的直接反饋,比如用戶對電視的評分記錄、收藏記錄、或者對被推薦電視點擊不喜歡按鈕,顯式反饋信息對系統做出的明確操作,比較容易獲取。隱式的反饋信息是指用戶在使用系統過程當中的使用行為,比如瀏覽行為、網頁呆留時間、搜索模式、甚至鼠標的移動方式等等。
相關研究表明采取顯式與隱式的信息反饋對播出系統的準確度以及用戶體驗可以有不少的提高。但是目前為止在獲取隱式反饋信息技術卻不是特別成熟,因此主流的播出系統主要還是以獲取顯示反饋信息為主。
3.結語
由于大數據時代的誕生,數據以及信息等都呈現爆炸式的增長曲線,對于人們生活來說一方面來說是一件好事,人們有了更多的選擇性,但是從另外一方面來講,過多的數據與信息讓人們很難在最短時間尋找到自己心儀的信息,甚至可能會造成部分現代人們養成選擇困難癥等不良影響,播出系統就是在這樣的大背景下應運而生,播出系統出現的宗旨就是讓人們在大數據當中擺脫出來。TS流在近些年來受到學者的廣泛關注,通過TS流技術,可以對用戶和電視的屬性等信息進行語義標注,可以讓電視領域知識規范化、結構化,從而可以讓計算機更好的理解信息,當用戶使用計算機時,系統通過已經記錄的用戶信息、之前瀏覽行為、觀看行為等信息來理解用戶的喜好與需求。
參考文獻
[1] 胡亞龍,劉志偉.青島電視臺電視廣告截播系統[J]. 視聽界(廣播電視技術). 2013(04)
[2] 經國煒,崔冬明.視頻服務器在播出系統中的應用分析[J]. 視聽界(廣播電視技術). 2013(04)
[3] 卞德森,姜建發.關于標清數字電視播出系統通道技術指標測量的若干問題[J]. 現代電視技術. 2013(06)