999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

廣播電視節目標簽標注與可視化研究

2015-06-22 14:40:34張貝貝殷復蓮王欣然白雪松
電視技術 2015年20期
關鍵詞:可視化信息

張貝貝,殷復蓮,王欣然,白雪松,白 璐

(中國傳媒大學 信息工程學院,北京 100024)

廣播電視節目標簽標注與可視化研究

張貝貝,殷復蓮,王欣然,白雪松,白 璐

(中國傳媒大學 信息工程學院,北京 100024)

針對傳統廣播電視節目類型和節目標簽并行存在,無法定量刻畫節目與標簽接近程度,節目與標簽關聯關系展示效果不佳的問題,提出了電視節目與標簽“粘度”的概念,通過為電視節目標簽賦予不同權重,并利用D3插件建立節目與標簽的扁平化網絡結構關系,實現了節目與標簽關系的定量描述及可視化展示。通過抓取網絡熱播劇標簽,對標簽粘度進行計算及可視化展示,證明提出的方案能夠直觀、動態地將標簽粘度關系進行有效展示,可以為后續的數據分析和數據挖掘提供技術基礎。

節目分類;節目標簽;標簽粘度;可視化

1 電視節目分類與標簽的發展

學術界目前對中國電視節目類型的劃分中,按照節目主題和節目形式劃分,其中,按照節目主題進行劃分是目前業界最認可的分類方式。其中影響較大的是四分法,將節目分為新聞類節目、娛樂類節目、教育類節目、服務類節目。四分法是電視節目分類的一個基礎。郭鎮之[1]在《中外廣播電視史》中區分了四種類型:廣播電視新聞、電視劇、紀實類節目和電視綜藝。張海潮[2]的《中國電視分類體系》中對電視節目的四分法體系進行了進一步的拓展,他運用系統論方法、第一識別特征法、層級法、分類維度等方法建立了電視節目分類體系,基本囊括了中國所有的電視節目類型。層級法是目前國際通行的主要節目層級設定方法,具有查找簡易的特點。劉燕南[3]認為傳統的層級分類方法忽略了電視節目多屬性的特點,提出“電視節目多維組合的分類系統”。美國信息架構專家Thomas Vander Wal和Gene Smith于2004年首先提出大眾分類法這個概念,是由大眾的一致意見產生的基于用戶的分類體系。大眾分類法的重要特征之一是扁平化,它打破傳統的“知識之樹”的分類結構,沒有層次結構,只存在平行關系,迎合了Web 2.0信息大爆炸時代的需求。大眾分類法催生了標簽及標簽系統,人們使用標簽系統以便更加容易地對電視節目的信息進行分類或索引[4]。

盡管大眾分類法出現后對類型日益豐富的電視節目的分類有巨大貢獻,但是大眾分類法給出的標簽屬于平行關系,無法體現電視節目與其自身特點的定量關系,且將節目標簽之間的粘度關系形象地展示出來在國內外尚無人研究。自18世紀后期數據圖形學誕生以來,人們對于抽象信息的視覺表達手段進行了深入研究,以期用來揭示數據及某些隱匿模式的奧秘[5]。20世紀90年代期間圖形化界面問世,人們能夠直接與信息進行交互,帶動了十多年來的信息可視化研究[6]。尤其是互聯網時代的到來,更是把可視化研究的浪潮推到了前所未有的高度,可視化技術被應用于很多方面:數據挖掘可視化、網絡數據可視化、社交可視化、交通可視化、文本可視化、生物醫藥可視化等等[7-9]。信息可視化放大了人類的認知能力[10]:利用某種可視化資源等提高人類的記憶能力;信息承載量大,利用較少的空間表達大量的數據;提供一種便于操作的不同于靜態圖的媒介,加強模式識別功能,易化對于各種關系推理等。

本文在現有技術基礎上提出了節目與其標簽之間“粘度”的概念,通過給電視節目的標簽類型賦予不同的權重,將電視節目與其標簽之間的關聯關系定量描述;同時使用可視化工具建立展示節目與其標簽粘度關系和節目多維屬性的可視化網站,有效地將復雜信息處理成富含信息量的視覺信息,為后續的數據分析和數據挖掘提供技術基礎。

2 節目數據采集及預處理

2.1 數據采集流程

本文使用定向網絡信息采集系統來進行節目信息的采集。定向網絡信息采集系統能夠根據用戶自定義的任務配置及相應的參數,批量而精確地抽取因特網目標網頁中的半結構化與非結構化數據,轉化為結構化的記錄,保存在本地數據庫中,用于內部使用或外網發布,快速實現外部信息的獲取。數據采集流程如圖1所示。

圖1 數據采集流程圖

首先確定要采集節目信息的網站,根據不同網站的特點設置不同的參數和數據采集字段,通過網頁探索器定位采集目標,獲取采集目標的網頁節點路徑,然后配置任務文件,設置對應的參數如網頁遍歷模式、任務執行時瀏覽網頁的速度、目標表特征等并執行一定的腳本動作,獲取到原數據,最后對原數據用適當的文本處理函數,對數據進行整理變形,得到符合一定格式的數據,存入數據庫。

2.2 數據預處理

本文采集的電視節目來自于某省網10個城市2014年3月—5月的節目單數據,成功抓取到360影視、愛奇藝、百度視頻、暴風影音、電驢、豆瓣、風行網、芒果TV、搜狐視頻、騰訊視頻、迅雷看看、優酷土豆、電視貓、m1905電影網等網站的相關節目基本信息,將節目名稱去重后,把電視節目分為6大類:電視劇、電影、綜藝、新聞、青少年、其他。由于每個網站對不同大類的節目采集到的字段不完全一樣,故應對數據進行融合、統一。以下是數據融合的4種方法:

1)對于節目編導、導演、制片、集數/時長、地區、主持人、播出頻道、首播時間等節目固有信息,在不同網站上的信息基本一致,只需將多個網站的信息進行合并、去重,即可得到節目的最全信息;

2)對于節目簡介,在不同網站上的描述或許有輕微差別,取比較權威的網站,作為節目簡介信息的來源;

3)對于評分,在不同網站上有不完全相同的評分,取平均值作為節目評分;

4)對于節目類型,在不同網站上不完全相同,且不同網站上標注的標簽,雖有不同但實質上是同種含義,如“愛情”與“言情”,“中國大陸”與“內地”等,這種情況僅取其一,將“言情”全部替換為“愛情”,“中國大陸”全部替換為“內地”,此外記錄每個網站的節目類型信息,以備后續計算標簽粘度。

處理結果中每個大類下的節目都有相同的字段,且格式統一,如表1所示。

表1 各類節目信息采集字段

節目大類采集字段電視劇節目編導、導演、制片、演員、集數、年份、地區、評分、類型、簡介等電影節目編導、導演、制片、演員、時長、年份、地區、評分、類型、簡介等青少年地區、集數、作者、配音、評分、類型、簡介等綜藝地區、主持人、嘉賓、播出頻道、播出時長、評分、類型、簡介等新聞首播時間、重播時間、播出頻道、播出時長、主持人、類型、簡介等

3 節目標簽粘度

3.1 標簽粘度定義

標簽粘度指標簽與某節目的接近度、契合度或各大網站對該標簽的認可度。電視節目的標簽高度概括節目整體的信息,但是每個電視節目的特色屬性都各有側重,傳統廣播電視領域中節目標簽屬平行關系,無法定量描述節目與其標簽的關聯關系,因此本文用“節目標簽粘度”這一概念實現了對節目與其標簽接近度、契合度的定量描述。計算節目與標簽之間的粘度公式為

Viscosity=n/N

(1)

式中:N表示在近14個視頻網站數據庫里,某節目的所有不為空的記錄;n代表這些記錄里某個具體類別標簽出現的次數。標簽粘度值在0~1之間。

3.2 標簽粘度計算示例

以電視劇《射雕英雄傳》為例,表2是采集的所有視頻網站中,節目名為“射雕英雄傳”的記錄中標簽類型不為空的所有記錄。

表2 所有視頻網站中的節目類型

節目名稱類型1類型2類型3來源網站射雕英雄傳愛情古裝武俠豆瓣射雕英雄傳古裝武俠愛情愛奇藝射雕英雄傳古裝武俠愛情電視貓射雕英雄傳歷史年代搜狐視頻射雕英雄傳古裝武俠愛情迅雷看看射雕英雄傳愛情古裝武俠騰訊視頻射雕英雄傳古裝360影視射雕英雄傳古裝武俠百度視頻射雕英雄傳內地電驢射雕英雄傳古裝武俠愛情優酷土豆

按照粘度計算公式,14個視頻網站有10個網站中“射雕英雄傳”節目的標簽類型不為空,古裝出現8次,武俠7次,愛情6次,……,它們對應的粘度分別是0.8,0.7,0.6,…,如圖2所示。

圖2 節目與其標簽粘度關系圖

4 實驗及結果分析

本文從各大視頻網站采集了大量的節目標簽數據,并進行了數據清洗,引入節目與其標簽粘度的概念,計算了所有節目的標簽粘度,在此基礎上建立了一個節目與標簽的扁平化、可視化網絡結構。

4.1 節目標簽跳轉圖

以電視劇類電視節目標簽跳轉圖為例,如圖3所示。圖中,深灰色(屏幕顯示為深藍色)節點代表標簽,淺灰色節點代表電視節目,任一節目對應多種標簽,任一標簽下有多個節目,點擊標簽可以看到標簽的熱度、受歡迎度,點擊某個節目可以看到節目的各個詳細特征及其與每個標簽之間的粘度大小。電視節目與標簽之間可以自由跳轉,且可視化圖中有一些附加功能,用戶可以搜索查找自己感興趣的標簽或節目信息。

圖3 節目標簽跳轉圖

由于此圖采用的是D3中的力學圖布局,D3中的力學圖布局使用韋爾萊積分法計算,這是一種用于求解牛頓運動方程的數值方法,被廣泛應用于分子動力學模擬以及視頻游戲中,用到的參數有摩擦系數、引力、重力、連接線的距離、連接線的堅硬度等。故位于中心的標簽類型鏈接的節目最多,這些標簽熱度最高、最受歡迎,而邊緣上的標簽下轄節目最少,熱度低、相對較偏。點擊單個標簽,該標簽下轄節目變色,變色的節目節點所占比例對標簽熱度進行了定性描述,標簽右下角會出現該標簽下轄的節目數量,對標簽的熱度進行定量描述。

此外,標簽系統作為一種更為靈活、有趣的信息分類方式,已成為推薦系統的重要信息來源,許多優秀的推薦系統都采用了標簽做推薦,如Amazon,last.fm等。標簽是用戶特意標注的,它含有用戶信息和所標注節目的信息。所以標簽既代表用戶喜好又可以體現節目特征,通過標簽與節目的粘度可以找到用戶對節目的評價與喜好。綜合所有節目,發現熱門標簽有歷史、戰爭、愛情、古裝、劇情、家庭等,說明這些標簽很受歡迎。如果再挑出收視效果比較好的電視節目,計算這些電視節目的標簽粘度,便能更精確地得到觀眾收視偏好,從而進行個性化節目推薦或廣播電視收視智能決策等。

4.2 單節目詳細信息展示圖

點擊節目節點,會跳出新的一層,左邊展示節目與其標簽之間的粘度關系,右邊展示節目的一些固有信息如導演、主演、地區、年代、節目簡介等。這樣,從各個方面全方位展示了節目的詳細信息。

如對于電視劇《射雕英雄傳》,圖4展示了它的全方位信息,跟它粘度最大的幾個標簽是古裝、武俠、愛情,說明該節目更側重這些屬性,主流視頻網站對這些標簽的認可度要高于其他標簽。根據節目的其他信息,了解到這是一個發生在南宋時期的武俠故事,且演出陣容強大,有胡歌、林依晨這樣的大牌明星助陣,這樣的電視劇應該會受武俠迷、古裝迷、胡椒粉、晨粉們的追捧。結合其他數據可以進行電視劇的播前預測,如收視率預測、用戶評價預測等;也可以進行播后數據分析,如廣播電視收視行為挖掘、個性化節目推薦等。

圖4 單節目詳細信息展示圖(截圖)

綜上,通過抓取電視節目的標簽,對標簽粘度進行計算及可視化展示,證明本文所提出的方案能夠直觀、動態的將標簽粘度關系進行有效展示,可以為后續的數據分析和數據挖掘提供技術基礎。

5 總結

傳統廣播電視領域對節目的標簽標注忽略了電視節目多屬性的特點,且標簽之間是平行關系,沒有側重,不能很好的反映節目與各標簽之間的接近度、契合度。因此本文提出了電視節目及其標簽的“粘度”這一概念,通過對電視節目的不同標簽類型賦予不同的權重,并用可視化工具建立了一個節目與標簽的扁平化的網絡結構,將節目及其標簽間的粘度關系進行了定量描述及可視化展示,使復雜的信息簡明扼要的呈現在視覺上,為后續數據挖掘帶來便利。在接下來的工作中,將會改進數據采集方法,爭取實現數據的實時獲取、分

析處理,保證人們在用網站時看到的是最新的數據。

[1] 郭鎮之. 中外廣播電視史[M].上海:復旦大學出版社,2005.

[2] 張海潮.中國電視節目分類體系[M].北京:中國傳媒大學出版社,2007.

[3] 劉燕南.電視節目“多維組合”分類法及其編碼設計[J]. 現代傳播,2003(1):1-5.

[4] 張斌,張引,高克寧,等.融合關系與內容分析的社會標簽推薦[J].軟件學報,2012,23(3):476-488.

[5] CHEN M,EBERT D,HAGEN H,et al. Data, Information, and Knowledge in Visualization[J].Computer graphics and applications,2009(6):12-19.

[6] Wikipedia.信息可視化[EB/OL].[2015-03-07].http://zh.wikipedia.org/wiki/信息可視化.

[7] MAY R, HANRAHAN P,KEIM D A,et al. The state of visual analytics: views on what visual analytics is and where it is going[C]//Proceedings of Visual Analytics Science and Technology (VAST). Salt Lake City,Utah,USA:IEEE Press,2010:257-259.

[8] XIONG Lirong, WANG Mengjun, FAN Jing. A visualization system for web retrieved credit information[C]//Proceedings of Natural Computation(ICNC).Shanghai:IEEE Press,2011:728-733.

[9] 陸泉,劉高,陳靜. 一個圖像語義可視化交互標注研究平臺——以“情感語義標注”為例[J]. 情報理論與實踐,2014(8): 111-116.

[10] CARD S,MACKINLAY J D,SHNEIDERMAN B. Readings in information visualization: using vision to think[M].San Francisco:Morgan Kaufmann Publishers,1999.

責任編輯:哈宏疆

Tagging and Labelling of Broadcast TV Programs and Research on Visualization

ZHANG Beibei, YIN Fulian, WANG Xinran, BAI Xuesong, BAI Lu

(College of Information Engineering, Communication Universityof China, Beijing 100024, China)

In view of traditional broadcast television program type parallel existence, which is unable to quantitatively describe the fitness and closeness of programs and labels, as well as lacking of visualizing the relationship between the programs and labels , the concept of the “viscosity” of television program and label is put forward, the labels are assigned weights, and the flat network relationship between the programs and labels is painted, which quantitatively describe and visualize the relationship between the labels and programs. Through calculating the viscosity of labels, and visualizing the relationship the programs and labels, the result prove that the method proposed in this paper show the relationship between the programs and labels dynamically and efficiently, which can provide the technical foundation for data analysis and data mining.

Program classification; Program label; the viscosity of label; Visualization

國家廣播電影電視總局科研項目(2-4)

G221

A

10.16280/j.videoe.2015.20.017

2015-03-10

【本文獻信息】張貝貝,殷復蓮,王欣然,等.廣播電視節目標簽標注與可視化研究[J].電視技術,2015,39(20).

猜你喜歡
可視化信息
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 欧美啪啪精品| 国模私拍一区二区| 亚洲成人在线免费| 欧美丝袜高跟鞋一区二区| 欧美一区日韩一区中文字幕页| 青青青国产视频| 丁香婷婷在线视频| 欧美一区福利| 亚洲人成影院午夜网站| 日韩视频精品在线| 国产日本视频91| 91伊人国产| 亚洲成人精品久久| 九九久久精品国产av片囯产区| 91精品最新国内在线播放| 99久久精品无码专区免费| 人妻无码AⅤ中文字| 亚洲乱码在线播放| 99久久无色码中文字幕| 亚洲色无码专线精品观看| 亚洲免费播放| 99免费在线观看视频| av大片在线无码免费| 婷婷六月在线| 色香蕉影院| 欧美日韩国产在线人成app| 色老二精品视频在线观看| 亚洲国模精品一区| 国产一在线| 亚洲午夜天堂| a色毛片免费视频| 福利国产微拍广场一区视频在线| 香蕉久久国产超碰青草| 欧美不卡二区| 国产不卡网| 国内精品久久人妻无码大片高| 国产手机在线观看| 青青青草国产| 激情亚洲天堂| 日本一本正道综合久久dvd| 日本午夜精品一本在线观看| 欧美成人免费午夜全| 综合色亚洲| 色婷婷狠狠干| 亚洲无码视频图片| 永久免费无码日韩视频| 日本三区视频| 欧美在线黄| 亚洲无码高清免费视频亚洲| 久久性视频| 999国内精品视频免费| 天天视频在线91频| 少妇高潮惨叫久久久久久| 日本五区在线不卡精品| 国产在线精品香蕉麻豆| 欧美色丁香| 国产乱人乱偷精品视频a人人澡| 狠狠做深爱婷婷久久一区| 久久婷婷五月综合97色| 欧美色综合久久| 夜色爽爽影院18禁妓女影院| 一级毛片a女人刺激视频免费| a级毛片免费网站| 扒开粉嫩的小缝隙喷白浆视频| 亚洲一区二区三区国产精华液| 一区二区自拍| 米奇精品一区二区三区| 精品99在线观看| 91蝌蚪视频在线观看| 亚洲免费人成影院| 免费看av在线网站网址| 九九这里只有精品视频| 免费看av在线网站网址| 欧美日韩资源| 国产91精选在线观看| 国内嫩模私拍精品视频| 免费啪啪网址| 国模粉嫩小泬视频在线观看| 色综合综合网| 97久久免费视频| 久久不卡国产精品无码| 欧美精品1区|