999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據挖掘在電視節目效果評估中的研究與應用

2021-09-10 06:13:55劉丹趙云飛
科技研究 2021年20期
關鍵詞:數據挖掘大數據

劉丹 趙云飛

摘要:當今,在新媒體的猛烈攻勢下,傳統電視媒體受到了很大的沖擊。傳統媒體正開始尋求與新媒體的融合發展,媒介融合、臺網互動由學術概念發展到實際的業務當中。本文在對國內外研究成果梳理、總結的基礎上,結合自身的項目經歷,運用大數據、數據挖掘、文本情感分析等理論和方法,探索了大數據在互聯網電視節目效果評估中的應用。

關鍵詞:大數據;數據挖掘;電視節目

引言

大數據時代,每一檔電視節目,觀眾均會對其發表大量的網絡評論,這些評論帶有觀眾對電視節目的態度和觀點,通過研究這些網絡評論數據可以挖掘觀眾態度、喜好,電視工作者通過這些信息可以更好地進行節目內容的創作。

1 需求分析

本文研究的內容來源于實際項目的需要,研究電視節目在新媒體領域的傳播效果。系統主要功能包括:視頻網站中電視欄目的用戶評論的采集、海量用戶評論的存儲、用戶評論的分析。本次研究,將選取綜藝節目《奔跑吧兄弟》,采集其在愛奇藝、優酷、騰訊視頻平臺的評論數據,通過海量數據的數據挖掘,評估用戶對節目的情感傾向性。

2 系統設計與實現

2.1 系統總體設計

本系統的技術架構[1]:

(1)數據采集層:采集海量的用戶評論數據。采集后的數據經過抽取、轉換、加載的處理。

(2)數據存儲層:匯總存儲采集的用戶評價數據。

(3)數據挖掘層:由管理平臺負責整體任務的調度,MapReduce負責計算引擎,通過機器學習模型,實現海量用戶評論數據的文本情感分析,并將分析后的數據存儲到數據倉庫中。

(4)數據可視化層:接收用戶提交的各項分析任務請求,調用底層的分析引擎進行數據的分析任務,將底層分析結果返回給前臺界面顯示。

數據流的走向設計:

2.2 數據倉庫設計

本系統的數據倉庫基于數據立方體理論進行設計[2],包含2-D數據表,以及3-D數據表:

2.3 大數據平臺設計

本次課題研究將選取Cloudera發行版作為大數據平臺。

基礎環境采用4臺機器的集群模式,單臺機器配置:

CPU:Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz *4

內存:32G

硬盤:1T

操作系統:CentOS6.5

主機 Hadoop組件

CDH Node1 HBase Master、HBase RegionServer、HDFS NameNode、HDFS DataNode、YARN NodeManager、Zookeeper Server

CDH Node2 HBase RegionServer、HDFS DataNode、HDFS SecondaryNameNode、YARN NodeManager、YARN ResourceManager、Zookeeper Server

CDH Node3 HBase RegionServer、HDFS DataNode、Oozie Server、YARN NodeManager、Zookeeper Server

CDH Node4 HBase RegionServer、HDFS DataNode、YARN NodeManager

2.4 數據采集模塊的設計與實現

本系統涉及的數據源包括優酷、愛奇藝、騰訊三個視頻網站的綜藝節目《奔跑吧兄弟》的用戶評論數據。

用戶評論數據表,共分為三個數據庫表comment_youku、comment_iqiyi、comment_qq,MySQL數據庫表設計

數據采集模塊的工作流程:獲取用戶評論數據URL->解析URL數據->將數據暫存到MySQL數據庫。

2.5 數據存儲模塊的設計與實現

數據存儲模塊,定期從數據庫表comment_youku、comment_iqiyi、comment_qq同步數據到HBase中。

使用ETL工具將MySQL數據庫中的用戶評論數據定期、增量導入到HBase,處理流程:配置MySQL/HBase數據源->MySQL中的數據表與HBase中的數據表進行映射和規則轉換->配置每天零點定時執行的計劃任務。

2.6 數據分析模塊的設計與實現

本文將采用基于機器學習的情感分析方法。為了能針對海量評論數據進行大規模的情感分析,需要基于MapReduce計算引擎完成。

本系統將使用Java開發實現MapReduce的過程:連接HBase數據庫->創建MapReduce任務->Map過程:調用機器學習模型完成每條用戶評價的情感傾向性判斷->Reduce過程:實現電視節目評價分析的數據匯總。

2.7 數據可視化模塊的設計與實現

數據可視化模塊,使用Web交互模式,用戶可以通過瀏覽器查詢分析結果。采用MVC設計模式。在頁面展示方面,圖表展示基于ECharts框架進行開發。

數據可視化模塊的處理流程:互聯網電視節目評價分析查詢->根據用戶選擇的不同維度匹配不同的分析引擎->查詢數據倉庫相應的維度數據->頁面呈現。

3 結語

大數據挖掘技術應用于電視節目效果評估,本文進行了研究及系統設計實現。我們可以基于此系統,進行非常廣泛的實際應用,例如通過獲取觀眾對電視節目的評論信息,分析觀眾對電視節目的喜好,及時調整電視節目的制作。

參考文獻

[1]曹佳豪. 基于Hadoop的報文數據挖掘研究與應用[D]. 武漢郵電科學研究院,2018.

[2]丁青松. 基于Hadoop平臺的大數據增量處理技術的研究[D]. 東北大學,2014.

作者簡介:劉丹(1980-),女,漢族,遼寧沈陽人,碩士,軟件工程師,研究方向:大數據技術

猜你喜歡
數據挖掘大數據
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 国产在线视频福利资源站| 国产H片无码不卡在线视频| 国产三级韩国三级理| 亚洲一区第一页| 国产性猛交XXXX免费看| 精品亚洲欧美中文字幕在线看| 99国产精品一区二区| 无码精油按摩潮喷在线播放| 精品久久香蕉国产线看观看gif| 992Tv视频国产精品| 精品亚洲欧美中文字幕在线看| 欧美精品在线观看视频| 日韩亚洲综合在线| 2048国产精品原创综合在线| 又大又硬又爽免费视频| 欧美日韩理论| 97在线免费| 国产导航在线| 成人夜夜嗨| 国产一区二区在线视频观看| 日韩欧美在线观看| jizz国产视频| 露脸真实国语乱在线观看| 99久久亚洲综合精品TS| 美女潮喷出白浆在线观看视频| 欧美国产日韩在线观看| 免费中文字幕在在线不卡| 欧美一级特黄aaaaaa在线看片| 日本高清成本人视频一区| 69精品在线观看| 免费一级α片在线观看| 国产精品白浆在线播放| 国产成a人片在线播放| 国产幂在线无码精品| 免费国产无遮挡又黄又爽| 亚洲成人在线免费| 无遮挡国产高潮视频免费观看| 99热这里只有精品在线播放| 国产成人精品高清不卡在线| 四虎综合网| 青青草原国产av福利网站| 精品久久久久久久久久久| 久久国产av麻豆| 91国内外精品自在线播放| 欧美在线三级| 超碰精品无码一区二区| 国产成年女人特黄特色毛片免| 熟女成人国产精品视频| 91在线国内在线播放老师| 午夜精品久久久久久久2023| 精品日韩亚洲欧美高清a| 国产一级毛片yw| 五月激情综合网| 99er这里只有精品| 午夜一级做a爰片久久毛片| 亚洲第一成年人网站| 亚洲高清中文字幕在线看不卡| 久久久亚洲色| 亚洲国产精品不卡在线| 国产免费怡红院视频| 少妇露出福利视频| 国产亚洲精久久久久久久91| 国内精品91| 成年人久久黄色网站| 国产精品无码AV中文| 香蕉eeww99国产在线观看| 青青操视频在线| 日韩精品一区二区深田咏美| jijzzizz老师出水喷水喷出| 精品超清无码视频在线观看| 麻豆精品视频在线原创| 亚洲 欧美 日韩综合一区| 一级看片免费视频| 亚洲丝袜第一页| 72种姿势欧美久久久大黄蕉| 欧美成人影院亚洲综合图| 国产精品无码影视久久久久久久 | JIZZ亚洲国产| 午夜精品久久久久久久99热下载| 四虎永久在线精品国产免费| 中国成人在线视频| 成人午夜网址|