山西廣播電視無線管理中心 李曉光
大數據技術在廣播電視監測中的應用方法
山西廣播電視無線管理中心 李曉光
豐富多樣的廣播電視播放形式不斷的推動了廣播電視監測系統領域的發展,同時需要檢測的數據信息量也明顯的增加,而當前的廣播電視監控的重中之重就是在龐大的檢測數據的體系中獲得有效的信息。文中對大數據的特點及將來的發展應用進行了講述,對分析監測數據有很好的參考作用。
大數據技術;廣播電視監測;應用
伴隨著高速發展的廣播電視業務,形成了多元化的監測播出形式,同時涉及的領域和規模也不斷擴大,對于廣播電視監測工作者而言,在大量的數據中得到有效的信息是當前行業面臨的最重要的問題,將信息量龐大的數據進行處理及應用被稱為大數據。當前的監測工作雖不屬于大數據時期,但正在逐步趨向于大數據時代。
1.1 數據預處理技術
通常用到的數據預處理的方法是將數據進行抽取和清洗。數據的抽取過程即數據集成,是將結構化的數據或者形式復雜的非結構化數據進行同質化,對后期的數據分析起到了很好的作用。數據的清洗指的是將將那些可有可無的數據清除掉,將有用的數據留下。當前社會,行業中起到主導地位的是Datastage和Powercenter兩款,可以依照數據結構由易到難對大量數據進行收集、變換、分發等操作,從而做到有效的處理大數據。
1.2 數據存儲與數據管理
數據管理是指利用計算機的硬件和軟件將數據采集、儲存及處理的過程。數據管理可以很好的將數據的功能展現出來。而對數據進行嚴格管理的重要之處則是數據組織。時代的發展也在影響著數據管理的發展,由原來的人工管理到文件系統,再到現在的數據庫系統共三個階段。數據庫系統中包含有數據結構,這樣不僅能很好的展現出數據之間的關聯,還對數據的修復及引申更新有一定的好處,同時還具有保證數據獨立、安全、完整的優點,使數據管理的效率得以提高。
1.3 數據挖據與智能分析
數據挖掘觸及到人工智能、模式識別、機器學習以及統計學等諸多方面。數據挖掘指的是在大量的數據信息中利用算法的方式將有用的信息搜索出來的過程。將計算機科學作為數據挖掘的主體,主要采用統計、在線分析處理、檢索、機器學習、專家系統和模式識別等方法,以此來達到搜索目標。且在商務管理、生產控制、市場分析和工程設計等眾多領域使用被檢索到的信息。
2.1 業務過于龐雜
目前廣播電視監聽監視系統、廣告監管系統、安全播出系統、WAP監管系統等大量系統投入到廣播電視監管工作中,導致業務系統十分的繁雜。導致服務器數量過多,且每一種管理方法與同一類型或系統相互呼應,使得監測監管工作的在極大數量的服務器中有著非常龐大的任務,而且上層應用接口、流程非常繁雜,使廣播電視監測監管工作變得十分的困難且繁瑣。
2.2 備用系統不足
目前的廣播電視監測監管過程中,現有系統受到人們的重視而備用系統的重要程度卻被人們所忽視,當系統和設備突然出現問題時,需要經過長時間的且非常復雜的手段才能將系統環境修復,備用系統不充分導致廣播電視監測監管工作遇到問題時不得已而暫停,使工作效率與工作質量降低。
2.3 資源利用不均
主機資源不能有效的被利用是當前的廣播電視監測監管過程中普遍存在的現象。一般情況下,在部署的輕量級應用主機當中,計算和I/O資源在輕量級的主機中處于閑置狀態,且固定的一個主機上會運行單一的業務,導致一部分主機被擱置,造成資源浪費,且重復投資的狀況頻繁出現。
2.4 平臺升級困難
硬件不斷更新,與之配套的操作系統和數據庫也隨著不斷變化,各業務系統不斷升級,導致業務系統運行穩定性差,由于尚未統一規劃軟件版本和硬件配置沒有統一的標準,導致對后期的工作帶來較大的影響。
3.1 采集監控信息
廣播電視監測監管分析系統依據大數據而建立,其中的采集監控信息模塊,將大數據的分析技術、互聯網搜索及文本挖掘技術合理的利用后,對各種社交軟件中產生的信息開始全面的整理及應用。能夠主動對互聯網中產生的資源信息進行增量采集,不僅能有效的建立原始信息庫還能實時更新。并且,此模塊能將網站中的多種語言信息全部進行采集,更便于廣播電視行業加強對國內外敵對勢力的動態信息的采集。網頁、視頻、圖片等各種模式的信息及網頁與論壇中的均可以利用全媒體技術進行采集,且將信息保存到數據庫中。
3.2 處理監控信息
文本和媒體在大數據中的挖掘技術經過過濾、排列、分類采集可以獲得原始信息資源,且能夠自動將內碼轉換成智能模式進行分析和處理監控信息,因而形成了內容豐富的信息樹。人工記錄信息在大數據技術中心也同樣支持,可以依照現實對它進行一系列處理,如:加工、修改或刪除。最重要的是,大數據技術能夠幫助頁面完成有效元數據的自動提取,也就是自動分析功能,同時能將垃圾文件自動刪除,避免了各種資源浪費。
3.3 分析監控信息
廣播媒體監測監管系統中的分析監控信息模塊不僅能快速的對監控信息分析處理,還能進行檢索工作,并且通過授權的方式對監控信息完成檢索,按照不同情況來提供與之相符的信息服務。尤其是大數據技術當中的知識管理技術能夠將需要分析的數據整理成報告及統計圖表,便于工作人員更加簡潔明了的了解監控情況。在監控信息導航技術能夠將各種信息數據分類并對監控報告進行管理;在其基礎之上,廣播電視行業可以對互聯網重點事件分析報告及監控分析報告做出相應的預警信息,警示其他人及時對違法違規的信息進行阻止且刪除。管理電視廣播監控監管工作的人員也可以隨時對監控信息導航樹定義和管理,方便對時間中的各種邏輯關系進行深入解析。
大數據作為一種資源、一種工具,雖然為廣播電視監管工作帶來翻天覆地的變化,但大數據仍無法將所有的數據采集、加工處理,所以并不能提供絕對準確的答案,我們只能將它作為參考數據,不能完全依賴。
[1]朱磊.廣播電視監測信息管理平臺的建設[J].現代電視技術,2007(10).
[2]程石,劉志偉.探究廣播電視監測中大數據技術的應用[J].通訊世界,2017(08).
[3]秦琨琨.廣播電視監測中信息化應用及安全防護[J].數字傳媒研究,2016(04).
[4]趙杰,丁勇扎西.廣播電視監測網安全管理平臺安全響應工單系統的設計與實現[J].廣播與電視技術,2007(11).
[5]王春雨,葉建超,關?。赩B的廣播電視監測報表軟件的設計與應用[J].電子世界, 2016(01).
[6]蔡國賢.廣播電視監測技術的研究[J].黑龍江科技信息,2015(31).
[7]趙國強.基于互聯網建立廣播電視監測服務平臺的構想[J].廣播電視信息,2014(03).
[8]李碩.廣播電視監測系統的應用與發展[J].電子制作,2013(16).
[9]李金根.廣播電視監測網網絡安全研究[J].科技創新導報,2011(24).
李曉光(1982—),男,山西翼城人,學士,工程師,從事廣播電視技術工作。