□戴冬云
現階段,應用大數據技術可以對海量數據和信息進行高效分析和處理,獲取有價值的信息,減少人的工作量,有效緩解工作壓力。就目前的發展狀況來看,監測工作還沒有進入到大數據時期。因而,現階段做好大數據技術的應用對于提升廣播電視監測工作具有重要意義。
大數據技術的應用,需要借助各種各樣的網絡數據庫和引擎等工具,同時該技術可以實現搜索、分類功能,并且可以進行數據的分析等。通過利用電子計算機所具有的高速運算能力,可以對一些事件或者是與事件相關的事物進行精確的研究與分析。這樣一來,就能夠在一定的范圍內對未來發展的方向做出相應的預測。通過大數據技術的應用,還能實現海量數據的快速、自動處理和分析,進而可以減少人力勞動。另外,大數據技術還能提供許多個性化的數據服務與應用,圖1為大數據處理平臺基本框架。

圖1 大數據處理平臺基本框架
在進行數據的預處理工作時,需要做好數據的抽取和清洗工作,這樣一來能夠將結構化的數據進行同質化處理,并且這一過程可以對形式相對復雜的非結構化數據做出同質化的處理,這一技術通常被稱為數據的抽取環節,也就是數據的集成。這一工作對于后續的數據分析有著重要的作用。通過抽取可以將一些無關緊要的數據排除在外,進而能夠獲取到更有價值的數據,這個過程就是數據的清洗環節?,F階段,Datastage以及Powercenter是行業內部應用較廣的兩款主流產品。清洗之后,可以按照數據結構從簡單到復雜的關系,進行大量數據的深層次操作。比如進行數據的收集、變換以及分發等,這對于大數據的高效處理有巨大的推動作用,圖2為數據預處理技術示意圖。

圖2 數據預處理技術示意圖
數據的存儲與管理主要借助于計算機的硬件與軟件得以實現,這一過程中可以實現數據的收集、存儲與處理、應用。通過應用數據管理技術,可以有效體現數據功能。隨著時代的不斷發展,數據管理也經歷了三個階段的變遷,早期的管理方式主要是以人工管理的方式為主,隨后而來的就是文件系統?,F階段,數據管理主要借助于數據庫系統來實現。通過將數據結構建立在相應的數據庫系統之中,可以實現數據間的聯系,同時可以進行數據的修改以及擴充、更新。通過應用數據管理技術,還能確保數據的獨立性、安全性與完整性,極大地提升數據管理工作的效率。
一般來說,數據挖掘涉及到的領域較為廣泛,比如現階段應用較廣的人工智能技術以及模式識別技術等。對于數據的挖掘過程來說,主要是以算法的方式從海量的數據中找出相應的有用數據。該技術將計算機科學作為載體,同時還應用了統計、在線分析處理以及專家系統、檢索、模式識別、機器學習等方法。通過應用該技術,可以達到高效的搜索目的。另外,搜索到的相關信息也經常被應用到商務管理、市場分析以及生產控制等環節,圖3為數據挖掘處理系統結構圖。

圖3 數據挖掘處理系統結構圖
目前,隨著現代化信息技術的不斷發展,廣播電視監測技術逐漸朝著自動化、網絡化、數字化的方向發展,該技術的應用極大地保障了廣播電視節目的安全播出。但是,現階段廣播電視監測監管工作還存在著一些問題,需要引起重視。
對于廣播電視行業來說,其不同的監測業務相對獨立,不同監測業務單位之間缺乏必要的協調與溝通。這樣一來,就造成不同監測系統之間很少進行數據上的交互。同時,由于同業務網內部的一些監測都是各自進行建設的,所以就會導致資源數據的利用方面出現浪費。因而,廣播電視監測工作要跟著行業發展的趨勢走,還要注重監測模式的融合以及合作、創新,最終形成一個智慧監管的大網。
近幾年來,隨著監測行業硬件升級速度的不斷加快,與之相匹配的硬件操作系統和數據庫環境也在不斷地進行著更新。目前,各個業務系統經常需要向新的平臺移植業務軟件并進行實時的升級,這在一定程度上對業務系統的穩定運行造成了一定的影響。由于軟件版本以及硬件配置沒有進行統一規劃,因而導致后期階段的硬件性能升級工作出現較大的困難。
隨著廣播電視行業的不斷發展,行業內監測系統在技術等方面有了很大的進步。但是,對于廣播電視的智能化程度來說,還有很大的改善與提升空間。一方面,因為大數據分析和新技術的應用相對較少,同時在應用方面質量不高,所以造成了行業內很多監測工作需要人工來完成;另一方面,監測數據的關聯分析效果較低,同時行業內不同監測模塊之間的關系較為獨立;此外,在進行相關監測數據的采集、分析工作時,也存在著較大的局限性,這一局限性主要體現在本單位設備的測量以及相應的監測數據方面。因而,對于廣播電視來說,要做好數據的采集以及制作、傳輸等工作,必須不斷提升監測的智能化程度,進而有效提升監管的效率與價值。
在應用大數據技術的過程中,首先要做好信息的采集工作,并且要形成初始信息庫。在這一過程中,要把繁雜的監測數據采集到相應的數據庫中,同時還要做好數據的分類工作,進而提升初始信息庫的利用價值。采集過程中,工作人員要適當降低正常頻譜存儲的精度,同時還要做好一些異常頻譜的重點存儲工作。
對于目前的廣播電視監測工作而言,從最初的數據采集工作到初始數據的處理,需要經歷重新的過濾、排列以及分類等環節,并且這一過程中要建立相應的專業化模型。對于專業化模型而言,可以支持手動記錄信息情報。在進行信息的處理工作時,如果發現相應的重點或者是難點內容,工作人員要結合實際情況做好相關數據的加工、處理、刪除等工作。
信息采集與處理工作結束后,工作人員要做好相關信息的分析工作。通過進行數據分析,能夠充分應用監測體系的信息導航功能,這樣一來就可以提供一系列的信息服務,同時還能對監測報告以及信息統計圖表起到良好的規范作用。這一環節中,一旦發現與異態相吻合的信息,工作人員要及時通知用戶并進行查看,同時還要適時地發出預警。另外通過做好監測信息的分析工作,并結合實際的狀況,可以隨時進行信息導航樹的定義、管理與監測,使之更加完善、合理。此外,在進行大數據技術的應用時,還要注意對大數據潛在價值的挖掘工作。一項數據可能現在沒有價值,但是在未來可能存在相應的價值,因此,我們要積極改變思維,用創新性的方式與思路進行數據的整理。比如可以對有線電視單個頻道的EPG信息以時間為序進行相應的縱向分析,進而幫助工作人員詳細掌握頻道節目的主要構成;通過全國范圍內的有線電視節目EPG信息的橫向分析工作,可以清晰地了解到節目的重播率,進而分析出節目的受歡迎程度。
大數據技術雖然是一項具有預測分析、數據挖掘、數據存儲等多種功能的綜合技術,但是不能過于迷信大數據,也不能認為數據分析能夠揭示出一切的問題。對于大數據分析而言,它的方法主要包括統計理論、數學理論、計算機科學理論等。大數據架構并不是一種萬能的架構,傳統的數據結構也具有相應的優勢與特點。在大數據時代,單位內部的數據結構主要表現出混合式的架構。精確數據具備一定的優勢,每一條數據均有準確的含義和確定的價值,同時還能夠表達出明確的信息。
進入二十一世紀以來,伴隨著信息技術的快速發展,大數據技術在廣播電視行業的應用越來越廣泛,并且這一技術已經成為平臺構建、海量數字信息分析以及數據存儲環節中的一項重要技術。因此,在新媒體時代,廣播電視行業要注重大數據技術的應用,并且要進行違法、違規信息的分析,防止不良信息的散布和傳播,凈化廣播電視大環境,促進廣播電視行業的和諧穩定發展。