文/戴文雄
針對于傳統媒體,如果想要實現真正的“媒體融合”,首先需要將傳統媒體與互聯網、手機等智能新媒體結合在一起,將不同的信息產品通過不同平臺傳遞給讀者。另外,應該對互聯網、手機等新興媒體中的信息優勢進行充分利用,將大數據的作用充分發揮出來,通過對數據的采集、分析等過程,為傳統媒體提供更好的服務工作,最終實現傳統媒體的流程再造。
想要實現大數據平臺的建設和發展,相關部門首先要做的就是數據采集。如果對數據的來源進行分類,可分為集團內數據和集團外數據;如果從數據格式上劃分,包括結構化數據和半結構數據。在平臺建設初期,相關工作人員需要根據平臺的最終建設目標,對需要采集的數據進行合理規劃,并根據數據的具體類型,選擇數據的采集方法。針對集團內數據,可以通過接口或文件畸形數據導入,并通過數據庫等裝置實現數據之間的對接。由于集團外部的網絡數據量較大,在大數據采集過程中,可對網絡爬蟲或公開的API進行合理利用,從而將網站中的相關文本、音頻等信息成功采集。
當數據采集工作完成之后,由于數據的來源和格式等存在不同性,再加上數量眾多,導致數據結構十分復雜。因此,在大數據實際應用之前,需要對其開展預處理工作,按照最終數據的使用要求,建設出一套或者多套數據選擇標準,并按照相應標準對數據進行處理,之后在輸送到讀者面前。在大數據預處理過程中,主要包括的步驟有數據抽取、數據清洗等。在數據采集過程中所獲取的大數據可能具備結構多樣化等特點經過數據抽取過程,可能會幫助人們將原本復雜的數據轉變成單一或者容易處理的結構類型,以此來達到對數據快速處理目的。在大數據使用之中,并不是所有數據均對人們有利用價值,有些數據信息更是讀者所不關心的,還有的數據存在明顯錯誤。因此,在數據預處理過程中,工作人員需要對數據進行仔細過濾,將無用或錯誤的信息驅除出去,從而實現數據預處理效果的有效提升[1]。
在數據預處理工作完成之后,工作人員需要將采集到的數據進行存儲,以此來實現數據的統一管理。一般來說,人們常用Hadoop主體架構來解決大規模的數據存儲問題。該架構由Apache基金會研究開發出來,屬于分布式系統的基礎架構。在使用過程中,用戶即使對分布式底層細節了解不夠詳細,也可以實現分布式程序的深層次開發,通過對集群的威力應用,最終實現數據的高效存儲。Hadoop還可以在分布式系統中建立文件庫,該軟件被稱為HDFS。HDFS在使用過程中具有較高的容錯率,可以將其利用在價格低廉的硬件裝置上,以此來實現數據傳輸效率的有效提升,適合在大數據環境下進行應用。利用該種架構對大數據平臺進行搭建,可實現對周期成本的有效降低。而在大數據存儲管理平臺建立的同時,還需要對同步平臺安全體系的建設進行充分考慮。工作人員可通過對數據的銷毀、加密等,促使大數據在存儲過程中保持完整,將整個存儲平臺的安全性有效提升。
在大數據分析過程中,可將其分成兩部分進行探討。其中,底層為基礎分析層,在這之上是業務分析層。基礎分析層的重要作用是為業務分析層提供分析基礎和服務,而業務分析層在工作過程中主要是根據用戶的不同需求,對分析對象進行準確定立,并在后續整合基礎分析服務,為用戶提供更為專業的分析結果。在實際分析工作進行時,工作人員可以根據已經建立好的多維語義,為每個標簽建立一個關鍵詞云庫,并根據以往使用的特定算法,對每篇新聞報道進行深層分析,并自動做好分類工作,將其輸送到固定的標簽之下。在自動分類過程中,分類結果可能在一開始可能存在問題,需要經過長時間的學習和訓練才能漸漸適應。除此之外,相關工作人員還要做好分類和糾錯工作,對分類算法和關鍵詞云庫進行適時更新,最終實現自動分類結果的合理優化[2]。
為了更好的促使媒體融合,各個媒體單位和部門做了大量的研究和實踐工作。以成都地區為例,當地媒體以成都地區300萬戶家庭的全量當做數據基礎,利用IPTV大數據分析系統,對收視率、收視份額等進行了全面統計和分析,時間甚至精確到秒,為各級廣播電視的節目優化和媒體融合發展提供了有利條件。與此同時,由于對觀眾需求有了一個大致的了解,為廣告主的精準營銷提供了數據支持,通過IPTV大數據分析系統,以及傳統媒體的權威性,再加上新媒體的傳播速度,廣告的影響力大大提升,為提升各個企業在市場中的知名度奠定了基礎。
智能選稿系統在業內被稱為智能“爬蟲”,可對互聯網中的新聞進行有效抓取,并通過大數據模型對熱點新聞事件進行深入分析,為新聞內容的產生和傳遞提供了有利條件。一般來說,新聞稿初選幾乎全部由機器來完成,并進行一鍵轉載,相關記者等人員可以根據關鍵詞的搜索,對熱點人物、專題等綜合信息進行獲取,從而為素材編輯提供數據支撐,還可以為新聞宣傳和媒體報道提供網絡傳播分析。這種選稿系統的出現,不但體現出了大數據的強大作用,還能在一定程度上提升媒體融合之下的新聞內容產生效率,促使新聞更加符合人們的關注點,最終實現新聞行業的全面發展。
大數據平臺在媒體融合之中的應用,主要體現在融媒體的數據分析過程之中。在日常媒體工作過程中,工作人員會在融媒體之中植入統一的數據“探針”,建立一個穩定有序的數據分析和采集系統,該系統的工作流程主要包括內容采集、生產、審核、發布。全過程都涉及到了大數據的分析,還涉及到很多政治服務、行業應用等全產品大數據分析體系。通過這種大數據平臺的應用,在促使媒體融合之外,還能實現各種產品之間的用戶互通,并實現用戶共享和內容共享,增加新媒體產品矩陣的創新性和共享性,還可以將大數據平臺的應用作用有效發揮出來[3]。
根據媒體融合過程中的內容產生機制和原理。首先,工作人員需要將全平臺與新媒體網絡之間的通路進行打通,在保證數據安全的前提下實現融合與共享。其次,需要按照內容匯集、資源共享等具體流程,對大數據平臺的應用進行全面指揮,以此來實現對熱點事件的全面融合性報道。在融合大數據使用過程中,需要對融合狀態下的全流程、全環節提供有效支撐。例如,在新聞內容的匯聚端口,人們需要根據智能選稿系統,對網絡中的熱點數據進行抓取,再通過融合編輯和資源共享,將記者的工作情況、稿件來源等進行掌握,而在此過程中,大數據平臺的可視化將會發揮出重要作用,對實時信息進行全面掌握。最后,在全媒體大數據演播室建造過程中,需要實現大數據平臺和虛擬前景系統的有效對接,促使各類演播室均具備可視化功能,以此來增加媒體融合之下用戶的體驗感。
綜上所述,在大數據時代下,人們應該對傳統媒體與新媒體之間的融合進行重視,并以互聯網技術為依托,慢慢順應大數據為整個新聞行業帶來的改變,努力克服各種困難。除此之外,傳統媒體還要對各方優勢進行借助,對大數據運營平臺進行建立,為時代的進步以及信息傳遞提供基礎,并在實現發展目標的同時,維持大數據的平穩與健康。
[1]梅劍平.大數據助力媒體融合——央視大數據平臺技術與實踐[J].現代電視技術,2017(05):100-104.
[2]李川.打造廣電融媒大數據中心助推城市臺媒體融合轉型升級[J].現代電視技術,2017(05):105-109.
[3]殷俊,柳青.論大數據模式對媒體融合的推進作用[J].西南民族大學學報(人文社科版),2017,38(05):161-165.