□杜 偉
“大數據”建立在互聯網技術基礎上,指的是信息量巨大的統計及技術操作。簡單來說,“大數據”其實就是海量資料巨量資料,這些巨量資料來源于世界各地隨時產生的數據。
在“大數據”時代,任何微小的數據都可能產生不可思議的價值。“大數據”有4個特點,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),一般被稱之為4V。
大數據的特征首先就體現為“大”。隨著時間的推移,存儲單位從過去的GB到TB,乃至現在的PB、EB級別。隨著信息技術的高速發展,數據開始爆發式增長。社交網絡(微博、推特、臉書)、移動網絡、智能工具、服務工具等,都成為數據的來源。迫切需要智能的算法、強大的數據處理平臺和新的數據處理技術,來統計、分析、預測和實時處理如此大規模的數據。
廣泛的數據來源,決定了大數據形式的多樣性。任何形式的數據都可以產生作用,目前應用最廣泛的就是推薦系統。日志數據是結構化明顯的數據,還有一些數據結構化不明顯,例如圖片、音頻、視頻等,這些數據因果關系弱,就需要人工對其進行標注。
大數據的產生非常迅速,主要通過互聯網傳輸。生活中每個人都離不開互聯網,也就是說每個人每天都在向大數據提供大量的資料,并且這些數據是需要及時處理的。大數據對處理速度有非常嚴格的要求,服務器中大量的資源都用于處理和計算數據,很多平臺都需要做到實時分析。數據無時無刻不在產生,誰的速度更快,誰就有優勢。
這也是大數據的核心特征。現實世界所產生的數據中,有價值的數據所占比例很小。相比于傳統的小數據,大數據最大的價值在于通過從大量不相關的各種類型的數據中,挖掘出對未來趨勢與模式預測分析有價值的數據,并通過機器學習方法、人工智能方法或數據挖掘方法深度分析,發現新規律和新知識,并運用于新聞等各個領域。
“大數據”時代的到來,改變了人們日常的生活和工作方式,對企業經營、媒體傳播及政府管理有重要意義。應該如何去對“大數據”加以分析和運用值得我們思考。
在“大數據”時代下,人們可以迅速得到實時發生的信息,能夠對未來可能發生的事進行預測并對突發事件進行有效防范。對新聞媒體而言,運用好“大數據”也很重要。它有助于新聞媒體工作人員迅速獲取信息,第一時間將信息傳播出去。
世界上的任何事物都是具有兩面性的,“大數據”也不例外。
“大數據”的積極作用在于:如果能夠科學、合理地使用“大數據”,那么就能推動社會科學和經濟的發展。然而,實現這一目標和任務并不容易,需要廣大新聞工作者的共同努力。顯然,現在很多大眾媒體或社交媒體都應用了“大數據“技術。科學地發展“大數據”產業,實現“大數據”的積極作用,將會為人們的生活和工作帶來巨大益處。
當然,“大數據”也有一定的消極影響,實際上“大數據”并不是萬能的,如果過度地依賴“大數據”技術而忽略其他信息技術的話,將造成傳播信息方式單一。要想有所建樹,就一定要保持理智,對“大數據”進行理性分析,使它能夠為新聞行業服務,提高工作效率。一定要冷靜對待“大數據”,需從技術、法律等多方面降低新技術產生的負面效應。
此外,數據安全利用和隱私保護是目前大數據商業化的一大挑戰,我們必須重視這個問題,進一步加強和規范科學數據管理,保障科學數據安全,提高開放共享水平。
現在的新聞信息可以說是海量的,更新速度極快,新聞媒體對這些新聞信息的獲取基本上是通過“大數據”技術,這些技術確保新聞工作者可以源源不斷地接收新聞信息,并有效進行分析、判斷。新聞媒體對這些龐大的新聞信息一定要學會整理和取舍。新聞信息不斷產生,如何在繁雜的新聞信息中找尋到新聞媒體需要的信息值得我們思考。一起事件是否能成為新聞、值不值得報道,依據的不僅僅是“大數據”,更重要的是要根據新聞價值作出判斷,這就需要新聞工作者提高新聞判斷力。
此外,記者若想對一起新聞事件進行完整的報道,就需要對這起事件從不同角度展開調查,全面分析才能形成一個完整的故事,這同樣也要依據“大數據”技術。數據庫可以幫助記者搜索與此新聞事件相關聯的背景等數據信息。當然,一個優秀的新聞報道是不能僅僅依靠“大數據”技術的,新聞媒體可以對關鍵新聞點進行深入思考并寫出獨家評論,這才是競爭制勝的法寶。
綜上所述,如今“大數據”已經被廣泛應用到人們的日常生活、工作中,雖然“大數據”技術的發展還不夠完善,數據庫也不完整,新聞行業對“大數據”技術成功運用的實際案例也不多,但是從長遠的角度來看,要是新聞行業及其他行業都能夠科學、合理地運用“大數據”技術,并對它進行創新,那么有朝一日,“大數據”技術肯定能夠使人類社會發生翻天覆地的變化。因此,討論新聞媒體如何駕馭好“大數據”具有十分重要的現實意義。