莫莉
摘 要 大數據時代的到來使數據新聞這一報道形式應運而生,技術的發展與變革決定了內容的生產、傳播呈現出新的特點。本文從技術發展視角分析數據新聞這一新型新聞報道形式,并關注技術是如何影響人的感知與理解。數據新聞以大數據技術為基礎,技術的變革重組了編輯部的生產流程,重塑了政府、媒介、公眾三方權利,技術的偏向性凸顯了數據新聞的短板,忽略了作為受眾的“人”應有的情感內核。當前形式下,我們必須警惕信息煙塵。
關鍵詞 大數據;數據新聞;新聞生產;技術視角
中圖分類號 G2
文獻標識碼 A
文章編號1674-6708(2016) 154-0013-02
大數據(mega data),指需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長和多樣化的信息資產。目前業界普遍認同大數據具有以下4個特點:數量巨大( Volume)、速度極快(Velocity)、形式多樣(Variety)、具有價值(Value)。大數據價值的獲取和實現與大數據處理技術密不可分,其中關鍵技術一般包括:采集篩選、存儲管理、分析挖掘、感知展現,這些技術又基于云計算技術和云存儲系統。
數據新聞的產生基于大數據。大數據時代的興起,使承載著大量信息并可進行挖掘的數據成為核心競爭力,由此給新聞界帶來了新觀念、新改革。數據新聞是一種基于數據的抓取、挖掘、統計、分析和可視化敘事化呈現的新型新聞報道方式。數據新聞是隨著數據時代帶來出現的一種新型報道形態,是數據技術對新聞業全面滲透的結果,它的出現一定程度上改變了傳統新聞生產流程。對數據新聞而言,大量真實可靠的數據是根本,大數據分析技術是關鍵,挖掘因果聯系的本質是核心,數據的可視化表達是形式。
北美媒介環境學派認為,技術/信息載體決定媒介內容的生產方式、特點和呈現形態,媒介內容的生產、傳播往往帶有技術的烙印。在政府和行業數據外,互聯網用戶數據、社交媒體UGC、視頻網站的點擊率、移動終端的位置信息等都成為海量數據庫中的一個部分。傳統新聞生產方式講求內容嚴謹,注重深度,但隨著低成本數據信息的大量涌現、基于云技術和云存儲的大數據運算技術的不斷發展、受眾對信息接收的求新求快,傳統新聞生產方式必須要做出一定的變革才能適應技術發展帶來的變化。數據新聞側重于數據本身,新聞線索來源于數據之間微妙的聯系和變化,由于數據具有精確性、客觀性,故能在新聞報道中避免人為、偏見、歧視等主觀因素影響。數據隨客觀事實的發展而變化,無論是時間維度還是空間維度,數據新聞報道根據這一特征,在橫向和縱向上挖掘前因、預測后果、挖掘關聯、找尋本質,以不斷變化的可視化方式向受眾表達傳遞信息,同時也要求數據內容呈現向動態、實時更新效果轉變。
1 大數據技術促使新聞編輯部門的重組
大數據技術給新聞生產流程帶來最大的變化是新聞編輯部門的重組。相比傳統的新聞生產流程,數據新聞的生產要求編輯和記者擁有挖掘數據、發現線索和簡單處理數據的能力,在新聞工作流程中融入代碼編寫、程序開發等工作,促進技術部門和新聞部門之間的溝通和合作。《華盛頓郵報》和《芝加哥論壇報》都有著一支這樣的“嵌入進編輯部的開發者”( EmbeddedDevelopers)團隊。程序開發員根據新聞報道過程中實時變化的需求,為記者挖掘報道所需的原始數據,編寫針對政府網站進行數據抓取的工具,解析和轉換大量PDF格式文檔,將非數據類型的信息轉化成可供分析的形式以及為記者最終的新聞報道提供不同的可視化方案。簡而言之,新聞記者給程序員提高數據處理技術帶來了明確要求,數據處理和呈現技術得到簡化與提升。同時,程序員為新聞記者帶來獲取新聞線索的靈感,為新聞記者的報道拓寬了時間和空間的維度。
2 大數據技術使公眾有可能成為新聞內容生產制作過程的一個部分
大數據技術為用戶生成內容、實現自我需求提供了可能,用戶變成了新聞內容生產制作過程的一個部分。“開源”是大數據時代興起的一種技術理念。作為一種開放式的合作機制,開源提倡在產品開發設計時擯棄版權壁壘,以及允許任何人在后期對產品的設計進行修改。當前運用于分析大數據的工具如Hadoop HDFS、NoSQL這類技術,都是基于開源大數據生態圈,意即計算機程序代碼公開向受眾開放,受眾可以在一定程度內進行自我后續開發。“以眾包模式獲取有價值的信息”是大數據時代下新聞選題來源之一,“眾包”簡單而言是利用公眾來發現線索、提供數據、補充缺漏、核實數據,將一個簡單新聞任務分包給多個人組成的社會網絡。盡管這一新聞線索來源的客觀性仍存在爭議,但不可否認這類做法提高了用戶參與的積極性和關注度,打破了傳統新聞生產流程中編輯部一統全部的格局。例如《衛報》向讀者開放“議員的開支賬目”這一新聞選題,將來自議員的四十五萬多條經過掃面的電話、機票等各類公開賬單公開給公眾,邀請公眾參與認領線索,幫助查找賬單的可疑之處,這種眾包模式讓衛報獲取了許多有價值的線索,其后采用了可視化呈現方式,讓公眾能一目了然各項開支數據。其他簡單例子如我國國內的“養老金并軌對你帶來了什么影響”、“兩會將如何影響我們的生活”等選題都將平臺對公眾開放,公眾可通過平臺發表意見和建議,添加和分享故事。
3 大數據技術對政府、媒體、公眾三方權利的沖擊與重塑
大數據時代下,技術的革新對政府、媒體、公民的社會權利進行了新的分割與重塑,一方面在一定程度上限制了政府權力的濫用,另一方面也擴大了公共權力,提高媒體與公眾聯動所產生的輿論影響力。
必須明確的是,大數據技術對政府權力只是“相對性弱化”,而不是削弱。在數據的來源和構成中,以政府、行業公開數據最多,雖然媒體有自我采集數據、公眾能形成和檢查數據,但相對于海量的政府開放信息而言只是極小一部分。用戶從免費開放平臺中獲得的數據也必須是符合法律規定的、從某種意義而言經過政府權力審批的數據,用戶可以對獲取到的數據進行自我挖掘和分析。但是面對公眾監督,政府部門必須促進政務信息和數據的公開,并提高官方解釋數據資料的能力,及時進行溝通和反饋,使政府部門的運行更為高效、民主。正如哈貝馬斯在其公共領域理論中所指出的,作為公共領域的媒體的發展能促進私人領域和政治領域的對話與協商,從而推動民主政治的良性運轉。
例如柴靜近期推出的公益調查片“穹頂之下”,片中以大量的數據分析為基礎,對霧霾的形成、產生、原因、危害都進行了具體、直觀的闡述,同時將直觀的霧霾議題延伸到政府部門的職能分割、國家法律的缺失、治理的不作為等等政治議題上,此片一出立馬引起了公眾的討論和思考。從這個案例我們可以看到,如果沒有大量、精確的數據說話,沒有數據的關聯與挖掘,人們還不能認識到環保(霧霾)議題的緊迫性和重要性。大數據技術提高了民主的去精英化和普及化,提高了媒介在公共領域形成重要民主議題的能力,擴大了公眾的聲音。
4 數據新聞存在技術偏向,易缺失新聞報道的人文主義情懷
在新聞報道中,有些事實可以使用數據新聞形式進行報道,但有些事實的本質和內涵是無法用數據新聞完全展示的。在數據新聞實踐中,數據新聞應用模板的套用的數據寫作機器人的誕生的確提高了新聞生產效率,例如在2014年3月美國加利福尼亞州發生的一起4.4級地震中,第一個報道此條新聞的是一個名叫Quakebot的機器人,它將地質勘探局發出的數據輸入內置的新聞模板,僅3分鐘就報道了這個消息。顯然,數據新聞存在技術偏向。但是,過于理性的數據呈現和分析將受眾當成了機器,將新聞生產變成了工廠流水線,降低新聞記者進行精神生產的積極性,忽略了新聞報道的精神內核,空洞了受眾的情感世界,缺乏應有的人文情懷和道德精神。人之所以為人,是因為人具有其他物種沒有的精神世界,新聞之所以區別于信息,是因為新聞具有一定的精神力量。以數據為中心而忽略精神內核,易讓技術失去平衡與和諧。
5 警惕信息煙塵,避免過分依賴數據
《大數據時代》一書的作者維克托,邁爾,舍恩伯格說:“在小數據時代,因數據是如此稀少,可以確保自己收集的每一個數據點都是非常準確的。
相比較而言,大數據往往是凌亂和質量參差不齊的。但相比以高額代價來保證測量和收集少量的精確性,在大數據時代,我們將接受這種雜亂,因為我們通常需要的只是一個大方向,而不是努力了解一種現象的細枝末節。我們并不是要完全放棄精確度,為的是獲取在宏觀層面上的洞察力。”
在浩如煙海的數據世界里,首先龐大的數據量必然難以去偽存真、去粗取精,非真實、可靠的數據不能如實反映事物和規律的本質,擾亂受眾視線,也就意味著這類數據是缺乏利用價值的。其次數據來源的可靠程度有待商榷。提供數據的主體,在提供時的目的、動機和嚴謹程度是無法統一衡量的,特別是大數據的來源主體,更多是零散的自由個體,有時候出于無意識的狀態可能會提供的不實數據,這是連主體本身都是無法意識到的。而惡意作假的虛假不實信息的可信度基本為零,這些信息有時候甚至會造成公眾的恐慌。而機構團體在提供數據時,會處于利益考慮有選擇性的公開部分數據,這使得在數據分析結果中產生一定偏向。如果缺乏進行正確判斷的是非標準和價值標準,則可能會以是為非、以非為是和選擇隱含價值偏頗的信息進行傳播,從而誤導受眾。
最后,由于數據新聞的核心在于對大數據因果聯系的挖掘,所以數據之間的關系是如何被發現的,至今沒有統一標準,有些無關聯的數據甚至被強硬的牽扯在一起,例如便利店巧克力銷售數量和犯罪率的聯系。納西姆。尼古拉斯。塔勒布提出“干草垛”的概念,即在龐大的“干草垛”中尋找那根被埋藏的針是很不容易的。在急速增長的大數據煙海中,噪音的比重會越來越大,過濫的信息反而阻礙了人們進行正確的判斷,人們搜索精確信息的時間和精力最終反而增加了。所以,警惕以上信息煙塵,也是大數據技術實現自身平衡、共生、和諧發展的必要思考。
不想說一個人若拒絕大數據就失去生命這樣沉重的話題,但大數據確實在深刻改變著你和我的未來。