文/楊嘉寧
大數據技術為新聞傳播行業的發展注入了新活力,通過對大數據的整理和分析,新聞工作者可透過現象深入挖掘新聞事件本質,并在專題報道中以可視化形式向受眾清晰呈現,這種報道形式已經越來越受到受眾的青睞。
隨著大數據技術在新聞領域的實踐不斷深化,數據新聞的目標已經從準確轉向精確。基于大數據的云計算分析,新聞工作者可以找出各個變量之間的因果關系,并依據定律推測出事物潛在發展規律,從而形成具有較高價值的獨家新聞報道。
1.冪律定律廣泛存在。艾伯特-拉斯洛·巴拉巴西曾在《爆發》一書中提及冪律定律。冪律定律指出,人類行為符合冪律分布,即看似偶然的人類活動有著更深層的聯系。該定律強調,這種深層次聯系需要排除大事件和大人物的干擾,因此必須保證擁有足夠的數據來確保冪律定律的準確性。這一定律為數據新聞報道提供了理論支撐,為數據新聞報道探究人類行為規律開拓先河。
2.數據讓追蹤成為可能。隨著各類手持移動設備的迅速普及,人類的一舉一動都暴露在移動設備的監控視線。一些互聯網公司可以通過用戶的手機授權達到監控目的,海量數據則由此傳輸至公司數據庫。可見,新技術使得數據的獲得模式由單一靜態收集轉變為靜態獲取和動態獲取相結合的模式。通過大數據方式收集來的數據客觀性已經遠勝于傳統手段。
3.獨家報道的新路徑。隨著媒體數量的不斷增多,獨家報道成為各大主流媒體爭奪新聞市場的一個主要手段,而獲得獨家報道的重要方式則是對新聞事件發展趨勢進行合理化預測。通過對大數據的分析,新聞媒體能夠及時了解受眾的關注熱點,并通過云計算分析新聞事件的發展趨勢,及時做好采編準備,以最快的速度發布獨家報道。獨家報道屬于明顯的“媒體賣方市場”,受眾為滿足其信息需求,很可能會為此購買新聞產品或下載資訊類APP。受眾規模的擴大,媒體的廣告收入隨之提升。
4.避免集合性行為的有效形式。巴拉巴西在《爆發》中同時提到,冪律定律出現,爆發點就會出現,所謂爆發點就是人類行為實施的時間節點。對于集合行為,學者郭慶光在《傳播學教程》中認為,集合行為是指在某種刺激下產生的非常態社會聚集行為。在全媒體時代,這種社會刺激是一種由量變到質變的過程,因此對網絡輿論傾向的分析至關重要。大數據技術可以對集合行為的爆發點進行精準預測,并通過數據新聞的形式進行報道,引起人們對報道對象的關注和重視,促進其調整相關行為,從而達到避免群體極化的最終效果。
1.零采訪得到實現。新聞采訪在深刻性方面制約新聞寫作,甚至決定了新聞稿件的真實性。在數據新聞的采寫中,記者扮演的是技術崗位與內容產業之間的橋梁角色,也就是說記者既要能采寫數據,又要采訪人物。“零采訪”在傳統新聞里是不存在的,而在數據新聞的制作過程中,采訪對象由人轉變為數據,并在數據整理、分析和可視操作之后,以數據新聞形式呈現在讀者面前。
2.專題報道更加深刻。專題報道是對現實生活中某些典型的新聞要素進行深入系統而又生動反映其發生、發展、結果及影響的全過程,揭示其對社會深層次的影響。專題報道對報道的深刻性有著較高的要求,新聞工作者需要對報道對象進行深入挖掘,探究其本質。大數據技術可通過分析事物內在聯系,輔以可視化圖表加以呈現,使得讀者能通過可視化圖表對新聞事件的成因和本質影響有更深刻的了解。通過定量分析,專題報道能夠更加客觀和全面,通過文字和圖表配合的形式,受眾能夠更好地理解新聞事件。
3.人工智能推動數據新聞生產。早在2007年,美國Automated Insights公司就開始為美聯社編寫新聞稿件,其人工智能系統擁有超過3億套模板,形成不同新聞體裁。憑借這一技術,該公司在2013年就生產了3億多篇新聞,2014年其產量高達10億篇。在我國,2015年9月,騰訊財經率先推出自動化新聞寫作機器人“Dream writer”,該系統僅用不到一分鐘的時間就寫出了一篇完整的報道;同年11月,新華社寫稿機器人“快筆小新”正式上崗,其專長是撰寫體育賽事中英文稿件和財經信息稿。人工智能以其高效率優勢逐漸活躍在全球新聞傳播領域,其功能也隨之不斷趨于完善。因此,筆者認為,在未來的新聞撰寫過程中,人工智能可集數據分析師和新聞工作者雙重身份于一身,創造出圖文并茂、內涵豐富的數據新聞報道。
相較于發達國家,我國數據新聞起步晚,發展不夠充分,新聞從業者數據素養也相對較低,數據水平不高使得數據新聞成為假新聞的“重災區”。
1.數據缺乏權威性和可靠性。數據來源的權威性和可靠性決定了數據計算結果的準確性,從而影響新聞報道的真實性和新聞質量的高低。因此,新聞工作者必須在可視化圖表上標注數據來源,方便讀者隨時查閱,鑒別數據來源是否權威。由于部分新聞工作者缺乏對權威數據定義的理解,隨意選取互聯網數據作為新聞來源,這種問題在新媒體平臺上尤為常見,數據來源把關缺失,導致受眾受到數據新聞的影響而做出錯誤的價值判斷。
2.小數據新聞仍為主導。大數據分析是否精準的最主要因素是數據是否足量,統計數據不足的新聞只能稱為小數據新聞。小數據新聞在我國數據新聞中占比較高,這類新聞因統計數據過少,樣本本身不具代表性,加之抽樣調查方法不科學,最終生成假新聞。而讀者無法把控數據采集量,因此無法推斷數據新聞是否可信。
3.數據新聞缺乏時效性。由于記者采集、整理、分析數據需要大量時間成本,并要仔細斟酌可視化新聞的表達形式,導致數據新聞時效性較差,滯后性較強,容易“新聞”變成“舊聞”。另外,數據新聞擅長講述宏觀的規律性故事,因而在一定程度上降低了對時效性的要求。
4.深度報道較為罕見。深度報道要求記者從細節出發,挖掘新聞事件本質。然而,我國數據新聞往往過于苛求制作形式,嘗試以別樣的新聞生產方式博取受眾眼球。這種數據新聞雖能帶來一時經濟效益,但當受眾失去興趣時,這種形式化的新聞也將走向沒落。因此,唯有保證內容質量,才可在新聞競爭中保持經久不衰的地位,這要求數據新聞通過大數據分析技術挖掘新聞事件的本質,由淺入深地探究新聞事件本質,把握事件脈絡,圖文并茂地講述故事。
大數據技術在帶來便利的同時,也帶來了較為嚴重的社會問題,如個人隱私泄露等。
1.無處不在的數據信息系統。在大數據時代,APP應用經由個人授權收集信息(包括個人綁定的身份證號和手機號等),并能記錄用戶操作行為,從而輕松獲取海量用戶數據,并通過大數據分析獲取獨家的商業機密。一些不法分子甚至通過惡意鏈接或木馬病毒等方式竊取個人信息,實施犯罪。
2.數據采集的倫理法規不夠健全。我國《憲法》第四十條規定了公民的通信私密與安全受法律保護。工信部頒布的《電信和互聯網用戶個人信息保護規定》,第一章便闡述了其立法目的——保護電信和互聯網用戶的合法權益。然而,這些法律法規缺乏執行力,對違法者的懲罰較輕,導致侵犯公民信息安全利益的違法分子更為猖獗。基于此,我國在制定法律法規時要注重保障公民個人信息安全不受侵犯,并加大對違法分子的刑事和民事處罰力度,同時要細化相應法規,依據違法行為的變化不斷擴充相關法規的細則。
在數據采集的倫理方面,我國新聞界尚未形成完備的規范體系。筆者了解到,目前一個較為普遍的觀點是,將政府對外公布的數據定義為可以隨意獲取的數據源。有關學者認為,記者在采集數據新聞的過程中,應向非政府網站上的數據來源發送請求,在獲得同意后方可繼續進行數據采集工作。筆者認為,新聞工作者應自覺樹立維護公民隱私的職業道德準則,決不為一己之利侵犯公民的合法權益,當公民隱私與國家根本利益產生沖突時,記者應依據相關法律法規,在相關部門授權或批準后進行數據采集工作。
1.增強數據新聞的交互性。數據新聞的可視化傳播使得傳者和受者的角色可以相互轉化:受眾不再只是被動的接收資訊信息,媒體也不再只是權威的信息發布機構。針對數據采集過程來說,數據的來源可以更多地依賴用戶提供,例如網絡問卷調查,甚至是用資金鼓勵受眾收集數據,鼓勵用戶以多種形式實現數據可視化。增加數據新聞互動性的另一個主要手段是設置評論區,媒體可以整理受眾對已發布新聞的看法,并深入研究制定數據新聞的修改意見,從而打造形式新穎、新聞價值豐富、用戶喜歡的獨家報道。
2.緊跟熱點生動敘事。在注意力經濟時代,緊跟熱點,能夠有效吸引讀者,對熱點新聞進行可視化操作,有助于使受眾在較短時間內更為清楚地理解熱點新聞。數據新聞工作者要學會生動敘事,注意敘述的來龍去脈和敘事邏輯,并在此基礎上提升數據新聞的趣味性。
3.找準受眾投其所好。新聞能否吸引受眾很大程度上在于其是否為受眾所需,通過大數據技術,找準受眾所好,實現個性化推送,將信息推送到最感興趣的受眾面前,例如,最關心養老保險并軌專題報道的受眾肯定是事業單位在崗員工和公務員,最關注高考取消文理分科報道的受眾必定是高考考生和家長。此外,依據受眾的文化程度和理解能力,處理成方便理解的文字和圖表,而不人為地設定閱讀門檻。
4.手機數據新聞的可視化特征。智能手機具有體積小、功能齊的優點,因而受到世界各國人民的青睞。然而,以手機為媒介進行數據新聞呈現也有不足,如由于手機閱讀方式碎片化不利于讀者深入理解和思考等。因此,在設計通過手機呈現的數據新聞圖表時,首先要降低可視化新聞的理解難度,使內容呈現一目了然。其次,在處理多圖報道同一事件的數據新聞時,要注意各圖的內部邏輯關系,使得讀者能快速掌握新聞事件的發展走勢,避免產生理解偏差。
5.提升新聞從業者的數據素養。要想數據新聞有深度,新聞工作者必須在具備強大業務能力的同時,對大數據技術稔熟于心。數據素養具體包括數據采集、處理、統計、分析、挖掘數據價值、數據可視化呈現等方面。由于新聞從業者大多文科背景出身,對大數據算法難以完全理解,因此,各媒體應成立專門的數據分析團隊為數據新聞發展注入活力。