【摘要】作為一種新興的新聞形式,數據新聞的核心在于數據,能夠為新聞報道提供更加多樣化的呈現方式。在智媒時代,不同于傳統的以文字為主的新聞報道,數據新聞能夠在深入挖掘信息資源的基礎上,進一步拓寬新聞主題的來源。本文主要探究智媒時代數據新聞的生產流程、局限性,并提出促進數據新聞發展與革新的具體措施。
【關鍵詞】智媒時代;數據新聞;人工智能
數據新聞又被稱為數據驅動新聞,它強調將精準性作為新聞報道的重要目標,通過數據搜集新聞來源,滿足了觀眾短時間內獲取大量信息的要求。隨著云計算、大數據等互聯網技術的興起以及成熟,我國的數據新聞也取得了長遠的發展,在新聞報道中扮演羞越來越重要的角色。
一、數據新聞生產的流程
數據新聞的生產流程主要包括確定選題、搜集數據、處理數據、數據可視化、新聞報道這五個環節,選題是數據新聞生產的開端,不同于其他類型的新聞報道,數據新聞的選題要從現有的數據出發,將雜亂無序的數據進行連接,深入挖掘其背后蘊含的價值,從而確定新聞的主題。搜集數據是確定新聞報道思路的過程,并不是所有的數據都是有價值的,需要根據新聞主題來劃定數據的范圍,縮短數據收集的時間,提高數據收集的效率。數據來源途徑是多樣的,最常用的是通過百度、今日頭條等大平臺的數據庫進行收集,還可以依靠傳感器來完成數據的收集,例如手機定位技術、位置服務等等。在形成數據樣本之后,還應當對數據進行處理,評估現有數據的價值性,保持客觀中立的態度,使數據之間內在的邏輯性顯現出來。數據可視化是數據新聞的關鍵,一般包括信息圖表、數據地圖、動態圖表這三種形式。
二、人工智能在數據新聞中的應用
(一)數據的篩選
新聞媒體在篩選數據時,能夠借助智能算法,淘汰那些與新聞報道主題無關的數據,并按照新聞生產的要求來篩選關鍵信息和敏感部分,并在未來有可能根據場景和需求的不同來配置數據,使數據資源能夠得到有效的利用。由于技術、資金等諸多因素的束縛,我國目前只有少數媒體利用機器來進行數據的篩選,但是為了順應數據時代發展的需要,媒體通常會與建立完備數據庫的企業進行合作,從而彌補數據匱乏這一短板。例如在2014年春節期間《晚間新聞》這一節目中,通過與百度的合作,利用百度地圖的定位技術,將春節期間人口的流動情況生動形象的展示了出來。
(二)數據處理
人工智能技術的革新,大大提升了機器對各類信息的處理水平,不僅能夠分析在日常生活中使用最多的數據,還能夠分析圖片、語音乃至視頻。機器新聞寫作在速度、準確性等方面有著明顯的優勢,能夠幫助新聞工作者從繁瑣的數據處理工作中解脫出來,從而有更多的時間與精力來進行新聞內容的深度創作。由騰訊推出的Dreamwriter、新華社推出的“快筆小新”等新聞寫作機器人,在體育、氣象等領域的新聞報道中扮演了十分重要的角色,隨著人工智能技術在新聞領域的進一步推廣,人機協同寫作將成為新聞行業發展的大勢所趨。
(三)數據呈現
新聞作品的實體開發是一種新型的數據呈現方式,在2019年的數據新聞大會上英國學者提出了數據新聞實體化的概念,并進行了具體的演示。實體形式的數據無需在瀏覽器中打開,能夠為用戶隨時提供多種形式的體驗,這對于用戶來說是十分具有吸引力的。新聞編輯室與公園、圖書館等公共場所合作,共同制作新聞裝置,選擇與公眾生活密切相關的內容,并將這個裝置長時間的留在這個地方,每次當人們經過的時候,就會關注到它,從而引導人們自發的參與到裝置信息討論之中。
三、智媒時代數據新聞報道面臨的挑戰
(一)部分數據來源不甚清晰
產權意識的強化使得新聞報道越來越注重數據來源的準確性,避免出現損害數據提供方合法權益的情形。但是在實際的新聞報道中,并不是所有的數據都清晰、準確的標注了來源,例如某新聞媒體客戶端《面臨四年禁賽,俄羅斯和反興奮劑機構糾葛幾許?》一文中,并未對所有的數據來源進行標注,讀者無法對數據的真實性進行核驗,而且容易產生一定的法律糾紛。對于數據來源不明但是又具有重要價值的數據,新聞媒體應當盡可能的明確來源,當無法保證數據真實性與權威性的時候,要及時的更換數據或者新聞主題。新聞工作者也應擔負起相應的責任,在審核時要認真負責,避免出現違背國家政策、法律法規、公序良俗等內容的新聞稿。為了更好的進行新聞報道,新聞行業應當定期為新聞工作者提供專業的培訓,對違反規定發布新聞的行為給予嚴厲的處罰,真正提高整個團隊的業務水平。
(二)部分數據權威性不足
數據是否權威決定著新聞報道的權威性,如果數據的權威性不能得到保證,那么新聞的公信力也會大打折扣。在澎湃新聞2018-2019年的新聞報道中,有多篇新聞的數據是從百度百科或者維基百科中獲得的,這類數據源嚴謹性并不是很強,普通的網民都可以對這些數據進行編寫,盡管這些數據獲取時非常簡單,引起爭議的可能性較小,但是權威性不能保證,在今后的新聞報道中應當減少引用的比例。有媒體在一篇涉及自然災害的報道中使用了民營數據庫中的數據,雖然民營企業的數據在新聞報道中也十分重要,但是與國家政治、經濟等有關的內容還是應當以官方發布的數據為主,在選取數據時必須要注重是否符合新聞報道主題。
(三)學術論文中的數據使用問題
作為數據新聞的重要來源,學術論文作者的主觀色彩比較濃厚,論文的質量也存在差異,有一部分論文作者在數據收集與整理時會出現不規范的情形,新聞報道在將論文觀點體現在可視化表格中時可能會影響論文的客觀性。當學術論文出現不同的觀點時,新聞編輯如何進行抉擇也是一個難題。新聞工作者可以對多篇論文結果進行綜合的分析,并咨詢相關專家,避免新聞報道有失偏頗。
四、智媒時代數據新聞優化的具體舉措
(一)統一標準,嚴格把關
數據新聞在采集的時候往往會涉及到很多的數據源,因此為了將這些數據融合在一起就必須制定一個統一的標準,避免將未經處理且標準不一的數據整合在一起,給今后的工作造成負擔。不同數據的重點不同,表達的核心也有差異,新聞工作者要注重把握每張圖片之間的內在邏輯關系,不僅要注重形式還應當注重內容,避免人為設置閱讀門檻。除此以外,新聞媒體還應當招聘一些掌握較高互聯網技能的人才,由他們專門負責數據的收集、篩選以及處理。在新聞創作完成之后,還應當進行檢查,減少錯誤出現的幾率,若已經發布的新聞出現錯誤,應當及時向上級領導上報,并盡快撤銷,從而避免造成更加惡劣的影響。
(二)注重隱私權的保護
在信息時代,人們足不出戶就可以在很短的時間內獲得世界范圍內的信息,但是也造成了一定的隱患,個人信息泄露便是其中之一。個人信息保護是隱私權保護的重要組成部分,各個國家紛紛將其上升到法律層面,主要體現在數據的相關性與可識別性這兩個層面。技術的革新使得信息的收集變得十分便利,利用這些信息甚至能夠分析出個體的人際關系,掌握用戶的閱讀好惡,從而實現新聞的精準推送。對于與個人隱私無關的數據信息,在收集的時候既要透明公正,又要嚴格遵守相關規定,避免侵害到他人的合法權益。澎湃新聞在報道新聞時選擇的是個案收集的方式,其能夠在保護公民隱私權的前提下披露真相,發揮新聞媒體在社會輿論中的引導作用。
(三)深入挖掘信息資源
新聞媒體在完成數據收集這一初步工作之后,還應當利用云計算、大數據等技術來分析和整理數據,從而能夠挖掘出數據背后的隱含信息。以文字為主的傳統新聞報道在內容選取上會有一定的局限性,而數據新聞則能夠有效彌補這一缺陷。圖證數據研究室是一個獨立的數據新聞組織,其在制作上強調原創和深入的報道,盡最大努力來挖掘數據背后的新聞信息,從而為公眾提供更多的有閱讀價值的新聞報道。需要注意的是,并不是所有的數據都適合作為新聞的來源,新聞媒體工作者應當有選擇的進行取舍,避免出現數據虛假的現象。
(四)拓展新聞主題來源
不同于其他的新聞形式,數據新聞是以數據為中心的,通過對數據加以收集和整理能夠將這些數據的內在邏輯聯系在一起,挖掘數據背后的新聞信息。在搜集數據的時候,通過對數據進行分析能夠形成新的新聞選題,在2014年的兩會期間,新浪對落馬官員的名單進行了梳理,通過一系列報道來呈現我國的反腐戰役。通過對數據的征集整理,可以將數據本身表達內容作為新聞報道的主題,也可以將這一過程中發現的新線索作為選題,從而形成新的一項新聞報道。
智媒體時代,數據新聞的重要性是無可取代的,作為一種新興報道方式,其并不是孤立存在的,新聞工作者應當將其與其他的新聞報道形式結合在一起,從而能夠更好的適應新聞行業發展的大趨勢,為大眾提供更加高質量的新聞信息。
參考文獻:
[楊嘉寧.智媒時代數據新聞發展與反思——以澎湃新聞“美數課”欄目為例[J].出版廣角,2020(07):68-70.
[2]方誠,數據新聞發展新趨勢:實用化、本地化、智能化和實體化[J].新聞愛好者,2019(12):57-59.
[3]張錚,陳雪薇.從“數據新聞”到“數據傳播”——智媒時代新聞傳播教育的數據轉向及因應策略[J].中國編輯,2020(05):74-79.
【作者簡介】史文雄,新疆廣播電視臺新聞中心記者。