李激

摘 要 新媒體時代,隨著數字信息技術和互聯網技術的迅猛發展,數據新聞應運而生。數據新聞利用數據分析和計算機技術獲取、分析和可視化呈現數據,講述新聞故事。文章通過具體分析網易數讀的七大板塊中數據新聞的特點,揭示其在形式、信息含量、技術手段、議題等方面的變化趨勢,為新媒體環境下國內數據新聞的發展提供參考和借鑒。
關鍵詞 新媒體;數據新聞;網易數讀;數據分析;計算機技術
中圖分類號 G2 文獻標識碼 A 文章編號 2096-0360(2018)22-0016-03
新媒體時代,隨著數字信息技術和互聯網技術的迅猛發展,在電視、廣播、報刊等傳統的媒體形態之外,涌現出網站、博客、播客、微博、微信等眾多新興的媒體形態,新聞業的傳播方式發生了巨大的變革。數據新聞在這樣的環境下應運而生,“運用各種技術軟件來抓取、處理、分析和形象化呈現數據,數據呈現方式包括可視化數據圖、互動圖表和網絡在線演示等”[1]。本文通過具體分析網易數讀(data blog)①的七大板塊中數據新聞的特點,對比了近年來數據新聞在形式、信息含量、技術手段、議題等方面的變化,為新媒體環境下國內數據新聞的發展提供了參考和借鑒。
1 數據新聞
數據新聞,又稱為數據驅動新聞,“是基于數據分析和計算機技術的可視化新聞樣式,在新聞敘事中使用數據呈現原本僅靠文字所難以呈現的內容,或者通過數據分析發現問題,并進而挖掘出新聞故事。”[2]
數據新聞在世界新聞傳播界的出現要追溯到2010年在阿姆斯特丹召開的第一屆國際數據新聞圓桌會議。隨后,英文版《Data Journalism Handbook》②和中文版《數據新聞手冊》的相繼出版,推動了國際和國內數據新聞的發展。2014年央視推出《據說春運》的專題報道③,以百度地圖的定位大數據展示春運的人流遷徙,引起了民眾的極大關注。從此,數據新聞開始在中國流行起來。
2 網易數讀
網易數讀是網易新聞下的數據新聞欄目,有電腦網頁版和手機微信版。根據數據新聞議題的不同,該欄目又劃分為國際、經濟、政治、民生、社會、環境和其他共七個板塊(如圖1所示)。
3 數讀作品分析
3.1 國際板塊的數據新聞
國際板塊數據新聞的主要議題涉及世界各國在學術、軍事、交通、國家關系等方面的重要事件或問題。該板塊的內容具體有泰國旅游、在日本學術造假的懲罰、美軍單兵裝備、部分鄰國對中國印象變差的原因、中國對俄羅斯的好感變化等。最新的一篇數據新聞(有關泰國旅游)在2018年7月發布,沒有參考文獻,包含6張數據可視化圖片和1張與主題相關的照片;可視化圖片中出現了動態地圖;其數據來源達到6個以上,包括:泰國旅游和體育部、Farang Deaths整理的在泰意外死亡外國人資料、World Health Organization《Global Report on Drowning》、World Health Organization《Global Status Report on Road Safety》、各國相關部門及公開報道、經濟論壇《2017年全球旅游業競爭力報告》等。其余新聞發布于2014年及以前,篇幅較短,沒有參考文獻,通常每篇只包含1張數據可視化圖片,1~3個數據來源,包括Chem-Station、Google、Yahoo、NBC、Wiki、Deagel.com等。有關泰國旅游、在日本學術造假的懲罰、美軍單兵裝備的3篇數據新聞中,熱度最高的是關于美軍單兵裝備的新聞,跟帖人數達到2 000多人,參與人數達到2.5萬人以上。
3.2 經濟板塊的數據新聞
經濟板塊數據新聞的主要議題涉及世界各國在國民經濟、商業貿易等方面的重要事件或問題。該板塊的內容具體有中國各省人口流失和生育情況、“制裁戰”下俄羅斯的經濟情況、各國對市場經濟的支持率、鹽稅與鹽業專營、中國旅游業的下滑情況等。該板塊的數據新聞均為2014年及以前發布,篇幅較短,沒有參考文獻,通常每篇只包含1張數據可視化圖片,1~3個數據來源,包括北京大學人口研究所、第六次人口普查、International Trade Centre、俄羅斯統計局、皮尤研究中心等。有關中國各省份人口流失和生育情況、“制裁戰”下俄羅斯的經濟情況、各國對市場經濟的支持率的3篇數據新聞中,熱度最高的是關于中國各省份人口流失和生育情況的新聞,跟帖人數達到近4 000人,參與人數達到5萬多人。
3.3 政治板塊的數據新聞
政治板塊數據新聞的主要議題涉及世界各國在國家選舉、政治外交等方面的重要事件或問題。該板塊的內容具體有世界著名政治家的藝術作品的價值對比、東西德人相互的偏見調查、中國歷年公務員國考報名和招錄情況、美國國會議員的工作量和時間分配、中美俄三國領導人的電話外交對象等。該板塊的數據新聞均為2014年及以前發布,篇幅較短,沒有參考文獻,通常每篇只包含1張數據可視化圖片,1~3個數據來源,包括Artron、民調機構阿倫斯巴赫研究所(Allensbach Institute)、中公教育、中國國家計局等。有關世界著名政治家的藝術作品的價值對比、東西德人相互的偏見調查、中國歷年公務員國考報名和招錄情況的3篇數據新聞中,熱度最高的是關于中國歷年公務員國考報名和招錄情況的新聞,跟帖人數達到900多人,參與人數達到7 000多人。
3.4 民生板塊的數據新聞
民生板塊數據新聞的主要議題涉及人民的日常衣食住行等生活事項。該板塊的內容具體有網約車的安全性調查、中國的景區門票價格貴的原因、二胎為什么生不起等。較新的3篇數據新聞(上述內容)的發布時間從2018年8月至10月,平均每篇包含6張數據可視化圖片和1.7張與主題相關的照片;其數據來源平均每篇達到6個以上,包括:
中國城市統計年鑒、中國政法大學法治政治研究院《地方網約車和順風車政策專題研究報告》、直轄市和副省級城市網約車實施細則、于天成(2015)《基于用戶體驗的中國未來出租車設計研究》(Master's thesis,北京理工大學)、《司法大數據專題報告之網絡約車與傳統出租車服務過程中犯罪情況》、中國社科院《我國5A級景區門票價格分析與國際比較(2015)》、中國國家旅游局、中國各省景區官網、《2017年中國旅游景區發展報告》、胡子龍(2013)《我國景區門票價格上漲的原因與對策研究》(《價格月刊》(7),13-17)、中國國家統計局、中國各地人口與計劃生育條例、OECD官網、歐盟統計局官網、國家衛健委《2014年中國家庭發展追蹤調查》等。
這3篇新聞中,關于二胎為什么生不起的新聞引用的參考文獻數目最多,達到13個;而且熱度最高,跟帖人數達到近2 000人,參與人數達到6萬多人。
3.5 社會板塊的數據新聞
社會板塊數據新聞的主要議題涉及生產、消費、娛樂、教育等社會活動。該板塊的內容具體有對批量生產的中國專利的調查、讀完研后工作與本科畢業后工作的對比、被拐賣失蹤的中國兒童的分析等。
較新的3篇數據新聞(上述內容)的發布時間從2018年8月至10月,平均每篇包含近8張數據可視化圖片和0.3張與主題相關的照片,可視化圖片中出現了動態地圖;其數據來源平均每篇達到8個(除了官方發布的數據報告以外,出現了爬取網站的數據來源),包括:
世界知識產權組織(WIPO)《專利事實與數據報告2017》(IP Facts and Figures 2017)、2006年與2017年《中國科技統計年鑒》數據計算所得、中國國家知識產權局、彭博社Bloomberg根據JZMC數據庫和中國國家知識產權局數據整理所得、各省考試院公告信息整理、中國學位與研究生教育學會德育委員會(2016)、國家青年社科基金“階層固化趨勢下農村籍大學生就業問題研究”課題組、麥可思《2018年中國本科生就業報告》、前程無憂51job招聘網站、對“寶貝回家”網站的數據爬取、第六次全國人口普查等。
這3篇新聞中,引用的參考文獻數目最多的達到4個,其中熱度最高的是關于對批量生產的中國專利的調查新聞,跟帖人數達到1 000多人,參與人數達到3萬多人。
3.6 環境板塊的數據新聞
環境板塊數據新聞的主要議題涉及大氣環境、水環境、土壤環境等問題。該板塊的內容具體有汽車限購與空氣污染的關系、煤炭對中國人民健康的影響、各國水質及居民滿意度等。
較新的3篇數據新聞(上述內容)的發布時間從2014年7月至12月,平均每篇包含近1.7張數據可視化圖片,沒有與主題相關的照片;其數據來源平均每篇達到3個,包括:
環保部數據中心、中科院大氣物理所研究員張仁健課題組、北京大學公共衛生學院郭新彪教授課題組、BP世界能源統計、中國衛計委、環保組織“綠色和平”發布的關于煤電廠影響居民健康的調查報告、蓋洛普Gallup,世界水監測網(World Water Monitor,WWM)等。
這3篇新聞沒有參考文獻,其中熱度最高的是關于各國水質及居民滿意度的新聞,跟帖人數達到近7 000人,參與人數達到12萬多人。
3.7 其他板塊的數據新聞
其他板塊用于以上6個板塊以外的議題。該板塊的內容具體有金庸筆下的武俠江湖的架構、上海高校歧視情況、三峽水底的古城世界等。較新的3篇數據新聞(上述內容)的發布時間從2018年9月至11月,其中關于金庸筆下的武俠江湖的新聞包含5張數據可視化圖片和1與主題相關的照片,數據來源于爬取1980年后修訂完成的金庸十五部“三聯版”武俠小說,參考文獻有3個;另外兩篇屬于“城市漫游計劃”出品,采用一幅精美長圖的形式展現,只在篇首有少量的文字敘述。
這3篇新聞中熱度最高的是關于三峽水底古城世界的新聞,跟帖人數達到近700多人,參與人數達到近3萬人。
3.8 對比分析
1)網易數讀在2018年的數據新聞與2014年及之前的數據新聞相比較,在形式上有了很大改變。2014年及之前的數據新聞篇幅較短,內容比較單一,每篇只包含1張靜態的數據可視化圖片,而且圖片比較模糊,需要再次鼠標點擊觀看清晰大圖。而2018年的數據新聞篇幅比較長,內容豐富,形式多樣,平均每篇包含6張以上的數據可視化圖片(其中偶爾出現了動態地圖),圖片尺寸大,畫質清晰;根據內容需要有的新聞還包含1張以上與主題相關的實景照片,增強了現場感和真實感;另一種新形式出現在“城市漫游計劃”出品的數據新聞中,用一幅長圖作為新聞的主體,通常只在篇首有少量文字敘述。
2)2014年及之前的數據新聞信息含量比較少,沒有參考文獻,每篇只有1~3個數據來源;其數據通常來源于官網發布的信息或公報;數據源比較單一。而2018年的數據新聞信息含量高,一部分有參考文獻,文獻列表數目有的甚至達到10個以上;平均每篇有6個以上數據來源;其數據除了來源于官網發布的信息或公報以外,還有的來源于學術期刊、碩士畢業論文或高校課題,另外還有通過數據爬取和數據分析技術從網站獲取并加工處理得到的數據;數據源多樣化,學術傾向性更強,技術含量更高。
3)數據新聞的跟帖人數和參與人數,與近年來數據新聞在形式、數據來源和參考資料等方面的變化沒有明顯的關系。數據新聞的熱度主要與議題有很大的關聯,例如2014年發布的關于各國水質及居民滿意度的數據新聞,雖然篇幅較短,只包含1張數據可視化圖片,但水質問題是與大家的日常生活息息相關的議題,熱度非常高,民眾的參與非常積極,跟帖人數達到近7 000人,參與人數達到12萬多人。
4 結論
本文通過具體分析網易數讀的七大板塊中數據新聞的特點,揭示了近年來數據新聞的變化趨勢:
在形式上,數據新聞的篇幅增大,內容更加豐富生動,向多樣化方向發展。具體表現為數據可視化圖片和實景照片增多,出現了動態的可視化效果;圖片清晰度提高;有一些數據新聞通篇用一幅精美長圖的形式呈現內容。在信息含量和技術手段上,數據新聞的學術性和技術性增強,內容更加嚴謹和規范。具體表現為參考文獻增多;數據來源的數量增多,類型多樣化,除了官網信息或公報以外,還包括學術期刊、碩士畢業論文或高校課題;有一些數據新聞運用了數據爬取和數據分析技術。在議題上,與民眾的日常生活關系越密切的主題,越容易得到關注和參與。
對網易數讀的變化趨勢分析,為新媒體環境下國內數據新聞的發展提供參考和借鑒。
注釋
①數讀_網易新聞官網,http://data.163.com/.
②Data Journalism Handbook,http://datajournalismhandbook.org.
③央視《據說春運》受關注:百度看遷徙,http://tech.sina.com.cn/roll/2014-01-27/11519131730.shtml.
參考文獻
[1]方潔,顏冬.全球視野下的數據新聞:理念與實踐[J].國際新聞界,2013(6):73-83.
[2]吳小坤.數據新聞制作簡明教程[M].上海:復旦大學出版社,2018.
基金項目:廣東外語外貿大學新聞與傳播學院“跨文化傳播與國際傳播院級創新團隊”項目。
作者簡介:李 激,副教授,研究方向為計算傳播,數據分析與挖掘,自然語言處理,情感計算,信息檢索,數據庫應用。