999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向智能化的數據新聞:2018美國計算機輔助報道年會的啟示

2018-08-10 01:17:34肖書瑤趙鹿鳴
中國記者 2018年7期

□ 文/肖書瑤 趙鹿鳴

內容提要 本文結合對2018年美國計算機輔助新聞報道年會的觀察,介紹了美國以及各國媒體在數據新聞等領域的最新技術與前沿思考供借鑒、探討。

美國計算機輔助新聞報道協會(The National Institute for Computer-Assisted Reporting,以下簡稱NICAR)創立至今已有二十余年歷史。每年舉行的NICAR大會既是全球調查記者、數據新聞記者的交流盛會,也是觀測美國媒體如何進行融合轉型的風向標。

2018年3月11日,新一屆的NICAR大會在美國佛羅里達州落下帷幕。224個分會議和334位演講者為上千名參會者帶來了美國以及各國媒體在數據新聞等領域的最新技術與前沿思考。他們當下的理念、方法及挑戰,可以給中國的數據新聞業提供經驗參考。

一、NICAR大會:媒體技術的前沿和手把手的課堂

20世紀80年代中期,計算機輔助報道在美國興起,一些記者嘗試用電腦進行數據分析,借此完成新聞報道。1989年,美國《普羅維登斯報》記者埃利奧特·賈斯平(Elliot Jaspin)在密蘇里新聞學院創辦了計算機輔助報道協會。1994年,NICAR成為IRE(Investigative Reporters and Editors,調查記者與編輯協會)附屬項目,并開始舉行一年一度的交流大會。目前,“計算機輔助報道”這個術語在美國被更多地描述為“數據新聞”,因此,每年的NICAR大會便成為了全球數據新聞行業難得的溝通機會。

NICAR大會的參與者既有來自世界各媒體的記者、編輯、設計師,也有來自美國各高校的老師與學生。許多參會者并沒有數據新聞從業的經驗,甚至并沒有系統學習過。因此,大會不僅為經驗豐富的從業者設立最前沿的研討會、小組討論,還為“半路出家”的初學者開設了視頻演示課以及實踐性極強的教學課程。從Excel基本知識和進階技巧、谷歌表格的使用到R,Python和SQL語言的學習,再到可視化設計和地圖繪制,基本涵蓋了數據新聞生產的全流程和常用的工具軟件。224個分會議的內容涉及到數據挖掘、數據分析、信息設計、動畫視頻、軟件展示、機器學習、案例分享、新聞思維以及新聞教育等方面。

二、智能化:美國數據新聞生產的新關鍵詞

數據新聞已經成為近年來中國學界和業界熱議的話題。數據化才是數據新聞最主要的特征,而大數據、人工智能并不是此前生產一份數據新聞的必要條件。理解這一事實是我們考察其發展動向的前提。

但值得一提的是,近年來,越來越多的美國媒體開始將機器學習、自然語言處理等技術作為輔助報道的手段,例如事實核查或幫助記者進行重復枯燥的工作,甚至是識別天空上方隱藏的偵察機。這使得數據新聞在數據化的基礎上,開始真正呈現智能化的趨向。NICAR大會上談到在媒體領域的機器學習應用,至少從四年前就開始了。

在今年大會的“機器學習輔助報道的入門指南”(Getting started with machine learning for reporting)研討會上,來自Buzzfeed、《紐約時報》(New York Times)、《明尼阿波里斯星壇報》(Minneapolis Star Tribune)和《洛杉磯時報》(Los Angeles Times)的記者介紹了三個機器學習在新聞上的應用案例,討論了“對記者來說機器學習到底意味著什么?”“什么時候需要使用機器學習”以及“如何為你選擇的算法來優化數據結構”。

▲ BuzzFeed News與Flightradar 24通過機器學習追蹤偵察機飛行軌跡。

▲ 《芝加哥論壇報》嘗試從數據中找到新聞故事中的報道對象。

《洛杉磯時報》此前的一篇調查報道揭露了洛杉磯警察部門因為錯誤地將14000條嚴重襲擊歸為輕型犯罪,使洛杉磯地區暴力犯罪率統計顯示下降。記者利用此前時報的關于犯罪的報道作為樣本訓練機器學習關鍵詞來分辨什么是“嚴重犯罪”和“輕型犯罪”,然后應用分析于當地警察部門自2005到2012年以來的犯罪數據記錄。報道促使當地警方采取包括改進內部問責和培訓警察正確分類犯罪行為在內的一系列改變措施。

此外,美國新聞聚合機構BuzzFeed News也在大會上深度解析了他們運用機器學習技術完成的作品《天空中的密探》。這篇報道與航班追蹤網站Flightradar 24合作,獲取了兩百架聯邦政府偵察機的定位數據,然后用地圖的形式展示出它們累積的飛行路線及隨時間變化的航班動態,從而完成對政府空中巡查規模和范圍的調查呈現。

其中,最引入矚目的流程是他們的數據收集——團隊首先將偵察機的規范圖像錄入一臺電腦,然后訓練電腦以此作為依據,對美國上空所有的政府偵察機進行識別,再對它們的飛行路線進行追蹤,最后完成可視化。如果說現場圖片的人臉識別僅僅是提高了記者的采寫效率,那么對于這篇作品而言,沒有機器的幫助,報道幾乎無法完成。

總體來看,美國的數據新聞業正朝著智能化的方向審慎前行。機器學習聽起來非常艱深,但在媒體使用最多的技術場景,還是對資料進行分類和打上標簽。比如,有大量政府文件需要知道分別是什么類型的,那么記者可以設計一個算法訓練機器去學習以往的數據來獲得分類特征,一定量的學習后,機器便能夠將新的政府文件根據特征而自動分類,代替人工閱讀海量的文本文件,省去了很多重復性勞動。

《明尼阿波里斯星壇報》的記者蔡司·戴維斯(Chase Davis)也在“何種情況下需要使用機器學習”給出了他的建議:是否重復而枯燥;可以讓實習生來做嗎;但如果這樣會感覺到強烈的愧疚嗎?同時,Buzzfeed的記者彼得·奧爾胡斯(Peter Aldhous)則提醒同行永遠要記得去檢查機器學習的結論,“不然你就讓算法做了你應做的工作。”

需要注意的是,智能化的數據新聞生產固然有利于將新聞作品的時效、深度、廣度提升到新高度。但美國的新聞從業者也在反思,在視人工智能為一種新方法時,要持有謹慎且懷疑的態度,因為所有的算法都是由人類編寫,不可避免地包含了人們的固有偏見和主觀判斷。NICAR大會有一個分會議的主題就是“算法問責制”(Algorithmic Accountability)。

三、不僅僅是可視化,而是找到數據背后的故事

酷炫的可視化效果是數據新聞吸引眼球的最終視覺呈現,但一篇數據新聞背后還隱藏著大量的數據挖掘和清洗工作。甚至在某些看起來并不那么“數據化”的新聞背后,往往是數據驅動的結果,是數據引領記者找到背后的故事和真相。

在“數字背后:如何在數據中找到你的報道對象”分會議中,《芝加哥論壇報》(Chicago Tribune)的記者Micheal J. Berens介紹了如何在數據中找到適合報道的對象并且豐富他們在故事中的形象,尤其是在數據驅動型報道中找到典型,把他們從幕后帶向臺前。《芝加哥論壇報》在當地醫療數據庫中對相關醫療事件進行分級,從中找到了三個典型人物,然后對他們進行了跟蹤采訪,由此通過一系列融合數據、圖片、視頻的多媒體報道揭露了伊利諾伊州的醫療輔助機構對殘疾人的虐待問 題。

顯然,這并不是我們所說的一個智能化的數據新聞,但這顯示了一種典型的數據驅動型新聞工作流程:跟蹤極端值、量化和分離數據、給數據評級、做實地調查、得出結論。他們努力從數據中找到新聞報道的對象(Turn Data Into Characters In Your Story)的方法依然收獲了美國同仁的贊譽。因為在保持技術更新之外,依然不要忘記對數據背后反映的真相進行實地調研和采訪,這才是一個完整的數據新聞作品不可或缺的重要流程,也是目前美國媒體進行數據新聞生產的共有理念。

《芝加哥論壇報》的邁克爾·J·貝倫斯(Micheal J. Berens)談到了許多數據分析與調查采訪結合的實用技巧,例如:創建你自己的數據庫;報道對象并不一定是“人”;不要使用不能反映普遍現象的異常數據;一個代表性的對象和好過幾個弱的;與愿意和你交談的人談話;追蹤和觀察報道對象的生活而不僅僅是聽他怎么說。

四、智能化是挑戰也是機遇

當前,全世界的傳統媒體都在困窘中前行,數據新聞能否成為媒體融合轉型的長期路徑,學界依然在討論中。但無論如何,越來越多的美國新聞院校開始意識到數據的重要性,因為信息公開法案、政府公開數據、社交網絡數據的出現,使其成為了一個不可或缺的內容來源。由此,新聞院校與媒體在近年來達成的又一個共有理念是:掌握計算機編程、數據挖掘、可視化等技術,或將是未來人才培養的基本要求。

可是,當智能化的新技術成為目前媒體的轉型邏輯,新的挑戰接踵而至——當技術趨于成熟,它是否會反噬新聞業,對編輯、記者的職業本身造成新的沖擊?這一話題也在2018年的NICAR大會上多次提及,具體來看,它不僅是促成了數據新聞的進一步變革,而是會對整個新聞業施以影響。

首先,如果讀者已習慣在社交網絡和信息聚合類應用上閱讀新聞,那么這些平臺上的算法如何推送新聞將影響各媒體的流量多寡,這對大量依靠互聯網流量的機構來說無疑是個巨大的考驗。如2016年,皮尤研究中心的結果顯示,美國有44%的新聞閱讀流量來自社交平臺臉書(Facebook),但同年這一平臺卻調整了他們的內部算法,不再以推送新聞優先,而是以用戶親朋分享的實時動態為推送優先。這使得諸多機構如 Five Thirty Eight、Buzzfeed News在短時間內減少了大量流量,進而失去了一部分廣告收入,他們不得不裁掉部分辦公室、精簡團隊來節省支出,本需要大量復合技能人才的數據新聞業只能向美國東西兩岸的大型媒體靠攏。這一過程一方面讓相關人才向計算機行業外流,另一方面也迫使媒體在數據新聞的生產上削減開支或調整周期。近來年,作為一種應對,美國媒體開始在用戶體驗和效果監測上狠下功夫——比如積極與技術公司合作,開發分析平臺來監測讀者的覆蓋率、觀看率、觀看時間;同時調查讀者的瀏覽習慣,相應地調整新聞推送的平臺、頻率等等。這些舉措,都讓媒體更好地理解讀者,從而對內容生產做出更明智的決定。

其次,新興技術的加入也使新聞業的用工需求出現變化。比如,在2016年的美國總統大選期間,美國的數據新聞業就迎來了井噴,幾乎所有媒體都愿意招聘擁有編程、數據分析、可視化等技術的人才,以便在新聞作品中提供更全面的內容、更吸引人的交互效果。但是當大選結束后,這類需求卻急遽下降,因為常規時期的媒體并不需要這么多的數據新聞記者。此外,算法加持下的自動化新聞(Automated Journalism)的出現也迫使媒體對記者、編輯們的分工進行調整。因為自動化新聞在代替記者撰寫一些相對“機械”的內容的同時,也讓媒體意識到,這種“人機聯動”的生產模式一旦成熟,那么記者也許可以獲得更充裕的時間去完成一些更深度的報道,整個新聞業的工作分配就會繼續調整。如何吸引更多的計算機科學、數據科學人才的加入?如何訓練傳統記者與智能技術的相處?如何調整人與算法的工作分配?將是未來所有新聞行業都會面臨的挑戰和機遇所在。

主站蜘蛛池模板: 亚洲不卡影院| 无码一区18禁| 91网在线| v天堂中文在线| 亚洲AⅤ综合在线欧美一区| 亚洲一级色| 99久久国产综合精品2020| 日韩一二三区视频精品| 成人福利在线视频| 一级福利视频| 少妇被粗大的猛烈进出免费视频| 国产福利微拍精品一区二区| 国产一级在线播放| 无码人妻热线精品视频| 久久精品中文字幕免费| 少妇被粗大的猛烈进出免费视频| 国产剧情一区二区| 亚洲狼网站狼狼鲁亚洲下载| 亚洲综合二区| 91无码人妻精品一区二区蜜桃| 亚洲国产成人精品一二区| 日韩欧美国产三级| 亚洲欧美不卡视频| 国产一区二区福利| 欧美一级爱操视频| 中文无码伦av中文字幕| 亚洲综合一区国产精品| 色网在线视频| 无码人妻免费| 波多野结衣无码AV在线| 毛片免费试看| 露脸国产精品自产在线播| 成人午夜视频网站| 国产精品熟女亚洲AV麻豆| 日韩精品亚洲一区中文字幕| 亚洲 日韩 激情 无码 中出| 日韩麻豆小视频| 日本色综合网| 午夜视频免费一区二区在线看| 91久久大香线蕉| 国产精品专区第1页| 久草视频精品| 四虎在线高清无码| 国产av剧情无码精品色午夜| a级毛片在线免费观看| 8090成人午夜精品| 久久美女精品| 中国国产A一级毛片| 黄色网址手机国内免费在线观看| 2021国产乱人伦在线播放| 中文字幕亚洲综久久2021| 国产亚洲视频中文字幕视频| 欧美日韩国产精品va| 亚洲精品无码日韩国产不卡| 亚洲一区黄色| 久久中文字幕不卡一二区| 免费在线a视频| 香蕉eeww99国产精选播放| 国产91小视频| 欧美爱爱网| 亚洲精品大秀视频| 欧美国产成人在线| 亚洲欧洲日产无码AV| 国产一二三区在线| 中文字幕永久视频| 欧美日韩国产在线人成app| 日韩无码黄色| 久久综合五月| 综合人妻久久一区二区精品| 亚洲无码免费黄色网址| 国产日韩久久久久无码精品| 毛片久久网站小视频| AV片亚洲国产男人的天堂| 国产农村1级毛片| 亚洲日韩图片专区第1页| 婷婷五月在线| 在线另类稀缺国产呦| 久久综合色视频| 这里只有精品在线播放| 国产成人免费高清AⅤ| 亚洲第一黄片大全| 人人爽人人爽人人片|