◎姜大為
(安徽廣播電視臺,安徽 合肥 230051)
傳統的新聞采訪較為復雜,記者獲取信息往往要通過查詢資料,現場目擊采訪,而大多采訪運用的還是那種偶遇式采訪調查,采集的樣本還是隨機樣本,整個新聞采訪的過程以記者獨立調查為主。近些年來,媒介技術的不斷進步,大數據的思維方式開始介入到新聞傳播領域,新聞行業也開始了對大數據應用的探索。特別是在新聞采訪中,大數據的創新應用為新聞信息采集的發展注入了新的活力。大數據時代,數據資源不僅是新聞采訪中的重要元素,而且成為了變革新聞報道生產方式的重要力量。

傳統新聞采訪與大數據信息采集比較
眾所周知,傳統新聞報道式微的重要因素就是制作周期長,采訪取證耗時耗力。大數據時代用數據采集這種采訪方式可以讓專業的記者把精力集中在對數據淺層信息源進行選擇性的分析上,挖掘新聞的深層意義,有效提高記者的工作效率。
大數據時代調查記者在采訪時可以在原有的基礎上進行發展和延伸。傳統的信息采集方式,記者需要通過調查走訪或是在檔案館、資料室查閱。而在數據化時代,各種檔案都有電子化的數據記錄,調查記者可以經過核實后可以直接利用,更可以通過大數據技術對記錄的數據進行分析處理。《南方都市報》為了調查城市空氣污染指數,曾向全國31個省市的環保系統提出了公開PM2.5數據的申請,很快得到了10個省市的回應,其回復的速度比聯系宣傳部門采訪要快得多。
在新聞報道的數據采集上,比較常見的就是直接采用公開發表的數據,主要有以下三種方式:第一,通過網絡在線獲取。第二,通過圖書館館藏資源獲取。第三,利用工具采集數據。這三種方式也是最高效的數據采集手段,目前國內媒體用數據來做調查報道最常見的是直接獲取官方公布的數據信息。2020年1月武漢新冠病毒肆虐,對人民的生命造成了極大的傷害,每日新增的數據使全國彌漫著一種恐慌的情緒。起初處于對安全的考慮,央視開始并沒有派出大量記者實地采訪。為了消除恐慌情緒,央視在新聞報道多次引用了國家衛健委數據庫里的數據,通過大數據比對深度解析了病例迅速上升的原因。國家衛健委的數據都是由各地上報匯總、及時更新,數據信源來自官方權威,可信度高。以央視2020年2月2日《新聞1+1》關于新型冠狀病毒肺炎的報道為例,我們可以從圖表中看到:
截至2月2日24時在病死率方面全國<湖北<武漢,全國范圍除湖北以外的新冠肺炎致死率是0.18%,而武漢市卻達到了5.15%。隨后李蘭娟院士在采訪中對這組數據進行了解讀,新冠病毒并不會因為病毒離開武漢會有所減弱,可能是由于在其他省份是幾名醫生對一名患者而在武漢是一名醫生要面對多名患者,加之匱乏的醫療物資等原因造成在病死率方面武漢要遠遠大于其他地區。
對這種對時效性有要求的調查報道,可以清晰地看出數據采集的優勢。記者著重于對數據的分析,以數據為主輔以專家采訪來報道,可以在極短的時間內完成報道。報道中以數據來佐證新聞事實,短時間內向人們解讀了前期新冠肺炎病毒致死率高的原因,以高效的手段在一定程度上消除人們的恐慌情緒。

圖片來源:2020年2月2日《新聞1+1》節目截.http://tv.cctv.com/2020/02/02/VIDE0QnBmIUwa31L3ktKu9Un200202.shtml.
大數據技術的發展,樣本數據更加豐富,使得調查的結果更加具有科學性。傳統新聞報道遵循的是抽樣的理念,通過樣本來推斷總體。但是任何記者在采訪的過程中,都會受制于自身的視野和樣本的數量,可能會對調查的結果帶來傷害。大數據信息采集可以在一定程度上規避記者主觀感受的風險,避免記者把相關性和因果性相混淆。傳統的調查方法來了解采訪對象,可能是通過對其相關聯的人進行采訪,來獲取其信息。然而通過大數據技術我們可以通過社交網站、微信、微博的數據,分析人物關系來調查這個人,這樣得出的結果可能更加全面。大數據對于新聞采訪最大的優勢在于其基于數據來源的多樣化及海量數據分析下計算出的結果,準確度大大提升,在信息爆炸的時代給受眾以安全感。
2014年央視新聞頻道在“據說春運”的報道中,利用百度地圖LBS定位了手機大數據,通過LBS這個平臺對2億部智能手機的用戶進行定位,通過從獲取的數據實時制作出中國春運遷徙圖,整個過程沒有和以往傳統的調查報道一樣派記者在各大火車站蹲守采訪,其信息的獲取全部是通過手機定位。在LBS平臺下定位的信息是非常具有說服力的,因為這個平臺的定位信息覆蓋了十萬以上個APP,每天定位信息數據達到十億以上。[1]大數據分析的結果是北京和成都之間的路線是春運幾天最熱門的線路,這個結果與成都鐵路局的統計調查結果不謀而合,這說明通過大數據分析精準地反映了當年春運的旅客遷徙軌跡。
大數據新聞報道方式更多的是一種從微觀視角到宏觀視角的轉變,宏觀層面的視角對于調查報道來說比微觀視角更勝一籌。而有效加工的大數據可以更加真實、客觀地揭示隱藏在事件背后的意義,大數據樣本的科學性讓新聞報道的結論更具說服力,提升了新聞采訪的科學性。
大數據采集降低采訪成本,節約人力物力。調查取證是新聞報道最重要的一個環節,而這個環節最大的劣勢在于采訪成本過高。在大數據技術的支持下,作為新聞記者不一定非要去新聞現場進行調查采訪,可以通過對有效數據的收集和分析工具來挖掘對報道有價值信息。
大數據背景下,記者可以通過收集受眾的數據來完成報道,有效的降低調查成本。英國《衛報》為了了解英國議員的消費情況,邀請了兩萬余名讀者參加調查。緣起《衛報》的對手《每日電訊報》已提前獲知英國議員違規消費的信息,為了回應受眾不滿的情緒,政府公布了所有議員近四年以來的消費情況,總計100多萬份文件。這些未經整理的數據,僅僅通過記者或是新聞團隊在短時間內是無法核實的。于是《衛報》將這100萬份文件數據壓縮成45萬份在網上發布,并設計了一個讓讀者參與的軟件,參與的讀者可以領取數據。在調查項目上線的80小時內,就有1.7萬份文件被讀者審核完畢,使得作品最終得以呈現。[2]《赫芬頓郵報》在關于金融危機的調查中也曾發起過“Blogging the Meltdown”的項目,調查的內容主要是讓公眾填寫經濟下行對于生活的影響,在大規模的數據的基礎上,集合受眾的故事來完成,取得了受眾很高的認同感。
大數據時代,記者除了通過直接在數據庫索引數據還可以通過在互聯網上發調查問卷的形式向讀者來獲取數據。以這種數據采集的方式完成來采訪的前期準備,幫助媒體節省采訪成本,具有一定的經濟價值。
大數據技術對新聞采訪帶來諸多便利的同時,可能會帶來一系列的風險。因為報道數據的來源可能不夠客觀,造成數據可能會“說謊”,以及記者在采訪過程中數據素養的缺乏會導致一些倫理問題。因此,新聞媒體在利用數據進行報道的過程中必須對其產生的風險進行治理。
首先,記者做好數據“把關人”。記者在利用數據進行報道的過程中,務必要做好“把關人”。大數據時代,任何人通過互聯網都能發布信息,越來越多渠道造成了信源的不確定性。記者在獲取數據的時候首要的問題就是做好數據的核實工作。調查采訪不可丟,數據收集結合實地調研,了解數據的背景和與之相關聯的因素。具體可細化到:第一,記者對報道中邏輯和細節要有質疑的態度和批判性的思維,不能過分的依賴數據而造成事實的偏差。第二,記者不斷對數據和報道內容核實,特別是對重要數據進行反復驗證,辨別數據真偽。新聞媒體和記者在調查報道的過程中,數據收集一定要和調查采訪相結合,交叉印證新聞事實才能提高調查報道的精確性。
其次,提升從業者數據素養。新聞高校培養專業人才,提升從業者的數據素養。由于歷史原因,國內新聞院校的人才培養與社會的需求存在著脫節的現象。以往新聞報道的從業者大多是文科生,而現在的傳媒行業一大趨勢就是工科化,數據分析、編程、頁面設計等人才都是市場所急需的。未來的新聞學院可能是偏向理科的,新聞學院一定是與設計學院、計算機學院、數學與統計學院相結合的,“新聞+技術+大數據”是未來培養記者的方向。
近年來,美國的密蘇里大學、加州大學伯克利分校、紐約大學、學北卡羅來納大學的新聞傳播學院等高校都增設了數據新聞的課程。哥倫比亞大學設立了“新聞學—計算機科學”的雙碩士學位,由新聞學和計算機專業的老師聯合授課,除去學習新聞傳播學知識還要學習大數據與編程的課程,由專業記者兼大數據專家Jonathan Strays授課,培養的學生未來可以從事調查報道的數據分析、線上編輯、互聯網設計員等工作,這種學科交叉的培養模式已經成為了共識。為了滿足大數據背景下媒體對于新聞數據人才的需求,國內的新聞院校也陸續開設了大數據相關的課程,逐步解決新聞隊伍中數據人才匱乏問題。中國傳媒大學、清華大學、中國人民大學、復旦大學、武漢大學等高校也都相繼開設了數據新聞的課程。開設數據新聞課程的同時,高校應該加強與企業的合作建立數據新聞人才基地。目前財新傳媒數據可視化實驗室、網易數讀、新華網數據新聞等知名媒體與高校已經建立了合作關系,這為未來數據新聞人才的培養提供了重要的實踐平臺。阿里巴巴和重慶九所高校簽訂了協議,部分核心課程由阿里云大學承擔,利用企業這個平臺來培養大數據人才。
記者提高數據素養可以從以下兩個方面的入手:
第一,在報道中要保證調查數據的真實性。所謂數據的真實性不僅僅要求數據的出處具有權威性,而且要求采集的是全面的數據。應用數據的目的是為了反映客觀事實,而不是為了獲得需要的結論而片面的選擇數據。在報道中,對數據的實際用途有著深刻的認識,記者需要對數據功能的邊際有著深入的了解,同時也需要了解到自身所存在的局限性,在對大數據進行評價時,記者需要表現足夠的客觀、理性,保證數據的合法性。大數據背景下,在報道的生產過程中,數據的作用舉足輕重。這就要求從事報道的新聞機構和個人在技術上要發展加密技術,在思想上要做到行業自律,與此同時政府職能部門加強對數據的監管。多方努力,才能保證數據的合法性。
第二,記者提高數理統計能力,科學運用數據。國內不少的調查報道在數據的使用中幾乎都是數字的堆疊,以這種方式呈現出來的報道除非是專業人士,普通受眾幾乎是不會去看的。因此,記者在面對這些堆疊的數字中要能尋找到對受眾有意義的數據,并能結合數據進行深入的采訪和挖掘。在報道生產的過程中會需要用到大量的數據,對此從事采訪的新聞工作者需要表現出高度敏感性,真正地喜歡運用數據,提高審核數據、分析數據的能力。在數據的基礎之上做出決策,針對數據,從業者需要真正的擁有從數據中找到問題以及反思批評能力。
最后,數據采集遵守新聞倫理。從當前數據報道的新聞實踐來看,在數據采集和數據應用和數據展示層面引發了一些新的職業道德問題和新聞倫理的問題。讓受眾犧牲個人的數據利益來為媒體采集信息,而由此產生一些風險和后果都是不合理的,有違新聞倫理。媒體在利用數據進行采訪的時候,要充分考慮到公眾的利益,要對公眾負責。因此,記者在采訪報道過程中,還必須遵守以下幾條原則:
第一,尊重公眾利益。利用數據進行采訪報道,不能以損害公眾利益為代價。記者在采訪的過程中要告知采訪對象有關個人信息采集及處理的注意事項,必須獲得數據采集主體的同意。媒體在收集了大規模的用戶數據后,就需要對這些數據進行深入挖掘以及分析,此時制作機構需要與相關利益人進行充分的溝通,有效的了解其中所存在的潛藏風險。必須要將尊重原則落實到實處,給予弱勢公眾以平等對待。對于數據應用的媒體來講,需要采取一系列的措施來保障匿名信息,使得個人信息盡可能不會出現泄漏的情況。
第二,公平參與原則。新聞報道最大的作用就是要維護社會的公平正義。大數據時代,數據公平是報道客觀公正的起點。采訪報道中要充分考慮數據鴻溝的情況,必須要對這種現象進行規范,遵循公平公正原則,采集數據時兼顧大部分群體的利益,在分配數據資源的過程中盡量地體現出公平,采取必要的措施,使得數據鴻溝盡可能地縮小。在開發及應用大數據技術的過程中,給與公眾平等的機會參加調查報道的權力,同時這樣權利也是不容任何組織與個人侵犯的。
第三,公共利益優先原則。個人利益與公共利益發生矛盾時,要優先保障公共利益。在西方國家,個人信息要涉及到公眾利益就不屬于隱私了,因此隱私權是有可減性的[3]。采訪報道的目的之一在于維護公共的利益,在調查報道中若因公共權益使用到個人數據,新聞媒體必須權衡利弊,犧牲一部分個人的數據權力。但可以利用技術手段對個人數據進行加密處理,但必須將這種傷害降至最低。目前我國新聞界在數據應用倫理方面尚未有完備的規范體系。一般較為普遍的觀點是:政府對外公布的數據可以作為獲取的數據源。絕不能以記者一己私利來侵害公眾的合法權益,當個人隱私與公共利益相沖突時,記者要根據法律法規,得到有關部門授權后方可利用數據來進行報道。
在利用大數據進行新聞采訪時,我們既要承認它的實用價值,又要認識到它的局限性。在采訪中將數據為我所用,不能淪為技術的奴隸。新聞工作者只有理解大數據在新聞采訪中的利弊,做好新聞報道中的風險治理,才能充分地發揮大數據在新聞報道中的作用,從而體現大數據在新聞采訪中的力量和價值。