趙鑫鏢 王春煜
21世紀是以數據為生產資料的大數據時代。人工智能、云計算、區塊鏈等新興技術逐漸改變傳統生產模式,成為新式生產力,而社會生產關系的運轉則更加依賴互聯網環境。信息技術是一種記憶的技術,而遺忘在互聯網平臺成了意外。互聯網為大數據的產生提供溫床的同時,也給社會帶來了一定的風險。2010年,騰訊與奇虎360的“3Q之戰”拉開了我國互聯網領域數據安全問題的序幕。2016年,阿里巴巴集團意圖讓順豐從騰訊云切換至阿里云,并要求順豐將客戶隱私數據提供給菜鳥物流。2020年4月,市場監督總局依法做出行政處罰,責令阿里巴巴集團停止“二選一”等違法行為。通過梳理我國數據安全相關問題可以發現,我國數據及其延伸產業在高速發展的過程中,不斷出現數據壟斷、數據寡頭、數據侵權等問題。數據新聞是以數據為核心,通過挖掘、清洗、分析及可視化技術來展示數據背后關聯和意義的新聞報道新形式。數據是數據新聞生產的根基和源泉。因此,在數據安全問題備受關注的背景之下,從數據安全視角出發討論數據新聞的數據隱憂及其突破路徑,具有重要意義。
南方都市報的數據新聞記者鄒瑩在從事數據新聞工作時發現,我國數據新聞最大的痛苦莫過于數據缺失,且多數數據未被公開,這種選題一旦碰壁,讓人倍感無力①。我國政府和大型互聯網平臺掌控著大量高價值的數據資源,其中部分數據資源屬于社會共有資源。合理利用這部分數據能促進數字經濟發展與社會治理。當下,我國一些地方政府和企業的數據開放程度、范圍、質量較低,數據壟斷成為當地數據新聞生產與發展的第一絆腳石。
從全球數據開放的現狀來看,歐洲地區數據開放程度排名第一,其次是美洲,開放程度最低的是非洲地區②。從整體來看,各地數據開放程度與其經濟發展、科技水平、文化底蘊有很大的相關性,而數據新聞的數據獲取難易程度與數據開放程度息息相關。隨著我國國際地位的提高和綜合實力的增強,2019年,我國修訂了《政府信息公開條例》。從政府信息公開工作的基本原則來看,新修訂的條例更加明確要以公開為常態,并且不斷擴大主動公開的范圍。此外,該條例還細化了政府信息公開的范圍、程序、監督及保障機制。但當下,我國一些地方政府的數據公開仍存在滯后、惰性和模糊問題。未來,我國數據開放進程還需時間沉淀和不斷推進。
其次,數據的公共資源屬性在我國互聯網平臺企業中難以體現。從我國企業數據共享現狀來看,企業數據共享使得數據使用權和所有權分離。數據獲取者在使用過程中可能會帶來數據濫用、數據侵權等問題。因此,大多數企業會將數據當作企業隱私來對待,對數據開放持保守態度。由于互聯網平臺數據可能牽扯商業機密和個人隱私問題,因此,如何使公共利益、企業利益、個人利益達成三項平衡,成為企業數據共享的難點。此外,我國企業數據共享還處于初始階段,法律和政策對企業數據問題涉及較少,互聯網平臺企業的數據共享辦法有待進一步制定與頒布。同時,由于很多企業認識不到數據共享的社會價值和長遠意義,缺乏企業數據共享實踐案例,導致企業數據共享不積極,這都不利于企業數據開放的推進。
2021年兩會期間,全國人大代表宋文新提出,整頓無底線追星,明星成名應靠作品和實力而不是數據和流量。近年來,隨著網絡新媒體的飛速發展,數據為王、流量是金的理念進一步被認同。數據帶來的經濟效益是直觀的。正如《技術元素》里說的:“目光聚集的地方,金錢必將追隨。”③大數據是一組系統信息,蘊含著新聞的價值④,而數據造假也為數據新聞傳播帶來了難題。2018年,藝人蔡徐坤過億微博轉發量引發社會對數據造假的關注。微博數據主要包括微博的點贊量、評論量、轉發量,而明星的過億微博數據大部分都是明星粉絲刷出來的假數據。加之自動刷量、批量刷量工具的運用,使數據造假變得簡單快捷。此外,商品營銷、公司公關、網絡水軍、優良統計傳統的缺失、有效監督機制的缺位,都使得數據造假成為常態⑤,數據的準確性、客觀性、可靠性、可信度難以得到保證。大數據的特點是數據體量大、種類繁多、價值密度低,這也為數據的核查和清洗帶來極大的困難。優質的數據內容必須保證數據真實可信⑥。真實性和客觀性是新聞的基本原則。數據新聞是數據驅動的新聞報道,而數據的真實和客觀與否都會影響數據新聞報道的質量。數據造假不僅給數據新聞制作者清洗數據帶來了困擾,還會誤導受眾。因此,數據造假成為數據新聞生產的第二絆腳石。
隨著微博、微信、短視頻的崛起,碎片化閱讀成為讀者樂于接受的信息獲取方式。一圖看懂新聞是讀圖時代的新特點。數據新聞是傳統媒體為滿足受眾需求而形成的新聞報道新方式。但在滿足受眾需求的同時,傳播者容易忽略數據本身的特征和新聞內容的特點,過分迷信數據本身,使得數據新聞的呈現僅是數據的組合與疊加,抑或淺顯的統計分析。這就弱化了新聞對數據背后意義和關聯的闡釋,且執念于數據的可視化呈現。通過對比分析中美數據新聞的數據表現可知,對于新冠肺炎疫情期間的就業失業問題,財新網的《疫情沖擊就業市場,艱難時刻如何度過?》僅展示了失業的數據,而紐約時報《被過早歡呼,關注核心失業率》的報道對失業率數據進行深入分析和深度挖掘,指出新冠病毒打破了大多數的經濟模型,對于失業率的數據,應該剔除臨時裁員后的核心失業率。此外,對于疫情期間的經濟問題,財新網的《疫情沖擊有多大?壓力在哪里?廣州民企這么說》只將數據調研轉化為簡單的可視化圖示,而紐約時報的《觀察經濟衰退的另一種方式:用電量下降》則對美國電網的全國用電量進行了闡釋⑦。
在數據新聞發布階段,我國數據新聞作品面臨著著作權和數據隱私權侵權的風險。數據侵權成為數據新聞生產與發展的第四個絆腳石。合法獲取和使用數據是避免侵犯隱私權的重要方式。數據新聞獲取的網絡數據是由網民的個人數據組成的。數據隱私權是隱私權在大數據時代的延伸。法律規定,個人數據受隱私權的保護,需要征得個人同意和法律許可才能使用。網絡平臺上的個人數據及數據集歸屬于個人還是平臺,成為隱私保護避不開的話題。國家網絡安全法規定,個人信息是指以電子或者其他方式記錄的能夠單獨或者與其他信息結合識別自然人個人身份的各種信息。網民的瀏覽記錄、消息記錄、消費記錄等信息都可以界定為個人信息。此規定將個人信息的范疇進一步擴大,而關聯性個人信息也應當被認定為個人信息。個人信息范疇的擴大雖有利于保護個人隱私權,但也可能導致個人信息邊界的消弭。個人信息概念的泛化和模糊也為保護個人隱私帶來困擾。
法律保護個人隱私取決于個人信息的認定,而現實中個人信息和非個人信息的界限并非黑白分明,一成不變,而是隨著技術的進步不斷變化。此外,個人隱私權還受個案情景差異的影響,這些都可能使數據新聞觸碰數據隱私法律紅線。
保羅·萊文森說過:“一切技術都是刀子的翻版。”技術在為數據新聞的數據獲取提供便利的同時,也為隱私泄露提供了溫床。置身于大數據時代,每個人都成了“全景式監獄”里的透明人。網絡平臺收集個人信息及數據主要通過用戶注冊、登錄來創建用戶基本信息,而數據庫會創建用戶的信息表,同時,信息表收集用戶在網站上的操作行為。網站收集用戶數據信息主要通過HTTP Cookie和Cookie技術。Cookie技術是通過設置記憶文件實現操作行為的記憶,實現用戶的連續操作?。此外,還有對用戶操作行為的不斷備份,并對丟失文件進行恢復的增強技術。
互聯網時代,全社會信息生產的分工更加去中心化,與第三方機構合作成為常態化運營現狀,媒體獨自生產數據新聞已經成為過去式?。數據新聞由于作品屬性、著作權人身份的特殊性,令其版權保護變得更為困難?。數據新聞作品著作權歸屬問題超越了當下我國著作權法規定的法理概念范疇。對于一般的合作作品,其著作權歸屬于參與完成這一作品的所有自然人。因此,行使合作作品著作權必須取得所有作者的一致同意,缺少任何一位合作者的同意,合作作品著作權的行使都會被判定為無法律效力。由于我國對數據新聞作品版權保護還沒有明晰的認定,相關概念還未充分厘清,應對治理及懲罰的相關規定還存在大量法理空白,因此,數據新聞作品著作權訴訟幾乎陷入無法可依的現狀。對法律部門而言,數據新聞中的數據歸屬認定技術操作難以實現,媒體對數據新聞版權保護意識較為薄弱,維權意識有限,使得數據新聞作品的著作權保護、著作權歸屬面臨法律困境?。
筆者結合數據新聞的生產流程,從數據安全視角來追根溯源,分析我國數據新聞發展進程中的困境,通過對數據新聞的數據壟斷、數據造假、數據依賴、數據侵權的問題思考,簡析數據新聞的突破路徑。以下,筆者著重探討數據新聞媒體或機構在相關問題上的應對策略。
為應對我國當下一些政府部門和企業數據開放程度低的難題,數據新聞生產者應采取客觀理性的態度。信息共享、數據開放理念是伴隨著互聯網技術發展而產生的新理念。任何新理念從產生到被普遍接受都需要經過時間的沉淀和事件的推進,同時,接受過程中還會伴隨層出不窮的新問題。絕對壟斷和完全開放并不利于保障社會安全和經濟發展。數據開放程度取決于信息的定位和獲取信息對象的使用目的。目前,數據新聞行業規范還沒形成,數據開放可能會帶來責任難以認定的問題。而作為獲取數據的主體,應當承擔起相應的數據責任,具備數據倫理道德。傳播者對數據的使用是為了進行必要的新聞傳播,是為了滿足公眾獲取信息的需求,以更好地引導社會輿論。
此外,數據新聞機構之間應首先在數據開放和數據共享的理念上達成共識,實現同行之間數據共享、共贏。數據新聞報道要給政府、企業和公眾留下值得信任的印象,這是數據新聞媒體為解決數據獲取困難應有的態度和格局。對數據新聞記者而言,如果采用非正當手段獲取數據,抑或對數據進行偏向性篩選,都會影響數據新聞的公信力。因此,數據新聞媒體之間也要建立行業標準和道德規范,以此來影響和規制數據新聞記者的認知、態度和行為。
VarianClinic600直線加速器6MV高能X射線機,購自美國瓦里安公司;BV‐520型多普勒探測儀,購自上海寰熙醫療器械有限公司;Med550酶標儀,購自美國Bio‐Rad公司;CLARIOstar全波長熒光掃描酶標儀,購自德國BMG LABTECH公司。
媒體應建立自身的數據庫來降低對外部數據資源的依賴程度,擁有一定的數據獲取備選方案,數據新聞機構也可以與數據企業達成合作,簽署數據合作協議。政府、企業、個人的數據資源豐富了數據的容量,提升了多樣性,但同時也存在很多不確定性。數據持有者也可能存在私心問題。在面對不利于維護自身美好形象的數據時,數據持有者可能會修改相應的數據并進行選擇性傳達。數據新聞媒體在不知情的情況下進行數據處理和新聞報道,會喪失新聞報道的自主權,進而影響數據新聞的公信力和客觀性。因此,數據新聞機構降低對外界資源的依賴程度就顯得尤為重要。
媒體數據庫的建立有利于提高媒體之間數據的相互使用,提高新聞業的透明度和公信力。2020年,美國已嘗試自建媒體數據庫。雖然中國也在摸索,但中國數據新聞機構自建數據庫的開發程度和普及程度均不高。由解放日報出品的上觀新聞的自建數據庫已容納有自采數據、爬蟲數據和政府公開數據等內容?。
身處信息時代的記者更加需要對大量數據進行核對、分析和整理?。為應對數據造假和數據侵權問題,數據新聞傳播者應練就一雙慧眼,提升從業人員的數據素養。如果新聞記者不具備良好的數據新聞素養,就會造成重要信息的遺漏,也會讓錯誤的結論誤導受眾?。當下,我國新聞傳播專業需要跨學科的知識儲備。然而現狀是,計算機專業的學生鮮少知曉新聞傳播,新聞傳播專業的學生很難有好的計算機編碼基礎?。由此可見,我國數據新聞人才培養應該劃分校園培養和媒體培養兩個分支。高校需聘請計算機、數學、統計專業的老師來開設數據挖掘、清洗、分析和可視化課程?,新聞專業的研究生招生也應重視理工科背景的跨專業考生。媒體培養可通過老人帶新人的模式,定期開設數據素養學習班,和不同行業進行交流學習,在工作中磨煉和提升員工的數據素養。武漢鏑次元數據科技有限公司就通過與高校及數據新聞研究所合作,培養出大量涵蓋數據挖掘與搜索、數據分析、數據可視化與運營人才,形成了數據素質培育方案。再者,數據新聞機構需轉變生產理念。數據新聞生產可以借力政府、企業或個人等具備數據清洗和分析能力的合作對象?,也可外包或成立相應的法律部門,讓知法懂法的專業人才來把關數據的挖掘清洗和數據新聞發布過程。
為避免數據侵權問題的發生,數據新聞生產者理應向數據源提前說明使用者身份和使用意圖?,并請求數據源對涉敏或涉密數據進行修改和審查,以符合數據歸屬者的合理預期和數據的合理合法利用的法理要求。數據新聞從業人員要提升版權意識,加強對數據新聞著作權的判定能力培養,養成維權理念。對于商業數據和個人數據,媒體可支付一定的費用,當數據涉及公共利益、企業利益或個人利益沖突時,要以社會利益為主,保護公眾利益。總之,數據新聞傳播者應承擔更多的社會責任,在獲取數據源的同時,不能辜負數據歸屬者的信任。應保障數據歸屬者的數據安全,不得泄露個人隱私數據。
我國數據及其延伸產業剛剛起步,各種數據商業模式還在探索和發展之中,且暴露的相關數據問題還不徹底。當下,基于數據隱憂而提出的解決問題的方法還在不斷醞釀和革新中。在這種情況下,處理數據問題的方式也應順勢而為,應時而變。
媒介依賴大眾資源和社會公共資源,而社會和大眾同樣需要媒介來獲取信息,因此,雙方具備了依賴的相互性。數據新聞在危機傳播中發揮著重要作用,危機數據新聞的傳播高度依賴外部數據資源,而對數據依賴成癮將會對數據新聞發展帶來很多負面影響。媒介過度依賴外部環境資源會使得二者互動異化,互動異化則很可能會導致二者從合作走向分裂。因此,要提醒數據新聞媒體或機構在不斷從外部環境中汲取養分的同時,也要釋放對外部環境的回饋信號,及時給外界環境“回禮”。兩者只有對等依賴,才能實現合作共贏。

注釋:
①鄒瑩.可視化數據新聞如何由“作品”變“產品”?——《南方都市報》數據新聞工作室操作思路[J].中國記者,2015(01):92-93.
②唐斯斯,劉葉婷.全球政府數據開放“印象”——解讀《全球數據開放晴雨表報告》[J].中國外資,2014(09):28-31.
③[美]凱文·凱利.技術元素[M].張行舟,余倩 等譯.北京:電子工業出版社,2012.
④?陳力丹,李熠祺,娜佳.大數據與新聞報道[J].新聞記者,2015(02):49-55.
⑤朱鴻軍.警惕數據新聞中的新聞倫理問題[J].傳媒,2017(03):34-36.
⑥支庭榮.優質數據內容三要素:真實、量大、有用[J].青年記者,2021(07):5.
⑦楊宏.中美數據新聞專業規范對比研究——以新冠肺炎疫情期間財新“數字說”與紐約時報“UpShot”欄目為例[J].青年記者,2020(36):40-41.
⑧唐錚,丁振球.數據新聞的社交化傳播之困——基于兩個數據新聞微信公眾號的定量研究 [J].新聞記者,2020(11):59-67.
⑨郎勁松,楊海.數據新聞:大數據時代新聞可視化傳播的創新路徑[J].現代傳播(中國傳媒大學學報),2014(03):32-36.
⑩?沈浩,談和,文蕾.數據新聞記者的數據素養[J].青年記者,2014(21):17-18.
?丁曉東.用戶畫像、個性化推薦與個人信息保護[J].環球法律評論,2019(05):82-96.
??王瓊,徐園 等.中國數據新聞發展報告(2018-2019)[M].北京:社會科學文獻出版社,2020.
?王鴻.可以分割使用合作作品著作權行使規范之完善[J].學海,2016(06):149-153.
?劉建.數據新聞合作作品著作權歸屬的困境及其破解[J].出版發行研究,2018(09):80-83.
?方潔,顏冬.全球視野下的“數據新聞”:理念與實踐[J].國際新聞界,2013(06):73-83.
?劉義昆.大數據時代的數據新聞生產:現狀、影響與反思[J].現代傳播(中國傳媒大學學報),2014(11):103-106.
?許向東.對中美數據新聞人才培養模式的比較與思考[J].國際新聞界,2016(10):100-110.
?王敏.大數據時代如何有效保護個人隱私?——一種基于傳播倫理的分級路徑[J].新聞與傳播研究,2018(11):69-92+127-128.