大數據對新聞業研究方向的拓展

2020-08-28 11:33:26葉寧

新聞愛好者 2020年6期

葉寧

【摘要】大數據是數字、數據的融合，是一個社會、文化和科技的現象，從中體現出的是分析技術、數據驅動以及數據操作后果影響等一系列新型議題。當學者們開始對大數據在媒體和公共生活的大框架下進行理論概括和深入研究時，對于新聞業的研究又有哪些值得注意和可供擴展的方面？通過結合相關文獻，擬從認識論、經濟學和倫理學的視角，探討大數據對于新聞業的專業邏輯和產業生產的意義，以及在此基礎上對新聞業未來研究方向的拓展。

【關鍵詞】大數據；認識論；專業性；倫理

大數據不僅僅是數字科技的重大進步，它也在重新定義我們的生活、工作和思考方式?！皵祿谋▽⒏淖兾覀兊男袨槟Ｊ健Ｃ恳粋€互動，每一次信息交流，每一個觸點都會產生數字的附帶碎片———可供分析和掌控的數據塊”。不斷增加的事實表明數據的本質正在發生重大變化，主要體現在數據表現的量和種類不斷增加，數據的搜集方式、類型擴大以及對社會、文化和金融價值所能產生的巨大潛力，并由此帶來的有關隱私、準確性和道德的問題。由無處不在的移動設備、傳感器、智能機器以及數字數碼追蹤裝置、數據庫和由點擊、推特、GPS坐標、時間標記等所產生的社會、自然行為的碎片，都對大數據的研究提出了前所未有的挑戰。這種“大數據行為不僅僅只是數據泛濫的技術轉變，更是一個社會技術現象，有著文化的、經濟的和政治的起源和含義，既是一門科學、一種行業，也是一個神話”。[1]

“相對于傳統數據來說，大數據時代在數字科技變革的支撐下實現了數據規模、變量、數據分析結構、數據分析能力等各個方面的突破性發展”[2]。大數據現象也對新聞媒體提出了一系列問題，例如對知識和真相的概念主張，職業狀態的協調和對新的專業化發展的技術配置以及效率、資源、創新和價值生產、收益機會方面的潛在挑戰等。這些發展和問題對引導人們的決定生成、科技系統的規范和價值都提出了挑戰。

從社會學角度看，大數據處于社會、文化和科技三種動力的相互作用中，進一步說，大數據提供的是更高形式的智慧和知識。這主要體現在計算能力的最大化和搜集、分析、聯結，較大數據塊算法的準確性上面。以數據塊辨析模式而產生的經濟的、社會的、科技的以及法律的相關問題正逐漸成為學界關注的焦點。

大數據引發的是對規范評價和作為一種職業操作的新聞業的重新定義，它也是一種有組織的生產———包括從知識生產、經濟原理到實際操作，利用算法和定量衍生價值。因此，大數據包含著紛繁復雜的內容。對于新聞業來說，大數據體現著數據叢、算法和計算方法及相關過程中信息工程范例的量化行為及規范等。

一、新聞和媒體行業的大數據

在對新聞業的大數據研究中，媒體行業必須面對的首要問題是如何使用數據。當然，新聞業從誕生之日起就一直與數據打交道，早期計算機輔助報道（computer-assisted reporting）（CAR）之時，或者更早的新聞視覺化的形式中，數據庫就已經是新聞生產的主體。如今的信息數字化的大幅轉向，對于新聞業意味著電腦和數據科學扮演著更重要的角色，其中包括編程、算法到機器學習和概率模式，以及開放資源的軟件發展的回饋和數據集合的透明化和交互性。因此，“問題并不是數據、計算機和算法是否能夠被新聞從業者應用于公眾利益上，而是何時何地如何使用，為什么使用和被誰使用”[3]。

在目前已有的研究文獻中，有關大數據概念發展和研究展望主要集中在“計算機化的新聞業”或“對新聞業的計算機化研究”。與之形成對比的是，在媒體和傳播研究的文獻中，學者們的研究方向已包括如以大數據為目標的市場化和媒體生產的議題，對于大數據的使用者，如手機用戶的研究、大數據隱喻性框架以及大數據的傳媒研究方法等。

新聞業是最有影響力的現代知識生產機構之一，具有其獨特的認識論意義，它勾勒出“規范、慣例和在一個社會環境中機構化的程序，并且決定其知識生產的形式以及其知識主張的表達或者指稱”[4]。簡單來說，就是新聞從業者對于知識操作的重要性及他們從事的何種知識生產的認識。在大數據時代，新聞工作中不同技術的引進已經對科技的特定工作形式及相關的知識價值提出了問題。

在新聞傳播方面，大數據與正在出現的數字新聞業的展現方式密切相關，如信息圖形，可視化交互數據以及可定制概率模型等。“數據新聞以數據為核心，通過文字、圖片、音頻、視頻、鏈接等多種內容整合成新聞主體，既加強了新聞信息數據的整合能力，也增強了新聞信息傳播的生動性和影響力，給用戶帶來更具有視覺感染力的新聞閱讀體驗”[5]。這些新的產品反過來也包含了一系列認識論假設，比如觀眾如何獲取知識，如何鼓勵用戶去“玩轉”數據以理解某一個新聞敘述的特別版本。

在大數據背景下，新聞傳送和觀眾參與的過程也展示了關于知識的合法性和數據驅動的參與問題。艾克斯多姆在他對電視新聞的分析中將新聞認識論概念化為三個部分：知識的形式，知識的生產以及對知識的受眾研究。每一個視角指向著未來研究中可拓展的方向，如：特定形式的大數據新聞如何與特定類型的知識需求結合起來？社會行為人用以指導以數據為依托的知識需求的生產機構化的慣例是什么？以及這些慣例如何制定以保證這些需求的合法合理性？觀眾如何從大數據新聞產品中知識習得，什么類型的條件能夠滿足以確保公眾接受這樣的知識需求？

二、專業性與經濟學方面

瑞奇（Reich）認為記者可以被理解為是一種交互的專家：他們的專業知識存在于他們與其他不同類型專業者的共同工作的能力上，因為他們能夠將其他專業知識合成和翻譯為非專業人士能夠理解的內容。他進一步提出，記者生產的是交互專業知識的兩極內容，因為他們一方面接觸的是各種專業知識，而另一方面必須與普通讀者互動，因此就形成了一個雙重參與的過程，這個過程構成了他們自己種類的專業技能。

因此，在新聞業和其他社科領域，科學技能或者其他技能被認為是專業區別的主要基準點。這些框架，無論本質上是建設性的還是規范性的，都為在大數據時代新聞記者專業知識的概念化提供了有用的準入點。這些可以被描述為社會交互、網絡交互、技能組合。

瑞奇將新聞業描繪為雙極互動知識專業，因為不同類型新聞工作者的工作內容并不完全相同。有的新聞工作者也許首要的是信息來源交互的專業知識和技能（如長時間快節奏工作的記者），有些也許首要的是與讀者觀眾交互的技能（如傾聽讀者聲音的編輯），有些可能是兩者都有（如專欄作家和評論家）。那么，大數據的社會、文化和科技特質如何在這些與消息源和觀眾的互動中產生影響就成為研究的一個方面。

越來越多的大新聞機構開始聘用數據科學家和其他科技專家來處理和理解數據，其中包括新聞故事來源材料的數據和為了商業發展的受眾數據。記者在什么樣的程度上能與“數據語言”交談，他訪問數據時能否獲取足夠多的來源數據？專業知識的社會—科技互動出現在記者（作為行為人）與機器（作為行為體）的交互中。安德森認為，在新聞業中越來越多的算法和自動化的運用可能會催生新的“互聯網專業知識”，從而改變我們的思考方式。大數據作為一個現象和方法優先體現于某些實踐技能中，比如數據分析，計算機編程和視覺化，這些都源于一些基礎學科如計算機科學、數學和統計學。

在經濟學方面，媒體經濟被定義為“研究媒體機構如何運用有限的資源來產生傳播于一個社會中不同需求的消費者所需的內容”[6]。這樣的定義為媒體管理、媒體經濟研究和媒體創新提出了管理策略和戰術的問題。越來越多的媒體機構面臨著不斷減少的廣告來源，不斷碎片化的讀者以及來自移動媒體、社交媒體和數字媒體日益激烈的競爭等問題。

在眾多創新的呼聲中，大數據代表了一個通過業務過程以及產品和服務更新帶來的價值生產的機會。大數據與收益有著密切聯系，隨著個人化的數字媒體的發展，媒體機構能夠更好地理解和定位觀眾和廣告方向。從最基本的意義上來講，大數據通過“更少成本，更多觀察”提高經濟效益。

大數據與增值的關聯不是簡單地通過對新聞工作的科技替代人工勞動來實現，而是體現在搜集、組織和分析散亂的信息流的功能方面的特點。利用大數據來報道和展示新聞的方式將記者從傳統的故事講述模式中解放出來，不僅能在新的讀者類型中產生價值，也能形成與市場上的相似商品之間的差異。這種轉變被稱為“方法新聞學”。它將涵蓋的范圍（如標題、節奏或者感興趣的定位）轉移到對方法的聚焦上。主動以數據為重點可能是產生區別的主要形式，而這些差異正是成功的關鍵點。無論從吸引讀者來說還是通過提供數據庫資源而產生的認購和咨詢服務所能產生的利益方面來說，大多數新聞媒體機構還未完全意識到數據作為業務模式的潛在戰略價值。大數據為新聞媒體減少開支、創造價值提供了一個重要的途徑，但在這方面的探討還遠遠不夠。大數據經濟學對媒體創新是一個挑戰。所有的發展都為理論和研究提出了問題，其中很多問題還是互相重疊的。對于新聞業研究來說，大數據的處理在什么程度上可以增強編輯和市場運作人員之間的關系？又會有什么樣的新聞價值判斷？收益和利潤又是怎樣的？對于價值創造的定位導向又會如何影響新聞作品生產的操作？

三、道德倫理方面

道德行為和道德論證一直以來都是傳媒和新聞業的關注點。道德標準是道德規范和價值的基礎，體現在真實性、精確性、透明度和公共服務等方面。媒體生產行為的轉變，引導規范和價值的哲學轉變。而同時大數據現象本身背負著自己的一套道德窘境：比如使用者的隱私、信息的安全性和數據的操控安全，這些都反映了創新與協調的問題，值得細究。

開放性是新聞業和大數據的交叉規范，是新聞記者的職業準則。同時大數據的資源開放原則也是記者與科技工作者共同努力的目標，既包括完整的數據集合以及開放給公眾檢測的程序編碼，也包括使用者的貢獻和合作。當然，無論是由政府或者政治機構提供給新聞機構或是由新聞機構通過眾包、數據碎片或者其他方式搜集的公共數據，通常也會存在問題，比如說，像由百萬個推特對于某一特定事件積累起來的大數據通常被認為具有代表性，但同時也反映了深刻的結構性的“標志性問題”，忽視了其他類型群體的反映。

大數據信息源的開放將會使很多隱私信息與公共數據混雜在一塊，從而暴露權力主體的信息。再加上個性化推送，對于用戶數據的挖掘與分析，使得隱私問題日益嚴重。

其次是社會科學研究道德規范。“社會學家們正在經歷一個深刻的道德建構轉變，這個道德建構定義了使用技術的道德倫理規范，并且要重新考慮如何去保護個體不受傷害，并在一個包括了千百萬人的大數據研究方法上達成共識。[7]當大數據帶來新聞業大規模的、科技引領的轉向時，當科技行為體的算法被嵌入假設、規范和價值這些因素時，對于人類的定義又會發生什么樣的變化？當機器在新聞判斷中起著越來越重要的作用，新聞種類的選擇和消費是否以否定他種為導向？機器又如何被“教”出有道德的行為？有沒有一個算法的倫理道德？[8]如果有這樣一個道德，需解鎖什么樣的選擇、詮釋和預期因素，以揭示算法如何構造我們關注的重點？

對于未來在大數據與新聞業交叉點的道德方面的研究還有很多問題需要解決。以數據為中心的道德如何在跨國、跨社會文化和科技的背景中建構和合理化？假設道德建構隨著大數據現象的展開而改變，那么這種改變又有什么特點，對于新聞業又意味著什么？每一個研究都代表了與認識論、專業性和經濟學有關的獨特的理解。

四、結語

將新聞業的大數據定義為一個社會、文化和科技現象，有助于我們從認識論、專業性、經濟學和倫理道德等視角去系統地理解大數據。對于這些突出且互相聯系的視角的討論可以顯示出在這個算法、計算機化和量化的時代，新聞業如何去理解大數據？它的職業邏輯和產業生產又會出現怎樣的新含義，以及總體行為對價值的衍生會產生怎樣的影響和后果？這些視角的整體互動對于我們了解大數據為新聞業、媒體和社會帶來的機遇和挑戰提供了起始點，也為學界對大數據與新聞業的研究提供了方向參考。

參考文獻：

[1]達娜·伯埃德，凱特·克勞福德.大數據中的關鍵問題：一個文化、科技及學術的現象[J].信息交流與社會，2012，15（5）：662—679.

[2]楊茗.大數據時代社會學研究的機遇和挑戰[J].新聞愛好者，2019（9）.

[3]亞歷山大·霍華德.數據驅動新聞業的藝術和科學[M].紐約：哥倫比亞大學出版社數據新聞業特爾中心，2014：4.

[4]馬茲·艾克斯多姆.電視新聞學的認識論：理論框架[J].新聞學，2002，3（3）：259—282.

[5]鄧洪燕.大數據時代對新聞傳播領域的影響：評《新聞傳播的大數據時代》[J].新聞愛好者，2019（9）.

[6]阿蘭·艾爾巴侖.媒體經濟：理解市場、產業和概念[M].英國：布萊克威爾出版社，2002：5.

[7]喬希華·費爾菲爾德，漢娜·施泰因.大數據，大問題：有關數據科學和新聞學道德的一些問題[J].大眾傳媒道德雜志，2014，29（1）：38—51.

[8]費萊斯塔斯·克里莫，基斯·馮·歐豐菲爾德，馬丁·彼德森.算法有道德嗎？[J].道德與信息科技，2011，13（3）：251—260.

（作者為華東師范大學外語學院博士生，講師）

編校：鄭艷

大數據對新聞業研究方向的拓展

一、新聞和媒體行業的大數據

二、專業性與經濟學方面

三、道德倫理方面

四、結語

一、新聞和媒體行業的大數據

四、結語