王瑤琦 任戌盈
【摘? ? 要】本文分析了2015年-2020年五年間Web of? Science數據庫中有關算法新聞的研究文獻,運用Citespace軟件對其進行可視化整理和分析,以知識圖譜的方式展示其發展脈絡。研究發現,近五年算法新聞研究數量穩定增長,并呈現出五個主要的研究聚類熱點;算法新聞研究可被概括為對其運行機制和原理的研究、對其引發的新聞實踐和新聞理念的討論與思考、關于受眾對算法新聞的感知與評價三階段。同時,本文還探討了該領域的奠基性文獻和關鍵節點文獻。
【關鍵詞】算法新聞;智媒時代;知識圖譜;趨勢
近五年來,國內外新聞業界和學界都在熱議“算法新聞(algorithmic journalism)”“機器人新聞(robot journalism)”“自動化新聞(automated journalism)”“計算機生成內容(computer-generated content)”。據預測,“計算機生成內容(CGC)”很快將與“專業新聞記者生成內容(PGC)”以及“用戶生成內容(UGC)”一起構成智媒時代數字化新聞和信息的三大主體。[1]
本文擬分析以下幾個問題:一是近五年來,算法新聞研究的熱度與區域分布特點;二是算法新聞研究的發展趨勢;三是算法新聞研究的奠基性文獻和關鍵節點文獻。通過以上三個方面,借用分析工具描繪出算法研究的知識圖譜。這將有助于把握當前新聞業和新聞研究的發展趨勢,為智媒時代算法新聞的理論和實踐發展提供參考,為后來的研究者厘清脈絡。
一、研究方法與數據收集
科學知識圖譜是以科學知識為對象,顯示科學知識的發展進程與結構關系的一種圖形。[2]本文采用了科學知識圖譜的研究方法,利用Citespace軟件實現結果的可視化。在得出可視化結果后,輔以文本解讀對結果進行進一步的整理和闡釋,以求對近五年算法新聞的研究獲得更全面的了解和認識。
本研究以“algorith* journalism”為檢索主題詞,將時間范圍設定在2015年至2020年期間,在Web of Science(WoS)核心合集的數據庫中進行檢索。得到檢索結果后,按照文獻類型為“article”、研究領域為“social science”等進行二次檢索,在篩選排除無關聯文獻后,得到175篇文獻的數據。數據內容包含文獻基本屬性(出版年、出版物名稱、研究方向、被引頻次等)、摘要和參考文獻。此后,利用軟件Citespace對其進行進一步的可視化分析。
二、算法新聞研究整體描述
(一)話題熱度
從2015年開始,在Web of Science數據庫中,有關研究文獻發表量整體呈現逐年上升狀態,尤其是在2019年,研究者對算法新聞的關注度顯著提高。從媒介融合到智能媒體,從無人機到算法新聞,從大數據到人工智能,從基于“互聯”為核心的Web1.0時代到現在的以“社交”為核心的Web2.0時代,[3]這可謂是重大轉變。隨之而來的是近五年算法新聞研究的數量持續增長,國內外的研究者對算法新聞研究的關注度在不斷增加。
(二)發表區域
在Citespace中以“country”為分析對象,設定相應參數并選擇探索關鍵路徑算法Pathfinder,來繪制算法新聞研究文獻地域分布圖。
WoS文獻數據顯示,國際上共有36個國家(地區)的研究者對算法新聞研究做出貢獻。發文量前五名的依次為美國(49)、西班牙(13)、德國(10)、英國(10)、中國(8)。美國作為算法新聞研究發文量最高的國家,占文獻總量的33.8%;中國學者在算法新聞這一研究領域的活躍度也比較高,能夠產出一部分具有國際視野的學術成果。整體上呈現出以發達國家(地區)為主,發展中國家(地區)為輔的研究格局。但是,在該研究領域并未形成明顯的國際合作網絡。
(三)研究關鍵詞
在Citespace中以關鍵詞為分析對象,可以得出175篇文獻中所有關鍵詞的出現頻次及每個關鍵詞的中心性(centrality)。在算法新聞研究領域,研究者們多關注計算機新聞(computational journalism)、社交媒體(social media)、自動化新聞(automated journalism)、大數據(big data)、人工智能等話題(見表1)。
三、算法新聞研究熱點與趨勢
(一)研究主題聚類
通過對算法新聞研究文獻的關鍵詞詞頻的聚類分析,可以發現,175篇文獻的關鍵詞被分為多個集群,通過結合詞頻,可以得到算法新聞研究的五個研究主題(見表2)。
大數據和過濾氣泡現象。過濾氣泡(Filter Bubble)是指媒體基于大數據,針對用戶的使用習慣生成用戶畫像,并通過算法為之精準推送符合其內容消費習慣的個性化內容。“過濾氣泡”使受眾接受到的信息內容愈加窄化,新聞媒體通過專業的價值判斷進行“議程設置”的職能也被不斷削弱。[4]
自動化新聞生產。當新聞生產的主體從人向機器轉向,人工不再是新聞產品輸出的決定性環節。[5]一方面,學者關注自動化新聞的生產方式和流程;另一方面,研究者也關注機器人寫作對傳統新聞環境產生的重要影響。
算法與權力。喻國明認為,技術不僅能夠賦能與賦權,而且它自身就構成一種權力的行使和對傳統權力模式的替代。目前,在新聞生產的各個階段,我們都可以窺見算法權力意志的體現。
算法與假新聞。不同于傳統媒體對新聞真實性的把關,社交媒體傳播假新聞的問題逐步顯現,并在2016年美國大選中徹底暴露。在這樣的背景下,算法與假新聞之間產生了千絲萬縷的聯系。一方面,算法可以成為傳統新聞工作者識別真假新聞源的重要合作伙伴;另一方面,算法也在加速假新聞的泛濫。
人機關系背后的認識論問題。這一類研究探討算法帶來的認識論問題。有人神話技術,強調技術的無所不能,認為個人自主權可以完全在未來的新聞業中消失;也有人認為技術是需要被馴化的,要讓價值理性駕馭工具理性。此外,算法的高門檻使很多研究者將其稱為“黑箱”,這在一定程度上也將人與機器置于了不平等的位置。
(二)研究發展趨勢
以Web of Science核心合集中2015年-2020年有關論文數據導入Citespace,時間切片選擇一年,利用Citespace軟件的最小生成樹(Minimum Spanning Tree)技術來修剪節點間連線,可以得到關鍵詞時區圖,從中可以總結出算法新聞研究的三個發展趨勢。第一階段,2015年是文獻收集的起始年份,“大數據(big data)”“數據新聞(data journalism)”“創新(innovation)”等主要關鍵詞在此時出現,體現出研究者對算法新聞這一新事物運行機制與運行原理的關注。第二階段是2016年-2017年,算法新聞研究逐漸開始轉向對新聞倫理的探討,關鍵詞“可信度(credibility)”“算法的透明度(algorithmic transparency)”“信任(trust)”出現在這一時期。第三階段則在2018年以后,伴隨著“感知(perception)”“私人化(personalization)”等敘述,受眾對于算法新聞的感知與評價開始進入研究者的視野。
(三)關鍵文獻分析
在算法新聞研究中,早期奠基性文獻和高被引、高中心度的關鍵性節點文獻共同構成了研究骨架。用Citespace軟件運行收集到的文獻數據,節點類型選擇Cited Reference,然后以時區(timezone)視圖展示,得到算法新聞研究早期奠基性文獻知識圖譜。其顯示了發表于2012年-2014年間、被引率較高的7篇早期奠基性文獻,詳細信息如表3所示。
通過閱讀這些奠基性文獻,能夠看出有關算法新聞的早期研究呈現出的整體態勢。總的來說,奠基性文獻主要包含兩種范式:一類是探討算法新聞對新聞記者產生的影響,一類是提綱挈領的方法論研究,為后來的研究者提供研究算法新聞的視角和參考維度。
第一類奠基性文獻如Arjen van Dalen在2012年發表的文章中就開始探討算法新聞對新聞記者產生的影響。他認為新聞記者應該著重培養自己的分析能力、創新能力和寫復雜句子的能力,因為客觀性、時效性、簡潔性等特質將完全由計算機完成。記者會有更多的時間來進行深度報道。
第二類奠基性文獻如Anderson在前人的基礎上提出研究算法新聞的六個視角:政治、經濟、場景、組織、文化和技術。Philip M.Napoli提出要把算法新聞和現有的學術理論聯系起來,在學術視野下探討算法新聞在媒體內容生產與消費中扮演的角色。
一項研究的理論基礎,除了考察奠基性文獻之外,還應關注到高被引、高中心度的關鍵性節點文獻。通常高頻被引文獻中的內容在某一時期內獲得了較多研究者的認可,且研究者將以高頻被引文獻中的觀點、知識作為基礎來開展下一步的研究;高中心度的文獻則反映其在算法新聞研究脈絡中的樞紐作用。[6]經統計,將被引頻次排前十位的重要文獻同時列出,如表4所示。
Matt Carlson認為在新興的圍繞著數據開展的新聞實踐中,“自動化新聞(automated journalism)”是最具有顛覆性的一種。他認為自動化新聞帶給新聞業及新聞從業者的影響是一把雙刃劍:一方面能夠提升新聞消息發布的效率,另一方面可能會導致新聞機構裁員增加以及新聞寫作的商品化、程序化等問題。
Mark Coddington在研究中將計算機輔助下的報道(computer-assisted reporting)、數據新聞(data journalism)和計算機算法新聞(computational journalism)作為三種定量的新聞實踐形式進行對比探討。他認為這三種新聞形式互相關聯但是也各不相同,各有各的優勢與缺陷,但對新聞業都有所助益。
Konstantin Nicholas D?rr從技術層面探討了自然語言生成(NLG)的算法是否能夠發揮專業新聞的功能,同時還延伸討論了自然語言生成算法在新聞業中蘊含的經濟潛力。這篇文章為在大數據等技術的角度上分析新聞業將面臨的挑戰的研究奠定了基礎。
Nicholas Diakopoulos則關注到了算法與社會權力結構之間的關系。他在文章中提出了“有關算法可說明性的報道(algorithmic accountability reporting)”這一概念。他認為新聞記者有責任對算法行使監督的權利,新聞報道應當觀照到算法內部的權力結構,揭示算法中包含的缺陷和偏見。他的研究提醒人們對逐漸滲入社會生活方方面面的算法保持警惕之心,同時也為后來的研究者提供了應對算法帶來的問題的研究范式。
Andreas Graefe運用實驗的方法來探測受試者對于計算機自動生成的新聞的態度和看法。研究發現,無論實際來源是什么,受試者對聲稱是人工撰寫的文章總是有更高的評分。研究受眾對算法新聞的感知與評價的研究者多援引此文章,使之處于研究脈絡的樞紐地位。
結語
技術調節理論認為人與技術是相互交織、不分彼此的。因此,對新聞業而言,無論是面臨算法還是其他新出現的技術物,都不應忽視技術調節的框架下技術物對人所帶來的規范或引導作用。[7]從這個角度來說,算法新聞對新聞業及新聞從業者、研究者的沖擊與重塑是相伴而生的。與算法新聞相隨的新聞實踐的問題、暗藏在算法里的社會權力結構變化的問題、由算法引發的新聞倫理問題,尚有待研究者們進一步探索。
此外,可針對中文CNKI數據庫做類似的數據分析,對比探討中文研究者在算法新聞研究中與國際學者的差異,也可補足我國學者在算法新聞研究這一領域的盲點與不足。
注釋:
[1]鄧建國.機器人新聞:原理、風險和影響[J].新聞記者,2016(09):10-17.
[2]劉則淵. 科學知識圖譜:方法與應用[A]. 遼寧省哲學社會科學成果獎評審委員會辦公室,遼寧省哲學社會科學獲獎成果匯編[2007-2008年度][C].遼寧省社會科學界聯合會,2010:4.
[3]喻國明,楊瑩瑩,閆巧妹.算法即權力:算法范式在新聞傳播中的權力革命[J].編輯之友,2018(05):5-12.
[4]王斌,李宛真.如何戳破“過濾氣泡” 算法推送新聞中的認知窄化及其規避[J].新聞與寫作,2018(09):20-26.
[5]許向東,郭萌萌.智媒時代的新聞生產:自動化新聞的實踐與思考[J].國際新聞界,2017(05):29-41.
[6]孫寧,陳雅.WoS視域下國際網絡輿情研究知識圖譜分析[J].情報資料工作,2014(04):21-26.
[7]毛湛文,孫曌聞.從“算法神話”到“算法調節”:新聞透明性原則在算法分發平臺的實踐限度研究[J].國際新聞界,2020(07):6-25.
(作者:王瑤琦,中國傳媒大學電視學院碩士研究生;任戌盈,中國傳媒大學電視學院碩士研究生)
責編:周蕾