●張 璐 敬 卿 (國防科技大學 長沙 410073)
信息技術的發展提升了信息服務的覆蓋度和深度,信息資源在豐富人們生活方式的同時,也帶來了重復堆疊與虛假信息等干擾。從恐怖主義到網絡攻擊,虛假信息帶來的風險一直存在,網絡虛假信息給現實世界也帶來了一定程度的負面影響,它已經被世界經濟論壇(WEF)列為人類社會的主要威脅之一[1]。廣義上,虛假信息可以被定義為不正確的信息,“虛假信息”與“謠言”“假新聞”間的區別并沒有得到明確界定[2]。與真實信息相比,一些假新聞因其新穎、奇特的內容,更易于得到傳播[3],而虛假信息的傳播擴散會干擾社會治理賴以存在的傳播秩序,網絡信息治理迫在眉睫[4]。虛假信息治理是一項復雜的系統工作,尤其是在自媒體時代,治理難度極大增加[5]。新環境下,隨著信息傳播媒體的擴展和參與用戶的變化,虛假信息已經成為現代信息治理的重要挑戰之一[6]。
到目前為止,學者對虛假信息從定義、傳播到治理等角度都進行了研究,但基于整個領域文獻來識別研究前沿的探討仍較少。SciVal是愛思唯爾開發的科研分析及科研表現分析平臺,基于Scopus數據庫(全球最大的同行評審文摘與引文數據庫)縱覽全球科研動態,能實現230個國家和17 000多所研究機構科研表現的可視化分析,可助力發現全球研究的前沿熱點。本文基于SciVal科研分析平臺,針對Scopus數據庫中2016年至2021年虛假信息相關研究文獻,采用文獻計量學的方法,分析該領域的研究現狀,挖掘潛在的前沿熱點,以期為虛假信息研究提供借鑒與參考。
鑒于“虛假信息”與“虛假新聞”常交替使用[7],本文檢索表達式為:TITLE-ABS-KEY(“false information”)OR misinformation OR rumor OR disinformation OR (“fake news”)OR(“inaccurate information”)OR(“biased information”)OR(“digital falsehood”)OR(“fabricated news”)OR(“false news”)AND PUBYEAR > 2015 AND PUBYEAR < 2022,在Scopus數據庫中進行檢索(檢索時間為2021年12月31日),即標題、摘要或關鍵字為虛假信息,時間范圍為2016年至2021年,最終得到14 799篇文獻記錄。因SciVal平臺更新至2021年12月15日,將所得文獻記錄導入到SciVal時部分文獻無法導入,最后成功導入14 667條文獻記錄。
科技文獻的引用分析能夠幫助我們跟蹤新思想、預測新領域[8],而高關注度和新穎性則是研究前沿最為主要的特征[9]。除了文獻計量學常用的指標外,本文還采用了主題顯著性百分位數和歸一化影響因子,用來給前沿探測提供數據支撐。主題顯著性百分位數是SciVal在主題創建中應用全域微觀(Global-micro)模型,基于近2年論文的引用、瀏覽和期刊質量指標綜合計算得出的,該指標兼具高關注度和新穎性兩個特征,研究人員可以根據需要選擇主題顯著性百分位數前1%的主題作為研究前沿[10]。除此之外,考慮到關于虛假信息可能會有多個學科參與研究,需要將不同學科的科技文獻進行比較,本文還用到歸一化影響因子(Field Weighted Citation Impact, FWCI)指標,即標準化后的論文影響力,這是目前國際公認的定量評價科研論文質量的最優方法[11],世界平均FWCI為1,大于1意味著論文影響力高于世界平均水平。
CiteScore是衡量來源出版物所發表文獻的平均被引用次數的指標,如CiteScore 2020計算在2017—2020年所發表文獻(articles, reviews, conference papers, book chapters 和 data papers) 的被引用次數,除以在2017—2020年發表的文獻總數。CiteScore Percentile 指連續出版物在其學科領域中的相對位置,如果該值為96%則代表根據CiteScore排名,該連續出版物等于或高于其所在類別中96%的出版物[12]。
SciVal平臺每周都會根據Scopus的最新數據重新計算文獻的指標數值,本文出現的指標及數值均為數據導入后第一周內數值。
14 667條文獻共被引用106 540次,篇均被引用7.3次,所有文獻平均FWCI為2.07,前1%高被引論文405篇,文獻涉及Scopus的全部27個學科分類,包含4 460個發文機構,覆蓋超過100個國家或地區。
對所有文獻的出版年份進行統計分析如圖1所示,2016年以來,虛假信息相關研究文獻數量逐年穩步上升(2021年數據僅更新至12月15日尚不完整)。主題發文數量的年度分布可以展現該主題的發展趨勢,發文量越大增速越快,說明虛假信息相關研究愈發受到學者的關注與重視。

圖1 2016—2021年虛假信息相關論文數量年度分布
SciVal僅展示發文數量前100的國家/地區,如為合作發文則每個國家/地區均計算一次。本文選取了前十個國家/地區,同時對比了他們的國際合作占比、FWCI、前1%高被引論文占比情況,具體如表1所示。

表1 國家/地區詳情(發文數量前十位)
發文數量超過1 000的國家/地區分別是美國、英國和中國,其中美國的發文數量遠遠超過其他國家,并在FWCI和前1%高被引論文方面也有不俗的表現,整體質量較高,是虛假信息研究領域的重要國家。英國發文數量略高于中國,國際合作、FWCI、前1%高被引論文占比則遠高于中國。值得關注的是澳大利亞和加拿大,雖然論文數量不是特別多,但超過半數的論文都采用國際合作的方式完成,論文的整體質量也較高。
發文數量前十位的機構詳情如表2所示,各個機構發文數量相差不大,前1%高被引論文占比差距較大,占比超過10%的機構分別是哈佛大學和賓夕法尼亞大學,均為美國高校。排名前十的機構中,美國占據了6所,英國2所,新加坡和法國各1所。說明歐美在虛假信息研究規模方面目前已具有明顯的領先優勢。

表2 機構詳情(發文數量前十位)
發文數量前100的機構主要分布于17個國家/地區,如表3所示,美國以絕對的優勢占據首位,囊括了近半數的機構。中國(含港澳臺地區)的7所機構(發文數量排名)分別是:中國科學院(11)、中國科學院大學(28)、武漢大學(48)、教育部(61)、電子科技大學(77)、香港大學(95)、四川大學(99)。

表3 機構所屬國家/地區分布
(1)來源出版物學科分布。ASJC(All Science Journal Classification)是Scopus對連續出版物的學科分類,一種出版物可能會有多個ASJC分類,該分類方法在SciVal中得到了延續,本文所指的學科分類均為ASJC分類。虛假信息相關文獻來源出版物覆蓋了ASJC所有27個學科分類,各學科發文占比如圖2所示,圖中僅展現了占比較高的前9個學科,其他學科因占比較少,統一歸于“Other”中進行計算。虛假信息學術成果來源出版物主要集中于計算機科學、社會科學、醫學、工程、人文藝術等學科領域。

圖2 來源出版物所屬學科發文占比
(2)研究主題學科分布。SciVal中的主題是指具有共同知識關注點的動態文獻集。2016年至2021年,虛假信息相關文獻共涉及3 441個研究主題,每一篇文獻僅可歸屬于一個主題,這些主題主要集中于計算機科學、社會科學、醫學、數學等學科,詳情如圖3所示。圓圈內每個氣泡代表一個研究主題,主題所屬學科可根據氣泡對應的圓圈外圍及下方的標注確定(在SciVal平臺中以氣泡顏色來區分不同學科),氣泡大小與發文數量成正比。氣泡位置與整個主題中占據主導位置的學科(ASJC分類)相關,越靠近圓心則該主題的跨學科特征越明顯。總體來看,虛假信息研究主題學科覆蓋范圍非常廣泛,跨學科研究的論文數量較多。

圖3 研究主題所屬學科分布
發文數量前十位的來源出版物詳情如表4所示,包括叢書、會議錄和期刊三種類型,期刊所屬學科多與計算機科學、數學、醫學、工程相關,這也反映了虛假信息的重要研究方向。

表4 來源出版物詳情(發文數量前十位)
為了解虛假信息領域的研究熱點,本文進行了關鍵詞分析。SciVal平臺從文獻的標題、摘要和作者關鍵字等信息中提取重要的關鍵詞,虛假信息領域關鍵詞如圖4所示,圖中50個關鍵詞相關研究熱度均處于上升的狀態,字體越大表明與主題相關性越強??梢园l現,除了“虛假信息”相關表述外,Social Media、COVID-19、Communication、Fake detection、Pandemic、Vaccination、Politics等詞具有較高的關注度。

圖4 領域熱點關鍵詞(相關性前50位)
SciVal平臺基于整個引文網絡(包括超過48萬條索引文獻和超過20萬條非索引文獻)分解形成了9.6萬個主題[13]。主題命名規則運用了愛思唯爾的指紋引擎技術(Elsevier Fingerprint Technology,EFT),綜合利用自然語言文本挖掘技術、學科敘詞表、加權術語來確定主題命名關鍵詞[14]。本文分析的14 667條文獻涉及3 441個研究主題,顯著性百分位數位于前1%的主題有279個,其中發文數量超過100的主題如表5所示,這些主題均為虛假信息研究領域的重要主題和研究方向,本文綜合考慮了與虛假信息領域的相關性、發文量和顯著性百分位數等方面因素,重點分析了4個前沿主題。
由表5可知,發文量最高的主題是謠言與虛假信息(T.28 966),結合主題命名規則來看,該主題與本研究契合度非常高,與本研究相關的文獻共計2 366篇,平均FWCI為3.01,篇均被引頻次為11.7,前1%高被引論文104篇,約占總數的4.4%。高被引論文的研究方向主要集中于虛假信息識別與監測技術,虛假信息在網絡平臺、政治活動、醫藥健康等領域的傳播與擴散等。
本文進一步分析了與謠言與虛假信息(T.28 966)相關性最高的50個主題,其中顯著性百分位數位于前1%的共有6個,按相關性排序依次為Twitter等社交媒體中的危機處理與事件感知(T.6 485)、Twitter等社交媒體中的政治競選與政治傳播(T.5 299)、品牌社區的在線評論與網絡口碑(T.1 190)、新聞制作與新聞實踐(T.9 441)、政治黨派活動中的媒體使用(T.2 736)、以Facebook和Instagram為代表的社交網站(T.2 470)。其中,T.2 736、T.5 299、T.9 441和T.6 485也出現在表5中,即該4個主題顯著性百分位數位于前1%,也與謠言與虛假信息(T.28 966)主題相關性較高,同時還是本文設定的檢索條件下發文量較多的主題。基于此,本文認為T.2 736、T.5 299、T.9 441和T.6 485為虛假信息研究領域的前沿主題。

表5 顯著性百分位數位于前1%的主題(發文量>100)
(1)政治黨派活動中的媒體使用(T.2 736)。在虛假信息領域中,該主題發文共計272篇,平均FWCI為4.29,篇均被引頻次為10.4,其中前1%高被引論文19篇,約占總數的7%。
該主題下研究內容主要涉及:虛假信息對重大政治活動的影響,黨派政治活動中如何應對虛假信息,黨派關系與政治活動對虛假信息的影響,信息鴻溝對政治活動的影響,分享虛假政治信息的動機,如何開展政治謠言治理,網絡平臺上的政治謠言傳播,政治誤解與分歧的形成,虛假政治信息中的傳播學理論研究,虛假信息與公眾信息素養等。
前1%高被引論文重點關注:虛假信息如何影響社會公眾的認知,虛假信息對政治活動的持續影響,2016年美國總統大選期間虛假新聞的傳播特征及預測,過濾氣泡和選擇性接觸導致的虛假新聞和意識形態的兩極分化問題,青年如何判斷爭議性政治話題的真假,虛假信息的糾正,新冠肺炎疫情對新聞媒體與社會公平的影響,虛假信息傳播對政治活動的影響,社交媒體上分享的小報新聞與虛假信息間的關聯——以英國大選為例,面對虛假政治信息時深思熟慮是否有用,2016年美國政治大選期間的虛假信息發布網站研究,政治參與和虛假信息傳播的關系研究,社交媒體中“回音室”現象出現和意識形態極化的核心機制,虛假政治信息的核查與揭露,政治環境中虛假信息如何影響個體觀念,美國政治大選中的敘事特征和虛假信息,虛假信息的社會效用,虛假信息背景下的新聞素養與公眾社交媒體行為,虛假信息的定義及內涵外延。
(2)Twitter等社交媒體中的政治競選與政治傳播(T.5 299)。在虛假信息領域中,該主題發文共計150篇,平均FWCI為2.18,篇均被引頻次為6.2,其中前1%高被引論文2篇,約占總數的1.3%。
該主題下的研究內容主要涉及:Twitter謠言對民主、民粹、人權等政治理念的影響與干擾,歐美國家政治大選期間的Twitter謠言,Twitter上的網絡戰與政治對抗,Twitter、Instagram、Facebook、YouTube、Tik Tok、Parler 等平臺上的虛假政治信息傳播與治理等。
前1%高被引論文重點關注:2012年及2016年美國大選期間Twitter上的政治謠言。
(3)新聞制作與新聞實踐(T.9 441)。在虛假信息領域中,該主題發文共計128篇,平均FWCI為2.34,篇均被引頻次為6.2,其中前1%高被引論文4篇,約占總數的3.1%。
該主題下的研究內容主要涉及:虛假信息的生產與傳播動機,虛假信息識別技術、算法與工具,數字媒體時代的假新聞危機與解決方案,面向虛假信息的新聞教育,新聞報道中的虛假信息,虛假信息對電視、報紙、網站等新聞媒體平臺的挑戰,虛假信息的治理,虛假信息對記者及讀者等人群的影響等。
前1%高被引論文重點關注:新聞制作過程中的“黑暗參與”,政治事實核查的制度根源,國家外交政策中的虛假信息,仇恨言論和虛假信息的平臺治理問題。
(4)Twitter等社交媒體中的危機處理與事件感知(T.6 485)。在虛假信息領域中,該主題發文共計109篇,平均FWCI為1.07,篇均被引頻次5.3,其中前1%高被引論文1篇,約占總數的0.92%。
該主題下研究內容主要涉及:社交媒體平臺上的虛假信息如何影響公共危機事件(如公共衛生事件、自然災害、突發輿情等),人工智能、區塊鏈、機器學習、自然語言處理等技術在虛假信息治理中的應用,重大突發事件下的信息傳播規律、媒體情緒分析等。
前1%高被引論文重點關注:新冠肺炎疫情中的信息流行病管理框架構建。
本文以虛假信息研究領域2016—2021年Scopus數據庫文獻為基礎,利用SciVal平臺進行分析,了解全球自2016年以來在虛假信息研究領域的發文趨勢、國家/地區、機構、學科領域、來源出版物、前沿熱點等。結果顯示,2016年至2021年,該領域發文逐年上升,發展勢頭較好,且學術影響力明顯高于全球平均水平。該領域研究廣泛分布于全球多個國家和地區,美國的發文數量居于世界領先地位,遠超其他國家。英國的發文量居第二位,其學術影響力在發文量前十位的國家中居于首位。中國的發文量和學術影響力雖略低于美國和英國,但也高出世界平均水平,中國科學院的發文量居于全球第11位,其學術成果的被引次數、FWCI、前1%高被引論文比例均有較好的表現,顯示了該機構在虛假信息研究領域的競爭力。虛假信息研究領域發文主要集中于Lecture Notes in Computer Science、CEUR Workshop Proceedings和PLoS ONE等,出版物類型涵蓋了叢書、會議錄和期刊等,在高水平刊物(CiteScore Percentile 2020 前25%)的發文量達47.6%。
14 667條文獻的來源出版物覆蓋了Scopus全部27個學科,主要集中于計算機科學(占比19.5%)、社會科學(占比19.5%)、醫學(占比13.4%)等學科領域(見圖2),計算機科學與社會科學具有明顯優勢。對14 667條文獻涉及的3 441個研究主題所屬的學科領域進一步分析發現,虛假信息研究領域的跨學科特征非常明顯,充分說明了虛假信息問題已出現在各個學科領域并得到了學者們的關注。虛假信息問題波及范圍較廣,尤其在數字時代虛假信息的擴散速度更是呈指數級別增長,各學科均易受影響。計算機科學領域重點從機器識別、算法等角度來探討對虛假信息的識別、核查和處理;社會科學領域重點從新聞倫理、新聞制作、傳播路徑等角度來研究,這正是本文分析的主題T.9 441的主要研究方向。除此之外,還有醫學、工程、藝術人文、數學等學科基于本學科研究基礎,分析虛假信息相關問題。
正如本領域高被引論文指出的,虛假信息是一個全球性的歷史長期問題,社會科學和計算機科學領域都已經探討了它的傳播機制和動機問題,學者也正在關注虛假信息在政治領域傳播所導致的復雜結果,虛假信息的預警、治理和糾正,需要跨學科研究才能對癥下藥[15]。
虛假信息與政治活動的相關研究自2016年以來有較高的學術產出,在本文重點分析的4個主題中,主題T.2 736和T.5 299均和政治活動有關。虛假信息的產生動機和廣泛傳播與政治活動、意識形態緊密相關[16],容易接觸到虛假信息的主要是保守派、年齡較大者和非常關注政治新聞的人群[17]。2016年美國政治大選中的虛假信息傳播是其中的典型案例,在大選最后五個月內,Twitter上與大選相關的信息中虛假、極端偏見信息占到25%,而此類信息的傳播網絡連接更加緊密,即推文被轉發的數量更多[ 18]。社交媒體因其準入門檻低、信息碎片化、社交圈信息趨同等特征,成為虛假政治信息滋生和傳播的土壤,但尚無明確證據可證明社交媒體上的虛假信息在影響大選結果上起到決定作用[19]。
與2016年美國政治大選類似,2017年法國政治大選[20]、意識形態兩極分化[21]、烏克蘭沖突[22]等政治活動中均有虛假信息的介入。虛假信息對政治活動的影響是復雜而深遠的,尤其是以社交媒體為代表的網絡平臺賦予了虛假信息更快的傳播速度、更復雜的網絡人際關系、更隱蔽的偽裝形式,虛假信息對政治活動的干預和影響可能更加難以具象和量化,目前一些社交媒體和網絡平臺已在盡力遏制虛假政治信息的傳播,如采取人工干預或機器算法來識別并限制正在傳播中的虛假信息。
危機事件(如地震、臺風、洪水、恐怖襲擊、疫情等)的暴發會影響人們的物質、情感狀態,干擾人類生存環境,在這個過程中人們會利用信息與通信技術獲取信息以應對災難中的不確定性,這是危機信息學的核心[23],也是本文重點分析的前沿主題之一T.6 485的主要內容。近半數(45%)的公眾會在危機中使用社交媒體來分享或查找信息,但虛假信息已成為這個過程中的主要障礙[24]。虛假信息不斷消解公眾對信息中介的信任,破壞了信息空間的完整性,影響公眾和管理者的行為與決策。
危機事件中的虛假信息治理尤為重要,虛假信息一旦進入傳播鏈條引發信息污染,將使得危機事件的走向更加復雜,難以管控,可能會帶來危機事件本身以外的重大輿情事件。正如危機信息學結合了計算機科學、社會科學一樣,危機事件的虛假信息的治理也主要集中在以下兩個方向:在技術方面,可采用基于排序和分類的混合方法[25]、多模態深度學習方法[26]等來自動識別虛假信息;在綜合治理方面,可以組織公眾自發參與信息驗證、平臺及時處理過時信息、對公眾開展信息素養教育、政務機構和第三方組織積極參與[27]等。重大輿情和危機事件中的虛假信息治理需要專業技術與綜合治理雙管齊下,只有在識別、分辨、監測、預警技術的支撐下加強虛假信息綜合治理,在綜合治理的過程中不斷提升技術,才能避免重大輿情和危機事件進一步惡化。
本文通過文獻計量分析發現,虛假信息研究領域熱度不斷上漲,學術產出整體水平較高,研究主題豐富多樣,前沿方向主要是虛假信息對政治活動的干擾與影響,計算機、社會科學領域的虛假信息技術識別和新聞倫理,危機事件中的虛假信息傳播擴散等。
可以預見,未來關于虛假信息在政治活動和危機事件中的傳播規律研究,將有助于建立更加完善有效的虛假信息治理模式,為虛假信息治理的自動化識別、全流程管控、多主體參與奠定基礎。網絡賦予了虛假信息更大的影響范圍、更快的傳播速度和更復雜的外在形式,虛假信息的傳播可能會引發社會問題和重大輿情事件,甚至危及國家信息安全。虛假信息治理是一項系統工程,只有加快完善虛假信息治理框架,通過系統性的政策和規則,引導信息生產者、傳播者、使用者和管理者共同參與到虛假信息的管控和治理中來,才能在信息傳播鏈條上有效阻斷虛假信息的入侵和干擾,提升信息質量,降低信息使用成本,保障信息安全。