










摘" 要: 針對目前謠言檢測研究存在謠言傳播言論與其標簽關聯性不足和傳播結構特征丟失的問題,提出一種聯合可信度學習的雙向相關GCN網絡謠言檢測新方法。首先,根據謠言傳播言論立場與其標簽關系構建言論動機(善意或惡意)關系,訓練可信度特征提取模型,以獲取謠言言論可信度潛在表示;其次,融合嵌入表示和可信度潛在表示,分別對自上而下和自下而上傳播方向節點進行相關性計算,隨后使用Bi?GCN模型捕獲雙向傳播特征;最后,將雙向傳播特征融合后輸入到分類器中,以獲取謠言檢測分類結果。在微博數據集下進行實驗,結果表明基于可信度學習方法優于基于立場檢測方法,綜合表現也超過先進的基線模型方法,尤其在謠言早期還未經傳播,就可達到91.1%的檢測準確率。
關鍵詞: 謠言檢測; 可信度學習; 動機關系; 立場檢測; Bi?GCN; 相關性計算
中圖分類號: TN711?34; TP181" " " " " " " " " " "文獻標識碼: A" " " " " " " " " " 文章編號: 1004?373X(2025)07?0085?10
Joint credibility learning for rumor detection in bi?directional
correlated GCN
DENG Lei1, 2, YUN Jing1, 2, BAN Qi1, 2
(1. College of Data Science and Application, Inner Mongolia University of Technology, Hohhot 010080, China;
2. Inner Mongolia Autonomous Region Engineering amp; Technology Research Center of Big Data Based Software Service, Hohhot 010080, China)
Abstract: In view of the insufficient correlation between rumor spreading statements and their labels and the loss of communication structure features in the current rumor detection research, a new method based on joint credibility learning for rumor detection in bi?directional correlated GCN (graph convolutional network) is proposed. Firstly, according to the relationship between the rumor spreading statement stances and their labels, which is constructed as the relationship of statement motivation (goodwill or badwill), a credibility feature extraction model is trained to obtain the potential representation of rumor statement credibility. Secondly, the embedding representation and credibility potential representation are fused, and the relevance is computed for the nodes of the top?down and bottom?up propagation directions, respectively, and then the bi?directional propagation features are captured by the Bi?GCN model. Finally, the bi?directional propagation features are fused and input into the classifier in order to obtain the results of rumor detection classification. The results of experiments conducted under the microblogging dataset show that the credibility?based learning approach outperforms the stance?based detection approach, and the comprehensive performance of the former also outperforms that of the advanced baseline modeling approach. In particular, an detection accuracy rate of 91.1% can be achieved at the early stage when the rumor has not yet spread.
Keywords: rumor detection; credibility learning; motivation relationship; stance detection; Bi?GCN; correlation computation
0" 引" 言
隨著在線社交媒體的快速發展,用戶能夠便捷地發布信息和獲取信息。然而由于社交媒體對于用戶發布的消息缺乏嚴格審核,并且用戶在瀏覽信息時往往不會投入太多精力對其真實性進行求證,因此為謠言的滋生和傳播創造了有利條件。謠言,指的是在發布時未經證實的信息。例如新冠疫情期間的“用微波爐加熱口罩可以消毒”以及“熏艾可以預防新冠肺炎”等。這些謠言不僅可能誤導公眾采取有害或無效的措施,還可能對人民的身體健康造成危害。因此,盡早發現并遏制謠言傳播是至關重要的,因為這可以最大程度地減少不實言論的危害,對于維護社會穩定具有重大現實意義[1]。
然而,謠言衍生迅速,數據龐大且內容繁雜,人工識別謠言雖能夠保證一定的準確率,但不僅成本高昂,還效率低下。近年來,隨著深度學習方法的快速發展,這種方法因其無需復雜的特征工程、能夠自動從原始數據中提取高層次特征表示的特點,較傳統的機器學習方法在謠言檢測研究領域中更受關注和使用。不過,基于深度學習的謠言檢測方法仍面臨兩大主要挑戰。
1) 如何有效地捕捉謠言傳播言論與其標簽之間的關聯性,很多研究人員采用多任務方法,通過在原本文本語義中挖掘其他語義特征,如情感和立場信息,來捕獲真假謠言的語義差異。例如文獻[2]為謠言數據集引入情感標簽和新穎性標簽,利用BERT和GloVe提取前提和假設內容文本語義特征,將這些特征拼接后輸入到以前饋神經網絡組成的新穎性檢測模型、情感檢測模型和謠言檢測模型,以最小化三個模型損失加權和為目標。文獻[3]設計了一種將不規則謠言樹構建為規則樹的方法,利用樹自注意力算法提取謠言傳播路徑每個節點及其分支的局部特征進行立場檢測,通過使用提取到所有節點的立場特征進行樹卷積和樹池化操作,用于謠言檢測。盡管這些方法豐富了語義表達,卻未能將謠言言論與其標簽建立深層次的對應關系,限制了謠言傳播言論在謠言判斷中的有效性。
2) 為了在傳播過程中提取緊湊的結構特征,研究人員對謠言傳播過程進行建模,提取事件本身的局部關系、全局關系以及與其他事件的關系等。然而,謠言傳播路徑往往不具備統一規律,因此很難用一種方法對所有謠言的傳播路徑進行建模。早期的建模方法,如RvNN[4?5]、RNN[6?7]和CNN[8]方法,在捕獲結構特征時存在深度和廣度局限性。而GNN網絡則通過圖結構更有效地捕捉節點之間的復雜關系,成為主流的建模方法,其變體模型GCN和GAT也備受關注。然而,傳統的GNN方法未能充分考慮到謠言傳播路徑中雙向傳播方向中節點間影響的異質性,無法自適應地關注不同鄰居節點的信息。
基于上述挑戰和缺點,本文提出聯合可信度學習的雙向相關GCN網絡謠言檢測方法,該模型包括可信度特征提取模塊和節點相關性計算模塊。為了進一步探究謠言傳播言論與其標簽的對應關系,本文將謠言傳播言論與其標簽的立場關系重新構建為動機關系(善意或惡意),采用多任務學習方法,使用重構的動機關系數據集對可信度學習網絡進行預訓練,并與謠言檢測主任務進行聯合訓練和微調。為了增強節點更新的動態性,本文在雙向傳播過程中,于節點更新之前引入注意力機制算法,對源方向節點進行相關性計算,得出相關性系數;對源方向節點特征表示進行加權求和,從而更新GCN網絡中節點表示,以更有效地捕獲謠言傳播的結構特征。
綜上所述,本文的主要貢獻包括以下三個方面。
1) 提出可信度學習子任務,將傳統的立場關系重構為動機關系,并建立多任務學習模型,結果表明可信度學習子任務的性能高于立場檢測。
2) 提出一種方法來計算謠言雙向傳播節點間的相關性,節點融合直接傳播源鄰居節點的特征更具相關性,更有效提升對謠言傳播特征的捕獲能力。
3) 在真實微博數據集中,實驗結果表明,本文所提方法綜合性能優于最先進的基線,并且在謠言早期傳播階段,檢測準確率可達91.1%。
1" 相關工作
1.1" 基于多任務學習的謠言檢測
多任務學習的目的是利用不同任務之間的相關性,通過聯合訓練來改善各個任務的泛化能力和準確性。多任務學習應用廣泛,在謠言檢測領域主要體現在聯合立場檢測和聯合情感分析任務中。
情感分析任務是通過分析帖子內容中的情感表達來識別用戶的情感狀態,如討厭、害怕、傷心等。研究表明,虛假謠言通常具有煽動性和誤導性,更易引發更強烈的情感反應,特別是消極情感[9]。文獻[10]將帖子聲明和評論的語義特征與情感特征拼接后,分別輸入謠言檢測分類器和情感檢測分類器,通過加權求和二者損失作為共同損失,以優化模型參數。類似地,文獻[11]采用詞嵌入方法將帖子聲明轉換為嵌入向量,分別進行情感檢測和謠言檢測,并最小化二者損失來優化模型參數。文獻[12]在情感檢測的基礎上,增加了新穎性檢測,并對兩者進行數據適應性的預訓練,使用GloVe提取新穎性特征,BERT提取情感特征,融合它們用于謠言檢測。
立場檢測任務定義為辨別帖子內容對目標謠言的態度,即支持、否定或中立。據研究,謠言傳播期間,虛假謠言往往比真實謠言更容易受到否定或質疑,導致其立場分布方面存在顯著差異[13]。文獻[14]利用GRU網絡構建元網絡和多個任務網絡,元網絡收集所有任務共享的高層元知識,謠言檢測和立場檢測執行時需要結合各自的語義和元知識特征,緩解了多任務間的語義差異。文獻[15]分別研究了自下而上和自上而下的傳播方向使用RvNN的效果。首先使用RvNN對傳播節點進行立場檢測以獲取立場特征;然后運算傳播節點與帖子聲明的語義特征得到每個節點的注意力分數;最后通過加權求和立場特征用于謠言檢測,結果表明自上而下的性能要更好。文獻[16]構建了一個基于單詞和帖子異構圖的模型,通過自適應圖注意力層來捕獲鄰居特征更新節點進行立場檢測,隨后再經過圖池化層和自適應圖注意力層進行謠言檢測,將二者損失累加以實現聯合訓練。
在以上描述的謠言檢測子任務中,雖然其綜合性能優于單一任務,但情感分析和立場檢測任務并未深入探索謠言立場與真假標簽的關聯性,導致與謠言檢測任務的關聯性不足。在這一背景下,對傳統的立場檢測任務進行改進,引入了可信度學習的概念。通過區分帖子和評論的善意與惡意來判斷其可信度,基于這個思路,可以認為善意的帖子很可能是真實的,而惡意的帖子則很可能是虛假的。因此,模型在解決謠言檢測這個二分類問題上具有積極的作用。
1.2" 基于傳播結構的謠言檢測
謠言在傳播過程中具有“自我糾正”的特性,用戶分享對謠言的看法也可以作為謠言檢測的重要依據[17]。考慮到謠言傳播路徑的復雜性,很難用統一的方法去提取不同謠言的層次特征。圖神經網絡(GNN)能夠在不規則和非結構化的圖數據中提取和挖掘特征,所以成為了建模謠言傳播結構的主流方法[18]。而GCN和GAT作為GNN的變體,同樣廣泛應用于謠言檢測任務中。
文獻[19]提出兩種根據謠言傳播的時間和順序生成快照的方式,并利用雙向GCN網絡更新每個快照包含的節點特征,以捕獲謠言傳播的動態性特征。文獻[20]提出多跳GAT網絡,使節點更新能夠融合更遠視野域的全局特征,并引入差分時間感知網絡以捕獲謠言傳播的時間特征。文獻[21]使用GNN網絡更新節點特征以捕獲傳播特征,同時使用CNN網絡獲取謠言的語義特征,并通過對比學習分析這兩種特征的關系以約束模型的學習。文獻[22]提出基于GNN的雙層特征聚合方法,從文本內容和謠言傳播結構中學習單詞和文本粒度的高級表示來進行謠言檢測。文獻[23]通過GCN網絡建模用戶與謠言聲明以及謠言聲明與其評論之間的關系,拼接這兩種關系后用于謠言檢測。
以上方法說明了基于鄰居節點重要性進行節點更新的重要性,以及結合兩個傳播方向的結構特征的重要性。然而,據了解并沒有相關方案能同時聯合這二者的優點來改進謠言檢測任務。本文方法受雙向GCN和GAT方法的啟發,使用注意力機制算法來計算相關性,在每個傳播方向節點更新時,依據相關性將直接傳播源節點的特征加權融合,以提高模型對傳播結構特征的捕獲能力。
2" 聯合可信度學習的雙向相關GCN網絡
2.1" 問題描述
定義1:謠言事件。[r=r1,r2,…,rm]是一組用于謠言檢測的所有事件實例,其中[ri]是第[i]個事件,[m]是事件數量。[ri]由帖子聲明及其評論組成,表示為[ri={pi,0,pi,1,…,pi,n}],[n]是[ri]評論的個數,[pi,j]是謠言[ri]的第[j]個評論,其中[pi,0]表示第[i]個事件的聲明。
定義2:可信度檢測函數。謠言傳播結構中,每個評論內容對于根帖子(謠言聲明)有著不同的態度,支持、否定或中立。
如圖1所示,當謠言標簽為真時,其支持的言論設定為善意,否定的言論設定為惡意;同樣,當謠言標簽為假時,其支持的言論設定為惡意,否定的言論設定為善意。給定一個謠言[ri],判斷其所有交互[pi,j]的交互類型,即[fcd:pi,j→ycdi,j],其中[ycdi,j∈]{善意,惡意}。
定義3:謠言檢測函數。通過對傳播樹建模,給定一個謠言[ri],結合謠言傳播樹中的帖子和評論,判斷[ri]的標簽,即[frd:ri→yrdi],其中[yrdi∈]{非謠言,假謠言}。
2.2" 模型概述
本文提出了聯合可信度學習的雙向相關GCN網絡謠言檢測方法(CDR?aBiGCN),框架如圖2所示,主要由以下三個組件組成。
1) 可信度特征提取網絡模塊。負責提取參與謠言傳播的言論與標簽之間的可信度特征關系。
2) 雙向相關GCN網絡模塊。負責聚合謠言文本嵌入和可信度特征,并構建自上而下和自下而上傳播圖。該模塊通過計算雙向節點間的相關性,利用GCN網絡更新節點特征,獲取謠言傳播結構特征。
3) 判別輸出模塊。將所有謠言傳播過程中的節點表示融合為一個整體表達,送入線性分類層,用于生成謠言的分類結果,同時計算損失函數數值實現更新雙向相關GCN網絡和微調可信度特征提取網絡。
2.3" 傳播關系構建
通過對謠言傳播關系建模,可以學習到其結構特征。以往的研究已經證明同時利用雙向特征作為互相補充,可以提升模型的性能。
同樣,本文也選擇使用兩個傳播方向。在事件[ri]中涵蓋多個節點[pi,0],[pi,1],…,使用圖(Graph)的數據結構構建關系。
1) 自上而下(Top?Down, TD)的傳播圖,從根節點到葉子節點路徑方向中,所有節點的連接關系能夠有效地捕獲節點傳播的特點,反映事件傳播的自然序列,展示節點之間的層次結構和因果關系。
2) 自下而上(Bottom?Up, BU)的傳播圖,從葉子節點到根節點路徑方向中,所有節點的連接關系可以揭示帖子的自我糾正特征,凸顯信息的反饋機制,強調了事件最終狀態對整個傳播過程的關鍵影響。
自上而下的傳播圖[GTD=V,E],其中[V]是節點信息,[E]表示節點的傳播方向(根節點[→]葉子節點)。[V=ri=pi,0,pi,1,…,pi,n],包含事件中所有節點信息。同理,可得出自下而上傳播圖[GBU]。
2.4" 可信度特征提取網絡模塊
以往的研究人員使用多任務學習方法來增強語義表達能力。在此基礎上,本文提出了一個新的子任務,即可信度學習,通過將謠言傳播言論與其標簽建立聯系,以提取利于謠言判斷的可信度特征。文本嵌入采用基于Transformer的雙向編碼器BERT[24],以捕獲豐富的語義特征,此前,BERT已被廣泛應用于翻譯和摘要等任務中,顯示出強大的文本理解能力。給定一個帖子內容[pi, j],對其分詞并按順序建模得列表[pi, j=w1,w2,…,wo],[o]為單詞總數,隨后使用BERT獲取特征嵌入。
[hti, j=BERTpi, j=BERTw1,w2,…,wo] (1)
式中,[hti, j∈Rdw]是BERT預訓練模型中最后一層CLS的隱藏狀態,[dw]是文本嵌入的維度。
然后,將文本嵌入[hti,j]作為模型原始輸入[hd0i, j],進行一系列的線性變換和非線性激活函數,得到了逐層變換的可信度特征表示:
[hd1i, j=σW1hd0i, j+b1] (2)
[hd2i, j=σW2hd1i, j+b2] (3)
式中:[σ]為激活函數;[W1]、[W2]分別是線性變化操作第一層和第二層的權重矩陣;[b1]、[b2]分別是線性變化操作第一層和第二層的偏置向量。這一系列變換實現了對文本嵌入的逐層特征提取,通過非線性映射和權重調整,逐步形成了更抽象的表示[hd2i,j]。
最后,獲取[hd2i,j]的可信度標簽概率,應用Softmax函數將可信度特征轉換為類別概率。具體而言,使用以下公式計算概率分布。
[Ycdi, j=SoftmaxW3hd2i, j+b3] (4)
式中:[Ycdi, j∈]{善意,惡意}是可信度的預測概率;[W3]和[b3]是全連接層的權重和偏置。
2.5" 雙向相關GCN網絡模塊
GCN網絡能夠自適應地學習圖結構中節點的特征和關系,因此可以有效地對不同長度和形狀的謠言傳播網絡進行建模。然而,傳統的雙向GCN網絡的節點更新方法存在不足,無法根據節點與不同鄰居節點的相關性獲得不同的更新,導致動態性缺乏。本文使用雙向相關GCN網絡,節點更新之前先進行相關性計算,隨后使用GCN網絡捕獲結構特征,從而使得節點間的結構更加緊湊。在可信度特征提取模塊中,得到了可信度特征嵌入[hdi, j],通過[concat]函數拼接原始文本嵌入[hti, j],可得特征增強后的節點特征:
[hi, j=concathdi, j,hti, j] (5)
謠言傳播的結構特征捕獲通常使用節點更新方法,具體而言:計算自身節點和其他節點的相關性,將其他節點的特征根據相關性添加到自身節點表示中。
節點之間的相關性通過注意力算法進行計算,逐個評估節點[j]與其直接傳播源節點[v]的相關性。
[ei, j,v=aWhi, jWhi,v] (6)
[ai, j,v=Softmaxei, j,v] (7)
式中:[v∈Nj],[Nj]是[j]的直接傳播源的相鄰節點集合;[,,]是拼接操作;[a]和[W]是線性變化權重參數;Softmax是歸一化函數。
然后獲取相鄰節點的特征,更新節點特征表示為:
[hi, j=σv∈Ni, jai, j,vWhi,v] (8)
在自上而下的傳播結構中,重復式(6)~式(8),可以融合更遠視野域節點特征,融合兩跳結構信息的節點[j]的計算公式為:
[hTDi, j=h1i, j=σv∈Ni, jai, j,vWhi,v] (9)
[hTDi, j=h2i, j=σv∈Ni, jai, j,vWh1i,v] (10)
式中:[hTDi=hTDi,0,hTDi,1,…,hTDi,n],[hTDi∈Rn×64]表示謠言[i]的整個傳播過程所有傳播節點;[hTDi, j∈hTDi]表示謠言[i]的傳播節點[j]的特征表示,同理,可計算得到自下而上傳播過程的表示[hBUi]。為了獲取整體傳播結構特征,將兩個傳播方向的節點按照式(11)進行融合。
[H*i=mean(h*i)=meanh*i,0,h*i,1,…,h*i,n] (11)
式中:[H?i∈R1×64]表示傳播方向為“[?]”的傳播結構特征;“[?”∈TD,BU];mean為平均函數。
2.6" 分類輸出
給定謠言[ri],經過BERT嵌入后得到其表示為[hti]。隨后,將該表示向量與可信度檢測模塊的輸出[hci]進行拼接,分別通過不同的傳播結構更新后得到[hTDi]和[hBUi]。接著,使用平均函數(mean)分別對這兩個向量求平均得到[HTDi]和[HBUi]。最后,通過合并函數([concat])拼接后輸入到線性分類層,謠言分類概率表述為:
[Yrdi=SoftmaxW4concatHTDi,HBUi+b4] (12)
式中:[Yrdi∈]{非謠言,假謠言}為謠言[i]是謠言與否的預測概率;[W4]和[b4]是全連接層的權重和偏置。
3" 實" 驗
3.1" 數據集
本文在可信度學習子任務中,采用SemEval?2019的task7英文立場數據集,通過百度翻譯接口將其翻譯為中文,以構建中文動機數據集,該立場數據集來源于真實的社交網絡——Twitter和Reddit,具體數據分布情況如表1和表2所示。
而在謠言檢測的主任務中,使用Weibo16數據集,這是當前謠言檢測研究中使用最廣泛的中文數據集之一,其數據來自于中國的微博平臺,數據分布情況如表3所示。
3.2" 對比實驗
為了進一步驗證本文所提出的謠言檢測方法的有效性,與以下13種研究方法進行對照實驗。
1) DTC[25],基于決策樹分類器提取和分析信息傳播的帖子特征。
2) RFC[26],基于隨機森林分類器,利用用戶、內容和結構屬性作為手工特征。
3) SVM?TS[27],基于線性SVM分類器,利用手工制作的社交上下文特征,使用時間序列對特征值隨時間的變化進行建模。
4) SVM?RBF[28],基于SVM的RBF內核模型,與DTC類似,使用謠言帖子的手工特征。
5) SVM?TK[29],基于樹核的SVM分類器,通過核學習方法捕獲傳播結構特征。
6) SVM?HK[30],使用混合核的SVM分類器,通過核學習方法捕獲傳播結構特征。
7) RvNN[17],將帖子及其評論建模為對話樹,并采用遞歸神經網絡學習傳播特征。
8) TD?RvNN?GA[4],在之前的研究上[17],將每一個傳播過程中的言論通過注意力機制賦予權重。
9) Bi?GCN[31],建模謠言傳播言論,使用雙向圖卷積網絡捕獲雙向(自上而下和自下而上)結構特征。
10) GLAN[32],使用CNN網絡力機制融合帖子間的語義潛在表示,而后將帖子、轉發和用戶關系建模為全局關系異構圖,捕獲結構特征。
11) HAGNN[22],設置GCN來捕獲結構特征,再設置門控GNN來更新文本和單詞的聚合表示,池化后經Softmax函數輸出分類結果。
12) SBAG[33],首先預訓練多層感知網絡捕獲社交機器人特征,然后嵌入特征構建多個GNN網絡對帖子建模。
13) SDR?aBiGCN,將本文的可信度檢測子任務替換為立場檢測子任務,在謠言檢測網絡訓練時,建模融合謠言傳播言論的態度立場潛在特征,隨后使用雙向相關GCN網絡訓練。
3.3" 實驗設置
在實驗環節,采用BERT預訓練模型進行文本嵌入表示,其維度設定為默認的768維。在可信度學習子任務中,使用Adam優化器,批尺寸大小為64,學習率為0.001,訓練輪次為100,Dropout率為0.5。為了確保訓練的有效性,引入早停機制。具體而言,如果驗證集損失在10個epoch后仍未減少,將認為模型已經收斂,便會停止訓練并保存模型權重,以備用于后續處理檢測模塊輸入數據。
在謠言檢測主任務中,同樣采用了Adam優化器,訓練輪次為100,學習率為0.000 1,批尺寸大小為64。為了更好地捕捉謠言傳播特征,構建有向圖數據結構,并設置GCN卷積層數為2。
3.4" 實驗表現
實驗結果如表4所示,本文提出的聯合可信度學習的多任務方法優于其他多任務學習基線方法0.004~0.01,優于單謠言檢測方法0.006~0.035,優于基于傳統手工特征方法0.065~0.149。
在第一組實驗中,明顯可見基于傳統手工特征提取的方法效果明顯低于基于深度學習方法的效果。具體而言,前四類方法(DTC、RFC、SVM?TS和SVM)的性能較低,這可能是由于手工特征的質量受到限制,而這些特征可能并不適合直接用于模型判斷,從而導致準確率較低。相比之下,SVM?HK和SVM?TK通過核方法捕獲結構特征,顯示出了更好的性能,也表明了傳播結構特征對于謠言判斷是有益的特征。
在第二組實驗中,探索了不同傳播結構特征捕獲能力的差異。TD?RvNN和TD?RvNN?GA對比得知,加入注意力機制可以選擇有效的內容數據進行謠言判斷。Bi?GCN方法要比RvNN方法優0.013左右,其原因是RvNN方法是一種深度遍歷方法,對于捕獲廣度結構特征能力不足。GLAN雖然可以捕獲到更遠距離的節點結構特征,但是CNN網絡局部特征提取有限,容易造成對復雜傳播結構特征捕獲不足。HAGNN和Bi?GCN在第二組實驗中表現最好,證明了GNN類模型在捕獲傳播結構特征方面的能力,也進一步驗證了使用雙向傳播特征(Bi?GCN)優于單向傳播(HAGNN)的性能。
在第三組實驗中,相比于一般的傳播結構上的研究方法,通過增加輔助任務(SBGA、SDR?aBiGCN)可以明顯提高檢測性能。SBGA的假謠言檢測性能要優于SDR?aBiGCN和本文提出的CDR?aBiGCN,證明了用戶特征對于謠言判別的有效性,但其非謠言的檢測能力不足,原因可能為用戶信息并不真實,進而無法準確判斷是否是機器人,用戶特征不明顯,將真人識別為機器人。CDR?aBiGCN和SDR?aBiGCN的實驗結果顯示,基于可信度學習的子任務方法要比基于立場檢測的子任務在謠言檢測方面具有更佳的檢測性能。
本文提出的謠言檢測方法,相比以上提到的基線模型,在非謠言的精確率和假謠言的召回率方面表現略低,但在其他指標上均取得了最好的表現。因此,本文提出的方法具有較高的檢測性能。
3.5" 消融實驗
本文提出的CDR?aBiGCN模型主要由可信度學習網絡、相關性計算和BiGCN網絡三部分組成。為了評估本文方法中各個組件的有效性,設計以下幾個變異模型,并將其性能與相關方法進行比較。
w/o CD:刪除可信度學習模塊,取消可信度特征嵌入,使用文本初始嵌入用于分類。
w/o A:去除雙向相關性計算方法,節點更新方式采用傳統GCN網絡更新方法。
w/o BU:刪除自下而上的謠言傳播特征,只使用自上而下傳播特征。
w/o TD:刪除自上而下的謠言傳播特征,只使用自下而上傳播特征。
如表5所示,可以觀察到每個組件對整個模型都是不可或缺的。由傳播結構的變異模型中可見,捕獲的傳播特征網絡方法的性能表現為:Bi?GCNgt;BU?GCNgt;TD?GCN。在去除TD后,性能下降并不明顯,這表明自上而下捕獲的傳播特征對整體模型判斷的貢獻度相對較小。然而,當去除BU后,模型性能下降明顯,表明了來自于子節點的自下而上表示的重要性,證明了謠言在傳播過程中具有自我糾正的特點,可以作為謠言判斷的重要依據特征。綜合考慮二者的結合對優化模型性能具有顯著作用。
在相同條件下的變異模型中,當去除可信度特征提取模塊后,模型的準確率下降幅度為0.01~0.025。表明可信度特征增強了語義表示,在謠言檢測任務中,起到了重要的作用。當去除雙向相關性計算權重方法后,模型性能下降,證明了在GCN網絡中傳統的節點更新方法的節點間更新相關性不足,從而導致傳播特征的缺失。
綜上所述,本文提出的模型的各個組件對于整個模型都具有關鍵作用,證明了該框架的有效性。
3.6" 早期檢測表現
如果能夠盡早識別判斷謠言,就可以盡可能地降低對社會的危害,為此很多研究開始了對早期謠言檢測。對于這項工作,本文采用兩種類型:一種是根據帖子聲明發布后經過的時間;另一種是根據傳播樹深度的不同數據比例設置,來驗證模型是否能夠根據當前早期時刻攜帶的有限信息正確識別謠言。實驗結果如圖3所示。
可以觀察到,在謠言傳播的早期階段,由于交互數據較少,所有方法的性能都顯著降低,唯有本文提出的方法表現出相對較高的性能,在只有0.1%數據下準確率可達91.1%。隨著評論數據的逐漸增多,檢測的準確率也在不斷提高,這進一步證明了謠言傳播具有“自我糾正”的特點。與傳統的立場檢測子任務方法相比,本文方法能夠在早期獲取謠言聲明的可信度特征,分析言論動機是否出于善意或惡意,從而為謠言判斷提供了有效支持。
3.7" 特征可視化
圖4展示了模型訓練過程中的標簽可視化。其中:0表示非謠言;1表示假謠言。
圖4a)展示了僅使用文本嵌入的情況,不同類別的謠言表示存在較高的重合度,表明僅靠文本嵌入無法有效區分謠言與真實信息。
圖4b)展示了帖子聲明經可信度特征提取后的分類結果,顯著增強不同類別間的區分差異,這進一步證明了在謠言檢測中利用可信度特征的有效性。
圖4c)展示了真實標簽樣本的分布情況,為模型分類提供了參考。
圖4d)展示了本文方法的預測結果,此方法結合可信度特征和雙向相關GCN網絡,使不同類別之間的特征區別更加顯著,進一步提高了模型對真假謠言的區分能力。
4" 結" 語
本文提出一種聯合可信度學習的雙向相關GCN網絡謠言檢測方法,該模型采用可信度檢測作為子任務進行多任務學習,在真實世界的微博數據集進行訓練和測試,主要結論有:
1) 基于可信度學習的子任務方法相較于基于立場檢測子任務方法,建立了謠言傳播言論與其標簽的深層次對應關系,謠言檢測性能表現更優秀;
2) 謠言傳播網絡節點更新方式采用雙向相關性計算,能夠更好地捕捉節點在雙向傳播過程中的異質性特征,從而有助于提取出更為緊湊的結構特征。
本文在捕獲結構特征時,特征更新局限于網絡的兩跳范圍,無法捕獲較遠距離的節點特征。因此,下一步研究的重點將集中在擴展結構特征融合的范圍,以捕獲更遠距離的節點特征,從而進一步提升謠言檢測的性能。
注:本文通訊作者為云靜。
參考文獻
[1] 孟凡森,魏霞,黃德啟,等.基于ACON?Transformer的謠言檢測研究[J].現代電子技術,2022,45(21):67?76.
[2] KUMARI R, ASHOK N, GHOSAL T, et al. Misinformation detection using multitask learning with mutual learning for novelty detection and emotion recognition [J]. Information processing amp; management, 2021, 58(5): 102631.
[3] BAI N, MENG F R, RUI X B, et al. A multi?task attention tree neural net for stance classification and rumor veracity detection [J]. Applied intelligence, 2023, 53(9): 10715?10725.
[4] MA J, GAO W, JOTY S R, et al. An attention?based rumor detection model with tree?structured recursive neural networks [J]. ACM transactions on intelligent systems and technology, 2020, 11(4): 1?28.
[5] HUANG Q, ZHOU C, WU J, et al. Deep structure learning for rumor detection on twitter [C]// 2019 International Joint Conference on Neural Networks (IJCNN). New York: IEEE, 2019: 1?8.
[6] LIU Y, WU Y F B. Early detection of fake news on social media through propagation path classification with recurrent and convolutional networks [C]// Proceedings of the AAAI Conference on Artificial Intelligence. [S.l.]: AAAI, 2018: 354?361.
[7] CHEN T, LI X, YIN H Z, et al. Call attention to rumors: Deep attention based recurrent neural networks for early rumor detection [C]// Trends and Applications in Knowledge Discovery and Data Mining. Heidelberg: Springer, 2018: 40?52.
[8] YU F, LIU Q, WU S, et al. A convolutional approach for misinformation identification [EB/OL]. [2022?03?21]. https://doi.org/10.24963/ijcai.2017/545.
[9] GHANEM B, ROSSO P, RANGEL F. An emotional analysis of 1 information in social media and news articles [J]. ACM transactions on internet technology (TOIT), 2020, 20(2): 1?18.
[10] 馬儀,邵玉斌,杜慶治,等.基于聯合情感的多任務謠言檢測方法[J].云南大學學報(自然科學版),2024,46(4):642?653.
[11] CHOUDHRY A, KHATRI I, JAIN M, et al. An emotion?aware multitask approach to fake news and rumor detection using transfer learning [J]. IEEE transactions on computational social systems, 2022, 11(1): 588?599.
[12] KUMARI R, ASHOK N, GHOSAL T, et al. What the fake? Probing misinformation detection standing on the shoulder of novelty and emotion [J]. Information processing amp; management, 2022, 59(1): 102740.
[13] MENDOZA M, POBLETE B, CASTILLO C. Twitter under crisis: Can we trust what we RT? [C]// Proceedings of the First Workshop on Social Media Analytics. New York: ACM, 2010: 71?79.
[14] ZHANG H W, QIAN S S, FANG Q, et al. Multi?modal meta multi?task learning for social media rumor detection [J]. IEEE transactions on multimedia, 2022, 24: 1449?1459.
[15] YANG R C, MA J, LIN H Z, et al. A weakly supervised propagation model for rumor verification and stance detection with multiple instance learning [C]// Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2022: 1761?1772.
[16] LI C, PENG H, LI J X, et al. Joint stance and rumor detection in hierarchical heterogeneous graph [J]. IEEE transactions on neural networks and learning systems, 2022, 33(6): 2530?2542.
[17] MA J, GAO W, WONG K F. Rumor detection on twitter with tree?structured recursive neural networks [C]// Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics. [S.l.]: ACL, 2018: 1980?1989.
[18] YAN Y Q, WANG Y J, ZHENG P. Rumor detection on social networks focusing on endogenous psychological motivation [J]. Neurocomputing, 2023, 552: 126548.
[19] CHOI J, KO T, CHOI Y, et al. Dynamic graph convolutional networks with attention mechanism for rumor detection on social media [J]. Plos one, 2021, 16(8): e0256039.
[20] CHEN J H, ZHANG W Y, MA H C, et al. Rumor detection in social media based on multi?hop graphs and differential time series [J]. Mathematics, 2023, 11(16): 3461.
[21] GAO Y, WANG X, HE X N, et al. Rumor detection with self?supervised learning on texts and social graph [J]. Frontiers of computer science, 2023, 17(4): 174611.
[22] XU S Z, LIU X D, MA K, et al. Rumor detection on social media using hierarchically aggregated feature via graph neural networks [J]. Applied intelligence, 2023, 53(3): 11?14.
[23] LIU T R, CAI Q, XU C X, et al. Rumor detection with a novel graph neural network approach [EB/OL]. [2024?04?09]. https://doi.org/10.48550/arXiv.2403.16206.
[24] DEVLIN J, CHANG M W, LEE K, et al. BERT: Pre?training of deep bidirectional transformers for language understanding [EB/OL]. [2022?09?26]. https://doi.org/10.18653/v1/n19?1423.
[25] CASTILLO C, MENDOZA M, POBLETE B. Information credibi?lity on twitter [C]// Proceedings of the 20th International Conference on World Wide Web. New York: ACM, 2011: 675?684.
[26] KWON S, CHA M, JUNG K. Rumor detection over varying time windows [J]. PloS one, 2017, 12(1): e0168344.
[27] MA J, GAO W, WEI Z Y, et al. Detect rumors using time series of social context information on microblogging websites [C]// Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. [S.l.: s.n.], 2015: 1751?1754.
[28] YANG F, LIU Y, YU X H, et al. Automatic detection of rumor on Sina Weibo [C]// Proceedings of the ACM SIGKDD Workshop on Mining Data Semantics. [S.l.: s.n.], 2012: 1?7.
[29] MA J, GAO W, WONG K F. Detect rumors in microblog posts using propagation structure via kernel learning [C]// Con?ference of the European Chapter of the Association for Computational Linguistics. [S.l.: s.n.], 2017: 708?717.
[30] WU K, YANG S, ZHU K Q. False rumors detection on Sina Weibo by propagation structures [C]// 2015 IEEE 31st International Conference on Data Engineering. New York: IEEE, 2015: 651?662.
[31] BIAN T, XIAO X, XU T Y, et al. Rumor detection on social media with bi?directional graph convolutional networks [J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(1): 549?556.
[32] YUAN C Y, MA Q W, ZHOU W, et al. Jointly embedding the local and global relations of heterogeneous graph for rumor detection [C]// 2019 IEEE International Conference on Data Mining (ICDM). New York: IEEE, 2019: 796?805.
[33] HUANG Z, Lü Z L, HAN X Y, et al. Social bot?aware graph neural network for early rumor detection [C]// Proceedings of the 29th International Conference on Computational Linguistics. [S.l.]: ICCL, 2022: 6680?6690.
[34] 趙東波,李輝.一種改進的FCM遙感圖像變化檢測方法[J].電子設計工程,2023,31(9):156?160.
作者簡介:鄧" 磊(1999—),男,內蒙古興和人,碩士研究生,主要研究方向為自然語言處理、謠言檢測。
云" 靜(1980—),女,內蒙古呼和浩特人,副教授,碩士生導師,主要研究方向為圖像處理、自然語言處理、機器學習。
班" 琪(1999—),女,內蒙古錫林郭勒人,碩士研究生,主要研究方向為自然語言處理、跨語言摘要生成。
收稿日期:2024?07?20" " " " " "修回日期:2024?08?12
基金項目:國家自然科學基金資助項目(62062055)