
中圖分類號:E911 文獻標志碼:A DOI:10.3969/j. issn.1673-3819.2025.05.010
Abstract:Withtherapiddevelopmentand popularizationof information technology,cognitive domainoperations willbean importantformof militaryoccupationandcontrol,striking enemy forcesandparticipating innonwarmilitaryoperations in thefuture.Inorder togaintheinitiativeinthewar,enemyforcesoftenuse mediaplatformstopublishfakenews,attempting to confuse thepublic'svisionandevenmisleadpublicperception,posingathreat tosocialstabilityandsecurityThisarticle proposesasocial mediafakenews detection modelinthecontext ofcognitive domainoperations,which byutilizingthe news itself,user information,andusercomment informationcanbemodeledasaHeterogeneousInformationNetwork(HN),the introductionof hierarchicalaggegationtechnologynables thesimultaneouscaptureof globalandlocalfeaturesofdatabyaggregating HNatbothnodeandclasificationlevels.Thestudyaims todetectfakenews incognitivedomainwarandcurbthe dissemination before it hasanegative impact.
Keywords: cognitive domain;fake news;detection model
隨著科技的飛速進步,互聯網日益完善,網民規模和互聯網普及率均呈現顯著的提升。與網絡相關聯的認知對抗,是信息化戰爭的新形態和新領域,是未來軍隊占領與控制、打擊敵方勢力、參與非戰爭軍事行動的重要形式。戰時和應急情況條件下,利用社交媒體發布虛假新聞,實施針對性的敏感信息“爆料”等方式,容易造成輿情轉向,心理失控,社會動蕩。因此,如何精確檢測虛假新聞,確保新聞的真實性和可信度,已成為當前社會研究的重要方向之一。
虛假新聞作為一種具有高度欺騙性和誤導性的新型武器,在認知域作戰中發揮著重要作用。社交媒體平臺現已成為虛假新聞傳播的主要渠道。與傳統媒體相比,社交媒體具有更廣泛的受眾、更快的傳播速度和更高的互動性。虛假新聞在社交媒體上得以迅速擴散,影響公眾對事件真相的判斷力和對敵方的認知,從而達到戰略或戰術目的。
基于圖神經網絡分層聚合的虛假新聞檢測方法具有獨特的優勢。圖神經網絡能夠處理復雜的節點和邊的關系,并從中學習有用的特征表示。在社交媒體數據的圖結構表示中,節點可以是用戶、帖子、標簽等,邊可以是用戶之間的關系、互動、轉發等。運用圖神經網絡可以更好地理解新聞在社交媒體上的傳播模式,分層聚合策略在虛假新聞檢測中具有重要意義。
在認知域作戰中,虛假新聞往往經過不法分子的精心設計和傳播,以逃避檢測和過濾。采用分層聚合策略就是從多個層次和角度分析社交媒體數據,從宏觀到微觀,從整體到局部,全面了解新聞傳播的路徑和模式。通過聚合不同層次的信息,能夠更準確地識別虛假新聞,并對其來源和動機進行深入分析。
基于圖神經網絡( GNN[1] )分層聚合模型,能夠在社交媒體平臺上高效捕捉和識別敵軍傳播的虛假信息[2],這將有助于提高公眾對新聞真實性的認知和判斷能力,有效減少虛假新聞的傳播,提高官兵輿論防護能力,此外,還可以為相關機構和媒體提供參考,加強對虛假新聞的監管和防范,維護社會穩定和公共安全。
1虛假新聞檢測發展現狀
虛假新聞檢測作為一個新興的課題,國內外學者已經進行了一些研究工作,其中,Ciampaglia等[3]基于知識的方法旨在通過比較從新聞中提取的信息與真實信息來評估新聞的真實性。然而,Zhou 和Zafarani[4]提出知識圖譜的及時性和完整性仍然是一個未解決的問題。另一種典型的方法是基于寫作風格,例如通過運用修辭結構理論進行話語水平檢測[5、情感和可讀性[?;谛侣勎谋?、用戶(傳播者)和帖子之間的關系,開發了矩陣分解[7]、張量分解[8]、分層詞編碼器[9]以及遞歸神經網絡(RNNs)[10-11]進行虛假新聞檢測。
虛假新聞檢測技術的核心在于利用多種技術手段來分析和驗證新聞的真實性。文本分析技術通過對新聞文本的語義、情感、邏輯等方面進行深人分析,以辨別其真實性。自然語言處理(NLP)技術通過對文本進行詞頻分析、情感分析、邏輯分析,識別虛假新聞特征。媒體來源驗證技術通過對新聞網站的域名、證書、訪問歷史等進行分析,可初步判斷新聞來源的可信度。
總體來說,現有虛假新聞檢測方法可以分為兩個流派。一種是基于信息本身,另一種是憑借外部信息的幫助。虛假信息檢測發展現狀呈現技術融合與創新、方法多樣化的趨勢,但仍需不斷應對新的挑戰和問題。
2基于圖神經網絡分層聚合的虛假新聞檢測模型構建
基于圖神經網絡分層聚合的虛假新聞檢測模型(HAGN)由節點級注意力和歸類級注意力的分層注意力結構構成。HAGN利用節點級注意力來學習屬于同一類型的鄰居權重,并將其聚合獲得特定類型的鄰居表示。再通過歸類級注意力來學習節點類型的信息,將得到的兩種鄰居表示再次聚合,實現最終虛假新聞檢測任務的最優加權組合,總體框架圖1所示。
圖1 HAGN總體框架
Fig.1HAGN Overall framework

2.1 術語定義
新聞文章:新聞文章指的是發布在社交媒體或公共媒體上的新聞內容,可以表示為集合N={n,,…,|nm} ,對于每條新聞文章 ni∈N ,都包含文本內容。
社交媒體用戶:社交媒體用戶是指網絡傳播的接受者,可以是一個人,也可以是一個組織、群眾,泛指上網者。社交媒體用戶表示為集合 S={S1,S2,…,Sk} 對于每個用戶 Si∈S ,都包含用戶信息。
用戶評論信息:用戶評論信息是指用戶在社交媒體上瀏覽新聞后發表的自身看法和觀點,一些較具權威的用戶評論對其他用戶會起到很大的引導作用。用戶評論信息可以用集合 C={C1,C2,…,Cn} 表示,對于每條用戶評論信息 Ci∈C ,都包含不同的見解、看法。
我們可以將新聞文章、社交媒體用戶和用戶評論信息建模為三種類型的節點,每個節點具有不同的特征,根據它們之間的連接關系構建不同類型的鏈接。
NewsHIN可以定義為 G=(υ,ε) ,其中節點集 υ= N∪S∪C ,鏈路集合 ε=εc,n∪εn,s 涉及用戶評論信息與新聞文章之間的“屬于”鏈接以及社交媒體用戶與新聞文章之間的“瀏覽”鏈接。
為了更好地理解NewsHIN并利用類型信息,有必要根據三類節點之間的關系來定義模式級別的描述。NewsHIN的模式將用于模型中,以了解不同類型的節點和鏈接的重要性。
形式上給定News HING=(υ,ε) ,模式表示為 SG= (νr,εr) (υr={?n,?s,?c} ?
屬于,瀏覽}), vT 和εT 分別表示異構信息網絡中節點類型和鏈路類型的結合。
2.2 問題定義
給定NewsHIN G=(υ,ε) ,虛假新聞檢測問題旨在學習分類函數 f NY ,將集合 N 中的新聞文章節點分類到具有 Y 中的可信度標簽的正確類中,有效合并News HIN G 中的各種異構信息。
2.3 節點級注意力
節點級注意力可以了解新聞文章中屬于同一類型的鄰居重要性,并且聚合那些有意義的鄰居的表示,形成一個集合表示,將其定義為模式節點。節點級注意力層的輸入是節點的初始特征向量。由于NewsHIN中存在多種類型的節點,初始特征向量屬于不同維度的特征空間。為了使注意力機制能夠在不同類型的節點之間輸出可比較且有意義的權重,我們首先利用特定類型的變換矩陣將不同維度的特征投影到同一特征空間中。以新聞文章節點 ni∈N 為例,類型 ?n 的變換矩陣是
,其中,
是初始特征
的維數, F 是映射到的特征空間的維數。對于所有類型特定的變換矩陣, F 是相同的。投影過程可以表示為

通過特定類型的投影操作,可以統一不同類型節點的特征空間,自注意機制可以在其中學習各種節點之間的權重。在這里,節點級注意力將分別學習同類型鄰居節點的重要性。在檢測虛假新聞時,目標節點是新聞文章節點 ni∈N ,其鄰居屬于 N∪S∪C 。需要注意的是,目標節點本身也要視為鄰居節點,以配合自注意機制。我們設 T∈{N,S,C} , T 中的節點具有相同的類型 ? ,則對于 T 中 ni 的鄰居節點,節點級注意力可以學習
的重要性,這意味著節點 ti∈T 對于 ni 將會多么重要。
的重要性可以公式化如下

attention表示與進行節點注意力相同的深度神經網絡,對于具有相同類型 ?t 的所有相鄰節點是共享的。掩飾注意力能夠保持網絡結構信息,只有當節點∈neighborn是類型為Φ,的節點i的鄰居節點時,它才會被計算并記錄為
。否則,它的注意力權重將為0,我們通過softmax函數將節點歸一化處理得到權重系數:

模式節點 Tni 可被聚合為

與圖注意力網絡(GAT)類似,在節點級注意力中,可以使用多頭注意力機制來穩定自我注意力的學習過程。具體來說, K 獨立節點級注意力執行方程(4)的變換,由 K 中關鍵詞實現的特征將被級聯,從而得到模式節點的輸出表示:

在面臨的一些問題中,基于HIN模式,每個目標節點 ni 都有3個模式節點 Nni,Cni,Sni ,對應3個不同類型的鄰居。
2.4 歸類級注意力
通過節點級注意力,我們將新聞文章節點的鄰居聚合為幾個模式節點。從本質上講,它相當于將來自相同類型的鄰居節點的信息融合到模式節點的表示中。我們現在仍然需要做的是從所有模式節點學習新聞文章節點的表示。不同的模式節點包含不同的類型信息,這需要我們區分節點類型的重要性。我們將使用歸類級注意力來自動學習不同模式節點的重要性,并最終使用學習到的系數進行加權融合。為了獲得足夠的表達能力來計算作為高級特征的模式節點之間的注意力權重,我們把一個可學習的線性變換應用于節點級注意力的模式節點的特征,這個線性變換由一個加權矩陣 W∈RF′×KF 參數化( K 是節點級注意力中的關鍵詞數量),歸類級注意力機制圖式是一個單層前饋神經網絡,應用了維度為2F0的激活函數Sigmoid。對于模式節點 Tni ,它的重要性可以表示為 

通過softmax函數來規范每個模式節點的重要性。最終融合的系數表示為
,計算如下:

基于所學系數,我們可以融合所有模式節點以獲得目標節點 ni 的最終表示

學習的最終表示集表示為 R 。圖2描述了兩級聚合過程。
圖2節點級與歸類級聚合過程說明
Fig.2Aggregation process of node-level attention and classification-level attention

2.5 損失函數
一旦實現了最終的表示,就可以使用標記的新聞文章節點來訓練分類器。在實驗中,使用邏輯回歸層進行預測。我們將一組標記的新聞文章節點定義為Nι° 對于虛假新聞檢測任務,優化目標函數被設置為交叉熵損失最小化,并且可以通過反向傳播進行優化。
在二分類虛假新聞檢測中,損失為

其中, Φ?Φy 是二進制指示符(0或1),指示標簽是否是新聞文章節點的正確分類。 pni 是新聞文章節點 ni 表示的預測概率。預測概率將由模型中的邏輯回歸層輸出。
對于多類虛假新聞檢測,基于交叉熵的損失可以表示為

其中, Φ?Φy 也是二進制指示符(0或1),其指示類標簽 j 是否是新聞文章節點 ni 的正確分類。將訓練多類邏輯回歸層以輸出預測概率Pnij°
3 實驗及結果分析
本實驗中使用的數據集是FakeNewsNet數據集在
PolitiFact平臺上搜集的數據。關于新聞文章,Politi-Fact在網站上提供原始內容、事實核查結果和全面的事實核查報告。該平臺根據內容和主題將它們分類為不同的科目,還將提供每個主題的簡要描述。事實核查結果可以表明相應新聞文章的可信度,并從{True、MostlyTrue、HalfTrue、MostlyFalse、False、PantsonFire}中取值。在PolitiFact數據集中,1322篇新聞文章被標記為“PantsonFire”,而帶有“False”的新聞文章數量為2 601篇。此外,數據集中還存在2539篇“MostlyFalse”新聞文章和2765篇“HalfTrue”的新聞文章?!癕ostlyTrue\"和“True\"新聞的數量分別為2676條和2149條。如果我們將標簽{Pantonfire、False、MostlyFalse分組為假新聞,將標簽{True、MostlyTrue、HalfTrue分組為真新聞,則假新聞的數量為6465,真新聞的數量為7590。我們在原始數據集的基礎上建立了一個異構的信息網絡(HIN)。HIN包括三種類型的節點:新聞文章(N)、社交媒體用戶(S)和用戶評論信息(C),以及兩種類型的鏈接:屬于(新聞文章和用戶評論信息之間)和瀏覽(新聞文章和社交媒體用戶之間)。描述HIN的關鍵統計數據見表1。
本文引入的2行2列混淆矩陣,如表2所示,作為一種標準格式,可以用來表示精度評價。其中:TP(truepositive):真正例,模型正確預測為正樣本的實際正樣本數。TN(truenegative):真負例,模型正確預測為負樣本的實際負樣本數。FP(1positive):假正例,模型錯誤預測為正樣本的實際負樣本數。FN(1 nega-tive):假負例,模型錯誤預測為負樣本的實際正樣本數。
表1HIN統計數據Tab.1 HiNstatisticaldata

表2混淆矩陣
Tab.2 Confusion matrix

3.1 二分類任務
HAGN模型在準確率、精確率、召回率和 F1 分數上實現了最佳性能,結果見表3。
然而,當考慮精度時,我們可以從圖3(d)中觀察到,HAGN模型的性能低于GCN和 GAT 。通過仔細分析可以發現,面對虛假新聞檢測,GAT和GCN傾向于將大多數實例判斷為“真實”,這與較高的精度與極低的召回率有關。在這種情況下,更高的精度是不實用的,導致很多虛假新聞無法檢測到。通過比較模型和網絡嵌入方法的性能,我們可以得出結論:文本信息是非常重要的,而僅僅基于網絡結構是不夠的。同時,通過模型和文本分類方法的比較,我們可以發現網絡結構對虛假新聞的檢測功能也很強大。最后,通過圖神經網絡方法之間的比較,驗證了應該以更有效的方式來處理網絡的異構性。如果簡單地忽略類型,將異構網絡視為同構網絡,那么結果將非常令人失望。同樣作為一種異構圖的方法,HAGN模型也顯示出優于HAN的優勢。更重要的是,HAGN模型是一個沒有手工制作功能限制的元路徑自由模型。
表3二分類實驗結果
Tab.3Binary-classificationexperimentresults

3.2 多分類任務
由于新興新聞性質的不確定性,通常很難直接判斷新聞是絕對真實的還是虛假的。此外,這也不利于后續操作。根據新聞的可信度進行更細粒度的多分類任務是非常有意義的。6個標簽分類的實驗結果如表4所示,其中HAGN模型優于所有比較方法,具有明顯的優勢。從更普遍的角度來看,這也表明HAGN模型在異構網絡中具有更強的學習能力,學習到的表示也更全面、更具鑒別力。結果表明,面對異構網絡中的其他場景,HAGN具有巨大的潛力和可擴展性。
3.3模式級注意力的表現
為了驗證模式級注意力的有效性,我們將基于圖神經網絡分層聚合的虛假新聞檢測模型的模式級注意力替換為模式節點的固定等權重。在實驗中,所有三個模式節點都被分配了權重3,并且我們將該比較模型表示為無模式級模型。圖4為HAGN模型和無模式級HAGN模型之間的比較結果。結果來自具有不同訓練比率的多類別分類設置的實驗。很明顯,從各種指標來看,HAGN模型和無模式級HAGN模型獲得了更好的性能。這表明模式節點的重要性區分,而HAGN模型可以有效地通過注意力權重來區分重要性。相比之下,聚合模式節點的簡單平均操作損害了性能,本質上相當于丟棄了模式節點的類型信息。
圖3二分類新聞文章分類結果

表4多類新聞文章分類結果
Tab.4Classification resultsofmultiple types of newsarticles

圖4HAGN與無模式級HAGN注意力的比較
Fig.4Comparison of attention between HAGN and HAGN_no_schema

4結束語
本模型充分利用NewsHIN的豐富特性,有效捕獲新聞文章的文本信息、用戶信息、用戶評論信息以及網絡結構信息,通過一種獨特的方式實現了對虛假新聞的更精準檢測。
本模型還具有高度的可擴展性,作為一種通用的圖表示學習模型,它不需要任何手工制作的特征或先驗知識,這使得其可以輕松地適應不同的應用場景和數據集,為其他基于異構網絡的問題提供了有效的解決方案。
參考文獻:
[1]吳博,梁循,張樹森,等.圖神經網絡前沿進展與應用[J].計算機學報,2022,45(1):35-68.WU B,LIANG X, ZHANG S S,et al. Advances and ap-plicationsin graphneural network[J].ChineseJournal ofComputers,2022,45(1):35-68.
[2] 王靜,何苗苗,丁建立,等.面向多維時間序列異常檢測的時空圖卷積網絡[J].西安電子科技大學學報,2024,51(3):170-181.WANGJ,HEMM,DINGJL,etal.Spatial-temporalgraphconvolutional networks for anomaly detectionin mul-tivariate time series[J].Journal of Xidian University,2024,51(3):170-181.
[3] 王玉璽,齊鋒,柯明星,等.透過俄烏沖突看人工智能對認知領域作戰影響[C]//第十一屆中國指揮控制大會論文集.國防科技大學電子對抗學院,2023:5.WANG Y X,QI F,KE M X. Look at AI's impact on cog-nitivefield operations through the Russia Ukraine conflict[C]//Proceedings of the 11th China Command and Con-trolConference.CollegeofElectronicWarfare,NationalUniversity ofDefense Technology,2023:5.
[4] Xinyi Zhou,Reza Zafarani.Fakenews:A survey of re-search,detectionmethods,and opportunities[J/OL].InarXivpreprintarXiv:1812.00315,2018.
[5]楊圣鵬,施建棟,周斯煒,等.基于圖框架變換的動態圖神經網絡模型[J].浙江師范大學學報(自然科學版),2024,47(1):19-28.YANG S P, SHI JD, ZHOU S W,et al.Dynamic graphneural network model based on graph framelets transform[J].Journal of Zhejiang Normal University(Natural Sci-ences),2024,47(1):19-28.
[6]張明書,葛曉義,魏彬.基于情感特征和謠言種類的謠言檢測[J].計算機仿真,2023,40(6):21-25,60.ZHANG MS,GE X Y,WEI B. Rumor detection basedon emotional features and types of rumors[J].ComputerSimulation,2023,40(6):21-25,60.
[7]韓浩.基于多任務學習的假新聞檢測[D].哈爾濱:哈爾濱工業大學,2020.HAN H. Fake news detection based on multi-task learning[D].Harbin:Harbin Institute of Technology,2020.
[8]柳曉翠.基于機器學習算法的虛假新聞檢測研究[J].信息技術與信息化,2021(9):237-239.LIU X C.Research on 1 news detection based on ma-chine learningalgorithm[J].Information TechnologyandInformatization,2021(9):237-239.
[9]王光晨.生成式自動文本摘要研究[D].保定:河北大學,2021.WANG G C. Research on generative automatic text sum-marization[D].Baoding:Hebei University,2021.
[10]SHUK,MAHUDESWARAND,WANGSH,etal.Fak-eNewsNet:a data repository with news content,socialcontext,and spatiotemporal information for studying fakenews on social media[J].BigData,2020,8(3):171-188.
[11] CUI L M, SHU K, WANG S H,et al. dEFEND: a sys-tem for explainable fake news detection[C]//Proceedingsof the 28th ACM International Conference on Informationand Knowledge Management. Beijing China,2019:2 961-2 964.
(責任編輯:許韋韋)