瞿倩倩,韓 華,呂亞楠,賈承豐,馬媛媛
(武漢理工大學理學院,武漢 430070)

謠言傳播作為一種社會傳染過程[4]與疾病傳播非常相似,因此謠言傳播的研究大都基于流行病傳播模型[5]。Daley 和Kenal提出了經典的DK謠言傳播模型[6],它是把個體分成3類:無知者、傳播者和免疫者。無知者是不知道謠言的人,傳播者是散布謠言的人,免疫者是知道謠言但不傳播謠言的人。Maki和Thompson延伸了DK模型,假設當傳播者與另一個傳播者接觸時只有最初的傳播者會變成免疫者[7]。在此之后,學者們開始在這兩種傳統模型的基礎上進一步研究謠言傳播。隨著復雜網絡理論的發展,由一些節點相互連接組成的復雜網絡可以更合理地描述現實的復雜系統,因此越來越多的學者開始研究網絡謠言傳播過程。Zan Yongli[8]考慮網絡中存在多種謠言傳播的情形,假定兩種謠言開始傳播的時間不同且謠言內容無關聯,引入選擇參數來表示兩種謠言的吸引力,建立了兩種謠言傳播模型:DSIR模型和CDSIR模型。Zhang Yaming等[9]提出一種考慮超擴散機制的新的謠言與權威信息傳播模型,運用平均場方程推導基本再生數與最終傳播規模,并在BA無標度網絡與新浪微博網絡上進行仿真分析。Qian Zhen等[10]基于SIR模型建立了一種復雜網絡上具有獨立傳播者(independent spreader)的謠言傳播模型,發現獨立傳播者的引入對謠言傳播過程與穩態均有影響,突破了傳統的必須通過連邊傳播的方式,認為無連邊也能傳播。Huo Liang’an等[11]建立了同質網絡上的謠言傳播模型, 考慮非線性傳播率并將傳統模型中謠言傳播者進一步分為活躍與不活躍兩類狀態, 計算基本再生矩陣的特征值得出基本再生數。

謠言傳播依附于具體的網絡,網絡結構必定會對謠言傳播過程產生影響,然而上述研究沒有充分考慮網絡結構特征對謠言傳播率的影響,因此,本文基于網絡結構特征引入謠言信度函數以及個體親密度函數的概念,定義一種考慮網絡結構特征的非一致傳播率。同時,考慮謠言傳播者本身的信謠程度可能不同,以至于傳播謠言的力度有所差異,在經典DK模型[6]的基礎上將謠言傳播者進一步分為完全信謠者與輕度信謠者兩類。由于現實社交網絡中存在用戶注冊與注銷的情況,考慮網絡中節點的移入與移除,依據平均場理論建立一種具有非一致傳播率的S2IR網絡謠言傳播模型。本文第1節通過建立的社交網絡謠言傳播模型得出謠言傳播的微分動力學方程;第2節推導出謠言傳播模型基本再生數的表達式;第3節對隨機免疫與目標免疫兩種免疫策略進行分析對比;第4節仿真分析謠言傳播的特點,探究模型中的參數對傳播過程的影響以及幾種免疫策略的效果,在仿真網絡與實際網絡上驗證模型的有效性;第5節針對社交網絡謠言傳播得出結論。
借助復雜網絡的相關概念,將社交網絡中的用戶抽象為復雜網絡中的節點,用戶間的好友關系抽象為節點之間的連邊。在經典DK謠言傳播模型基礎上,考慮傳播謠言的用戶的信謠程度不同導致傳播謠言的力度存在較大差異,把網絡中的節點分為五類:從未聽說過謠言的無知節點S、完全信謠節點I1(傳播謠言的力度較大)、輕度信謠節點I2(傳播謠言的力度較小)、曾經聽說過謠言但不會再相信謠言并且不會再傳播謠言的免疫節點R以及空節點。現有的謠言傳播模型大都將所有節點的謠言傳播率視為同一常數,而實際網絡中的謠言傳播率并非都相同。鑒于此,本文利用網絡結構特征定義謠言信度函數與節點親密度函數,提出一種新的非一致傳播率。
以往的謠言傳播模型往往忽略節點之間的差異,假定節點的抗感染能力一致。事實上,節點度的大小會影響節點的抗感染能力。一方面,在實際的社交網絡中,度大的節點一般是網絡中比較重要的節點,這樣的重要節點往往是較早加入網絡中的,它們具有更多的經驗與更強的防范意識,相應的抵抗謠言的能力也就更強,因此它們接收謠言后聽信謠言且成為謠言傳播者的概率也就相應降低了[14]。另一方面,節點的度越大,它可以選擇進行交流的鄰居節點數越多,每個節點的時間、精力有限,度越大的節點在與傳播謠言的鄰居節點進行接觸時相信謠言的可能性就越小[15]。所以,盡管度大的節點與謠言傳播者接觸的機會更多,但由于自身具有較強的抗謠言的能力,其每次接觸謠言時相信謠言的概率反而會低于網絡的平均接觸傳染率[14]。針對以上分析,引入謠言信度函數α(k)來表示度為k的節點對謠言的聽信程度(0≤α(k)≤1),α(k)隨著節點度k的增大而減小。

圖1 網絡拓撲示例圖Fig.1 An example network topology diagram
謠言傳播所依附的網絡的結構對傳播過程具有重要影響,為研究網絡結構特征對謠言傳播概率的影響,采用節點相似性來定義節點親密度函數。為描述方便,以圖1所示案例來定義傳播模型的網絡拓撲結構。令g表示網絡中的一個節點,取值為網絡節點編號,下面定義網絡節點的相關參數。
定義1節點的度k(g)。即節點g的鄰居個數,如k(1)=3。
定義2節點的鄰居集合Γ(g)。即節點g的所有鄰居節點的集合。如Γ(1)={2,3,4}。


表1 鄰居節點集合、鄰居節點度、共同鄰居數及節點親密度Tab.1 Neighbor node set, neighbor node degree, number of common neighbors and node intimacy

(1)
(2)
其中β為強化參數。式(1)中,當β=0(只考慮節點信度)時,式(1)等價于文獻[14]中SIR模型的傳播率,它能反映節點的差異性。

對于建立模型所需要的一些假設和參數描述如下:
1) 謠言傳播初始,選取一定比例的節點分別作為初始傳播節點I1、I2;
2) 在t時刻,任意一個度為k的謠言無知節點S被其傳播謠言的鄰居節點I1感染的概率為λ1(k)、被傳播謠言的鄰居節點I2感染的概率為λ2(k),被感染后的節點以概率τ1變成節點I1、以概率τ2變成節點I2;
3) 受辟謠工作的影響,傳播節點I1會以概率γ1變成免疫節點R,傳播節點I2會以概率γ2變成免疫節點R(γ1<γ2);
4) 傳播力度較大的完全信謠節點I1由于逐漸對謠言失去興趣或遺忘等原因會以概率η變成傳播力度較小的節點I2;
5) 空節點變成S節點的概率記為注冊率b,所有節點變成空節點的概率記為注銷率μ;
6) 在t+1時刻,由于個體所處狀態會隨時間而變化,謠言無知節點S會再次與其傳播謠言的鄰居進行接觸,傳播過程會跳轉至第2)步。

圖2 S2IR模型節點狀態轉移圖Fig.2 The state transition of S2IR rumor spreading model
謠言傳播機理如圖2所示。利用平均場理論[17],由上述傳播規則,得到新的網絡謠言傳播模型(S2IR模型)的平均場方程為:
(3)

(4)
令Qk=Sk+I1 ,k+I2, k+Rk,將系統(3)左右分別相加可得:

(5)
結合系統(3)和式(5)可以得到系統(3)的極限方程組:
(6)

借鑒傳播學中基本再生數的定義,定義謠言傳播的基本再生數為一個謠言傳播節點在它傳播謠言階段使得謠言無知節點轉變為謠言傳播節點的個數,它決定無謠言平衡點的穩定性,并與謠言傳播的最終規模有關。在這一部分將由正平衡點的存在性推導基本再生數的表達式,求出無謠言平衡點和有謠言平衡點,以及討論幾種常見的免疫策略。
為求解系統(6)的基本再生數,首先考慮穩態條件下的平衡解,令dSk/dt=0,dI1,k/dt=0和dI2,k/dt=0,容易求出方程組(6)的無謠言平衡點為

(7)
從Θ的表達式(4)可以看出,I1,k和I2,k的值取決于Θ。因此將式(7)代入式(4)可得到關于Θ的自治方程:
(8)
顯然,Θ=0始終是該自治方程的一個平凡根,下面導出自治方程(8)存在正根的條件。易證F(0)=0,則方程(8)在Θ∈(0,λ1(k)+λ2(k)]內存在正根當且僅當


則F(Θ)=0在(0,λ1(k)+λ2(k)]上有正根的充要條件是當Θ=0時滿足:
從而得基本再生數的表達式

由上述分析可得定理1。
定理1當R0<1時,系統(6)只有一個無謠言平衡點E0;當R0>1時,系統(6)除了E0之外,區域Γ中還存在唯一的有謠言平衡點E*。
下面給出全局穩定性的主要結論。
定理2當R0≤1時,系統(6)的無謠言平衡點E0是全局漸進穩定的;當R0>1時,系統(6)的有謠言平衡點E*是全局漸進穩定的。
利用文獻[18]的定理4.2與4.3容易證明上述定理2,因此本文不再贅述。
研究謠言傳播模型是為了揭示謠言傳播的特性以及影響傳播過程的因素,并提出有效的控制謠言傳播的方法以減輕或避免謠言傳播造成的不良影響。在這一節中,基于本文提出的具有非一致傳播率的S2IR謠言傳播模型來分析隨機免疫和目標免疫兩種免疫策略的效果。

(9)
進而可以求出系統(9)的基本再生數:
將分離純化后的菌株接種到對應淀粉培養基平板上,36 ℃培養48 h后將碘液滴加菌落上,有透明水解圈的菌落即判定該菌有產淀粉酶活力。
(10)




(11)
同理,可以推導出系統(11)的基本再生數為
(12)

由于大多數現實社交網絡的度分布服從低冪律分布,不失一般性,以下在無標度網絡上模擬社交網絡中謠言傳播過程。無標度網絡采用BA模型的生成算法[21],為便于仿真模擬,生成網絡的最終規模取N=1 000, BA無標度網絡[22]模型的相關參數為:初始節點數m0=2,每次進入新節點時新生成的連邊數m=2,網絡的平均度〈k〉=3.972,〈k2〉=45.318。本節所有實驗結果均為獨立進行了至少500次仿真實驗的平均結果。由第1.1節分析,謠言信度函數α(k)的表達式可以是任意形式的減函數,以下仿真時采用的形式為:α(k)=k-θ,θ≥0。
本節首先通過數值實驗驗證理論推導部分的準確性,然后分析相關參數對傳播過程的影響。固定參數b=0.4,μ=0.04,θ=0.6,β=0.6,λ1=0.9,λ2=0.5,τ1=0.6,τ2=0.4,γ1=0.05,γ2=0.07,η=0.1,此時R0=6.918>1。圖3a與圖3b分別展示了10組不同初始值情況下兩類謠言傳播節點的密度變化情況,其中圓圈代表初始值,三角代表謠言傳播穩態值。從圖中可以看出不同初始情況下,各密度曲線均收斂于一點。圖3c是在一組初始值I1(0)=0.001,I2(0)=0.001,S(0)=0.94,R(0)=0下各類節點密度的演化曲線,S、I1、I2分別達到0.3、0.08、0.17,與圖3a、3b相吻合。
取參數取值b=0.4,μ=0.04,θ=0.6,β=0.6,λ1=0.16,λ2=0.09,τ1=0.6,τ2=0.4,γ1=0.08,γ2=0.12,η=0.1,此時R0=0.925<1。圖4a與圖4b分別顯示了10組不同初始值情況下兩類謠言傳播節點的密度變化情況,三角代表謠言傳播穩態值。從圖中可以看出不同初始情況下,各密度曲線均收斂于一點,圖4c是一組初始值I1(0)=0.3,I2(0)=0.3,S(0)=0.3,R(0)=0下各類節點密度的演化曲線,S、I1、I2分別達到0.9、0、0,亦與圖4a、4b相吻合。

圖3 謠言狀態圖Fig.3 State diagram with rumor

圖4 無謠言狀態圖Fig.4 State diagram without rumor
圖3c顯示,當R0>1時,兩類傳播節點密度均逐漸上升達到峰值后開始下降,最后趨于穩定,即存在一個有謠言平衡點。圖4c表明,當R0<1時,盡管兩類傳播節點初始密度較大,謠言傳播節點密度仍逐漸下降,最后等于0,即系統只存在一個無謠言平衡點。
進一步探究R0>1時不同度的節點的演化情況,結果如圖5所示,度大的節點中謠言傳播節點的密度更大,即謠言在度大的節點之間傳播速度更快,感染峰值更大。這主要是因為度大的節點雖然每次和一個傳播謠言的鄰居節點接觸時被傳染的概率較低,但其有更多的機會與傳播節點接觸,導致謠言在度大的節點之間傳播速度更快、范圍更廣。

圖5 度為k的謠言傳播節點密度與時間的關系Fig.5 The relationship between the density of spreaders with degree k and time t
由傳播率的表達式可知參數θ與β對傳播過程有重要影響,當固定參數b=0.4,μ=0.04,λ1=0.9,λ2=0.5,τ1=0.6,τ2=0.4,γ1=0.05,γ2=0.07,η=0.1時,兩類傳播節點的總密度曲線如圖 6a所示,可以看出當θ或β減小時,傳播節點密度增大且傳播速度變快。這主要是因為謠言信度函數及節點親密度函數的存在,θ或β減小均會使接觸傳播率增大。當θ、β減小到0時即為傳統的同一常數傳播率,因此考慮謠言信度與節點親密度時,謠言傳播節點密度更小、傳播速度更慢。遺忘率η、辟謠率γ1與γ2對控制謠言傳播有重要作用,當固定參數b=0.4,μ=0.04,θ=0.6,β=0.8,λ1=0.9,λ2=0.5,τ1=0.6,τ2=0.4時,傳播節點密度曲線如圖6b所示,可以發現當γ1和γ2增大時,傳播者密度明顯下降,當η增大時,傳播者密度也會下降,但增大γ1與γ2比增大η時下降的效果更明顯;傳播達到峰值與穩態的時間幾乎相同。分析原因為:謠言傳播具有爆發性,達到峰值所需時間極短,因此無論是辟謠率還是遺忘率增加均對其影響均不大,但會降低峰值和最終穩態密度。因此,若要快速降低謠言傳播速度需從源頭出發,減小傳播率比增大遺忘率與辟謠率效果更好。

圖6 不同參數取值下傳播節點密度與時間的關系Fig.6 The relationship between the density of spreaders and time with different parameter values
對BA無標度網絡中基本再生數的敏感性分析如圖7所示,圖7a中的參數取值為μ=0.04,η=0.1,θ=0.6,β=0.6,τ1=0.6,τ2=0.4,λ1=0.16,λ2=0.09,γ1=0.04,γ2=0.06,得R0=1時注冊率為bc=0.081,R0隨b的增大而增大。圖7b中b=0.4,其余參數取值同圖7a,得R0=1時移出率為μc=0.069,R0隨μ的增大而減小。圖7c中b=0.4,γ1=0.08,γ2=0.12,其余參數取值同圖7a,得R0=1時遺忘率為ηc=0.054,R0隨η的增大而減小。因此減小注冊率b或增大注銷率μ、遺忘率η均能使R0小于1,即能有效地控制謠言的傳播。圖7d參數取值為γ1=0.08,γ2=0.12,其余參數取值同圖7a,當增大θ或β,R0能小于1,謠言能被控制住,這與第4.1節分析結果相同。

圖7 R0隨不同參數的變化Fig.7 R0 changes with different parameters

圖8 不同免疫策略下R0隨參數取值的變化Fig.8 R0 changes with different parameter values under immunization strategy
4.4.1 仿真網絡結構對傳播的影響
分別在ER隨機網絡[23]、WS小世界網絡[24]和BA無標度網絡上仿真實驗,3種網絡節點總數均為N=1 000,網絡平均度均為〈k〉=4,參數取值為b=0.4,μ=0.04,θ=0.6,β=0.6,λ1=0.9,λ2=0.5,τ1=0.6,τ2=0.4,γ1=0.05,γ2=0.07,η=0.1。分別隨機選取1%的度為4的I1、I2兩類節點作為初始傳播節點,傳播節點密度曲線如圖9a所示,BA網絡中傳播節點密度的峰值最大且傳播速度最快。這是因為BA網絡的度分布服從冪律分布,網絡中少數節點具有非常大的度(此類節點稱為Hub節點),一旦Hub節點被感染,其具有更多的機會與網絡其他節點接觸,傳播速度會明顯加快。
為探究網絡平均度對謠言傳播的影響,分別在平均度為10、20和30的WS小世界網絡上仿真分析,網絡節點總數均為N=1 000,分別隨機選取0.1%的I1、I2兩類節點作為初始傳播節點,參數取值同圖9a中參數取值,結果如圖9b所示。發現WS網絡平均度越大,傳播節點密度的峰值越大且達到峰值所需時間越短。因為當網絡平均度增大,節點間的接觸傳播率雖有所減小,但單位時間內節點之間相互接觸的概率增大,由于社會強化效應的存在,致使網絡中謠言傳播速度加快。

圖9 傳播節點密度與時間的關系Fig.9 The relationship between the density of spreaders and time t

表2 各網絡統計特征Tab.2 Statistical characteristics of each network

圖10 傳播節點密度與時間的關系Fig.10 The relationship between the density of spreaders and time t
4.4.2 真實網絡結構對傳播的影響
下面分別在四個真實網絡:爵士音樂家合作網絡(Jazz)、科學家合作網絡(選擇其中最大連通子圖Net-science)、洛維拉·依維爾基里大學成員郵件通信關系網絡(E-mail)和Facebook網絡上仿真分析,相關參數與節點初始比例與圖9a保持相同。表2列出了各網絡統計特征。
仿真結果如圖10所示,Facebook、Jazz與E-mail網絡中I(t)的峰值遠高于Net-science網絡,且達到峰值所需時間小于Net-science網絡,Net-science網絡中I(t)的穩態密度小于其他網絡,這是由于Net-science網絡平均度較小。E-email網絡中I(t)的穩態密度與傳播速度小于Facebook與Jazz網絡,是由于其網絡平均集聚系數較小。事實上,Net-science網絡中科學家的交流是基于科學家之間的研究方向與合作機會,其開放程度低于另外3個實際網絡,因此實驗結果與實際情況相符。對比圖10與圖9a可以發現真實網絡中傳播者峰值大體高于仿真網絡,這與文獻[16]結論一致,驗證了本文模型的有效性。
將同一常數傳播率應用到S2IR模型與傳統SIR模型進行對比實驗,SIR的傳播率、恢復率分別取S2IR中兩種傳播率、兩種恢復率的平均值,并將本文非一致傳播率S2IR模型與文獻[14]中的非一致傳播率SIR模型進行對比實驗,結果如圖11、圖12所示,帶*曲線均為非一致傳播。圖11反映,同一常數傳播率下,S2IR模型與SIR模型相比,I(t)峰值更低,傳播速度更慢;同一模型下,非一致傳播率比同一常數傳播率的I(t)峰值更低,傳播速度更慢;本文非一致傳播率S2IR模型與文獻[14]中的非一致傳播率SIR模型相比,I(t)峰值更低,傳播速度更慢。圖12反映,S2IR模型最終傳播規模比SIR模型小,非一致傳播率比同一常數傳播率最終傳播規模小。說明將傳播節點分成完全信謠與輕度信謠,或是將同一常數傳播率變為非一致傳播率時,謠言傳播速度與傳播規模均減小。

圖11 傳播節點密度與時間的關系Fig.11 The relationship between the density of spreaders and time t

圖12 傳播規模與時間的關系Fig.12 The relation between the scale of spreading and time t
考慮實際問題中謠言傳播的(接觸)傳播率具有非一致性以及謠言傳播節點的信謠程度存在差異的特點,本文結合復雜網絡理論和平均場理論提出一個基于網絡結構特征的社交網絡謠言傳播模型。該模型充分考慮了節點的度以及集聚系數,同時考慮了傳播節點本身的傳謠力度存在差異,更加符合現實社交網絡中謠言的傳播特點。利用建立的微分方程推導出了基本再生數,求出了隨機免疫與目標免疫下的基本再生數、對兩種免疫效果進行了對比分析。利用數值模擬驗證了理論分析的正確性。在BA網絡中仿真分析了網絡謠言傳播的特點,實驗表明謠言更容易在度大的節點之間傳播開。在隨機網絡、無標度網絡和小世界網絡中探究了不同網絡結構和WS網絡平均度大小對傳播的影響,發現BA無標度網絡中謠言傳播最快,WS網絡的平均度越大,謠言傳播節點密度峰值越大。進一步在真實網絡上仿真分析,驗證模型的有效性,并對S2IR與SIR模型進行了對比分析。
通過分析相關參數對謠言傳播的影響以及對基本再生數的敏感性分析,得到一些控制社交網絡謠言傳播的建議。參數θ或β增大會縮小謠言傳播范圍,θ和β一定時,謠言信度或節點親密度減小均會縮小謠言傳播范圍;辟謠率γ1、γ2或遺忘率η越大,謠言傳播規模越小,因此政府及相關部門應該加大辟謠力度,或者發布新的消息以增大遺忘率;必要時,控制用戶注冊率或增大注銷率,謠言傳播也能得以控制。若采取隨機免疫,則增大隨機免疫比例σ1或σ2能有效控制謠言傳播;若采取目標免疫,則增大免疫率δ或減小截斷值κ2能控制謠言傳播。
本文僅考慮將謠言傳播節點分為兩類,實際上,謠言未知節點抵抗謠言的能力即其被傳染的概率也存在差異,因此謠言未知節點也能進一步細分。沿著這個思路,我們下一步工作就是構造一個更加符合網絡謠言傳播的模型,以便更深入地發現網絡謠言傳播規律,進而提出更有效的控制網絡謠言傳播的建議。