999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于引力學的在線社交網絡空間謠言傳播分析模型

2017-12-08 05:58:26譚振華時迎成石楠翔楊廣明王興偉
計算機研究與發展 2017年11期
關鍵詞:用戶信息模型

譚振華 時迎成 石楠翔 楊廣明 王興偉

(東北大學軟件學院 沈陽 110819)

(tanzh@mail.neu.edu.cn)

基于引力學的在線社交網絡空間謠言傳播分析模型

譚振華 時迎成 石楠翔 楊廣明 王興偉

(東北大學軟件學院 沈陽 110819)

(tanzh@mail.neu.edu.cn)

社交網絡空間的謠言傳播行為具有極大的危害性,探索謠言傳播規律與分析模型成為當前研究的熱點之一.傳統謠言傳播分析模型大都基于SIR等傳染病傳播模型,能對在線社交網絡空間的謠言傳播過程進行粗粒度刻畫,但并未充分考慮社交網絡本身特征.鑒于此,結合引力學思想,提出了一種新的在線社交網絡空間謠言傳播分析模型GRPModel.該模型借鑒引力學思想,從用戶和謠言信息2個角度出發,探索謠言在用戶間的傳播規律.以用戶為核心,基于用戶間的關系、信息在用戶間的傳播關系、謠言接觸率、轉發率等對用戶影響力、謠言影響力進行建模,對謠言信息的傳播進行量化,并充分考慮用戶的個性化特征,構建相應的建模與分析函數.最后利用新浪微博真實社交網絡空間信息,對GRPModel進行分析驗證,驗證結果證明了所做模型的正確性和有效性.

謠言傳播模型;微博分析;在線社交網絡;信息擴散;引力學

隨著互聯網的快速發展,在線社交網絡(online social network, OSN)已深入到人們生產生活的方方面面.然而所滋生的一系列謠言正在侵蝕著人們的日常生活,沖擊著網絡與社會的正常秩序.相比日常社會中的謠言,網絡空間中的謠言傳播速度更快、波及范圍更廣、不可控因素更多,所以研究社交網絡空間中的謠言行為傳播規律,對控制謠言傳播具有積極意義.

隨著OSN平臺(如Twitter、Facebook、LinkedIn、新浪微博)的快速發展,其開放性催生了網絡空間的謠言傳播.在線社交網絡具有開放性特點,注冊用戶可以隨時發表或轉發微博信息.微博文章簡短,便于快速閱讀,迎合了移動互聯時代人們的閱讀認知方式.謠言傳播者利用在線社交網絡的以上特點,以社會問題等具有吸引力的信息為出發點,杜撰或篡改事實傳播微博謠言,有的甚至通過專業網絡推手進行策劃和發布,所以對社交網絡空間謠言傳播規律的探索成為了研究熱點.

針對在線社交網絡空間的謠言傳播特點,很多研究者基于傳染病傳播模型[1-8]展開了對網絡謠言傳播建模的研究,這些模型大都從易感、免疫、恢復3個維度刻畫謠言傳播的過程,大都是基于經典SIR(susceptible infected recovered)模型進行改進,在一定程度上可以刻畫社交網絡空間的謠言傳播規律,但在具體的社交網絡中卻遇到一定瓶頸.于是很多研究者引入其他自然科學領域相關模型展開了對謠言以及輿論傳播規律的探索,如勢能模型、遺傳學模型、羊群效應、彈性碰撞模型等[9-12].在我國,隨著新浪微博的快速發展,國內很多學者針對新浪微博信息傳播擴散的特點,通過數據挖掘、概率傳播、預測分析等方法對新浪微博進行了系列研究[13-18].然而,影響謠言傳播的因素眾多,在具體網絡空間的分析應用中,傳統模型仍需要在3個方面加強:

1) 社交網絡空間影響謠言傳播的因素有很多,但傳統模型沒有謠言個性化特征參數量化機制,都按照一個標準處理謠言,忽略了謠言的個性化參數;

2) 社交網絡中用戶對謠言的接觸率是隨著時間推進而遞減,并且在社交網絡中不是所有的用戶都是易感節點,只有接觸到謠言的用戶才有可能感染謠言,使之成為傳播節點;

3) 社交網絡用戶的個性化信息傳播行為是謠言在網絡空間中傳播的動力因素,所有用戶不能夠同等對待.

針對這3點不足,本文以真實的新浪微博謠言傳播數據為基礎,通過量化謠言特征以及用戶特征,對謠言的傳播進行建模,基于此提出了基于引力學的謠言傳播模型(gravity-inspired rumor propagation model, GRPModel),主要創新之處在于:

1) 從謠言和節點2方面進行傳播參數建模,對謠言的影響力、用戶的影響力、用戶之間的關系以及用戶與謠言之間的關系進行量化,細粒度刻畫謠言傳播的屬性;

2) 對用戶與謠言的接觸率進行函數建模,勾畫出用戶接觸率遞減曲線,從傳播過程角度分析謠言的傳播;

3) 對用戶的行為進行分析與建模,充分考慮每個用戶的個性化對謠言傳播的影響.

1 相關研究

在線社交網絡已經成為人們日常生活的一部分,社交網絡分析也成了近年來研究的熱點之一.近年來網絡謠言層出不窮,其帶來的影響也愈發嚴重,針對此現象廣大學者開始對網絡空間謠言的傳播規律進行細致的建模研究.

大多現有的模型是基于傳染病模型展開理論與實驗分析的.文獻[1]提出了一個基于BBV(barrat barthelemy vespignani)網絡謠言傳播模型,基于有權重的社交網絡模型展開,考慮BBV網絡遺忘機制,認為隨著遺忘率的增加,謠言的影響力逐漸降低,并得出了謠言在加權網絡中的傳播速度比其他網絡慢,而且在BBV網絡中謠言傳播存在閾值,與傳播機制無關.文獻[2]擴展了經典的SIR模型,在SIR模型中增加了從無知態到免疫態的直接聯系并通過節點的遺忘和記憶機制增加了休眠節點這一狀態.文獻[3]則在SIR模型的基礎上,將感染節點狀態分為積極感染和消極感染,并擴展SIR模型為SPNR(susceptible positive-infected negative-infected removed)模型,在SPNR模型中獲得了謠言的爆發閾值,在此基礎上提出了一種輿論引導的謠言控制策略.文獻[4]提出了8狀態的謠言傳播模型.除此之外,還有很多學者對SIR模型進行了不同程度的改進,如文獻[5-8].

很多學者將謠言傳播與其他領域模型相結合,構建了一系列有效的謠言傳播模型.文獻[9]提出了基于勢能的謠言傳播模型,該模型對信息的重要性、個人的辨識力以及信息的可信度進行了度量,但是該模型只是通過經驗意識判定2個節點的信任度和它們之間的距離成反比,而沒有對其信任度進行精確的建模度量.文獻[10]提出了社交網絡中基于遺傳學的謠言擴散模型,把一個帶有多條謠言的個體看作一個包含一系列基因的染色體,指定了染色體間的交互規則,以此來對個體間謠言的交互進行建模.文獻[11]研究了公眾輿論傳播中羊群行為的演化過程,運用羊群行為的演化模型來分析公眾網絡中的輿論傳播,并根據貝葉斯規則來分析這一過程.文獻[12]借鑒彈性碰撞過程中的能量傳輸模型提出了新的謠言擴散模型,綜合考慮了節點及謠言的歷史行為,對OSN中的謠言傳播過程進行了量化.

除此之外,很多學者對新浪微博傳播方式、用戶行為習慣開展了研究.文獻[13]對新浪微博的信息傳播進行分析與預測,挖掘了多種用戶以及微博特征并對其做了詳細的分析,以基于用戶屬性、社交關系和微博內容3類綜合特征為基礎對用戶的轉發行為進行預測.文獻[14]以真實新浪微博謠言為基礎,對采集到的新浪謠言微博數據進行了不同角度的分析統計,研究了謠言的影響力及其產生與消亡的特點,對新浪微博謠言進行了比較全面的定量分析研究,最后提出了一套綜合機器智能和群體智能的自動辟謠框架.文獻[15]基于微博平臺提出了基于把關人行為的微博虛假信息及早檢測方法,利用模型狀態持續時間概率為Gamma分布的隱半馬爾可夫模型來刻畫信息轉發者和評論者對流行的真實信息的把關行為,對微博用戶節點的行為進行了詳細的分析與建模.文獻[16]在微博平臺上提出了基于PageRank和用戶行為分析的微博用戶影響力算法,對微博用戶的影響力進行了詳細的量化.文獻[17]對新浪微博的用戶行為進行了分析,例如發表微博的驅動力等.文獻[18]對新浪微博用戶從用戶的信息傳播能力的角度進行劃分,用戶最終被分類為普通用戶、橋梁用戶和核心用戶.文獻[19]中作者用數學的方法來描述和預測用戶行為,并引進羊群效應、曝光效果、好奇心等,提出一種不對稱的用戶興趣模型.

獨立級聯(independent cascade, IC)模型[20-22]作為信息擴散模型的一種,在信息擴散乃至謠言擴散領域應用十分廣泛.在IC模型中,信息的傳播是這樣定義的,每個初始激活節點會產生自己獨立的擴散級聯,級聯之間是相互獨立,互不干擾的.例如:在網絡拓撲中,初始節點都是休眠節點,且每個節點被激活的概率分別為p(·),假設u作為起始節點,在時刻t節點u會以一定的概率p(u,v)去激活它的每一個粉絲節點v,如果在時刻t,粉絲節點v的多個上游節點同時要激活它,那么這些上游節點會隨機排隊去嘗試激活,所有的激活嘗試都在時刻t內完成.無論上游節點是否成功激活粉絲節點v,在隨后的任意時間都不會再去嘗試激活粉絲節點v,如果粉絲節點v在時刻t被激活,那么該節點會在時刻t+1去激活它的粉絲節點,該進程直到不再有激活行為發生而終止,這整個的信息擴散過程就稱為IC模型.

本文所提模型是對IC模型的擴展,在上游節點去激活下游粉絲節點之前加入了接觸率這一概念,只有接觸到上游節點謠言微博的粉絲用戶才有機會被激活,并且接觸率是個動態的數值,每一時刻下游粉絲節點對上游節點所原創、轉發謠言微博的接觸率都不同.

綜上,本文是將謠言傳播與物理學理論相結合,其中更側重于量化謠言的性質與用戶節點的性質,并對用戶和謠言的關系進行詳細的量化與建模,充分分析用戶節點的網絡行為,在各特征值量化的基礎上進行謠言傳播模型的構建,從而探尋新浪微博謠言的傳播規律以及用戶節點的轉發規律,為今后的微博謠言的控制提供一些新的思路.

2 從萬有引力到GRPModel

本節首先介紹萬有引力,在此啟發下結合在線社交網絡謠言傳播規律提出GRPModel.

2.1GRPModel思想來源

萬有引力定律表明,任意2個質點通過連心線方向上的力相互吸引.GRPModel的思想來源于萬有引力定律在人造衛星中的應用.人造衛星從發射到入軌過程中,當速度達到第一宇宙速度時,人造衛星就會擺脫地球的引力,圍繞地球做勻速圓周運動.若發射速度大于等于第二宇宙速度,則人造衛星就會擺脫地球吸引力的束縛,從而擺脫地球飛向太陽系,成為繞太陽運行的人造衛星.簡單地說,人造衛星擺脫地球引力的方式有2種:1)在發射階段,就以大于等于第一宇宙速度發射;2)衛星在軌道上運行時,人造衛星二次點火做正功,使其速度足以擺脫地球的引力.

本文將萬有引力模型與謠言傳播模型相結合,以萬有引力模型中的行星表示謠言傳播模型中的用戶節點,以人造衛星表示謠言傳播模型中的謠言rumor,以人造衛星圍繞行星運轉的情況表示謠言在用戶節點之間的傳播轉發關系,從而面向在線社交網絡提出新的謠言傳播分析模型GRPModel.

2.2基于萬有引力的謠言傳播擴散模型

文獻[2-8]中闡述了在線社交網絡中謠言傳播的動態性與傳統流行性病毒傳播的動態性不同,在線社交網絡中,用戶節點任意時刻面對謠言所處的狀態可能為以下3種:1)沉默狀態,即用戶節點沒有接觸到謠言時的狀態,由于種種原因可能會使用戶節點遺漏掉部分上游節點所傳播的謠言;2)接觸狀態,即用戶節點接觸到謠言的狀態,接觸狀態下的用戶節點又根據自己的興趣愛好或者行為習慣選擇轉發該謠言或不轉發該謠言這2種子狀態;3)免疫狀態,即用戶節點傳播完謠言時的狀態和用戶節點接觸了謠言但沒有傳播謠言的狀態.該現象和萬有引力模型中行星所處的狀態非常相像,在萬有引力模型中,行星也有3個可能的狀態,沒有捕獲到人造衛星、捕獲到人造衛星并且人造衛星在其軌道上做勻速圓周運動、捕獲到人造衛星但人造衛星二次點火脫離該行星的萬有引力.因此,在GRPModel中,用戶節點的狀態集可以定義為沉默狀態,接觸狀態,免疫狀態,其中接觸狀態又可以分為接觸不轉發狀態,接觸轉發狀態這2個子狀態.

定義謠言的原創用戶為u,其粉絲節點為v.在時刻t選取節點u為謠言擴散的種子節點,將u發表謠言看作是謠言rumor在節點u上發射,這時的rumor會脫離u的引力,奔向其粉絲節點v的引力場,此時表示謠言產生.在時刻t+1,謠言以概率p(·)進入節點v的引力場,其中p(·)則是根據節點v的活躍度、網絡行為習慣量化的,并且在時刻t+1,粉絲節點v面對謠言會有2個選擇:1)不轉發此條謠言;2)選擇轉發此條謠言.

重復以上步驟,即為GRPModel的擴散過程.GRPModel中,將謠言影響力充當rumor圍繞u運動的軌道半徑,將用戶節點u影響力的加權值充當球體u上的重力加速度,更多的關于這些參數的描述和數學建模,將在第3節詳細闡述.

3 GRPModel的數學形式化

3.1謠言傳播建模

3.1.1 用戶的綜合影響力建模

節點的性質包括節點的認證聲譽度、活躍度、節點粉絲數等,本節將對節點的性質進行定義建模.

定義1. 認證聲譽度.CR(u)∈[0,1]表示用戶u的認證聲譽度.

新浪微博用戶的認證類型有很多類型(主流有11種),認證作為用戶聲譽的基本保證形式.本文將新浪微博的認證類型按認證的難易程度分為{高,中,低}3大類.‘高’類對應{政府,團體(機構)}等認證;‘中’類對應{名人,企業,媒體,校園,網站,應用}等認證;‘低’類對應{微女郎,初級達人,中高級達人}等認證.{Chigh,Cmiddle,Clow}對應{高,中,低}3類認證的聲譽值,Cnull表示無認證用戶的聲譽值,且Chigh+Cmiddle+Clow+Cnull=1,由謠言分析員按數據集實際情況分析判斷具體值.根據u的認證類型對應的{Chigh,Cmiddle,Clow,Cnull}值確定u的認證聲譽度CR(u).

定義3. 影響力覆蓋指數.Q(u)表示用戶u的影響力覆蓋指數,用u的粉絲數|Nout(u)|的常用對數來表示,即:

Q(u)=lg|Nout(u)|+1.

定義4. 微博產出量影響力.IF(u)表示用戶u的微博產出量影響力.

定義5. 綜合影響力.Eu表示用戶u的綜合影響力,由IF(u),|Nout(u)|,CR(u)組成,即:

Eu=IF(u)×|Nout(u)|×CR(u).

可以看出,發博數越多,粉絲數越多,認證聲譽度越高,則用戶u的綜合影響力Eu越高.

3.1.2 用戶的謠言接觸率建模

用戶對謠言的接觸率對是否傳播謠言有重要影響.本文從用戶的活躍性及上游信息對謠言接觸的干擾性兩方面對謠言接觸率進行建模.

定義6. 發博概率.ε(η)表示24h中任意時刻(以h為單位)以均值為基準的發博概率.

為了能夠比較準確地描述用戶的網絡行為習慣,本文采用新浪微博官方提供的微博用戶日常發博行為習慣數據來描述用戶在1 d之中的任意時刻發博概率分布,圖1是2015年度新浪微博用戶發展報告[24]所給出的2015年度用戶日常發博行為習慣.不難看出,在凌晨1:00—6:00時段,多數微博用戶處于靜默狀態,這一時間段微博平臺產出的微博總量相對較低;在9:00—23:00時段,多數微博用戶處于活躍狀態.

Fig. 1 Users’ daily habit of publishing micro-blogging圖1 微博用戶日常發博行為習慣

以圖1所示的平均值為基準,確定每個時刻用戶的發博概率,結果如表1所示:

Table 1 Probability Distribution of Publishing Micro-Blogging表1 微博用戶日常發博概率分布

其中,η∈[00:00,23:00],表示以小時為單位的任意某個時刻.本文所提模型中的時刻都以η表示,其本質是1h內的時間段,以整點小時為計算依據.

定義8. 微博信息更新屏數.page(u,η)表示用戶u在時刻η所獲取的微博信息更新屏數.令用戶u每屏所展示的微博數量為Numpage(u)條,則:

其中ξ為衰減速度,ξ越大,衰減越快.可以看出,活躍度越高,衰減率越低,謠言接觸率越高.

3.1.3 謠言影響力建模

謠言影響力是謠言信息本身被用戶接受的能力.本文從謠言所屬信息類型受歡迎的程度、信息本身包含的敏感特征2個角度對謠言影響力建模.

定義10. 歡迎程度.L(rumor)表示謠言所屬信息類受歡迎的程度.

1) 采用樸素貝葉斯分類算法[25]對含有n條樣本微博的數據集進行文本分類.Xi=(x1,x2,…)表示每條微博信息info(i)的分詞形成的向量.令Class={classj|j∈[1,m]}表示微博的m個類別集合.則:

(9)

選擇最大概率對應的分類作為微博信息info(i)所屬的類別class(info(i)).

3) 按照式(9)方法得到謠言rumor對應類別,按照主成分分析獲得對應得分Srumor.令謠言受歡迎程度的范圍為[Lmin, Lmax],則:

(10)

謠言的影響力主要取決于謠言文本的描述,謠言描述的越接近真實,其越容易被用戶所相信,越容易被用戶所轉發.微博謠言可能會含有@符、圖片、視頻,這些特征因子的存在會增加用戶轉發此謠言的概率.令Inc_@,Inc_Image,Inc_Video分別表示歷史謠言信息中包含@符、圖片、視頻的謠言轉發數量,NonInc表示不包含@符、圖片、視頻的謠言信息數量.用k(rumor)表示包含@符、圖片、視頻情況下的謠言影響力增量,即:

定義11. 謠言影響力.Erumor表示謠言rumor的影響力,由謠言對應信息類別的受歡迎程度及特征因子增量組成,即:

Erumor=L(rumor)+k(rumor).

3.2GRPModel傳播擴散過程

用gu表示用戶u上的重力加速度,表示如下:

在本文中傳播用戶具有2種屬性狀態,分別為原創用戶和2度轉發用戶.

隨著v對謠言rumor的接觸,v可以選擇轉發謠言和不轉發謠言.

用rset表示v所接觸過的謠言集合,則用戶u上的謠言rumor被下游節點v轉發的概率為

(22)

因為用戶節點轉發謠言的概率會伴隨著時間而衰減,所以此處添加時間衰減函數[26],最終得到間隔ts時間步時下游用戶v轉發u的謠言的概率:

4 實驗結果與分析

本節設計了5個實驗分別驗證本文所提模型,包括驗證用戶影響力、謠言影響力、各類參數對謠言傳播的影響.表2是對所做實驗的描述:

Table 2 Experimental Description表2 實驗描述

4.1實驗1:謠言影響力算法的有效性驗證

4.1.1 信息的受歡迎程度

謠言文本分析采用開源ICTCLAS2016系統[27],它的功能主要包括漢語分詞、詞性標注等.為了更好地識別出命名實體,本文對ICTCLAS的分詞詞典進行了擴充,新增專有名詞50 520個.

統計微博受眾差異的語料是從“新浪頭條”采集得到,時間跨度為2015-06-01—2015-12-31,共計3 600余條微博信息.首先統計出每類別微博信息的轉發、評論以及點贊數量的均值,從而確定每類微博信息的受歡迎程度.利用統計分析軟件SPSS19.0進行主成分分析,如表3所示.為了使變量累計貢獻率達到80%以上,本文選擇前2個因子,最終得出如表4所示綜合評分.本文以表4所示的每類微博的綜合評分根據式(10)得到最終的謠言受歡迎程度,其中受歡迎程度的范圍[Lmin,Lmax]設為[30,80].

Table 3 List of Total Variance Explained of Data表3 數據的解釋總方差

Table 4 List of Comprehensive Ratings表4 數據的綜合評分

從表4可以看出,體育類、養生百科類、突發災難類、八卦娛樂類和社會萬象類微博信息的受歡迎程度L(rumor)比較高,基本符合廣大微博用戶的興趣點;而財經類、政治熱點類、拍案反腐類微博信息的L(rumor)比較低,這一類的信息被微博用戶轉發的量比較低.

① 具體謠言內容在論文評審階段已提交,鑒于安全考慮,在論文發表階段采用編號Ra, Rb分別代替.

4.1.2 謠言影響力特征因子權值設定

本文從新浪微博社區管理中心[28]抓取了跨度從2015-08-15—2016-08-08共計2 138條被舉報的真實微博謠言,抓取的數據格式包括用戶名、發表時間、謠言內容、圖片鏈接URL、轉發數、評論數、點贊數.經統計,所抓取的微博謠言樣本庫的平均轉發數為46,平均評論數為18,平均點贊數為28.我們對2 138條謠言信息中所有轉發信息進行了統計:

1) 含有@符的謠言轉發數Inc_@=63;

2) 含有圖片的謠言轉發數Inc_Image=68;

3) 含有視頻的謠言轉發數Inc_Video=145;

4) 不含有這3類特征的謠言轉發數為NonInc=9.

含有@符、圖片以及視頻的謠言被轉發量要大于不含這些特征因子的謠言,并且不同的影響力特征因子對謠言影響力所帶增量不同,實驗統計得出謠言影響力增量k(rumor)=30.7,可以看出識別謠言中的影響力特征因子對定量謠言的影響力十分重要.

4.2實驗2:用戶影響力算法的有效性驗證

為了計算用戶影響力,我們追蹤了2條謠言①的傳播軌跡,編號分別為Ra,Rb.謠言Ra發表于2015-08-15T18:08,截至2016-03-13已有25 200次轉發、7 057次評論以及60 050次點贊;謠言Rb發表于2015-08-19T02:12,截至2016-03-12已有13 874次轉發、6 128次評論以及9 376次點贊.本文分別抓取了這2條微博謠言的所有轉發用戶的基本信息,包括其粉絲數量、轉發時間以及轉發節點的基本信息等.此外本文還隨機抓取了10條轉發量大于10 000條的非謠言微博的轉發用戶信息,記為Infor1~Infor10.這12條信息及其轉發信息形成了12個樣本數據集,在此基礎上我們驗證了用戶影響力Eu的有效性.該實驗所需要的參數詳細定義如表5所示:

Table 5 Parameters of Experiment of Eu表5 Eu參數列表

我們使用Spearman等級相關系數來驗證Eu的準確率,以真實轉發量作為考量依據,并以粉絲數充當用戶影響力作為對比實驗.基于Spearman,轉發數與粉絲數、轉發數與用戶影響力Eu的等級相關性結果如表6所示:

Table 6 Significant Correlation Coefficients of

通過Spearman等級相關性分析可以看出,用戶粉絲數以及Eu與真實謠言轉發量都有很強的相關性,并且Eu與謠言轉發量之間的相關性要高于粉絲數量與謠言轉發量之間的相關性,即:用戶影響力越高其轉發的謠言被2次轉發的數量越多.其中非謠言微博數據集下,用戶影響力Eu與微博的轉發量之間的等級相關性大于0.41,所以加入了認證聲譽度量以及用戶活躍性度量的影響力更具說服力.

4.3實驗3:用戶的謠言接觸率有效性驗證

該實驗主要驗證所提用戶的謠言接觸率的有效性.分別取ξ=1/6,ξ=1/12,ξ=1/24,以驗證式(8)中ξ值對接觸衰減率的影響.實驗結果如圖2所示:

Fig. 2 Decay curves of the contact rates圖2 接觸率衰減曲線

通過實驗得出當ξ=1/12時,實驗結果擬合真實情況,所以選定參數ξ=1/12.接下來,利用謠言Ra所抓取的22 516個粉絲數據,計算其上游用戶的接觸率并求出其平均值,分別對比結合ε(η)與未結合ε(η)的接觸率情況.結果如圖3所示:

Fig. 3 Trends of user’s contact rate with time圖3 用戶對謠言接觸率隨時間變化曲線

可以看出本文所設計的用戶接觸率算法更符合微博用戶使用微博的時間習慣,即在01:00—07:00時,用戶基本都處于靜默狀態,而到了早晨7點左右,用戶使用微博的頻率又開始上升,并且總體下降趨勢符合對比實驗中的隨時間指數下降算法擬合出來的衰減變化曲線.但未考慮用戶使用微博時間習慣的算法所計算出來的用戶接觸率只是簡單地隨著時間而指數下降,這種下降趨勢不符合用戶使用微博的行為習慣.

4.4實驗4:各參數對謠言傳播的影響

Fig. 4 Experimental data topology圖4 實驗數據拓撲

該實驗主要驗證各類參數對謠言傳播的影響,包括用戶接觸率、上游用戶影響力、謠言影響力對謠言傳播的影響.模擬實驗數據選用謠言Ra的用戶真實數據.本數據集利用北京大學PKUVIS微博可視分析工具[29]采集得到,并得到謠言轉發的網絡拓撲圖,拓撲圖如圖4所示:

4.4.1 接觸率對謠言傳播的影響

圖5描述了每一時刻接觸到謠言的用戶概率密度統計結果.可以看出,整個社交網絡的用戶接觸率遞減曲線基本符合實驗3所得結果,即用戶節點在早晨時刻的活躍度會有小幅上升的趨勢.圖6描述了接觸率在CP和2CP情況下用戶接觸謠言的累積密度變化曲線,圖7描述了接觸率在CP和2CP情況下用戶感染謠言的累積密度變化曲線.

Fig. 5 Density of rumor contacted users圖5 接觸謠言的用戶密度趨勢

Fig. 6 Cumulative density of rumor contacted users圖6 接觸謠言的用戶累積密度趨勢

Fig. 7 Cumulative density of rumor infected users圖7 感染謠言的用戶累積密度趨勢

從實驗結果可以看出,用戶初始階段對謠言的高接觸率對謠言的傳播影響比較大,但隨著時間的流逝,高接觸率所帶來的感染謠言的用戶數量會逐漸趨于穩定,并且高接觸率會加速謠言的擴散.

4.4.2 上游用戶影響力對謠言傳播的影響

為驗證上游用戶影響力對謠言傳播的影響,本實驗中,初始用戶u0=3 876 165 335 330 640,謠言影響力Erumor=0.5,取上游用戶影響力為Eu,Eu+0.1以及Eu+0.2.如果Eu+0.1≥1或者Eu+0.2≥1,則取Eu=1.在NetworkX中分別對這3個用戶影響力情況進行模擬.圖8、圖9分別是該條件下感染謠言的用戶概率密度和累計概率密度結果.

Fig. 8 Density of rumor infected users under different Eu圖8 不同Eu情況下的感染謠言的用戶密度

Fig. 9 Cumulative density of rumor infected users under different Eu圖9 不同Eu情況下的用戶感染累積密度

從圖8看出,上游用戶即關注用戶的影響力越大,謠言擴散得越快,在每一時刻感染的用戶越多,所以上游用戶的影響力對謠言的傳播起促進作用,這也充分說明在謠言擴散建模方面,需要考慮上游用戶的用戶影響力,這也為以后的謠言控制提供了些許建議,如何能識別出社交網絡中的高影響力用戶并對其加以控制,就能在一定程度上控制謠言的傳播.從圖9可以看出,排除其他因素,謠言最終的影響范圍與用戶的影響力存在著緊密的關聯.

4.4.3 謠言影響力對謠言傳播的影響

該實驗主要為了驗證謠言影響力對謠言傳播的影響.本實驗中,初始用戶u0=3 876 165 335 330 640,謠言影響力分別取Erumor=0.5,Erumor=0.6,Erumor=0.7.在NetworkX中分別對這3個謠言影響力情況進行模擬.圖10、圖11分別是該條件下感染謠言的用戶概率密度和累計密度結果.

Fig. 10 Density of rumor infected users under different Erumor圖10 不同Erumor情況下感染謠言的用戶密度

Fig. 11 Cumulative density of rumor infected users under different Erumor圖11 不同Erumor情況下感染謠言的用戶累積密度

Fig. 12 Experimental social graph圖12 實驗網絡圖

從圖10可以看出,謠言影響力作為謠言傳播擴散模型中的最重要特征,它的大小也和謠言影響范圍緊密相關.從圖11可以看出,謠言的影響力越大,其所影響到的用戶總數也是越多的,所以謠言的影響力對謠言的傳播也起到了促進作用.

4.5實驗5:GRPModel與SIR及SPNR的性能比對

本節通過對比GRPModel、經典SIR模型以及SPNR模型驗證GRPModel的正確性和有效性.我們在4.2節所抓取到的用戶信息數據集的基礎上利用Gephi[30]開源軟件模擬生成了一份包含500個節點以及6 325條邊的社交網絡數據,如圖12所示.本文將采用此數據集進行模型對比實驗.

而SPNR[3]模型中定義整個社交網絡中的節點有4種狀態,分別是易感節點S、積極感染節點Ip、消極感染節點In、免疫節點R.由易感節點轉變為積極感染節點的概率為λ1,由易感節點轉變為消極感染節點的概率為λ2,由積極感染節點轉變為消極感染節點的概率為μ1,由消極感染節點轉變為積極感染節點的概率是μ2,由積極感染節點轉變為免疫者的概率為β1,由消極感染節點轉變為免疫者的概率為β2.

對比實驗的詳細參數如表7所示.利用NetworkX在模擬數據集上對GRPModel以及SIR模型和SPNR模型進行模擬,圖13描述了相關結果.

Table 7 Parameters of Comparison Experiment表7 對比實驗參數列表

Fig. 13 Rumor propagation performance of GRPModel, SIR model and SPNR model圖13 GRPModel、SIR模型以及SPNR模型的謠言傳播對比

從圖13可以看出,通過與經典SIR模型以及SPNR模型的對比實驗,本文所提出的GRPModel與SIR模型以及SPNR模型所模擬的謠言傳播的變化趨勢類似,即感染謠言的用戶數都是先經過一個波峰,然后緩慢下降.然而相對于SIR模型與SPNR模型,GRPModel在謠言傳播的模擬中更符合真實情況,即謠言的傳播在用戶活躍度普遍較高的早晨可能會出現一個小高峰,這種情況的出現是因為GRPModel在用戶接觸率這一參數下考慮了用戶的行為習慣.

5 總結與展望

在線社交網絡的謠言傳播對人們的生活具有很強的破壞作用.傳統的基于傳染病的謠言傳播分析模型未考慮社交網絡中節點的特征,并不適合在線社交網絡的謠言傳播分析.本文受引力學思想啟發,從用戶和謠言信息2個角度出發,探索了一種新的面向社交網絡謠言傳播分析的模型GRPModel.本文以新浪微博謠言為研究對象,以對謠言的參數度量和傳播節點的參數度量為主要出發點,其中包括謠言微博的影響力計算、用戶節點的影響力計算、用戶對謠言的接觸率建模,最后提出基于引力學的謠言傳播模型,并通過實驗驗證本文所提模型的合理性與有效性.

通過實驗可以看出,謠言的影響力在謠言的傳播過程中起著非常重要的作用,影響力越高的謠言其傳播范圍越廣,當然用戶對謠言的接觸率也是一個不可忽略的因素,通過實驗證實整個社交網絡用戶節點的接觸率也會對謠言的傳播起促進作用,即高接觸率會使謠言的傳播范圍更快更廣.此外,上游節點的用戶影響力也在謠言傳播過程中起著舉足輕重的作用.

GRPModel基于新浪微博網絡進行建模,其方法亦可用于其他社交網絡平臺的謠言分析.

[1]Zhao Laijun, Wang Xiaoli, Qiu Xiaoyan, et al. A model for the spread of rumors in barrat barthelemy vespignani (BBV) networks[J]. Physica A: Statistical Mechanics and Its Applications, 2013, 392(21): 5542-5551

[2]Zhao Laijun, Wang Jiajia, Chen Yucheng, et al. SIHR rumor spreading model in social networks[J]. Physica A: Statistical Mechanics and Its Applications, 2012, 391(7): 2444-2453

[3]Bao Yuanyuan, Yi Chengqi, Xue Yibo, et al. Precise modeling rumor propagation and control strategy on social networks[G]Applications of Social Media and Social Network Analysis. Berlin: Springer, 2015: 77-102

[4]Zhang Nan, Huang Hong, Su Boni, et al. Dynamic 8-state ICSAR rumor propagation model considering official rumor refutation[J]. Physica A: Statistical Mechanics and Its Applications, 2014, 415: 333-346

[5]Zhao Laijun, Wang Qin, Cheng Jingjing, et al. Rumor spreading model with consideration of forgetting mechanism: A case of online blogging LiveJournal[J]. Physica A: Statistical Mechanics and Its Applications, 2011, 390(13): 2619-2625

[6]Xia Lingling, Jiang Guoping, Song Bo, et al. Rumor spreading model considering the importance and fuzziness of information[C]Proc of the 9th Int Conf on P2P, Parallel, Grid, Cloud and Internet Computing. Piscataway, NJ: IEEE, 2014: 161-166

[7]Wang Jiajia, Zhao Laijun, Huang Rongbing. 2SI2R rumor spreading model in homogeneous networks[J]. Physica A: Statistical Mechanics and Its Applications, 2014, 413: 153-161

[8]Hong Weijun, Gao Zhipeng, Hao Yuwen, et al. A novel SCNDR rumor propagation model on online social networks[C]Proc of IEEE Int Conf on Consumer Electronics-Taiwan. Piscataway, NJ: IEEE, 2015: 154-155

[9]Wang Li, Liu Fengming, Yang Rongrong, et al. Research on spreading mechanism of network rumors based on potential energy[C]Proc of Int Conf on Cyber-Enabled Distributed Computing and Knowledge Discovery. Piscataway, NJ:IEEE, 2015: 282-285

[10]Wang Yannan, Chen Xiuzhen, Li Jianhua. A new genetic-based rumor diffusion model for social networks[C]Proc of Int Conf on Cyber Security of Smart Cities, Industrial Control System and Communications. Piscataway, NJ: IEEE, 2015: 1-5

[11]Li Yong, Li Li, Zou Kai. Modeling and analysis the evolution of herding behavior in public opinion propagation[C]Proc of Int Conf on Cyber - Enabled Distributed Computing and Knowledge Discovery. Piscataway, NJ: IEEE, 2015: 277-281

[12]Tan Zhenhua, Ning Jingyu, Liu Yuan, et al. ECRModel: An elastic collision-based rumor-propagation model in online social networks[J]. IEEE Access, 2016, 4(1): 6105-6120

[13]Cao Jiuxin, Wu Jianglin, Shi Wei, et al. Sina microblog information diffusion analysis and prediction[J]. Chinese Journal of Computers, 2014, 37(4): 779-790 (in Chinese)(曹玖新, 吳江林, 石偉, 等. 新浪微博網信息傳播分析與預測[J]. 計算機學報, 2014, 37(4): 779-790)

[14]Liu Zhiyuan, Zhang Le, Tu Cunchao, et al. Statistical semantic analysis of Chinese social media rumor[J]. Scientia Sinica: Informationis, 2015, 45(12): 1536-1546 (in Chinese)(劉知遠, 張樂, 涂存超, 等. 中文社交媒體謠言統計語義分析[J]. 中國科學: 信息科學, 2015, 45(12): 1536-1546)

[15]Xie Bolin, Jiang Shengyi, Zhou Yongmei, et al. Misinformation detection based on gatekeepers’ behaviors in microblog[J]. Chinese Journal of Computers, 2016, 39(4): 730-744 (in Chinese)(謝柏林, 蔣盛益, 周詠梅, 等. 基于把關人行為的微博虛假信息及早檢測方法[J]. 計算機學報, 2016, 39(4): 730-744)

[16]Huang Lijuan, Xiong Yeming. Evaluation of microblog users’ influence based on pagerank and users behavior analysis[J]. Advances in Internet of Things, 2013, 3(2): 34-40

[17]Yan Qiang, Wu Lianren, Zheng Lan. Social network based microblog user behavior analysis[J]. Physica A: Statistical Mechanics and Its Applications, 2013, 392(7): 1712-1723

[18]Qi Chao, Chen Hongchang, He Chenglong, et al. Role analysis of social network users based on neighborhood dissemination capability[C]Proc of the 5th Int Conf on Software Engineering and Service Science. Piscataway, NJ: IEEE, 2014: 1084-1087

[19]Zhang Nan, Chai Yueting, Liu Yi, et al. Modeling follow and forward behaviors of micro-blog user[C]Proc of Int Conf of Management Science and Engineering. Piscataway, NJ: IEEE, 2013: 113-119

[20]Kempe D, Kleinberg J, Tardos é. Maximizing the spread of influence through a social network[C]Proc of the 9th Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2003: 137-146

[21]Saito K, Nakano R, Kimura M. Prediction of information diffusion probabilities for independent cascade model[C]Proc of the 12th Int Conf on Knowledge-Based Intelligent Information and Engineering Systems. Berlin: Springer, 2008: 67-75

[22]Lü Shunming, Pan Li. Influence maximization in independent cascade model with limited propagation distance[G]Web Technologies and Applications. Berlin: Springer, 2014: 23-34

[23]Chen Wei, Lakshmanan L V S, Castillo C. Information and Influence Propagation in Social Networks[M]. San Rafael, CA: Morgan amp; Claypool Publishers, 2013: 9-35

[24]Fan Bo. Users report of sina Weibo in 2015[EBOL]. (2015-12-21)[2016-05-10]. http:data.weibo.comreportreportDetail?id=304 (in Chinese)(樊博. 2015微博用戶發展報告[EBOL]. (2015-12-21) [2016-05-10]. http:data.weibo.comreportreportDetail?id=304)

[25]Zhang Haiyi, Li Di. Naive Bayes text classifier[C]Proc of Int Conf on Granular Computing. Piscataway, NJ: IEEE, 2007: 708-708

[26]Goyal A, Bonchi F, Lakshmanan L V S. Learning influence probabilities in social networks[C]Proc of the 3rd ACM Int Conf on Web Search and Data Mining. New York: ACM, 2010: 241-250

[27]NLPIR-team. NLPIR big data search amp;mining development platform[EBOL]. [2016-05-10]. https:github.comNLPIR-teamNLPIR

[28]Sina Weibo[EBOL].[2016-05-10]. http:service.account.weibo.com

[29]Ren Donghao, Zhang Xin, Wang Zhenhuang, et al. WeiboEvents: A crowd sourcing weibo visual analytic system[C]Proc of IEEE Pacific Visualization Symp. Piscataway, NJ: IEEE, 2014: 330-334

[30]Gephi. The open graph Viz platform[EBOL]. (2016-02-15) [2016-06-10]. https:gephi.org

TanZhenhua, born in 1980. PhD. Associate professor. Member of CCF. His main research interests include networking behavioranalysis, information security and distributed secret sharing.

ShiYingcheng, born in 1991. Master candidate. His main research interests include networking behavior analysis and rumor propagating modeling.

ShiNanxiang, born in 1993. Master candidate. His main research interests include data mining and distributed secret sharing scheme.

YangGuangming, born in 1961. Professor. His main research interests include information security and computer operating system.

WangXingwei, born in 1968. PhD. Professor. Senior member of CCF. His main research interests include future Internet technology, cloud computing and information security.

RumorPropagationAnalysisModelInspiredbyGravityTheoryforOnlineSocialNetworks

Tan Zhenhua, Shi Yingcheng, Shi Nanxiang, Yang Guangming, and Wang Xingwei

(College of Software, Northeastern University, Shenyang 110819)

The influence of rumor propagation in online social networks (OSN) could result in great damage to social life, and it has been a hot topic to discover rumor propagation pattern. Traditional Epidemic-like rumor propagation models based on SIR, are generally coarse-grained for OSN but do not fully consider the features of OSN, such as personalization dimensions of users’ behavior and information attributes. Inspired by gravity theory, this paper proposes a novel rumor propagation analysis model named gravity-inspired rumor propagation model (GRPModel), and tries to find a new pattern of rumor propagation from the perspectives both of users’ properties and rumors’ attributes. In GRPModel, user influence and rumor influence are modeled mathematically by user relations and information attributes, and fully consider their personalized features. We collect experimental real data from Sina Weibo, which is a famous OSN in China, and investigate features of users and real rumors. Experiments prove the effectiveness and efficiency.

rumor propagation model; micro-blogging analysis; online social network (OSN); information diffusion; gravity theory

2016-06-16;

2016-12-09

國家自然科學基金青年科學基金項目(61402097);國家杰出青年科學基金項目(61225012,71325002);中央高校基本科研業務費專項資金項目(N151708005,N151604001)

This work was supported by the National Natural Science Foundation of China for Young Scientists (61402097), the National Science Foundation for Distinguished Young Scholars (61225012, 71325002), and the Fundamental Research Funds for the Central Universities (N151708005, N151604001).

TP393

猜你喜歡
用戶信息模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 日韩毛片在线播放| 国产不卡网| 日韩成人高清无码| 丁香五月婷婷激情基地| 免费网站成人亚洲| 日韩福利在线观看| 日韩在线欧美在线| 精品一区二区三区视频免费观看| 伊人婷婷色香五月综合缴缴情| 国产女同自拍视频| 97se亚洲| 亚洲狼网站狼狼鲁亚洲下载| 亚洲成a人片在线观看88| 无码高潮喷水在线观看| 美女内射视频WWW网站午夜| 亚洲天堂久久| 国产嫩草在线观看| 福利一区在线| 日韩小视频在线播放| 亚洲欧美人成电影在线观看| 国产美女91呻吟求| 久久综合丝袜日本网| 中国一级特黄大片在线观看| 久久久久中文字幕精品视频| 日韩激情成人| 亚洲AV无码乱码在线观看裸奔| AV片亚洲国产男人的天堂| 日韩精品一区二区三区免费| 看av免费毛片手机播放| 91久久偷偷做嫩草影院| 国产精品不卡片视频免费观看| 夜夜操国产| 国产精品手机在线观看你懂的| 国产高清无码麻豆精品| 亚洲婷婷在线视频| 中文字幕亚洲精品2页| 国产第一页亚洲| 在线观看91香蕉国产免费| 国产精品99一区不卡| 暴力调教一区二区三区| 伊人成人在线| 精品无码一区二区三区在线视频| 国产96在线 | 亚洲精品成人片在线播放| 国产视频a| 四虎AV麻豆| 欧美爱爱网| 精品無碼一區在線觀看 | 九九这里只有精品视频| 99视频在线精品免费观看6| 国模私拍一区二区| AV天堂资源福利在线观看| 欧美日本视频在线观看| 国产熟睡乱子伦视频网站| 中文字幕乱码二三区免费| av大片在线无码免费| 日本精品视频| 国产日韩欧美在线播放| 国产亚洲精品91| 国产区网址| 亚洲精品国偷自产在线91正片| 99热这里只有精品国产99| 免费观看男人免费桶女人视频| 亚洲AV人人澡人人双人| 国产日韩丝袜一二三区| 欧美 亚洲 日韩 国产| 午夜国产理论| 福利国产微拍广场一区视频在线| 国产免费看久久久| 2048国产精品原创综合在线| 亚洲天堂.com| 精品一区二区无码av| 午夜精品区| 久久国产免费观看| 视频二区中文无码| 无码内射中文字幕岛国片| 亚洲一区国色天香| 日本少妇又色又爽又高潮| 毛片免费高清免费| 亚洲高清无在码在线无弹窗| A级毛片无码久久精品免费| 欧美在线伊人|