999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于溯源的虛假信息傳播控制方法

2017-01-17 05:18:14周雪妍林澤鴻張健沛印桂生
哈爾濱工程大學學報 2016年12期
關鍵詞:情感用戶信息

楊 靜,周雪妍,2,3,林澤鴻,張健沛,印桂生

(1.哈爾濱工程大學計算機科學與技術學院,黑龍江哈爾濱150001;2.哈爾濱工程大學國家大學科技園,黑龍江哈爾濱150001;3.哈爾濱學院工學院,黑龍江哈爾濱150086;4.哈爾濱工程大學機電工程學院,黑龍江哈爾濱150001)

基于溯源的虛假信息傳播控制方法

楊 靜1,周雪妍1,2,3,林澤鴻3,4,張健沛1,印桂生1

(1.哈爾濱工程大學計算機科學與技術學院,黑龍江哈爾濱150001;2.哈爾濱工程大學國家大學科技園,黑龍江哈爾濱150001;3.哈爾濱學院工學院,黑龍江哈爾濱150086;4.哈爾濱工程大學機電工程學院,黑龍江哈爾濱150001)

為了研究微博傳播機制,本文提出一種基于溯源的虛假信息傳播控制方法,根據微博轉發關系和主題相關性得到級聯集合,并結合用戶關系網和信息級聯關系網確定微博信息的真正發起者。通過文本情感分析和信息級聯關系迭代計算節點的影響力指數和從眾指數,提取微博信息早期重要參與者。綜合發起者和早期重要參與者確定信息源頭并進行評估。通過刪除優質源頭節點和全局高影響力節點來控制虛假信息的傳播。在新浪微博數據集上通過實驗驗證了基于所有溯源節點的虛假信息控制策略效果最優。

微博;溯源;虛假信息;影響力指數;早期重要參與者;傳播控制

作為一種新的在線社交媒體平臺,微博已經成為互聯網上民意的集中表達與反映,在很大程度上影響著社會輿論的走向[1]。各種不良話題開始借助于社區媒體這種跨地域、跨國界、開放式的通信方式進行傳播。特別是反動、不利于社會安定的言論傳播,需要找到話題的源頭,鎖定謠言的散布者以平息謠言。網絡自身的傳播特點為虛假信息的產生提供了生存的土壤。而且,由于網絡傳播的匿名即時,很多網民也在無意之中成為了謠言的傳播者??梢姡皶r有效地對虛假信息進行傳播控制時輿情分析與預警的關鍵?,F有的虛假信息控制策略主要有兩大類:一種是基于最早時間戳的節點控制策略,一般應用“封號”、“刪除”、“禁言”等方式,這種方式沒有考慮節點間交互關系,治標不治本;另一種方式是基于影響力的節點控制方法,主要應用PageRank等排序算法找出高影響力節點,這類方法大部分是基于不考慮語義的拓撲關系進行分析,也不適應個人意見鮮明表達的網絡媒體。因此,如何結合時間因素、拓撲關系以及語義情感分析來進行虛假信息控制亟待解決。

基于此,提出一種基于溯源的虛假信息傳播控制方法,可通過刪除優質源頭節點和全局高影響力節點快速控制虛假信息傳播。

1 虛假信息及傳播方式概述

對謠言的系統科學的研究始于二戰,Knapp收集整理了1942年間的1000個戰時謠言,根據謠言的不同目的和內容進行了分類,這項研究為后來謠言的相關理論研究奠定了重要基礎。虛假信息傳播有兩類主要模型分別是一般傳播模型和復雜傳播模型[2]。1)一般傳播模型是從感官的傳染特性將疾病傳播的模型進行套用的結果。著名的D-K模型[3]實際上是借助隨機過程來分析謠言傳播,它把受眾按照謠言傳播效果分成了3類,并假定其中兩類人之間角色轉換的概率滿足一定數學分布。2)復雜傳播模型是按照不同的拓撲結構應用復雜網絡結構的一類傳播模型。Zanette[4]首先將復雜網絡理論應用于謠言傳播的研究,在小世界網絡上建立謠言傳播模型,得出一些包括謠言傳播臨界值在內的結論。文獻[5]認為傳統的SIR分析偏向均勻傳播網絡研究。在線社會網絡更適合第二類模型,同時其網絡數據龐大,找到虛假信息傳播的局域網絡是研究的前提條件。

另一方面,針對社會網絡信息傳播模式的研究很多,相當數量的算法從提取社會網絡中一組最有影響力的節點出發,基本思想是把這些節點作為種子從而使得信息能夠得到更廣泛的傳播,其中包括通過博客信息級聯的分析進行信息傳播預測等[6-7]。微博信息傳播的速度遠大于博客,且傳播模式也不同,如Dabeer等[8]分析了影響微博信息傳播的因素,并提出了基于馬爾科夫決策框架來度量信息傳播效果。Lehmann等[9]跟蹤了Twitter網絡中的HashTag的擴散過程,發現流行病傳播模式起著重要作用,其信息傳播范圍呈現“核裂變”式的幾何級數式擴大。Yang等[10]預測了微博中信息傳播的速度、規模和范圍。Tsur等[11]結合博文內容與網絡拓撲結構,利用線性回歸方法預測給定時間內的信息擴散。王佰玲[12]提出針對網絡數據流中活躍信息進行話題相關數據采集與分析方法,并對基于數據流的網絡輿情熱點話題發現、突發事件檢測與實時跟蹤等應用提供有利的數據資源。

而微博作為一個信息交互性極強的平臺受到研究者的青睞,研究微博轉發關系形成機制有助于了解微博中信息擴散的機理。如Yang等[13]利用微博的網絡關系提出了線性影響力模型,預測信息擴散路徑。Macskassy等[14]研究表明微博中大部分用戶并不一定轉發他們熟知的話題。Pal等[15]以原發微博數、參與會話數和轉發數作為主要指標對用戶的權威進行評估排序。

對微博平臺虛假信息進行傳播控制離不開節點影響力分析,影響力度量算法主要是分為基于個體的上下文角色和基于社會網絡結構兩類。大部分現有的微博影響力分析算法是傳統算法的改進算法,如在Twitter數據集中分別利用個體的粉絲數目、被轉發數以及被提及數來衡量個體的影響力。除此之外,微博中影響力分析還可以依靠擴散能力衡量影響力,如Bakshy等[16]在Twitter數據集中,根據URL構造傳播級聯樹,用種子節點的擴散范圍來衡量其影響力。Steeg等[17]利用轉移熵理論刻畫用戶間的信息流,識別Twitter網絡中有影響力的鏈接等。王永剛等[2]提出了一種社交網絡虛假信息傳播控制方法Fidic,針對社交網絡中虛假信息傳播時途經的用戶序列,該方法基于PageRank并結合用戶傳播虛假信息時的指向關系來對用戶進行評級。但以上這些方法大多數只是從節點的影響力角度評估,而沒有同時評估節點容易被其他節點影響的程度。

2 微博信息級聯及影響力分析

2.1 微博中的信息級聯

微博是一個流行的社交平臺,用戶通過微博來隨時隨地發表自己的心情和觀點。根據微博消息傳播機制建立用戶關系網絡和微博轉發網絡,其中,關注關系對應用戶關系網絡,而轉發關系對應針對特定主題的事件流級聯關系網。表1為微博信息級聯相關術語和概念中涉及的符號及含義。

表1 符號簡表Table 1 Symbol profile

2.2 影響力指數和從眾指數

影響力指數是衡量個體影響他人的能力,而從眾指數是指容易被他人影響的程度。社會網絡中高影響力通常指那些觀點和意見總是被采納的個體,因此在微博中提取關鍵人物需要考慮情感因素。微博中的轉發中主要包括肯定和否定兩種情感。一條從a到b的有向邊蘊含著節點a相信/贊同(或不相信/不贊同)節點b。其中,贊同含義的邊標注為肯定的(+),否則為否定的(-)。研究表明,網絡信息傳播取決于那些容易被其他人影響者之間的相互影響[9],所以在分析節點影響力的同時也應該量化節點容易被影響的程度。采用文獻[18]中情感傾向分析方法容易得到標注情感的有向圖G(V,E),其中每一條邊按照其表達的情感信息被標注為肯定或否定。信息級聯串進行標注后見圖1(a)。

圖1 級聯信息情感標注及迭代計算Fig.1 Cascade after emotional labeling and index calculation

E+={ce,dc}表示正向情感,E-={hd,gc}為否定情感。因此,社會網絡G(V,E)可以由肯定情感子圖G+(V,E+)和否定情感子圖G-(V,E-)構成。G中節點v的影響力指數Φ(v)和從眾指數Ω(v)為

可見,兩個互相依賴指數應通過遞歸循環進行計算。在某主題環境T下,對于任意v ?V,初始化ΦT(v)=ΩT(v=1),迭代至收斂見圖1(b)。

3 微博虛假信息控制方法

3.1 微博信息的溯源

網絡信息的發起者和早期參與者決定了信息傳遞的規模,所以準確鎖定信息的真正發起者和早期參與者是輿情分析的重要工作。發起者在微博中指原創博文的用戶,但有人習慣復制別人的博文進行直接發布,所以需要結合用戶關系網絡來找出這部分節點;早期參與者指較早進入級聯且影響力較高的重要節點。發起者和早期參與者提取算法的核心思想見算法1。

算法1:溯源算法(KP algorithm)

輸入:社會網絡G(V,E)

輸出:主題T的溯源節點結合KPT,全局高影響力節點GPT

Begin

C←ExtractCascade(G);//級聯提取

if級聯C是基于語義的 then

ζ←ExtractSubgraph(C);//基于主題的子圖提取

else

ζ={C}

對每一個主題T的級聯集合GT∈ζ do

ITT←ExtractInitiator(GT) //提取真正發起者ITT

if級聯集合GT不是情感標注網絡then

EPT←EarlyParticipants(ΦT,ΩT)//提取早期重要參與者EPT

GPT←GlobalParticipants(ΦT,ΩT)//提取全局重要參與者

KPT←(ITT,EPT)//ITT和EPT取并集

End

首先從特定時間段內的微博數據中提取出轉發級聯串,按關鍵詞匹配劃分為若干組同主題級聯信息;其次,對特定主題T下級聯集合提取真正的發起者ITT;再次,進行情感標注、影響力指數和從眾指數計算,從而提取出早期重要參與者EAT;最后,ITT和EAT合并整合為關鍵人物KT完成微博信息溯源。具體包括級聯提取、基于主題的子圖提取、發起者提取、情感標注、指數計算、早期重要參與者提取六個主要部分。下面分別進行說明:

1)級聯提?。‥xtractCascade)主要按照微博中轉發關系進行,E是社會網絡圖中的邊,也可以理解為一個最短的級聯。如果兩個現有的級聯有交集則合并為一個級聯,得到一個較大的級聯分支。

2)基于主題的子圖提取(ExtractSubgraph)主要是把相同主題的子圖放到一個集合中?,F在有很多潛在語義挖掘算法在社會網絡數據中有很好的應用。而微博中主題信息比較明顯,應用關鍵詞匹配的方法能夠完成基于主題的子圖提取,其核心思想是把出現相同關鍵詞的級聯放在一個集合中。如主題T的關鍵詞為{k1,k2,k3},則同時含有這3個關鍵詞的所有級聯構成基于主題T的級聯集合GT。

3)發起者提取算法(EarlyParticipants)找到所有的源節點并提取對應時間戳來提取真正發起者。因為部分用戶有直接復制他人博文發布的習慣,所以應該結合用戶關系網剔除這部分節點。具體思想是分析所有源節點之間的關系,取消晚于好友發布相同主題信息的節點作為發起者的權利。

4)情感標注(EdgeLabel)是為每一條邊加注情感權值的過程。設微博轉發邊E={uv}表示u轉發了v,且?E ? ci?GT,如無評論直接轉發則認定為正向情感E+,評論部分采用文獻[18]常用情感詞表進行匹配計算情感傾向。如果評論中含有多個情感詞,則綜合情感程度為其平均值,當其大于0.5時記為正向情感E→E+,否則記為否定情感E→E-。

5)指數計算(IndexCompute)為每個節點計算出影響力指數和從眾指數(3.2節),對?v ? ci?GT,初始化Φ(v)=Ω(v)=1,迭代計算并歸一化處理影響力指數Φ(v)和從眾指數Ω(v)。

6)早期重要參與者提?。‥arlyParticipants)是找到參與話題時間早且綜合影響力高的節點。TT= Earliest{Ti|Ti?ci?GT}為GT的發布時間,?v ? ci?GT,τ=Φ(v)/Ω(v),則提取早期重要參與者v,應滿足參與級聯時間Tv較早,指數τ較高。

全局重要參與者GPT的節點集合為綜合影響力τ=Φ(v)/Ω(v)在整個時間周期內的TOP-N,主要為控制策略做準備,不屬于溯源節點集合。

3.2 微博信息的溯源

微博信息溯源模型是一個通用的模型,只要選定主題的關鍵詞就可以溯源,因此,虛假信息同樣適用該模型,如虛假信息“吉林發生嚴重破壞性地震”的關鍵詞為{破壞性,嚴重地震,7級,吉林},謠言“哈爾濱下調取暖費”的關鍵詞為{哈爾濱,取暖費,下調,供熱}等,通過級聯聚合就可以得到對應的GT,進而得到溯源節點集合。這些節點包括了微博中信息的真正發起者和早期重要參與者。主要控制策略為:

(a)刪除時間戳較早的發起者ITT/2個;

(b)刪除所有的發起者ITT個;

(c)刪除綜合影響力較高的早期參與者EPT/2個;

(d)刪除所有的早期重要參與者EPT個;

(e)刪除所有溯源集合內的節點KPT個;

(f)刪除PR值最高的節點KPT個;

(g)刪除策略(a)和(c)節點及(KPT-ITT/2-EAT/2)全局綜合影響力指數τ最大節點,節點總數KPT個。

(h)刪除KPT個全局綜合影響力τ最大的節點。

其中,選中的節點的信息被其他用戶轉發所對應的直接鏈出邊將被刪除,設某虛假信息共覆蓋了N個節點,經過傳播控制后所達到的用戶數量為NC,則虛假信息傳播覆蓋率δ=Nc/N×100%。δ越小則控制效果越好。實驗部分將比較不同策略對虛假信息的控制效果,包括用PageRank等方法得到和溯源結果相等數量的高影響力節點(策略f),溯源節點結合綜合影響力的控制策略(策略g),以及綜合影響力控制策略(策略h),比較的指標為信息覆蓋率。

4 實驗驗證及控制策略分析

4.1 基于虛假消息的級聯提取

本文數據來自于中國內地知名微博網站——新浪微博,新浪微博自2009年10月正式向公眾開放,已經有注冊用戶近6億,日均活躍用戶近1億。微博信息的時效性強,大部分完整的話題會在短時間內淡出。本文選取2014年上半年部分數據(涉及博文465 546 132條)進行分析,本文算法主要是應用信息溯源結果進行虛假信息進行傳播控制,所以需要刪除對信息傳播沒有貢獻的孤立節點。雖然已經刪除了對信息傳播沒有貢獻的節點,級聯提取結果中仍然有近76%為不大于3的簡單級聯。算法在數據源中提取出不同的級聯并按拓撲結構分為204個。其中最常見的級聯為僅一次轉發的級聯,圖2給出了出現頻率較高的12種級聯形狀。

圖2 出現頻率高的常見級聯拓撲結構Fig.2 Basic high frequency cascade topology structure

對所有數據都進行分析會增加控制成本,因此應用關鍵詞匹配的方法能夠完成基于主題的子圖提取,其核心思想是把出現相同關鍵詞的級聯放在一個集合中。主題T的關鍵詞為{k1,k2,k3},則同時含有這該集合中若干個關鍵詞的所有級聯構成基于主題T的級聯集合GT,如謠言“哈爾濱下調取暖費”的關鍵詞為{哈爾濱,取暖費,下調,供熱},則包含其中任何一個關鍵字的博文構成的級聯都放入一個集合中。因為本文關注的是突發事件和虛假信息這類持續時間相對較短,但是輿論影響較大的微博信息的溯源。表2為精簡后的微博虛假信息集合。微博條數在本文實驗中為級聯數目。

4.2 發起者

一個新聞事件雖然具有相同的關鍵詞,但會因為關注角度不同和時間推移有不同的內容側重。將主題T下級聯Ci的源點記為Si,尋找真正發起者的人物是要減少集合S中的元素。主要從兩個方面著手:1)把相似度高的級聯歸為一個新聞版本,只保留其中時間戳最早的源點;2)排除修改后發表的源點,結合用戶關系排除晚于好友發布相似度較高信息的源點。由于每條微博最長為140個字且相似的博文大部分字詞并不會改變,因此采用簡單字詞重復比率來衡量文本相似度。

式中:len(Si)表示源點Si博文的字符數,num(text(Si)∩text(Sj))為源點Si與Sj中重復字符總數,sim越大表示相似度越高,直接復制轉發的博文相似度為1。實驗中sim(Si,Sj)大于閾值0.71則認為級聯Ci與Cj為同一博文。表3中給出了10個熱點事件按相似度歸類后的新聞版本數。

當然,微博信息傳播中的一種現象不容忽視,即信息被高影響力節點轉發后形成的二次爆發,因此,微博信息溯源僅找到信息發起者還不夠。

表2 事件及主要指標Table 2 Events and main index

表3 不同事件級聯集合變化情況表Table 3 Cascade set of issues

4.3 早期重要參與者

微博信息傳播過程中時間因素很重要,社會網絡中每個節點平均新增的邊數隨時間變化不大,而級聯邊的產生呈指數下降的[16]。具體而言,早期重要參與者應具有以下特性:1)參與轉發級聯時間早;2)具有高影響力指數和低從眾指數。

4.3.1 綜合影響力評估

情感標注采用情感詞表匹配法[18],包含30組否定詞和30組肯定詞,否定詞權重在0.5~1,越大表示否定情感越強烈;肯定詞的權重在0~0.5,越小表示越肯定。無評論的直接轉發行為認定為正向情感E+,評論部分按常用情感詞表進行匹配計算情感傾向。如果評論中含有多個情感詞,則綜合情感程度為其算數平均值,當其大于0.5時記為正向情感E+,否則記為否定情感E-。對?v ? ci?GT,初始化Φ(v)=Ω(v)=1,迭代計算并歸一化處理影響力指數Φ(v)和從眾指數Ω(v)。為了衡量用戶話題中用戶的綜合影響力定義τ=Φ(v)/Ω(v),圖3展示了不同話題中用戶τ的分布情況。

4.3.2 參與者提取

微博溯源時間因素尤為重要,早期重要參與者是指較早參與話題的高綜合影響力指數τ的用戶。定義GT的發布時間為TT=Earliest{Ti|ci?GT},T?= Latest{Ti|ci?GT},而?v ? ci?GT參與級聯的時間Tv,則Δt=Tv-TT。為了區分出Δt小且τ大的早期重要參與者,因為不同主題事件的規模不同,持續時間各異,采取分級量化的方法進行對比,Δt等級為總時間T?-TT均勻分為10段,再將τ>2的高影響力節點按參與級聯的時間投影到不同的Δt等級中去。如虛假信息1有14%的節點被涉及,圖4給出了其投影分布結果。

圖3 不同主題綜合用戶影響力分布Fig.3 Comprehensive influence distribution in various topics

從圖4中可以看出,事件的中早期高影響力的用戶節點分布較多,這里不排除一些為虛假信息造勢而注冊的活躍馬甲賬戶。虛假信息1中第一區間用戶占比為0.43%,這一較小的數字有利于進行后期虛假信息控制。左側第一區間為影響力最高且參與時間最早的人,這部分在所有10個虛假信息中最大值為114,即有效分離出了早期重要參與者。

4.4 溯源結果評估與確認

早期參與者中可能包含部分發起者,因此兩者應取并集。虛假信息溯源結果見表4,其中“√”表示達到指標,“×”表示不滿足該指標。可見,事件源頭基本鎖定在129個ID以內,達到了挖掘效果。為了對結果的準確性進行評價,需要從以下幾個方面進行考量:(a)是否包含了信息的最早發布者;(b)節點之間是否存在好友關系;(c)人工分析源頭節點所發微博與事件是否相關;(d)分析節點的微博數、粉絲數屬性等活躍程度,分析源頭節點是否都是相對較活躍的節點。

圖4 虛假信息1中τ>2的用戶節點參與時間分布圖Fig.4 The participate time distribution of the τ>2 users

所有的事件都達到了指標(a)溯源得到的節點中都包含了信息的最早發布者。指標(b)分為發起者(b1)和重要參與者(b2)兩部分:(b1)針對溯源結果中發起者之間的關系,如果有好友關系的兩個節點存在于同一級聯樹中,那么晚于好友發布同一消息的節點已經被剔除,所以大部分事件的源頭節點都是已經不存在好友關系孤立節點。指標(b2)主要衡量早期重要參與者是否與其他節點具有好友關系,而重要節點是通過拓撲結構分析得到的高影響力節點,因此理論上都應該存在好友關系。但事件2和6不滿足指標(b2)是由于存在某重要節點,其所在級聯的發起者由于晚于好友發布同一消息已經被剔除。指標(c)經人工識別后發現所有保留節點的博文都是與事件相關的,這一點也是由算法特性決定的,因為經關鍵詞鎖定主題和轉發形成級聯后,主題漂移的可能性不大。指標(d)衡量源節點是否都為活躍節點,這里對活躍節點沒有具體定義,僅認為被關注數較高并發微博數較大的用戶為活躍節點。綜上所述,本文算法的溯源結果包含了最早的信息發布者且都相對活躍,同時剔除了好友關系使得源頭更準確,并且控制了主題漂移。

表4 發起者和重要參與者統計Table 4 The initiator and important participants

4.5 虛假信息控制效果評估

對于同一虛假信息傳播的級聯集合,應用不同的控制策略以進行效果比較,如虛假信息1,經過溯源得到發起者59個和早期重要參與者78個,溯源結果集合取兩者并集共104個。則具體策略為:

(A)刪除時間戳較早的發起者30個;

(B)刪除所有的發起者59個;

(C)刪除綜合影響力較高的早期重要參與者39個;

(D)刪除所有的早期重要參與者78個;

(E)刪除所有溯源集合內的節點104個;

(F)刪除PR值最高的節點104個;

(G)刪除策略(A)和(C)的69個節點,全局綜合影響力指數τ最大的35個節點,共104個。

(H)刪除全局綜合影響力指數τ最大的節點104個。

為了對比,設置策略(F)對同一虛假信息的級聯集合應用PageRank得到影響力最大的104個節點,溯源結合綜合影響力的控制策略(G),以及全局綜合影響力策略(策略H)。策略(A)和策略(C)主要為策略(G)提供優質源頭節點,可見,優質源頭節點主要由溯源節點集合中時間戳較早的發起者和綜合影響力較高的早期重要參與者組成。圖5展示虛假信息在不同的控制策略下的傳播覆蓋率。

可見,所有的控制策略都不同程度地降低了虛假信息的覆蓋率。10個虛假信息的控制效果都在策略(G)時最佳,其次為策略(E),策略(E)刪除了所有溯源得到的節點集合,而策略(G)選擇了溯源節點中較優質的一部分,同時,為了更好的控制效果,將綜合影響力擴展到信息傳播的全過程。為了對比,共選?。↘PT-ITT/2-EAT/2)個全局綜合影響力指數τ最大的節點,使得策略的刪除節點數相等??梢?,單純刪除溯源節點的策略(E)對個別虛假信息的控制效果不如策略(F),如虛假信息7和8,這是因為虛假信息的傳播態勢不同,信息傳播過程中晚期高影響力節點多,導致信息二次爆發,此時僅僅刪除溯源節點控制力不足。通過對比發現,基于溯源的虛假信息傳播控制策略能夠在刪除少量節點的情況下更好地控制信息傳播的規模。而實際虛假信息控制經常是找到發表信息時間戳最早的一個用戶并刪除,所刪除節點僅僅是策略(A)的一個子集,該方法在復雜微博傳播機制下不能很好地控制信息規模。

圖5 不同策略下虛假信息傳播覆蓋率Fig.5 False information transmission coverage under different strategies

5 結論

虛假信息的傳播一般為人為惡意操作,且針對特定人群,所以傳播的速度比一般信息還要快。文章針對虛假信息控制問題展開建模分析得到以下結論:

1)基于溯源的虛假信息傳播控制策略能夠及時準確地鎖定信息的源頭;

2)用戶節點的綜合影響力由影響能力和從眾程度共同決定;

3)基于虛假信息的關鍵節點挖掘與僅考慮拓撲關系的關鍵節點意義不同。綜上所述,本文算法在同等條件下虛假信息控制效果最佳。虛假信息是網絡輿情分析與預警的重要對象,虛假信息傳播演化規律的研究將進一步揭示網絡輿情演化機制,這將是下一步主要研究內容。

[1]丁兆云,賈焰,周斌.微博數據挖掘研究綜述[J].計算機研究與發展,2014,51(4):691-706.DING Zhaoyun,JIA Yan,ZHOU Bin.Survey of data mining for Weibos[J].Journal of computer research and development,2014,51(4):691-706.

[2]王永剛,蔡飛志,LUA E K,等.一種社交網絡虛假信息傳播控制方法[J].計算機研究與發展,2012,49(S1):131-137.WANG Yonggang,CAI Feizhi,LUA E K,et al.A diffusion control method of fake information in social networks[J].Journal of computer research and development,2012,49(S1):131-137.

[3]DALEY D J,KENDAL D G.Stochastic rumours[J].IMA journal of applied mathematics,1965,1(1):42-55.

[4]ZANETTE D H.Dynamics of rumor propagation on small-world networks[J].Physical review E,2002,65(4 Pt 1):041908.

[5]ZHOU Jie,LIU Zonghua,LI Baowen.Influence of network structure on rumor propagation[J].Physics letters a,2007,368(6):458-463.

[6]LESKOVEC J,MCGLOHON M,FALOUTSOS C,et al.Patterns of cascading behavior in large blog graphs[C]//Proceedings of the 2007 SIAM International Conference on Data Mining.Minneapolis,Minnesota,USA:SIAM,2007,7:551-556.

[7]LI Hui,BHOWMICK S S,SUN Aixin,et al.Affinity-driven blog cascade analysis and prediction[J].Data mining and knowledge discovery,2014,28(2):442-474.

[8]DABEER O,MEHENDALE P,KARNIK A,et al.Timing tweets to increase effectiveness of information campaigns[C]//Proceedings of the 5th ICWSM.Barcelona,Spain: AAAI,2011:105-112.

[9]LEHMANN J,GON?ALVES B,RAMASCO J J,et al.Dynamical classes of collective attention in twitter[C]//Proceedings of the 21st International Conference on World Wide Web.Lyon,France:ACM,2012:251-260.

[10]YANG J,COUNTS S.Predicting the speed,scale,and range of information diffusion in twitter[C]//Proceedings of the 4th International AAAI Conference on Weblogs and Social Media.Washington:AAAI,2010,10:355-358.

[11]TSUR O,RAPPOPORT A.What's in a hashtag?:content based prediction of the spread of ideas in Weiboging communities[C]//Proceedings of the 5th ACM International Conference on Web Search and Data Mining.Seattle,Washington,USA:ACM,2012:643-652.

[12]王佰玲,曲蕓,張永錚,等.基于數據流的網頁內容分析技術研究[J].電子學報,2013,41(4):751-756.WANG Bailing,QU Yun,ZHANG Yongzheng,et al.Research on network-traffic based web traffic computing technology[J].Acta electronica sinica,2013,41(4):751-756.

[13]YANG J,LESKOVEC J.Modeling information diffusion in implicit networks[C]//Proceedings of the 10th International Conference on Data Mining.Sydney,Australia:IEEE,2010:599-608.

[14]MACSKASSY S A,MICHELSON M.Why do people retweet?anti-homophily wins the day?。跜]//Proceedings of the 5th International AAAI Conference on Weblogs and Social Media.California:The AAAI Press,2011:209-216.

[15]PAL A,COUNTS S.Identifying topical authorities in Weibos[C]//Proceedings of the 4th ACM International Conference on Web Search and Data Mining.Hong Kong,China: ACM,2011:45-54.

[16]BAKSHY E,HOFMAN J M,MASON W A,et al.Everyone's an influencer:quantifying influence on twitter[C]//Proceedings of the 4th ACM International Conference on Web Search and Data Mining.Hong Kong,China:ACM,2011:65-74.

[17]VER STEEG G,GALSTYAN A.Information transfer in social media[C]//Proceedings of the 21st International Conference on World Wide Web.Lyon,France:ACM,2012:509-518.

[18]ZHOU Xueyan,YANG Jing.A BBS opinion leader mining algorithm based on topic model[J].Journal of computational information systems,2014,10(6):2571-2578.

False information spread control method based on source tracing

YANG Jing1,ZHOU Xueyan1,2,3,LIN Zehong3,4,ZHANG Jianpei1,YIN Guisheng1
(1.College of Computer Science and Technology,Harbin Engineering University,Harbin 150001,China;2.The National University Science Park,Harbin Engineering University,Harbin 150001,China;3.College of Engineering,Harbin University,Harbin 150086,China;4.College of Mechanical and Electrical Engineering,Harbin Engineering University,Harbin 150001,China)

To study the Weibo transmission mechanism,this paper provides a false information spread control method based on source tracing.The cascade sets were built on the basis of the retweeting of a Weibo and its topical relevance,and real initiators were identified by the user relationship and information cascade networks.The influence and conformity indices of every node were then iteratively calculated according to text sentiment analysis,and the information cascades and important early participants were extracted.The real initiators and early participants were combined to ascertain the information source and then evaluated by an experiment.The source tracing nodes and the global high influence nodes were deleted to control the spread of false information.Experimental results verify that the proposed false information control strategy for all source tracing nodes has an optimal effect in a real Sina Weibo dataset.

Weibo;source tracing;false information;influence index;early participants;spread control

10.11990/jheu.201511076

http://www.cnki.net/kcms/detail/23.1390.u.20160928.0936.022.html

TP393

A

1006-7043(2016)12-1691-07

楊靜,周雪妍,林澤鴻,等.基于溯源的虛假信息傳播控制方法[J].哈爾濱工程大學學報,2016,37(12):1691-1697.

2015-11-30.

2016-09-28.

國家自然科學基金項目(61672179,61370083,61402126);高等學校博士點專項科研基金項目(20122304110012);黑龍江省社科研究規劃項目(16XWB01、16TQD03);黑龍江省藝術科學規劃課題(2016C030);黑龍江省青年科學基金項目(QC2016083);黑龍江省博士后基金項目(LBH-Z14071);哈爾濱學院青年博士科研啟動基金項目(HUDF2016207).

楊靜(1962-),女,教授,博士生導師;

周雪妍(1981-),女,副教授.

周雪妍,E-mail:zhouxueyan_zxy@163.com.

YANG Jing,ZHOU Xueyan,LIN Zehong,et al.False information spread control method based on source tracing[J].Journal of Harbin Engineering University,2016,37(12):1691-1697.

猜你喜歡
情感用戶信息
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
如何在情感中自我成長,保持獨立
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 国产成人午夜福利免费无码r| 亚洲无码37.| 青青草原国产| 在线欧美a| 九九热精品视频在线| 第一页亚洲| 亚洲福利网址| 精品一区二区三区自慰喷水| 天堂成人av| 亚洲欧美精品在线| 一区二区三区国产精品视频| 亚洲国产成熟视频在线多多| 一本无码在线观看| 国产幂在线无码精品| 九九热在线视频| 99国产精品一区二区| 色哟哟国产精品一区二区| 精品人妻AV区| 亚洲成综合人影院在院播放| 中国一级特黄大片在线观看| 免费看美女毛片| 色哟哟色院91精品网站| 91一级片| 国产成人你懂的在线观看| 国产精品粉嫩| 亚洲热线99精品视频| 国产成人高精品免费视频| 欧美日韩亚洲综合在线观看| 日韩视频免费| 99热这里只有成人精品国产| 国产精品原创不卡在线| 精品视频一区二区观看| 欧美日韩亚洲综合在线观看 | 岛国精品一区免费视频在线观看| 国产在线观看91精品| 黑人巨大精品欧美一区二区区| 国产成人综合网| 久久精品欧美一区二区| 久久国产高潮流白浆免费观看| 成人午夜福利视频| 日本久久网站| 2020亚洲精品无码| 婷婷久久综合九色综合88| 国产草草影院18成年视频| 日韩av无码精品专区| 91美女视频在线观看| 国产网站在线看| 免费啪啪网址| 色香蕉影院| 精品剧情v国产在线观看| 亚洲成人在线免费| 不卡午夜视频| 国产精品视频导航| 国产亚洲精品91| 人禽伦免费交视频网页播放| 日本欧美一二三区色视频| 久久一级电影| 免费在线看黄网址| 中文字幕有乳无码| 国产精品无码作爱| 在线观看欧美精品二区| 久久综合婷婷| 亚洲最新网址| 天天色综合4| 四虎影视国产精品| 欧美伊人色综合久久天天| 国产欧美在线观看一区| 国产永久在线视频| 欧美第一页在线| 亚洲一区二区视频在线观看| 久久久亚洲色| 久久美女精品| 中文字幕第4页| 国产精品丝袜视频| 日韩欧美中文| 人妻无码AⅤ中文字| 国产视频久久久久| 欧美中文字幕在线二区| 永久免费AⅤ无码网站在线观看| 无码福利日韩神码福利片| 五月婷婷亚洲综合| 国产美女一级毛片|