崔金棟,鄭 鵲,孫 碩
微博信息傳播模型及其演化研究綜述
崔金棟,鄭 鵲,孫 碩
文章針對微博信息建模過程中影響因素眾多、過程復雜現狀,梳理模型構建的依據及其演化脈絡。文章對現有微博信息模型進行功能解析和演化分析,從節點自身屬性、鏈接關系到整體拓撲結構演化的視角,解析微博信息傳播模型中的社會網絡特征;從傳播模式、傳播影響因素和傳播規律演化的角度,闡釋微博信息傳播模型的復雜網絡特性;從傳播預測和傳播控制的視角,揭示微博信息傳播模型的雙重網絡特質。文章提出微博信息傳播模型的演化方向,即微博信息傳播中節點、節點鏈接與信息內容的融合,復雜網絡與多重網絡的融合,微博信息傳播與大數據的融合。
微博信息傳播 網絡結構 傳播規律 傳播預測
移動互聯網已經成為信息傳播的主要途徑,微博作為一個可以自由發表觀點和態度的平臺,具有信息傳播多樣化、信息交互便捷化等特性,同時意味著其信息的傳播具有不可控的屬性。因此,有效監管信息的真實性、準確性和時效性,控制不良信息擴散范圍,對規范網絡環境,促進微博平臺健康發展具有重要意義。
國外對微博信息傳播的研究大都建立在對Twitter研究的基礎上,在微博網絡結構、傳播機制和傳播模型等方面取得了一定的成果。國內對微博信息傳播的研究起步較晚,大多數是基于目前國內最先進、最活躍、用戶數量最高的新浪微博,對其信息傳播特征、影響因素[1-2]、傳播模式[3]、傳播預測模型和影響力等展開研究[4-5]。然而,學者們普遍從自身的研究角度出發,采用的信息傳播模型側重點各有不同,研究結論多樣化。因此,筆者以微博信息傳播功能為視角,在解析微博信息傳播模型演化規律基礎上,提出未來微博信息傳播的技術發展趨勢。
微博作為在線社交平臺,每一個用戶可以視為一個節點,各個節點相互關聯構成整個微博網絡。為了更加科學且合理地解析微博網絡結構及其節點屬性,研究者普遍將復雜網絡理論、多重網絡理論和社會網絡分析法作為基礎支撐理論。
復雜網絡是復雜性理論的分支,具有結構復雜、節點多樣、網絡結構多變等特征,是抽象于復雜系統的框架性表示形式[6],主要特征包括:(1)由多個節點或子系統組成;(2)易受外界環境影響,并與外界不斷進行物質、能量和信息交換;(3)在特定情況下,網絡內的節點之間存在某種鏈接關系,并且互相作用,從而給彼此帶來影響;(4)節點間的相互作用和整個系統存在某種復雜的非線性關系。在理論研究方面,復雜網絡主要運用圖論和統計物理作為理論支撐,深入探討網絡拓撲結構及其特性[7]。20世紀末小世界網絡和無標度網絡被發現,并通過實例論證真實世界網絡同時擁有小世界網絡屬性和無標度網絡屬性,并非以往認知中的規則網絡或隨機網絡,因此科學家將擁有這兩種屬性的網絡統稱為復雜網絡[7]。隨著對復雜網絡認知的深入,研究快速發展。目前相關理論研究趨于完善,主要將其運用到其它學科領域。
隨著對微博網絡研究的深入,學者們發現微博網絡不僅僅是一個單層次復雜網絡,因此提出多重網絡(Multiplex Network)概念,即在一個網絡結構中具有多層網絡,每層網絡的參與節點相同[8-12],但不同節點之間的鏈接屬性存在一定的差異。多重網絡可以看作是一種多個平行網絡層動態相互耦合的網絡,各子網絡層間具有一定的關聯性。多重網絡亦稱為多層次網絡、相互依賴網絡、多關系網絡[13-14]。多重網絡作為特殊的相互作用的網絡,它的結構和動態演化過程受到越來越多的關注,研究者從多角度在多個學科領域對其展開研究[15-16]。通過研究多重網絡的內部屬性,節點之間的鏈接關系等,可實現對子網絡之間相互影響和動態關系的挖掘;亦可運用多重網絡對微博網絡進行仿真,探索微博網絡結構的內部屬性和傳播規律。
從實踐角度看,社會網絡分析(SocialNetwork Analysis)是一種解析社會網絡結構及其屬性的技術方法;從理論視角來說,亦可以視作一種結構分析思想[17]。社會網絡分析法將整個網絡看作由若干個節點構成,每個節點之間有一定的鏈接關系,網絡結構內的鏈接關系決定了信息的傳播路徑及其特征[18]。社會網絡分析法通常用于分析不同社會單位(個人、群體)乃至整個社會網絡結構內的個體和整體的屬性以及節點的鏈接關系特征[18],其中個體屬性主要涵蓋點度中心性、中間中心性和接近中心性[19]。點度中心性指在網絡結構中某個節點與其他節點的關聯程度,直接關聯的數量決定該節點成為中心節點的概率[20];中間中心性指通過衡量節點之間占有信息和資源的程度,從而實現評估網絡中心性的目的;而接近中心性則主要用來比較分析節點之間的差異性,節點差異值表示了節點接近網絡核心的距離。常見的社會網絡分析軟件有Ucinet、Pajek、Netminer等。
這三個基礎理論是開展微博傳播研究的基石,也是微博信息建模的出發點。筆者以上述理論為主線對微博傳播模型及其演化進行闡述,總結現有成果的不足以及技術發展趨勢。
微博信息傳播的主體主要由傳播者、信息、接收者構成。在微博信息傳播的研究過程中通常將傳播者和接收者(即用戶)看作節點,用戶的相互關注視作節點關聯形成的邊,把整個微博網絡抽象成一種有向網絡圖。因此,節點自身屬性、節點鏈接關系和網絡拓撲結構的演化是挖掘傳播過程中關鍵節點的重要因素。
節點自身屬性是識別微博網絡關鍵節點的重要因素,分析節點自身屬性,計算節點權重值,從而識別關鍵節點是學界普遍采用的方法。權重值越大,作為關鍵節點的概率就越大。早期模型中,節點權重值計算方法主要通過對不同節點自身屬性進行對比,將用戶微博貢獻值、社會影響力等作為指標,進行權重值計算。這類方法最大的不足在于準確度低、時間復雜度高。隨后研究者發現節點傳播影響力對識別關鍵節點具有重要作用,因此,將信息擴散廣度、速度和深度作為評價用戶傳播影響力的指標,分別賦予權重系數,構建基于WSD-Rank算法的傳播影響力模型。與傳統PageRank算法對比,這種算法對節點傳播影響力的表達更加直接,提高了適用性[21]。隨著拓撲結構研究的融入,學者基于拓撲結構將緊密中心度和介數中心度作為評價指標衡量節點傳播影響力,但這種方法僅從節點自身屬性出發,忽略了節點鏈接關系帶來的影響,缺少整體性,準確度低[22]。因此,后續模型將近似計算節點和邊的中介中心性作為識別關鍵節點的評價指標,基于Brandes算法,執行Betweenness算法,最終求出每個節點的唯一中介性值。這種方法不僅提高了計算效率,而且提升了識別準確度[23]。
構建信息傳播模型也是研究節點自身屬性的常用方法之一。研究者在獨立級聯模型(IC)和線性閾值模型兩個經典模型的基礎上,提出遞減級聯、DRUC等演化模型。遞減級聯模型認為,在傳播過程中,隨著時間的推進,節點之間的傳播概率會逐漸下降。DRUC(Decaying Reinforced User-Centric)模型是在線性閾值模型的基礎上,結合信息內容和用戶輪廓,綜合考慮用戶興趣度、接收者傳播意愿和被感染的鄰居節點三個因素的反作用。但是,獨立級聯模型和線性閾值模型及其演化模型的最大缺陷在于:模型構建的前提是假設任意兩個節點之間的信息傳播時間是相同的,整個傳播過程是離散的、同步的。然而在實際的傳播過程中,任意兩個節點之間的傳播時間是有差異的,整個傳播過程是連續的、不同步的。因此,通過引入傳播延遲時間,提出AsIC(Asynchronous IC Model)非同步模型(如圖 1),即在對傳播主體特征(影響力、權威度和活躍度)、傳播客體特征(傳播意愿)和傳播的信息特征(情感屬性、是否包含URL鏈接、是否包含標簽)進行討論分析后,構建基于AsIC模型的細粒度社會網絡信息傳播模型[24]。實證表明該模型提升了信息傳播過程中的預測準確率。

圖1 IC模型和AsIC模型
節點鏈接關系表示兩個節點之間相互作用所產生的對彼此的影響。不同節點的鏈接關系不同,對微博信息傳播的影響和作用也不同。現有的節點鏈接關系算法大多從PageRank算法演化而來,比較成功的演化算法有TwitterRank算法、SpreadRank算法。TwitterRank算法通過融入話題影響力、關注關系網絡、用戶發布微博數量和用戶興趣相似度等影響因子,提高識別話題的敏感度;SpreadRank算法將轉發時間間隔作為影響因子,并考慮不同用戶在傳播過程中的級別,提升影響力計算的準確度[25-26]。
節點鏈接關系最直接的表現就是節點之間的關注度,因此可運用程度中心法衡量節點的直接關注度。直接關注度越高,成為關鍵節點的概率就越大。但是,這種方法只考慮節點的局部環境,忽視其他間接關聯節點的影響作用。基于此,有學者提出了接近中心法,將節點與其他節點的最短路徑和作為衡量指標,最短路徑和越短,接近中心度就越高,成為關鍵節點的概率越大。雖然與程度中心法相比,接近中心法的準確度和整體性都有所提升,但這種算法的約束性和計算復雜度很高,必須在所有節點完全相連的網絡中才能夠執行。為解決該問題,在同質節點的所有子網絡中引入超級節點,這些超級節點令整個網絡內的所有節點完全相連,然后運用接近中心法計算節點最短路徑和。這種方法不僅突破了原算法的約束性,而且提高了適用性,可以分別從全網絡、同質子網絡、異質子網絡進行測量,算法更加全面合理[27],見圖2。

圖2 基于節點鏈接關系的判定方法及其演化
網絡作為微博信息傳播的載體,它的屬性對微博信息傳播的影響大。因此,分析網絡拓撲結構屬性,或通過構建網絡拓撲結構找出信息傳播規律是重要的研究方向。通過分析微博社會網絡中心性,發現當信息敏感度超越某個臨界點,關鍵節點影響力將會隨著敏感度的提升而減弱[28],因此,精準、及時識別關鍵節點對控制事件的傳播擴散具有重要作用。以突發性事件的傳播作為研究對象,分析事件發展的時間階段特性,采用鄰接矩陣的方式表示節點和邊,構建信息傳播網絡拓撲結構,為找出控制事件惡性發展的關鍵時間和節點提供有效手段[29]。雖然這種方法能有效識別關鍵節點,但不具有通用性。因此,構建兩個雙向“關注”網絡,通過分析網絡的中心性指標(節點度、緊密度、介數、K-核),證實節點中心性指標的差異給信息傳播的深度和廣度帶來的影響有所不同,而緊密度和K-核指標的應用提高了尋找網絡核心節點的準確度[30]。隨著研究及學科之間交互作用的深化,借鑒社會物理學思想,以微博信息傳播網絡特征向量為出發點,將傳播過程中的影響因素以及傳播模式類比作動力學變量,從而建立微觀動力學方程:

公式1中Xi(t)表示t時刻用戶獲取信息繼續傳播的概率;v0表示信息價值;e-λix(t-t)表示信息關注程度;其余部分表示時效性以及參與信息傳播的用戶比例。此模型說明信息價值與信息關注度、被傳播的概率成正向相關關系。信息關注度越高,用戶繼續傳播的可能性也就越大[31]。
復雜網絡的信息傳播動力(即網絡內信息的傳播形態)機制研究一直是微博網絡研究的熱點問題。區別于人人網等熟人關系網絡,微博的公開性令其成為一種由信息推動的弱關系網絡。弱關系型網絡最明顯的特征就是用戶之間的關系可以是單向的。單向關聯關系的優勢在于令網絡內的節點互聯性更優、網絡結構更加緊密。微博網絡存在較多單向關聯關系,促使其信息傳播路徑更長,傳播速度更快,具有很明顯的小世界網絡特質,符合六度分隔理論[32]。在此基礎上,研究者對信息轉發的傳播動力模式進行研究,將其分為三種傳播模式(見圖3):(1)單關鍵點型,傳播速度快,傳播節點大多數是強勢節點;(2)鏈式型,傳播范圍小,影響力小;(3)多關鍵點型,在傳播過程中需要大量的強勢節點和關聯中介節點,傳播范圍廣,影響力較大。這種分類方式略為粗糙,在詳細分析新浪微博若干個熱點信息的傳播動力模式后,發現其主要傳播動力模式有七類:波紋型、蒲公英型、菌落型、煙花型、蜂巢型、雙子星型、隨機引爆型,其中比較普遍的是波紋型和蒲公英型。

圖3 信息轉發傳播模式
時間、用戶行為特征、發布的信息都有可能引起微博信息傳播網絡結構的演化,從而給信息傳播帶來影響。因此,筆者從網絡結構整體屬性、局部屬性以及演化時間規律三方面分析影響網絡結構演化的主要因素。
小世界、無標度特性通常被用來形容復雜網絡的整體宏觀結構。正是因為這些特性,微博網絡在演化進程中,存在擇優連接的現象,即節點粉絲數量越多,被新節點關注的概率就越大[33]。因此,將節點被新節點連接的概率P(ki)表示為:

其中,ki是節點i的度值。除了這種擇優連接現象,微博平臺會通過相關規則實行推薦機制,包括推薦好友、推薦微博信息等隨機因素,所以網絡內還擁有大量的隨機連接。將擇優和隨機模式融入無標度網絡模型,則節點被新節點連接的概率表示為:

其中αi為吸引力因子;ρ為可調參數,取決于擇優和隨機的權重,當ρ較小時擇優權重占優,反之隨機占優。從公式3可以看出,節點被新節點連接的概率取決于網絡的隨機性、節點的度和吸引力。節點度值大、吸引力高,被連接可能性就非常大;節點度值小,吸引力高,被連接的可能性會較高。這類節點通常指新注冊的社會名人,或是受一些事件影響突然成為焦點的普通用戶;節點度值大、吸引力低,被連接的概率小,如名人退出微博平臺,不再發表信息,其吸引力隨之會迅速減弱;節點度值小、吸引力低,則被連接的概率更低,這類節點普遍是粉絲數量較少的普通用戶。
(1)共同鄰居節點的影響。對真實網絡進行實證分析,結果表明陌生節點是否能建立聯系,與它們的共同鄰居節點有很大關系[34]。共同鄰居節點越多,建立直接聯系的可能性就越大。在微博網絡中,可以將兩個互相關注節點看作是一個子網絡,則微博信息傳播過程是由若干個子網絡所構成的網絡結構,子網絡數量越多,共同鄰居節點越多,延長信息傳播路徑、擴大信息傳播廣度的幾率就越高。
(2)共同屬性的影響。在微博網絡內,具有共同屬性(相同興趣、職業等)的節點往往會形成一個小集體網絡。很顯然,小集體網絡內原本陌生的兩個節點變成互相關注鏈接關系的概率將會大大增加。共同屬性的存在驅動著小集體網絡的構建,提高了節點之間的直接聯系概率,進而促進微博信息的傳播。
(3)鍍金效應。鍍金效應是指在微博網絡中借助其他用戶力量來提高自身影響力的行為。具體做法就是將增加粉絲數量作為共同目的進行用戶之間的互相推薦,或是通過與名人互動,吸引名人的關注、評論和轉發,從而獲得關注量,提升自身影響力。鍍金效應的前提在于用戶活躍度以及發布的信息價值。信息價值高,鍍金效應發生的概率就較大,擴大信息傳播范圍的概率就越大。
網絡結構的演化不是一種穩定的結構變動。用戶的活躍時間分布情況、突發事件的發生等不確定性因素都會對信息源節點的網絡結構帶來一定的影響。經統計分析,用戶活躍度日高峰期處于 11:00-12:00、17:00-18:00、22:00-23:00三個時間段,周高峰期則在周五、周六、周日三天。由此可見,活躍度高峰期幾乎處在用戶的休息時段內。通過對微博網絡的演化情況進行監測,發現在高峰期演化較快,低谷期則比較平穩。突發性事件作為影響網絡結構演化的一種不確定因素,一般會經歷三個時期:醞釀期、飛漲期、消退期。從以往的調查數據可以看出,事件發生后較短時間內,信息轉發量和信息相關節點的關注度會暴增,從而令整個網絡結構發生顯著變化。
微博信息傳播模型多數是基于SIR模型所構建的。根據動力學方法構建的SIR模型,早期主要用于病毒傳播及其發展規律的定量研究;后期則用于研究信息傳播,并逐漸成為應用最廣泛的模型之一。SIR模型將S定義為易感染節點,I定義為傳染節點,R定義為免疫節點,每個節點都有可能變為這三種類型之一。但是,SIR模型的最大不足在于,它的假設前提是網絡內用戶總數量不變,易感染節點變為傳染節點和傳染節點變為免疫節點概率值都是固定的;并且只考慮隨時間的變化節點之間內在因素的影響,忽略了外部環境影響因素,因此出現了SIR模型的演化模型。
(1)融入新影響因素的SIR模型。SIR模型是一種單向傳染機制,但是真正的傳染方式是雙向的、不固定的。因此,將遺忘機制(可能將感染節點和免疫節點變成易感染節點)和遏制機制(可能將感染節點轉變成免疫節點)作為影響信息傳播的重要因素融入SIR模型(見圖4),依據此模型所構建的微分動力學方程如公式4所示。

通過計算節點密度變化趨勢及傳播速率,發現遺忘機制和遏制機制對信息傳播具有顯著的影響作用[35]。由于網絡社會因素同樣會給傳播路徑帶來影響,所以將社會加強因素融入,提出CSR(在線社交網絡謠言傳播)模型,但CSR模型的針對性較強,不具有通用性。因此,通過更新傳播規則,運用動力學方程,融入個人接受閾值,提出一種基于移動社交網絡的謠言傳播模型[36],該模型驗證了信息在均勻網絡結構中的傳播速率更快。但是,上述研究都將拓撲結構置于規則網絡中,與實際的網絡結構有一定的差異,研究結果缺少實用性。因此,有學者加入用戶相對影響力因子來構建RWSIR模型,通過引入節點轉化概率系數λ,并在隨機網絡、小世界網絡、無標度網絡中進行仿真分析,研究結果顯示RWSIR模型與實際的微博信息傳播過程更加貼合[37]。
(2)SIR模型節點形態的演化。通過改進節點形態而構建的SIR演化模型有SEIR、SIRS和SEIRS等。這些模型依據不同研究方向和目的,通過融入潛在節點E或是改變節點感染流程進而改良SIR模型。另外,為了研究信息傳播周期、傳播速度、傳播深度與節點狀態的關系,研究者將傳播節點分為S態(易感染用戶)、Ia態(感染用戶,且與傳播者觀點一致)、Id態(感染用戶,與傳播者觀點不一致)和R態(免疫用戶),依據經典SIR微分方程推導原理,計算節點感染概率、信息忽略概率和感染用戶衰減度。實證結果表明,信息傳播過程中的初始節點感染率越高,傳播速度越快;信息忽略概率越高,被感染用戶越少;已感染用戶衰減速率越快,傳播周期越短,傳播范圍越小[38]。亦有為研究信息傳播有效率和節點規模大小的影響程度,將節點分為S態(未收到信息)、I態(收到信息,確定會繼續傳播),IR態(收到信息,不確定是否會繼續傳播)和R態(收到信息,確定不會繼續傳播)四種形態,從網絡結構特征、信息屬性和用戶主觀差異性進行分析,通過模型仿真,認為這兩種因素對信息傳播的速度和深度產生的影響可以忽略不計[39]。SIR演化模型在挖掘微博信息傳播模式和傳播規律的研究中取得了突破性的進展。
微博網絡可以看作是由線上網絡和線下網絡構成的一種多重網絡,線上網絡由微博平臺內的節點用戶構成,線下網絡由現實世界的微博用戶構成。因此,基于多重網絡對線上網絡開展傳播預測研究,為線下網絡制定信息傳播控制策略提供依據;對線下網絡進行微博信息傳播控制研究,為網絡環境安全提供保障。

圖4 SIR經典模型及其演化
早期的線上網絡微博信息傳播預測模型主要對用戶的轉發行為、信息的傳播路徑進行預測分析,將用戶名、直接鏈接節點數量、信息內容等特征作為預測指標。若預測指標過少,預測精度難以保證;當預測指標數量滿足條件時,雖提高了精確度,但由于特征向量過多,量化處理非常復雜,難以達到預測目的。因此,一種信息傳播路徑級聯概率模型出現了。通過運用貝葉斯網絡、樸素葉貝斯和邏輯回歸三種經典算法,分析影響用戶轉發行為的相關因素,從而實現用戶轉發行為和傳播路徑的預測,實驗證明該模型預測精度比較理想[40]。隨著研究的深入,最初運用的判定樹、貝葉斯、樸素葉貝斯、邏輯回歸等經典算法已經不能滿足微博信息傳播預測研究的需要。基于此,學者提出了一種改良的決策樹算法——隨機森林微博轉發預測算法,其構建過程如圖5所示。通過提取重要特征,加入用戶間微網絡關系和用戶權重等系數,預測用戶的轉發行為,實驗證明隨機森林微博轉發預測算法性能高于其他經典算法,并取得較高的預測精度[41]。

圖5 隨機森林微博轉發預測算法的構建過程
由于微博網絡的特殊性,一旦不良信息形成爆發式傳播,將對微博平臺、網絡環境帶來諸多不利影響。微博信息傳播研究的最終目的就是為了控制微博信息傳播的流向和流速,因此,對控制策略的制定和實施方式進行研究具有重要意義。微博信息控制策略模式分為個體式、分割式、誘導式以及改變式四類[42]。最初的微博信息傳播控制研究提出一種隨機控制策略,其缺點在于如果想要達到控制的目的,需要選取的控制節點數量過于龐大。為了解決這一問題,學者提出了一種目標控制策略,然而微博網絡的巨大規模令目標控制同樣難以實現。因此熟人控制策略應運而生,熟人控制策略將隨機控制策略和目標控制策略相融合,首先運用隨機策略選取部分節點,然后找到與其相關聯的鄰居節點,最后對部分鄰居節點采取目標控制策略。仿真分析驗證了這種方法不僅容易實現,而且實施效果非常理想[43]。博弈論是一種研究特定條件下,個體如何選取令自己收益最大化的策略的理論。借鑒博弈論思想,分析信息傳播策略演化,計算遇到突發事件時采取不同策略分別可能獲取的收益,可為控制微博信息的惡意傳播,制定適合事件良性發展和演化的最優策略提供依據。仿真分析結果顯示,參與傳播用戶多、爆發時間長并且規模較大的群體事件更加適合透明公開處理;參與傳播用戶少、爆發時間短并且在未變為熱點事件前可適當對信息進行屏蔽處理[44]。
從微博信息傳播模型及其演化看出,研究側重點主要集中在微博傳播節點屬性和傳播路徑屬性,卻忽略了關鍵主體——信息。在微博傳播過程中,信息可以劃分為多種類型,不同類型信息的傳播路徑、影響力等都會存在較大的差異。不僅節點之間存在鏈接關系,節點與信息內容同樣有一定的聯系,節點用戶的心理行為、關注信息的類別、發布信息的類型等都關聯著不同的信息屬性。由于微博網絡可看作由多個子網絡構成,所以信息屬性與子網絡的匹配度、信息在傳播過程中的演化等問題同樣是微博傳播研究的重要方向。劃分微博信息類別,構建指標體系來評估信息差異性以及其在傳播過程中帶來的影響,不僅可促進信息傳播特征以及傳播機制的挖掘深度,而且可為制定信息調控監管策略、規范微博網絡環境提供更可靠的依據。
現實微博網絡的復雜性,線上線下的多重關系,子網絡結構鏈接關系的差異性,用戶的個性化特征、信息的多種類別都給微博網絡的屬性增添了復雜性。運用單一的網絡結構研究微博信息傳播顯然不夠貼合實際,研究成果現實適用性并不強。因此,運用大數據解析微博網絡的基本特征,并引入復雜網絡與多重網絡的理念,令整個微博網絡既具有小世界和無標度等復雜網絡的特性,同時又兼具多重網絡的線上線下網絡結構特性。從微博網絡的整體性來看,將微博傳播規律研究與預測控制研究相融合,不僅令所構建的網絡結構模型更貼合實際,而且可通過網絡結構的整體性研究,進一步提升信息傳播的路徑及其演化規律的準確度。從微博子網絡角度來看,將線上網絡與復雜網絡融合,對網絡結構自身特性及其復雜性進行研究,有利于拓展微博信息傳播研究深度,進一步提升預測精度,使成果應用更具實踐價值;將線下網絡與復雜網絡融合,優化控制策略方案,提高控制策略實施點的精準度,可為微博信息監管調控提供更可靠的依據。
隨著大數據技術的飛速崛起,將大數據技術與微博信息傳播管理相融合,不僅為研究微博信息傳播提供了新的研究工具,而且為傳播監管提供重要的技術支持(見圖6)。在理論研究方面,運用大數據技術,分析歸納總結微博信息傳播主要影響因素、關鍵路徑等,為理論研究提供準確度更高的實踐依據。在實踐應用方面,運用大數據技術,解析整個微博網絡結構所有因子的屬性,從中找到每一類因子的共通特性,以此為基礎識別用戶性質,嚴加監管“水軍”類型用戶,甚至可將其設置為黑名單用戶。同時,利用大數據識別信息性質,辨別虛假消息并進行相應的封閉處理。最后,可利用大數據預測信息傳播路徑以及用戶轉發行為,實現對輿論信息爆炸性傳播的有效控制。

圖6 基于大數據的微博信息傳播
[1]崔金棟,于圓美,王新媛,等.信息管理技術視角下微博研究綜述與趨勢分析[J].圖書館論壇,2015(4):92-99.
[2]袁毅.微博客信息傳播結構、路徑及其影響因素分析[J].圖書情報工作,2011(12):26-30.
[3]劉繼,李磊.基于微博用戶轉發行為的輿情信息傳播模式分析[J].情報雜志,2013(7):74-77,63.
[4]馬捷,孫夢瑤,尹爽,等.微博信息生態鏈構成要素與形成機理[J].圖書情報工作,2012(18):73-77.
[5]張海濤,宋拓,張連峰,等.基于信息內容與信息屬性的微博熱點信息生態化的實現研究[J].圖書情報工作,2014(15):123-127.
[6]方錦清,畢橋.統計物理與網絡科學面臨的若干挑戰與思考[J].復雜系統與復雜性科學,2010(4):29-38.
[7] 劉建香.復雜網絡及其在國內研究進展的綜述[J].系統科學學報,2009(4):31-37.
[8]Peter J M,Thomas R,Kevin M,et al.Community structure in time-dependent,multiscale,and multiplex networks[J].Science,2010,328:876-878.
[9]Kyu-MinL,CharlesD.Brummitt,K.I.Goh.Threshold cascades with responseheterogeneity in multiplex networks[J].Physical Review E Statistical Nonlinear&SoftMatterPhysics,2014,90 (6):062816.
[10]Gomez-Gardenes J, Rrinares I, Arenas A, et al.Evolution of cooperation in multiplex networks[J].ScientificReports,2012,2:620.
[11]GiuliaM,DanielR,PietroP,et al.Weightedmultiplex networks[J].PlosOne,2014,9 (6):e97857.
[12]Nicosia V,Bianconi G,Latora V,et al.Growing multiplex networks[J].PhyscialReview Letters,2013,111(5):058701.
[13]BoccalettiS,BianconiG,CriadoR,et al.The structure and dynamicsofmultilayer networks[J].PhysicsReports,2014,544 (1):1-122.
[14]Mostafa S,Rajesh S,Moreno M,et al.Spreading processesin multilayer networks[J].IEEE Transactionson Network Science and Engineering, 2015, 2 (2) :65-83.
[15]Federico B,Vincenzo N,Vito L.Structural measures for multiplex networks[J].Physical Review E Statistical Nonlinear&Soft Matter Physics, 2014, 89 (3) :032804.
[16]Azimi-Tafreshi N,Gomez-Gardenes J,Dorogovtsev S N.K-core percolation on multiplex networks[J]Physical Review E Statistical Nonlinear&Soft Matter Physics,2014,90 (3):032816.
[17]H X WU,M JXIN.Aquick emergencyresponsemodel for micro-blog public opinion crisis oriented to mobile Internetservices:Design and implementation[J].Advances in Intelligent and Soft Computing,2012,7(6):1-7.
[18]周秀云,婁策群.信息生態群落演替的概念、過程與特征[J].情報理論與實踐,2011(6):12-14.
[19]吳少華,崔鑫,胡勇.基于SNA的網絡輿情演變分析方法[J].四川大學學報(工程科學版),2015(1):138-142.
[20]Rafa D,Jan S,Wojciech F.The application of social networkanalysisalgorithmsin asystem supportingmoney laundering detection[J].Information Sciences, 2015,295:18-32.
[21]蔣侃,唐竹發,隋浩.基于微博信息擴散質量的網絡輿情關鍵節點識別[J].情報科學,2016(7):64-69.
[22]鐘杰,陳興蜀,王文賢,等.面向微博話題傳播的重要節點測量研究[J].計算機應用研究,2016(8):2290-2293.
[23]鄧小龍,李欲曉.面向應急管理的大圖重要節點中介度高效近似計算方法[J].系統工程理論與實踐,2015(10):2531-2543.
[24]周東浩,韓文報,王勇軍.基于節點和信息特征的社會網絡信息傳播模型[J].計算機研究與發展,2015(1):156-166.
[25]Z Y DING,Y JIA,B ZHOU,et al.Measuring the spreadabilityofusersin microblogs[J].JournalofZhejiang UniversitySCIENCEC ,2013,14(9):701-710.
[26]袁毅,楊成明.微博客用戶交流的機制、結構及特征研究[J].圖書館論壇,2010(6):82-86.
[27]武澎,王恒山,李煜.突發事件信息傳播超網絡中樞紐節點的判定研究[J].管理評論,2013(6):104-111.
[28]鄭蕾,李生紅.基于微博網絡的信息傳播模型[J].通信技術,2012(2):39-41.
[29]莊亞明,余海林.群體性突發事件信息傳播網絡特性研究——以搶蠟燭事件為例[J].情報雜志,2013(7):37-42.
[30]苑衛國,劉云,程軍軍,等.微博雙向“關注”網絡節點中心性及傳播影響力的分析[J].物理學報,2013(3):502-511.
[31]賀筱媛,胡曉峰.網絡信息傳播動力學建模研究[J].系統仿真學報,2010(11):2511-2514,2518.
[32]易成岐,鮑媛媛,薛一波,等.新浪微博的大規模信息傳播規律研究[J].計算機科學與探索,2013(6):551-561.
[33]KimB J,TrusinaA,MinnhagenP,et al.Selforganized scalefreenetworksfrommergingandregeneration[J].The European Physical Journal B Condensed Matter and ComplexSystem,2005,43(3):369-372.
[34]G.Kossinets,D.J.Watts.Empirical analysis of an evolvingsocialnetwork[J].Science,2006,311(5757):88-90.
[35]王超,劉騁遠,胡元萍,等.社交網絡中信息傳播的穩定性研究[J].物理學報,2014(18):87-93.
[36]王輝,韓江洪,鄧林,等.基于移動社交網絡的謠言傳播動力學研究[J].物理學報,2013(11):106-117.
[37]王金龍,劉方愛,朱振方.一種基于用戶相對權重的在線社交網絡信息傳播模型[J].物理學報,2015(5):71-81.
[38]黃宏程,蔣艾玲,胡敏.基于社交網絡的信息傳播模型分析[J].計算機應用研究,2016(9):2738-2742.
[39]田占偉,王亮,劉臣.基于復雜網絡的微博信息傳播機理分析與模型構建[J]情報科學,2015(9):15-21.
[40]曹玖新,吳江林,石偉,等.新浪微博網信息傳播分析與預測[J].計算機學報,2014(4):779-790.
[41]羅知林,陳挺,蔡皖東.一個基于隨機森林的微博轉發預測算法[J].計算機科學,2014(4):62-64,74.
[42]Thomas W V.Network interventions[J].Science,2012,337 (6090):49-53.
[43]顧亦然,夏玲玲.在線社交網絡中謠言的傳播與抑制[J].物理學報,2012(23):544-550.
[44]肖人彬,張耀峰.網絡群體事件信息傳播的演化博弈分析[J].復雜系統與復雜性科學,2012(1):1-7.
A Review of the Study on Microblogging Information Dissemination Model and Its Evolution
CUI Jin-dong,ZHENG Que,SUN Shuo
A review of the basis on which microblogging information dissemination model is constructed and the evolutionary process of the model is instrumental for the microblogging information transmission,since the impact related to the process is various and complex.In this paper,analysis is performed on the functions and evolution patterns of the existing microblogging information dissemination model,attempting to interpret that it is of the traits of a social network in terms of the own properties of the nodes,the link relation and the overall topology evolution;of the characteristics of a complex network in terms of the dissemination patterns,influencing factors and evolutionary laws of the model;of the qualities of a dual network in terms of information transmission prediction and control.After analyzing the functions and technical trends of the model,the authors point out the evolution direction of microblogging information dissemination model,that is,the fusion of nodes,node links and information content,the integration of complex networks and multiple networks,and the application of big data technology.
microblogging information dissemination; network structure; dissemination law; dissemination prediction
格式 崔金棟,鄭鵲,孫碩.微博信息傳播模型及其演化研究綜述[J].圖書館論壇,2018(1):68-77.
*本文系國家社科基金規劃項目“基于信息生態的微博信息管理機理研究”(項目編號:16BTQ068)研究成果。
崔金棟,博士,東北電力大學經濟管理學院副教授;鄭鵲,孫碩,東北電力大學經濟管理學院研究生。
2017-04-09
何燕)