柯赟
(1.武漢工商學院;2.湖北網絡社會發展研究中心,武漢430074)
基于動態貝葉斯網絡的輿情預測模型研究
柯赟1,2
(1.武漢工商學院;2.湖北網絡社會發展研究中心,武漢430074)
隨著新興媒體的出現,為了提前并更加準確地判斷突發事件網絡輿情的發展演化方向,以便做出比較合理的預測監控。文章基于動態貝葉斯網絡模型,建立了關于突發事件的網絡輿情預測監控模型。通過關聯概率的計算,對動態貝葉斯網絡中存在因果關系的節點變量進行預測。并以分析2014年上海踩踏事件為例,確定此事件對象中的節點變量,并通過10位專家評分的方式給出了對突發事件網絡輿情進行預測的具體操作方法,得到比較合理的預測結果,證明了該方法的可行性和實用性。
網絡輿情;預測;突發事件;動態貝葉斯;專家評分
與傳統的社會輿情相比,隨著計算機網絡的迅速普及以及網民規模的滾動式增長,網絡上的言論日益頻繁,其中,網絡環境中突發事件的“羊群行為”影響趨勢擴大,包括影響的傳播速率以及擴大規模。因此,近年來在輿情中,一種新的表現形式——網絡輿情也隨之出現。網絡輿情主要是指一些事件發生的前后憑借網絡媒介傳播后,人們對于這些事件的評價、認知方向、行為趨勢等反應回饋形成的集合。鑒于其突發性、爆發性以及實時性等特點,若無法對網絡輿情實施適當準確的引導并監管,則將導致其負面性對社會公共安全造成很大影響。
基于此背景下,對于突發事件的網絡輿情進行提前、準確的預測監控顯得越來越有必要,并成為當前研究的一大熱點問題[1]。目前國內外關于網絡輿情方面的研究文獻,側重點已經從定性研究開始慢慢向定量和定性相結合的趨勢發展。
本文基于動態貝葉斯網絡模型,對突發事件的網絡輿情建立演變模型,并且利用特定的關聯概率公式計算來進行實時預測,給國家政府提供管理突發事件網絡輿情情況的參考價值。
1.1 突發事件網絡輿情演變分析
分析突發事件網絡輿情的演變情況,關系著如何采取有效的措施以最大程度的減小其對社會的影響,從而給政府相關部門充分的時間,在突發事件網絡輿情高潮來臨之前做好各種合理的處理預案。如張一文[2]將突發事件網絡輿情對社會的影響分為了四個階段:潛伏期、明顯期、高潮期以及消退期。本文在參考一些文獻的基礎上,認為其具有一定時期的潛伏期,為了在突發事件網絡輿情到來時有足夠的預備措施,必須在此階段對其做好合理的預測分析。
因此,本文將突發事件網絡輿情的發展主要分為三個階段:潛伏期、發生期和演化期。其中,政府相關部門需要在潛伏期做好合理準確的預測分析,從而做好相應的預處理方案,采取有效的措施對其發生進行處理,并引導突發事件網絡輿情平穩的度過演化期。
1.2 動態貝葉斯網絡概念
動態貝葉斯網絡模型是指跟隨時間動態變化而演化的模型[3],相對于靜態貝葉斯而言,其主要增加了一個時間要素,從而形成了包含對于時序數據具有處理能力的一個新的隨機模型。其中,“動態”是指變量隨著動態變化的時間取值,而非其網絡結構發生動態變化[4]。
1.3 突發事件網絡輿情預測建模
根據動態貝葉斯的概念可知,基于其描述的突發事件模型具備時間上的動態性,并且事件前后關聯,滿足突發事件發展、變化的規律。動態貝葉斯網絡主要采用概率計算和統計的方法,結合專家評價、收集已有資料和數據進行分析計算,具備信息時間累計的能力,相比靜態貝葉斯網絡描述,在很多情況下,更具備合理性。動態貝葉斯網絡主要由兩部分組成:(1)初始狀態,即初始貝葉斯網絡N0;(2)兩個或者兩個以上時間片段的貝葉斯網絡N。具體如圖1所示。
由圖1所示,可以看出此推理過程在很大程度上契合突發事件的發展變化規律。本文采用動態貝葉斯網絡模型來建立突發事件網絡輿情的關鍵情景,并對其主要要素進行分析。總體來說,動態貝葉斯網絡的概率計算必須遵循如下規則[15]:動態貝葉斯網絡參照貝葉斯網絡,同樣采用概率積分來表述不確定性,并且對于概率積分,最基本的規則為采用關聯事件的概率:

式(1)中,P(A,B)表示事件A和B發生的實際概率,P(B)表示事件B的絕對概率,P(A/B)表示給定事件B發生的情況下,事件A發生的條件概率。P(A/B)可由式(1)變換為表達式(2):


其中,P((Mi)為先驗概率,即所有量測之前的狀態i的概率。是對于某一狀態i給定測量向量e的條件下的概率。

圖1 動態貝葉斯網絡示例
注意事項:
(1)在對突發事件網絡輿情進行監控預測建模之前,首先需要把握任意兩節點變量之間的關系;
(2)在對(1)中節點變量之間關系的確定過程中,本文采用如下方法:第一步,通過相關領域專家分析輿情的關鍵因素點,并以評分的形式給定一個閾值r。若實際評分值大于r時,則對應的要素為關鍵要素;相反,若實際評分值小于r時,則需要丟掉;第二步,整合前面確定的關鍵要素點,并按照一定的邏輯順序連接起來。
(3)根據確定的節點變量關系,構建有向無環圖,也就是通過有向邊將每個節點的相互關系呈現出來。
2014年12月,上海市黃浦區外灘陳毅廣場發生群眾擁擠踩踏事件。政府對這一重大網絡輿情突發事件作出了迅速回應,考慮到其仍然社會影響極其惡劣,本文以此為例,進行網絡預測分析。
2.1 確定節點變量
針對上海踩踏事件網絡輿情對象,將這些對象作為網絡的某一個節點。在突發事件中,主要利用主觀數據和客觀數據來分別對末級指標進行量化,這些數據的來源大部分從各種現代傳播媒體、交互工具以及政府等獲得。而在此事件中,本文選用如下五個節點作為貝葉斯網絡節點:網民X1、傳統媒體(包括電視新聞、報紙等) X2、新興媒體(官方微博、管方微信等)X3、政府(包括官方日報、電視會議等)X4、民間傳播(公眾、休閑場所等傳播)X5。
2.2 確定網絡節點的關系
通過相關領域專家對某一節點給出評分,從而確定節點間的因果關系,進一步通過式(4)計算出當前節點變量的概率值X。然后,給出此突發事件中當前節點的一個信度閾值r,若前面計算出來的估算平均值大于r,則表示存在因果關系,否則,為不存在。對于存在因果關系的節點變量構建有向無環圖,用箭頭連接,從而建立此事件的整個貝葉斯網絡。假定此事件合理性閾值為0.7。

本文選用10名專家對節點X1、X2、X3、X4、X5進行分析評分,利用式(4)求得各個節點的算術平均值。具體情況見表1所示。

表1 變量X1、X2、X3、X4、X5的節點變量因果關系專家評分值

圖2 簡化后的貝葉斯網絡圖
2.3 條件概率確定
本文假定此突發事件的網絡輿情某一節點變量G必定發生,因此它的True(記為T)為1、False(記為F)為0。其他貝葉斯網絡節點的條件概率則由10名專家根據網絡輿情的發展變化規律分析給出。當G=T時,若10名專家對X1[1]為T進行打分分別為0.8、0.8、0.9、0.9、0.8、0.7、0.95、0.9、0.9、0.9,則計算出其平均值為0.855,從而其為F時,F=1-0.855=0.145;當G=F時,若10名專家對X1[1]為T進行打分分別為0、0、0、0、0、0、0、0、0、0,因此其為T的算術平均值為0,F=1-0=1。X1[2]、X1[3]、X1[4]、X1[5]的取值方法與X1[1]相同。本文只給出網民X1條件概率的確定值,具體情況見表2,傳統媒體X2、新興媒體X3、政府X4、民間傳播X5的計算方法與X1類似,這里只給出結果。

表2 X1的X1[1]、X1[2]、X1[3]、X1[4]、X1[5]時段的條件概率
2.4 狀態概率計算
根據上述專家評分,利用關聯概率計算出某一節點變量是否發生的概率。如X1的狀態概率P(X1)為:
P(X1[1])=P(X1[1]/G=T)×P(G=T)+P(X1[1]/G=F)×P(G=F)
可以預測網民X1、傳統媒體X2、新興媒體X3、政府X4、民間傳播X5在時間T2的動態。從而進一步根據T2五者之間的動態預測T3的動態,遞推到整個事件結束為止,完成預測。本文只對X1在X1[1]、X1[2]、X1[3]、X1[4]、X1[5]這五個時間段進行計算,具體結果見表3。
X2、X3、X4及X5的計算方法類似X1,得出X1[1]的T為0.855、X1[2]的T為0.752、X1[3]的T為0.787、X1[4]的T為0.787、X1[5]的T為0.861。同樣可以計算出其余各個節點的關聯概率T均大于0.7。
結果說明,當本文所列舉的事件發生時,各媒體、網民、民眾等對這一事件的關注度會增加,不會呈現出保持不變或減弱的趨勢。因此,給相關部門對這一突發事件網絡輿情預警監控提供了依據。

表3 X1節點在X1[1]、X1[2]、X1[3]、X1[4]、X1[5]時間段的狀態概率
本文采用動態貝葉斯網絡建立突發事件網絡輿情監控預測模型,通過時間的動態變化可以很直觀的從網絡圖中看出事件中定義的各個節點的發展趨勢,從而可以更加準確合理的做出預測,為政府相關部門輿情控制提供有效的參考。另外,通過專家分析評分來確定事件發展各個階段的條件概率,把定性問題定量化,可以有效的實現兩者的結合,因此經過計算得出的結果會更具有科學性。理論上,相關領域越權威的專家給出的評分更加具有參考性以及實際價值,同時專家數量的規模需要根據突發事件的實際情況確定。
最后,本文以上海踩踏突發事件為例,分析并預測了其網絡輿情變化。可以看出,本文方法可以應用到具體事例中,并盡可能從多方面相關渠道收集詳細的調查數據進行分析,從而做出更加準確合理的預測。隨著國內網絡輿情預測體系的不斷發展完善,這一方法將能夠為政府分析突發事件網絡輿情起到一定的參考價值。
[1]Schydel v R,Triklel A,Osbome C.A Digital w atermark[C].Procedding of International Conference on Image Proceeding.Texas:IEEE, 1994,(2).
[2]張一文,齊佳音,方濱興等.非常規突發事件網絡輿情熱度評價指標體系構建[J].情報雜志,2010,(11).
[3]史志富,張安.貝葉斯網絡理論及其在軍事系統中的應用[M].北京:國防工業出版社,2012.
[4]酈能敬.預警機系統導論[M].北京:國防工業出版社,1998.
[5]孫兆林,楊宏文,胡衛東.基于貝葉斯網絡的態勢估計方法[J].計算機應用,2005,25(4).
(責任編輯/亦民)
G530
A
1002-6487(2016)20-0026-03
湖北省社會科學基金重大項目(國信辦委托項目)(2012w T007)
柯赟(1978—),女,湖北武漢人,副教授,研究員,研究方向:網絡傳播、危機管理、輿情導控。