任昌鴻,童春燕
(重慶師范大學(xué)涉外商貿(mào)學(xué)院,重慶 401520)
隨著我國(guó)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)已經(jīng)成為人們?nèi)粘I钪斜夭豢缮俚脑亍>W(wǎng)絡(luò)使用率的增加,導(dǎo)致網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)出現(xiàn)。網(wǎng)絡(luò)輿情指的是互聯(lián)網(wǎng)上流行的對(duì)社會(huì)問(wèn)題不同看法的網(wǎng)絡(luò)輿論,實(shí)質(zhì)上是社會(huì)輿論的一種表現(xiàn)形式,主要是通過(guò)互聯(lián)網(wǎng)對(duì)熱點(diǎn)與焦點(diǎn)問(wèn)題中影響力較強(qiáng)的觀點(diǎn)與言論進(jìn)行傳播。現(xiàn)今比較被大眾所接受的網(wǎng)絡(luò)輿情定義為:網(wǎng)絡(luò)輿情主要是以網(wǎng)絡(luò)為載體,以事件為核心,對(duì)廣大網(wǎng)民態(tài)度、情感、觀點(diǎn)、意見(jiàn)等進(jìn)行傳播、互動(dòng)、表達(dá)與后續(xù)的影響[1]。網(wǎng)絡(luò)輿情信息比較多元、表達(dá)較為快捷,具有開(kāi)放與虛擬的特性,導(dǎo)致其具有直接性、隨意性、多元化、突發(fā)性、隱蔽性、偏差性等特點(diǎn)。但是,隨著網(wǎng)絡(luò)社會(huì)的崛起,網(wǎng)絡(luò)輿情逐漸的成為現(xiàn)實(shí)社會(huì)的“晴雨表”,也是一種不可忽視的頻發(fā)性社會(huì)現(xiàn)象[2]。網(wǎng)絡(luò)輿情主要是通過(guò)對(duì)民意進(jìn)行聚合,對(duì)社會(huì)產(chǎn)生深刻的影響。但是其也存在著較大的風(fēng)險(xiǎn),近幾年,由于負(fù)面的網(wǎng)絡(luò)輿情導(dǎo)致當(dāng)事人抑郁、自殺的事件頻發(fā),網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)也逐漸的受到人們的重視。
為了對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)進(jìn)行詳細(xì)的分析,國(guó)內(nèi)外對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型進(jìn)行了研究,并取得了一定的成果。目前使用較為廣泛的模型為基于多數(shù)原則的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型、基于有限信任的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型以及基于Sznajd的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型。其中,基于多數(shù)原則的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型主要的思想為觀點(diǎn)聚合,在該模型中,個(gè)體觀點(diǎn)呈現(xiàn)為二元離散狀態(tài),更加簡(jiǎn)單,并簡(jiǎn)化了分析的過(guò)程;基于有限信任的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型認(rèn)為觀點(diǎn)交互行為主要出現(xiàn)在觀點(diǎn)差值小于給定的信任閾值時(shí),以此為基礎(chǔ),對(duì)觀點(diǎn)模型進(jìn)行建立,分析網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化過(guò)程;基于Sznajd的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型是粒子交互模型中的典型代表,主要的思想為:更多的個(gè)體會(huì)更加讓人信服,因此,該模型主要是將觀點(diǎn)進(jìn)行聚合,以此為基礎(chǔ),對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型進(jìn)行構(gòu)建[3]。但是上述三種方法均存在著網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性低、控制效果差的缺陷,無(wú)法滿足現(xiàn)今互聯(lián)網(wǎng)的需求,為了解決上述問(wèn)題,基于大數(shù)據(jù)平臺(tái)對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型進(jìn)行構(gòu)建,并設(shè)計(jì)仿真對(duì)比實(shí)驗(yàn)對(duì)構(gòu)建的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型性能進(jìn)行測(cè)試與分析。
要想對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型進(jìn)行構(gòu)建,首要的任務(wù)就要對(duì)網(wǎng)絡(luò)輿情信息進(jìn)行獲取。通過(guò)研究發(fā)現(xiàn),協(xié)程網(wǎng)絡(luò)爬蟲(chóng)算法更加適用于網(wǎng)絡(luò)輿情信息的獲取[4]。具體的信息獲取過(guò)程如下所示。
通過(guò)協(xié)程網(wǎng)絡(luò)爬蟲(chóng)算法得到網(wǎng)絡(luò)輿情信息為
X={x1,x2,…,xn}
(1)
為了對(duì)網(wǎng)絡(luò)輿情信息中的觀點(diǎn)進(jìn)行提取,首先采用加權(quán)技術(shù)對(duì)信息中的關(guān)鍵詞進(jìn)行提取。采用權(quán)重對(duì)詞的關(guān)鍵程度進(jìn)行表示,詞權(quán)重計(jì)算公式為

(2)
其中,idfxi表示的是第i個(gè)詞的權(quán)重值;log表示的是底為10的對(duì)數(shù)公式;|D|表示的是網(wǎng)絡(luò)輿情信息集合D中信息的總數(shù);{d′∈D|t∈d′}表示的是包含詞t的信息數(shù)量。
在網(wǎng)絡(luò)輿情信息中,若是關(guān)鍵詞k出現(xiàn)了n次,而網(wǎng)絡(luò)輿情信息總詞數(shù)為N,則詞頻為n/N。
由于網(wǎng)絡(luò)輿情信息中含有大量的相似關(guān)鍵詞,為了簡(jiǎn)化網(wǎng)絡(luò)輿情信息,將相似的關(guān)鍵詞進(jìn)行集合,對(duì)相似關(guān)鍵詞權(quán)重進(jìn)行計(jì)算,得到

(3)
其中,Wxi,d′表示的是相似關(guān)鍵詞權(quán)重值;α表示的是計(jì)算參數(shù)。
通過(guò)式(3)得到各個(gè)相似關(guān)鍵詞的權(quán)重值,以此為基礎(chǔ),對(duì)網(wǎng)絡(luò)輿情關(guān)鍵詞分布圖進(jìn)行構(gòu)建。
通過(guò)統(tǒng)計(jì)分析方法得到詞頻的二維與三維圖,如圖1所示。

圖1 網(wǎng)絡(luò)輿情詞頻二維、三維圖
根據(jù)上述得到的網(wǎng)絡(luò)輿情詞頻圖,通過(guò)聚類算法獲取網(wǎng)絡(luò)輿情觀點(diǎn)信息,得到

(4)
通過(guò)上述過(guò)程完成了網(wǎng)絡(luò)輿情信息的獲取,并得到了網(wǎng)絡(luò)輿情觀點(diǎn)信息集合,為下述網(wǎng)絡(luò)輿情觀點(diǎn)的聚合提供數(shù)據(jù)支撐。
以上述得到的網(wǎng)絡(luò)輿情觀點(diǎn)集合為基礎(chǔ),采用Weisbuch-Deffuant模型對(duì)網(wǎng)絡(luò)輿情觀點(diǎn)聚合規(guī)則進(jìn)行設(shè)定,以此為基礎(chǔ),對(duì)網(wǎng)絡(luò)輿情觀點(diǎn)進(jìn)行聚合[5]。具體的過(guò)程如下所示。
忽略網(wǎng)絡(luò)輿情觀點(diǎn)聚合空間中流失的情況,設(shè)定網(wǎng)絡(luò)規(guī)模為M,將其中各個(gè)個(gè)體構(gòu)成的社會(huì)網(wǎng)絡(luò)記為G(M,E),其中,E表示的是網(wǎng)絡(luò)中邊的數(shù)量。


(5)

在網(wǎng)絡(luò)輿情觀點(diǎn)聚合中,個(gè)體交互程度具有非充分性與異質(zhì)性的特性,個(gè)體對(duì)他人觀點(diǎn)的接受程度也是不同的。在網(wǎng)絡(luò)輿情觀點(diǎn)聚合過(guò)程中,收斂系數(shù)主要是對(duì)個(gè)體對(duì)他人觀點(diǎn)接收程度進(jìn)行描述的變量,其取值的不同直接影響著觀點(diǎn)聚合的效果。因此,收斂系數(shù)設(shè)置為一個(gè)固定值并不合理[8]。本節(jié)采用收斂系數(shù)的分布f(μ)對(duì)收斂系數(shù)進(jìn)行代替。另外,將信任閾值與觀點(diǎn)距離引入,其滿足下述公式

(6)

根據(jù)上述公式得到網(wǎng)絡(luò)輿情觀點(diǎn)聚合一般規(guī)則為

(7)
其中,ε為值域[0,1]上的一個(gè)固定值。

方式一:隨機(jī)加邊[9]。主要是依據(jù)概率在網(wǎng)絡(luò)個(gè)體中進(jìn)行隨機(jī)選擇,使新加入個(gè)體與其聯(lián)系進(jìn)行建立;
方式二:依據(jù)度值權(quán)重進(jìn)行非等概率加邊[10]。主要是依據(jù)網(wǎng)絡(luò)連接的“馬太效應(yīng)”對(duì)新加入個(gè)體與已存在的個(gè)體進(jìn)行連接,其概率為

(8)
同時(shí),網(wǎng)絡(luò)中具有名人效應(yīng),以方式二進(jìn)行加邊更加符合實(shí)際的情況。因此,得到大數(shù)據(jù)平臺(tái)下網(wǎng)絡(luò)輿情觀點(diǎn)聚合流程如圖2所示。

圖2 大數(shù)據(jù)平臺(tái)下網(wǎng)絡(luò)輿情觀點(diǎn)聚合流程圖
通過(guò)上述過(guò)程完成了網(wǎng)絡(luò)輿情觀點(diǎn)聚合規(guī)則的設(shè)定,并對(duì)觀點(diǎn)進(jìn)行了聚合,為網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)系數(shù)的計(jì)算做準(zhǔn)備。
以上述得到的網(wǎng)絡(luò)輿情觀點(diǎn)聚合結(jié)果為基礎(chǔ),采用倉(cāng)室模型對(duì)網(wǎng)絡(luò)輿情信息擴(kuò)散模式進(jìn)行搭建,具體的模式搭建過(guò)程如下所示[11]。
倉(cāng)室模型是現(xiàn)今使用較為廣泛的模型類型,倉(cāng)室模型示意圖如圖3所示。

圖3 倉(cāng)室模型示意圖
如圖3所示,S表示的是個(gè)體非知情狀態(tài),表示個(gè)體沒(méi)有受到網(wǎng)絡(luò)輿情信息擴(kuò)散的影響,對(duì)輿情信息認(rèn)知較少;E表示的是個(gè)體知情狀態(tài),個(gè)體對(duì)網(wǎng)絡(luò)輿情信息具有一定的了解,并受到其擴(kuò)散的影響;I表示的是傳播狀態(tài),這些個(gè)體是網(wǎng)絡(luò)輿情信息擴(kuò)散的主要推動(dòng)者;R表示的是移出狀態(tài),該狀態(tài)的個(gè)體不會(huì)受到網(wǎng)絡(luò)輿情信息擴(kuò)散的影響,處于免疫狀態(tài)。
網(wǎng)絡(luò)輿情信息擴(kuò)散中個(gè)體狀態(tài)轉(zhuǎn)移流程如圖4所示。

圖4 個(gè)體狀態(tài)轉(zhuǎn)移流程圖
以圖4為基礎(chǔ),對(duì)網(wǎng)絡(luò)輿情信息擴(kuò)散模式進(jìn)行搭建,用公式表示為

(9)
其中,λ,1-λ,ω,?,γ分別表示的是S→I,S→E,E→I,E→R,I→R之間的轉(zhuǎn)移概率;Θ(t)表示的是t時(shí)刻傳播節(jié)點(diǎn)的概率。
通過(guò)上述過(guò)程完成了網(wǎng)絡(luò)輿情信息擴(kuò)散模式的搭建,對(duì)其擴(kuò)散模型進(jìn)行了詳細(xì)的分析,為下述網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)系數(shù)的計(jì)算提供支撐。
以上述搭建的網(wǎng)絡(luò)輿情信息擴(kuò)散模式為基礎(chǔ),通過(guò)敏感性分析對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)系數(shù)進(jìn)行計(jì)算[12]。具體計(jì)算過(guò)程如下所示。
傳播概率對(duì)網(wǎng)絡(luò)輿情信息擴(kuò)散效果有著直接的影響,隨著傳播概率的變化,網(wǎng)絡(luò)輿情信息擴(kuò)散的效果也存在著較大的不同。將上述過(guò)程簡(jiǎn)化為數(shù)值模型為

(10)
其中,ψ(t)表示的是網(wǎng)絡(luò)輿情信息擴(kuò)散效果。
根據(jù)上述公式結(jié)果,通過(guò)敏感性分析公式計(jì)算網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)系數(shù),得到

(11)
其中,Ξ表示的是網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)系數(shù),通常情況下,認(rèn)為網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)系數(shù)越大,則網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)越大。
通過(guò)上述過(guò)程實(shí)現(xiàn)了大數(shù)據(jù)平臺(tái)下網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型的構(gòu)建,為網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)的預(yù)測(cè)與控制提供了強(qiáng)而有力的支撐。
上述過(guò)程實(shí)現(xiàn)了大數(shù)據(jù)平臺(tái)下網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型的構(gòu)建,但是對(duì)其是否能夠解決現(xiàn)有模型存在的問(wèn)題還無(wú)法確定,為此設(shè)計(jì)仿真對(duì)比實(shí)驗(yàn)對(duì)構(gòu)建模型的性能進(jìn)行測(cè)試與分析。
首先對(duì)實(shí)驗(yàn)平臺(tái)進(jìn)行構(gòu)建,如圖5所示。

圖5 實(shí)驗(yàn)平臺(tái)示意圖
在仿真對(duì)比實(shí)驗(yàn)過(guò)程中,采用構(gòu)建模型與現(xiàn)有的基于多數(shù)原則的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型、基于有限信任的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型以及基于Sznajd的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型進(jìn)行對(duì)比實(shí)驗(yàn)。為了保障實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,將實(shí)驗(yàn)外部環(huán)境參數(shù)設(shè)置為一致,通過(guò)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性與控制效果對(duì)模型的性能進(jìn)行體現(xiàn)。具體的實(shí)驗(yàn)結(jié)果分析過(guò)程如下所示。
為了保障實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,在網(wǎng)絡(luò)輿情信息量15MBit與50MBit情況下,對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性進(jìn)行實(shí)驗(yàn),通過(guò)實(shí)驗(yàn)得到網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性對(duì)比情況如表1、表2所示。

表1 信息量15MBit下網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性對(duì)比情況表

表2 信息量50MBit下網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性對(duì)比情況表
如表1、表2所示,構(gòu)建模型的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性遠(yuǎn)遠(yuǎn)的高于現(xiàn)有三種方法,信息量15MBit情況下最大值為94%;信息量50MBit情況下最大值為89%。
網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型可以通過(guò)模型系數(shù)的設(shè)置對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)進(jìn)行控制,其控制效果直接影響著模型的性能。
通過(guò)實(shí)驗(yàn)得到網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)控制效果對(duì)比情況如圖6所示。

圖6 網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)控制效果對(duì)比情況圖
如圖6所示,構(gòu)建模型的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)控制效果參數(shù)遠(yuǎn)遠(yuǎn)的高于現(xiàn)有三種方法,說(shuō)明構(gòu)建模型控制效果更好。
通過(guò)實(shí)驗(yàn)結(jié)果顯示,構(gòu)建的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型極大的提升了網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性與控制效果,充分說(shuō)明構(gòu)建的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型具備更好的性能。
構(gòu)建的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型極大的提升了網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性與控制效果,為網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)的預(yù)測(cè)與控制提供了強(qiáng)而有力的支撐。但是模型的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性與控制效果依然具有很大的上升空間,需要對(duì)模型進(jìn)行進(jìn)一步的優(yōu)化。