吳詩賢 張必蘭
〔摘要〕[目的/意義]探討網(wǎng)絡(luò)輿情事件中群體觀點(diǎn)的演變規(guī)律,構(gòu)建有效預(yù)測其演變趨勢的方法。[方法/過程]參考物理學(xué)中場的思想和信息科學(xué)中數(shù)據(jù)場的方法,引入觀點(diǎn)場概念,提出了一種基于觀點(diǎn)勢的觀點(diǎn)潛在影響力評估模型;然后將該模型運(yùn)用到微博評論的群體觀點(diǎn)演化分析中,建立了微博評論的觀點(diǎn)趨勢預(yù)測方法。該方法的基本思想是以當(dāng)前評論的觀點(diǎn)勢分布來預(yù)測未來評論的觀點(diǎn)分布,在觀點(diǎn)勢計算時,以既有評論的排序值代表新的信息受眾所處的參考場點(diǎn)與觀點(diǎn)場中既有評論之間的距離。[結(jié)果/結(jié)論]通過實(shí)際的微博輿情事件數(shù)據(jù)實(shí)驗表明,該網(wǎng)絡(luò)輿情群體觀點(diǎn)趨勢預(yù)測模型能較好地評估已發(fā)表的顯性觀點(diǎn)對后來網(wǎng)民觀點(diǎn)形成的影響力,具有較高的網(wǎng)絡(luò)輿情觀點(diǎn)趨勢預(yù)測準(zhǔn)確率。
〔關(guān)鍵詞〕群體極化;觀點(diǎn)場;觀點(diǎn)勢;影響力;評估模型;微博;評論;演變規(guī)律;演化趨勢;網(wǎng)絡(luò)輿情;輿論趨勢;預(yù)測
DOI:10.3969/j.issn.1008-0821.2018.09.012
〔中圖分類號〕G202〔文獻(xiàn)標(biāo)識碼〕A〔文章編號〕1008-0821(2018)09-0074-05
An Opinion-Field-Model-Based Method for Prediction of the
Evolution Trends of Opinions of Microblog CommentsWu Shixian1Zhang Bilan2
(1.Computer Science and Information Engineering College,Chongqing Technology and
Business University,Chongqing,400067,China;
2.Library,Chongqing Technology and Business University,Chongqing 400067,China)
〔Abstract〕[Purpose/Significance]To explore the formation and evolution of group opinion trends in cyber public opinion events,and to construct a corresponding method for efficient prediction of the evolution trends.[Method/Process]Based on the analysis of the generation and evolution of viewpoints in network public opinion events,the concept of opinion field was introduced with reference to the idea of physical fields and data fields in information science.An evaluation model for the impact of opinion potential was thus proposed.The model was applied to the evolution analysis of the group opinions in microblog comment groups to establish a method for protection of such evolution trends.The basic idea of this method was to predict the viewpoints distribution of future comments & opinions based on the distribution of the current opinion potential,the quantification of which was based on the rankings of current comments that represented the distance between the reference field point (in which the new information audience was located) and the existing comments in the opinion field.[Result/Conclusion]The actual data experiments on microblog public opinion events showed that the forecasting model of the evolution trend of network public opinion & group opinion could better evaluate the influence of the published explicit opinion on the forthcoming formation of the netizens opinions,and predict more accurately the corresponding evolution trends.
〔Key words〕group polarization;opinion field;opinion potential;impact;evaluation model;microblog;comment;evolution rule;evolution trend;public opinion;opinion trend;prediction
相較于現(xiàn)實(shí)環(huán)境下的群體交流,傳播過程的匿名性、輿情匯聚的便利性、輿情演化的馬太效應(yīng)等新媒體輿情發(fā)展特征,使得網(wǎng)絡(luò)輿情事件往往容易形成群體觀點(diǎn)的極化,并極有可能向網(wǎng)絡(luò)群體激化方向發(fā)展乃至釀成現(xiàn)實(shí)社會群體性事件,甚至危及社會公眾安全與政治穩(wěn)定。因此,在網(wǎng)絡(luò)輿情事件發(fā)生的早期,及時把握網(wǎng)絡(luò)輿情觀點(diǎn)發(fā)展趨勢是輿情監(jiān)控、輿情群體極化預(yù)防的重要措施之一。
情報學(xué)、社會學(xué)等多個領(lǐng)域的學(xué)者們從輿情形成機(jī)理、以及動力機(jī)制、演化規(guī)律等多方面展開了網(wǎng)絡(luò)輿情群體觀點(diǎn)演化相關(guān)問題的研究,取得了豐富的研究成果。典型的輿論演化模型主要有三類:一類是建立在微觀個體之間有界信任基礎(chǔ)上的DW模型[1]、HK模型[2],以及有界信任模型的改進(jìn)模型[3-4];另一類是以復(fù)雜網(wǎng)絡(luò)為載體的輿論演化模型[5-7];還有一類是將復(fù)雜網(wǎng)絡(luò)和有界信任相結(jié)合的輿論演化動力學(xué)模型[8]。現(xiàn)有的輿情觀點(diǎn)演化分析,大多基于給定的觀點(diǎn)網(wǎng)絡(luò)結(jié)構(gòu),采用一定的網(wǎng)民觀點(diǎn)交互影響及更新模型來評估群體觀點(diǎn)的演化,而在實(shí)際網(wǎng)絡(luò)中,輿情事件的參與者數(shù)量及相互之間的鏈接關(guān)系時刻都在變化,信息傳播的拓?fù)浣Y(jié)構(gòu)演變非常迅速,是典型的動態(tài)時變網(wǎng)絡(luò),直接定義在兩兩網(wǎng)民對上的觀點(diǎn)影響模型,難以刻畫未直接鏈接的網(wǎng)民之間觀點(diǎn)的影響;模型驗證也多以仿真為主、基于真實(shí)演化數(shù)據(jù)進(jìn)行的實(shí)證分析較少。同時,筆者通過對多個實(shí)際輿情事件觀點(diǎn)演化案例的分析,發(fā)現(xiàn)一旦網(wǎng)民在網(wǎng)絡(luò)上表達(dá)觀點(diǎn)后,受包括意見領(lǐng)袖在內(nèi)的其他網(wǎng)民的影響而改變觀點(diǎn)的并不多,大量觀點(diǎn)交互的結(jié)果往往是誰也說服不了誰。網(wǎng)絡(luò)輿情事件群體觀點(diǎn)的極化,一般并不是初期參與輿情事件討論的網(wǎng)民的觀點(diǎn)由分散轉(zhuǎn)向極化,而是后期不斷增加的網(wǎng)民觀點(diǎn)向前期影響力大的觀點(diǎn)偏移形成的。因此,輿情事件群體觀點(diǎn)的演化預(yù)測,關(guān)鍵是要較準(zhǔn)確地評估已發(fā)表觀點(diǎn)對后來網(wǎng)民觀點(diǎn)形成的影響力。
微博、微信等新社交傳媒工具能真實(shí)地記錄針對具體輿情事件的各種評論的大量屬性(如點(diǎn)贊量、回復(fù)量等),為觀點(diǎn)演化理論和實(shí)證研究帶來新的機(jī)遇。但是,在微博等社交環(huán)境下,已有評論與新信息受眾之間很多時候并無直接鏈接記錄(比如,網(wǎng)民進(jìn)入某博文評論區(qū)瀏覽,是難以準(zhǔn)確記錄他實(shí)際看了哪些評論的),這種情況下已有評論對后期網(wǎng)民觀點(diǎn)的影響是在非直接鏈接情況下實(shí)現(xiàn)的。
為了描述這種非直接接觸式作用,本文在對網(wǎng)絡(luò)輿情觀點(diǎn)形成規(guī)律分析的基礎(chǔ)上,受物理學(xué)中關(guān)于場的思想方法的啟發(fā),引入虛擬的觀點(diǎn)場來分析輿情事件中既有評論觀點(diǎn)與新信息受眾之間的作用,通過擬核力場勢函數(shù)描述既有觀點(diǎn)在觀點(diǎn)場中空間上的分布,以此為基礎(chǔ)構(gòu)建已發(fā)表觀點(diǎn)對后來網(wǎng)民觀點(diǎn)形成的影響力評估模型,并利用該模型建立微博評論群體觀點(diǎn)趨勢預(yù)測方法,最后利用真實(shí)輿情事件數(shù)據(jù)對該方法進(jìn)行了驗證。
2018年9月第38卷第9期現(xiàn)代情報Journal of Modern InformationSep.,2018Vol38No92018年9月第38卷第9期基于觀點(diǎn)場模型的微博評論觀點(diǎn)演化趨勢預(yù)測方法Sep.,2018Vol38No91研究對象界定
輿情的事件的性質(zhì)和敏感程度等很多因素都會直接或者間接影響網(wǎng)絡(luò)輿情演化的趨勢。對于良惡定性毫無爭議、超越了多元主觀認(rèn)知臨界的輿情事件,網(wǎng)民觀點(diǎn)受基本倫理道德規(guī)范的約束易出現(xiàn)單極群體極化現(xiàn)象;而那些事件信息模糊、話題爭議性顯著的輿情事件,相對立的觀點(diǎn)情緒都可能引起廣泛共鳴,受群體情緒演化影響顯著、輿情場極化可向多方向發(fā)展[9]。前一種情況的輿情事件,其極化方向是顯而易見的。本文的目標(biāo)是構(gòu)建觀點(diǎn)可向多方向發(fā)展類輿情事件的觀點(diǎn)趨勢預(yù)測方法。
2觀點(diǎn)場模型
物理學(xué)中把場作為描述物質(zhì)之間非接觸相互作用的介質(zhì),描述場的性質(zhì)和運(yùn)動規(guī)律的場論成為現(xiàn)代物理學(xué)的重要分支,其相關(guān)概念和思想被廣泛引入到其他學(xué)科領(lǐng)域。如,吳國恩利用情報場來描述信息施體、信息受體之間非接觸相互作用[10],淦文燕等利用虛擬數(shù)據(jù)場來描述數(shù)據(jù)對象之間相互作用[11]。
借鑒物理學(xué)和情報學(xué)中場的思想和方法,本文引入觀點(diǎn)場的概念來量化描述觀點(diǎn)的影響力和相互作用。
21觀點(diǎn)場的定義
參照物理場和數(shù)據(jù)場的概念,假設(shè)在網(wǎng)絡(luò)輿情事件發(fā)生后到某一時刻T,共產(chǎn)生了n個觀點(diǎn)構(gòu)成觀點(diǎn)集V={v1,v2,…,vn}。如果將這些觀點(diǎn)及其作用看作一個物理系統(tǒng),V中的任意一個觀點(diǎn)視作一個具有一定觀點(diǎn)質(zhì)量的粒子,那么它在產(chǎn)生之后就會在周圍形成一個作用場,n個觀點(diǎn)的作用場合成為整個輿情事件的觀點(diǎn)場。
22觀點(diǎn)場的勢和勢函數(shù)
輿情事件觀點(diǎn)場的勢可理解為已經(jīng)發(fā)出顯性觀點(diǎn)信息的觀點(diǎn)粒子所具有的潛在影響能在觀點(diǎn)場的分布。與物理場類似,在觀點(diǎn)場中也可以定義勢函數(shù),觀點(diǎn)勢函數(shù)描述的是單個觀點(diǎn)在觀點(diǎn)場的分布規(guī)律。某場源觀點(diǎn)在場中某點(diǎn)的觀點(diǎn)勢則由場源觀點(diǎn)的觀點(diǎn)質(zhì)量以及場源與該點(diǎn)之間的距離確定。考慮到觀點(diǎn)影響作用隨著距離的增長快速衰減的短程特性,參考數(shù)據(jù)場勢函數(shù)定義,本文用具有良好短程作用數(shù)學(xué)性質(zhì)的擬核力場高斯勢函數(shù)來描述任意觀點(diǎn)vi的作用,則任意觀點(diǎn)vi∈V在場點(diǎn)j的勢函數(shù)為:
φvi(j)=mie-rijσ2(1)
其中,mi為觀點(diǎn)vi的觀點(diǎn)質(zhì)量;σ為控制每個觀點(diǎn)的作用力程系數(shù),即影響因子;rij為場源觀點(diǎn)vi與場點(diǎn)j的距離。
根據(jù)上述擬核力場高斯函數(shù)的性質(zhì),對于給定的σ值,每個觀點(diǎn)的影響范圍近似為3σ/2單位距離的局域區(qū)域,當(dāng)距離大于3σ/2單位距離時,觀點(diǎn)勢函數(shù)值很快衰減到接近0。因此,為了簡化計算,某個場點(diǎn)的勢值不需要精確計算所有觀點(diǎn)對象的影響合力,而只需要疊加以該場點(diǎn)3σ/2單位距離鄰域內(nèi)的觀點(diǎn)產(chǎn)生的勢值。
23觀點(diǎn)質(zhì)量
觀點(diǎn)質(zhì)量是指觀點(diǎn)蘊(yùn)含的對其他網(wǎng)民觀點(diǎn)在距離為0時影響力的大小。觀點(diǎn)質(zhì)量的大小主要由觀點(diǎn)載體(一般為1篇博文、1個論壇帖子、1篇新聞文章、1個評論等)的說服力等屬性以及觀點(diǎn)發(fā)布者的固有影響力確定。承載觀點(diǎn)的文本一經(jīng)發(fā)布,其所蘊(yùn)含的觀點(diǎn)情感傾向和強(qiáng)度等屬性不隨時間變化而改變、在具體輿情事件演化的一定時間內(nèi)觀點(diǎn)發(fā)布者的固有影響力也基本不變,因此,一般情況下觀點(diǎn)質(zhì)量可以看成不變量;但觀點(diǎn)在輿情事件演化過程中所附加的一些屬性也可能改變(如,某個觀點(diǎn)獲得的點(diǎn)贊量可能不斷變化),這種情況下觀點(diǎn)質(zhì)量則可看成變量。
24觀點(diǎn)極化度和觀點(diǎn)勢極化度
觀點(diǎn)極化度代表了某一時刻網(wǎng)絡(luò)輿情觀點(diǎn)場輿論分布的極化程度,而觀點(diǎn)勢的極化度代表了網(wǎng)絡(luò)輿情觀點(diǎn)場輿論極化的趨勢。
對網(wǎng)絡(luò)輿情群體觀點(diǎn)極化程度的度量,需要從其定義和本質(zhì)出發(fā)設(shè)定其計量模型。如果直接測量某種傾向觀點(diǎn)數(shù)量的絕對值,容易受群體大小等因素影響,所以群體極化一般考慮用極端觀點(diǎn)比率這樣的相對值來判定群體是否出現(xiàn)極化現(xiàn)象以及極化程度[12]。
德國科學(xué)家Rudolf Clausius(克勞修斯)最早提出用“熵”來表示任何一種能量在空間中分布的均勻程度,能量分布得越均勻,熵就越大。香濃將其引入到信息論中,提出用“信息熵”度量信息量的大小。由于觀點(diǎn)是信息的一種,可以用信息熵的方法定義觀點(diǎn)(勢)熵和觀點(diǎn)(勢)極化度:
Hv=-∑ni=1pi×log2(pi)(2)
dgp=1Hv(3)
其中,pi為某種極性觀點(diǎn)數(shù)在所有觀點(diǎn)數(shù)中的比例(計算觀點(diǎn)極化度時)或某類觀點(diǎn)勢值占總的觀點(diǎn)勢值的比例(計算觀點(diǎn)勢極化度時),Hv為觀點(diǎn)(勢)熵,dgp為群體觀點(diǎn)極化度或觀點(diǎn)勢極化度。
顯然,各種觀點(diǎn)(勢)的比例分布越均勻,觀點(diǎn)(勢)熵就越大,如果所有觀點(diǎn)(勢)的比例都一樣,則觀點(diǎn)(勢)熵達(dá)到最大,此時,觀點(diǎn)(勢)極化度最小。
3基于觀點(diǎn)場模型的微博評論群體觀點(diǎn)趨勢預(yù)測方法微博的極大便捷性和交互性特點(diǎn),使其迅速成為使用范圍和影響力都極大的社交媒體,成為個人參與公共話題的一個重要平臺,一些大“v”博主的個體影響力甚至超過一個傳統(tǒng)媒體[13]。微博評論本身“雖然無法對微博進(jìn)行傳播,但獲得較多用戶評論的微博會以熱門話題形式被推薦到更多其關(guān)注對象的用戶微博主頁中,實(shí)現(xiàn)廣泛性傳播。”[14]。盡管微博評論者大多是普通網(wǎng)民,但是,普通網(wǎng)民的評論觀點(diǎn)如果成為熱門評論也會對群體觀點(diǎn)產(chǎn)生極大的影響,在評論的分布和增長中仍然體現(xiàn)出“多者越多”的非均衡增長和“極化效應(yīng)”,“群體極化”現(xiàn)象在微博的傳播過程中表現(xiàn)得也極為明顯[15]。
本文以知名新浪博主針對某輿情事件博文作為根源信息構(gòu)成的評論觀點(diǎn)場為對象。觀點(diǎn)極化分析主要考慮網(wǎng)絡(luò)輿情受眾面向博文的根源觀點(diǎn)做出的主觀評論,暫不考慮轉(zhuǎn)發(fā)、點(diǎn)贊和對評論的回復(fù)所表達(dá)的觀點(diǎn)。
31模型參數(shù)的討論
利用式(1)計算微博評論觀點(diǎn)勢,需要先確定3個參數(shù):微博評論觀點(diǎn)場中場源觀點(diǎn)與信息受眾場點(diǎn)的距離rij、觀點(diǎn)質(zhì)量mi、影響范圍因子σ。
311場源觀點(diǎn)與信息受眾場點(diǎn)的距離的確定
在前述觀點(diǎn)場概念模型中,觀點(diǎn)vi∈V在參考場點(diǎn)j的勢φvi(j)隨著它們之間的距離rij的增長而快速下降。在具體觀點(diǎn)場中,距離的物理含義是不同的,如果是觀點(diǎn)之間通過轉(zhuǎn)發(fā)、回復(fù)等構(gòu)成的有鏈接的觀點(diǎn)網(wǎng)絡(luò),則距離rij為場源點(diǎn)和參考場點(diǎn)之間的網(wǎng)絡(luò)距離,一般可由它們之間最短網(wǎng)絡(luò)路徑長度來代表,而在微博評論觀點(diǎn)場中,每一個進(jìn)入微博網(wǎng)絡(luò)輿情場的網(wǎng)民個體雖然在理論上都具備遍歷全域觀點(diǎn)的能力,但事實(shí)上不可能遍歷所有觀點(diǎn),新的博文信息受眾(網(wǎng)民)查看評論的時候,一般只是查看部分排序在前的評論,如果把新的信息受眾進(jìn)入微博的點(diǎn)看作參考場點(diǎn)O,則觀點(diǎn)場中既有觀點(diǎn)與這個參考場點(diǎn)之間的距離則可由觀點(diǎn)在評論排序中的位置來代表。
新版新浪微博正文頁評論主要提供了按熱度和按時間倒序方式查看評論,默認(rèn)按熱度排序。通過對多位微博用戶的調(diào)查,大多數(shù)用戶通常按新浪微博默認(rèn)的熱度排序瀏覽評論,少部分通常按時間倒序展現(xiàn)評論或兩種排序瀏覽評論,同時由于最新評論不斷變化,在簡化計算時,可只考慮熱度排序。這樣,微博評論觀點(diǎn)與新信息受眾進(jìn)入觀點(diǎn)場場點(diǎn)O的距離rij可由該評論的熱度排序值代表。
312觀點(diǎn)質(zhì)量的確定
在微博里發(fā)表評論多是普通網(wǎng)民,再加上觀點(diǎn)的點(diǎn)贊量、轉(zhuǎn)發(fā)量、支持性回復(fù)量等已在新浪微博評論熱度排序計算中予以考慮,在簡化計算時,可以把所有觀點(diǎn)的質(zhì)量均認(rèn)為1。
313影響范圍因子的確定
在觀點(diǎn)勢的計算中,影響因子σ是非常重要的參數(shù),它的取值將會對結(jié)果產(chǎn)生很大影響。如果σ取值過小,那么會導(dǎo)致任何單位質(zhì)量觀點(diǎn)的勢值都接近0,觀點(diǎn)源對參考場點(diǎn)無影響;但如果取值太大,又會導(dǎo)致任何單位質(zhì)量觀點(diǎn)的勢值都接近1,容易忽視觀點(diǎn)源與參考場點(diǎn)間不同距離的影響。兩種情況下都會使整個輿情場內(nèi)距離對結(jié)果幾乎無影響。
具體到微博評論觀點(diǎn)場,通過調(diào)查分析發(fā)現(xiàn),信息受眾在查看評論的時候,查看的條數(shù)一般在一二十條內(nèi),超過50條的極少,即微博評論觀點(diǎn)場既有觀點(diǎn)對信息受眾的作用力程大多在50個單位距離以下。因此,為了更好地反映這一特點(diǎn),考慮到擬核力場高斯勢函數(shù)的性質(zhì),影響因子σ可確定為:
σ=50×2/3≈24(4)
32微博評論排序的演化趨勢特點(diǎn)
通過對大量微博評論時間序列數(shù)據(jù)的分析,發(fā)現(xiàn)按熱度排序前若干名的評論一般在開始階段變動較大,但大多在一段時間后變動逐漸減小,甚至不變,相應(yīng)地,觀點(diǎn)勢場也從不穩(wěn)定場變?yōu)榉€(wěn)定場,對應(yīng)的常見觀點(diǎn)勢演化趨勢如圖1所示。圖1微博評論觀點(diǎn)勢常見變化趨勢
利用評論的觀點(diǎn)勢場對觀點(diǎn)演化趨勢進(jìn)行預(yù)測時,如果觀點(diǎn)勢場處于不穩(wěn)定狀態(tài)時,可以根據(jù)其歷史變化趨勢對未來演化趨勢進(jìn)行預(yù)測,并進(jìn)一步利用其預(yù)測未來觀點(diǎn)的演化趨勢,如果觀點(diǎn)勢場已達(dá)到穩(wěn)定狀態(tài),則可直接利用當(dāng)前觀點(diǎn)勢的分布預(yù)測未來觀點(diǎn)極化趨勢。許多最終評論數(shù)達(dá)到上萬條的博文,往往在評論數(shù)達(dá)到幾百條后,前幾十條評論就基本穩(wěn)定下來了,因此,本文后面的預(yù)測算法即以評論觀點(diǎn)勢場已達(dá)到穩(wěn)定為條件。
33基于觀點(diǎn)勢的觀點(diǎn)群體極化趨勢預(yù)測算法描述
輸入:各類觀點(diǎn)排序向量R(1),R(2),…,R(n),作用力程影響因子σ
輸出:各類觀點(diǎn)的觀點(diǎn)數(shù)量增長比例預(yù)測、觀點(diǎn)極化度預(yù)測
算法步驟:
(1)[φ1,φ2,…,φ50]=Cal_opinionstr ength(R(1),R(2),…,R(n),σ)
//對每一個觀點(diǎn)根據(jù)觀點(diǎn)勢公式計算觀點(diǎn)勢值
(2)[φc1,φc2,…,φcn]=Sum_opinionstr ength(φ1,φ2,…,φ50)
//對各類觀點(diǎn)的觀點(diǎn)勢值求和
(3)dgp=Cal_polarizabi lity(φc1,φc2,…,φcn)
//計算觀點(diǎn)勢極化度
(4)以各類觀點(diǎn)勢的比值作為觀點(diǎn)增量比值的預(yù)測,以觀點(diǎn)勢極化度作為觀點(diǎn)極化度的預(yù)測。
輸入中某類觀點(diǎn)排序向量例:設(shè)在前50名排序評論中,第3、7、10、28、39、47名為第1類觀點(diǎn),則第1類觀點(diǎn)的排序向量為R(1)=[3710283947]。
4實(shí)驗
41數(shù)據(jù)來源及初步處理
筆者以2017年11月份熱點(diǎn)“喜事變喪事,母親因兒彩禮輕生”中衍生的話題作為實(shí)證案例,對前文提出的微博觀點(diǎn)場群體極化趨勢預(yù)測方法進(jìn)行驗證。以錢江晚報微博博文“喜事變喪事,母親因兒彩禮輕生,父親悲痛過度也跳河”為話題源的輿情子場來進(jìn)行觀點(diǎn)的群體極化趨勢預(yù)測。
評論主要聚焦于悲劇發(fā)生的根源討論,其中幾類主要觀點(diǎn)為:
A:抨擊彩禮制度,同情男方及父母
B:女方要求不過分,不能將責(zé)任完全歸咎于女方及其父母,是男方家長太偏激
C:男孩能力不足,連累父母
利用微博數(shù)據(jù)采集工具獲取從11月22日13點(diǎn)到11月23日9點(diǎn)59分的評論(不含回復(fù)),每隔1個小時采集該博文下評論原始數(shù)據(jù)1次,構(gòu)成評論的熱度序列數(shù)據(jù)。對每條評論進(jìn)行人工快速觀點(diǎn)判定,剔除少部分垃圾評論和無關(guān)評論,得到上述3類關(guān)于悲劇發(fā)生根源的共1 021條評論作為實(shí)驗數(shù)據(jù)。
42實(shí)驗方法
到22日16點(diǎn)59分,A、B、C 3類觀點(diǎn)共計達(dá)到229條,熱度排序前50中屬于A、B、C 3類的觀點(diǎn)數(shù)為49條,從此時到數(shù)據(jù)提取截止時間,熱度排序前50條評論變動極小,按前述觀點(diǎn)勢計算模型可知此后觀點(diǎn)勢變化也極小,實(shí)驗就以此時觀點(diǎn)場勢分布來預(yù)測觀點(diǎn)極化趨勢。
421預(yù)測
按33算法計算各類觀點(diǎn)增長比率預(yù)測值、增量評論的觀點(diǎn)極化度預(yù)測值。
422預(yù)測偏差率的計算
統(tǒng)計22日17點(diǎn)到23日9點(diǎn)59分各類觀點(diǎn)的增量并計算各類觀點(diǎn)增量的實(shí)際比率,然后按下述方法計算各類觀點(diǎn)增量預(yù)測的偏差率。
∑3t=1lt-ktkt2(5)
其中l(wèi)1,l2,l3為預(yù)測的各類觀點(diǎn)增長比率,k1,k2,k3為各類觀點(diǎn)增量的實(shí)際比率。
利用22日17點(diǎn)到23日9點(diǎn)59分各類觀點(diǎn)的增量,按觀點(diǎn)勢極化度公式計算觀點(diǎn)增量極化度,并按下述方法計算觀點(diǎn)極化度預(yù)測的偏差率。
dφ-dvdv×100%(6)
其中dφ為當(dāng)前觀點(diǎn)勢極化度值,dv為增量評論的觀點(diǎn)極化度值。
43結(jié)果與分析
431結(jié)果
按照上述方法,用后來評論的數(shù)據(jù)與預(yù)測數(shù)據(jù)對比,得到的結(jié)果如表1所示。表1預(yù)測結(jié)果
預(yù)測項目各類觀點(diǎn)評論增量比率增量評論的
觀點(diǎn)極化度預(yù)測02299:06327:0137407699實(shí)際02209:06422:0136907786預(yù)測偏差率(%)131112
432分析
分析結(jié)果可以看到,基于觀點(diǎn)勢的觀點(diǎn)趨勢預(yù)測模型對于輿情事件的觀點(diǎn)趨勢預(yù)測有很高的準(zhǔn)確率。在本例中,雖然預(yù)測開始時3類觀點(diǎn)的極化度較高(08291),但由于觀點(diǎn)勢的極化度相對較低(07699)并一直保持基本不變,評論最終的觀點(diǎn)極化度趨向于觀點(diǎn)勢的極化度,說明利用當(dāng)前觀點(diǎn)勢的分布能有效判別未來觀點(diǎn)分布的發(fā)展趨勢。
5結(jié)束語
輿論趨勢預(yù)測是網(wǎng)絡(luò)輿情研究領(lǐng)域中一個非常重要的課題。常見的輿情演化分析方法大多基于網(wǎng)民觀點(diǎn)相互連接、交互影響和更新模型來評估群體觀點(diǎn)演化趨勢,但網(wǎng)絡(luò)輿情事件群體觀點(diǎn)的演化,往往并不是初期參與輿情事件討論的網(wǎng)民的觀點(diǎn)相互碰撞、改變的結(jié)果,更多的是后期不斷增加的網(wǎng)民的觀點(diǎn)受前期影響力大的觀點(diǎn)的作用形成的。因此,輿情事件群體觀點(diǎn)的演化預(yù)測,關(guān)鍵是要較準(zhǔn)確評估已發(fā)表的顯性觀點(diǎn)對后來網(wǎng)民觀點(diǎn)形成的影響力。本文從場的視域?qū)W(wǎng)絡(luò)輿情事件中觀點(diǎn)的演化特征進(jìn)行分析,提出了用觀點(diǎn)勢來刻畫網(wǎng)絡(luò)輿情事件觀點(diǎn)場中各類觀點(diǎn)的影響力,并以新浪微博博文作為根源信息構(gòu)成的評論觀點(diǎn)場為對象,構(gòu)造了一種基于觀點(diǎn)勢作用模型的博文評論觀點(diǎn)趨勢預(yù)測方法,所提出的方法利用虛擬觀點(diǎn)場描述網(wǎng)民觀點(diǎn)的作用,相較于常見的基于網(wǎng)民個體之間觀點(diǎn)直接相互作用的輿情演化模型,大大降低了實(shí)現(xiàn)的難度。實(shí)驗結(jié)果顯示,該方法具有較高的預(yù)測準(zhǔn)確率,且在博文評論觀點(diǎn)趨勢預(yù)測的實(shí)際應(yīng)用中,該方法一般只需對排序靠前的少量評論的觀點(diǎn)進(jìn)行識別即可對未來大量評論的觀點(diǎn)分布進(jìn)行預(yù)測,在目前評論觀點(diǎn)自動識別技術(shù)還不十分成熟的情況下,更具有現(xiàn)實(shí)意義。
參考文獻(xiàn)
[1]Borra D,Lorenzi T.Asymptotic Analysis of Continuous Opinion Dynamics Models Under Bounded Confidence[J].Communications on Pure and Applied Analysis,2013,12(3):1487-1499.
[2]Su W,Gu Y J,Wang S.et al.Partial Convergence of Heterogeneous Hegselmann-Krause Opinion Dynamics[J].Science China Technological Sciences,2017,60(9):1433-1438.
[3]李根強(qiáng),羅艷艷,臧學(xué)蓮.基于有界信任模型的網(wǎng)絡(luò)社群輿情觀點(diǎn)演化研究[J].情報科學(xué),2017,(6):63-68.
[4]何建佳,劉舉勝,王祥兵.認(rèn)知失調(diào)視角下網(wǎng)絡(luò)輿論演化模式與對策研究[J].現(xiàn)代情報,2018,38(3):58-65,78.
[5]Meier J,Zhou X,Hillebrand A.et al.The Epidemic Spreading Model and the Direction of Information Flow in Brain Networks[J].Neuroimage,2017,152:639-646.
[6]Maroufy E I H,Kernane T,Becheket S.et al.Bayesian Inference for Nonlinear Stochastic SIR Epidemic Model[J].Journal of Statistical Computation and Simulation,2016,86(11):2229-2240.
[7]李青,朱恒民.基于BA網(wǎng)絡(luò)的互聯(lián)網(wǎng)輿情觀點(diǎn)演化模型研究[J].情報雜志,2012,31(3):6-9.
[8]鐘敏娟.無標(biāo)度特性下的有界信任交互網(wǎng)絡(luò)偽輿情演化建模及仿真研究[J].小型微型計算機(jī)系統(tǒng),2017,38(6):1284-1289.
[9]黃微,高俊峰.基于觀點(diǎn)勢能測度的網(wǎng)絡(luò)輿情場極性識別研究[J].情報學(xué)報,2016,35(11):1185-1196.
[10]吳國恩.論信息的情報運(yùn)動及其規(guī)律[J].圖書情報工作,1990,34(3):1-6.
[11]淦文燕,李德毅,王建民.一種基于數(shù)據(jù)場的層次聚類方法[J].電子學(xué)報,2006,34(2):258-262.
[12]霍鳳寧,禹婷婷,孫寶文.網(wǎng)絡(luò)群體極化的判定、測量與干預(yù)策略研究[J].電子政務(wù),2015,(10):19-26.
[13]于欣彤.微博的評論轉(zhuǎn)發(fā)功能對群體極化現(xiàn)象的影響分析——以王寶強(qiáng)離婚事件為例[J].新聞研究導(dǎo)刊,2017,8(1):71-74.
[14]黃微,王潔晶,趙江元.微博輿情信息老化測度研究[J].情報資料工作,2017,(6):6-11.
[15]蔡荻.微博空間中的輿論形成及社會影響——以“郭美美事件”為例[J].中國傳媒科技,2011,(12):5-7.
(責(zé)任編輯:孫國雷)2018年9月第38卷第9期現(xiàn)代情報Journal of Modern InformationSep.,2018Vol38No92018年9月第38卷第9期學(xué)術(shù)網(wǎng)絡(luò)社會資本視角下的學(xué)科評價指標(biāo)探索Sep.,2018Vol38No9
收稿日期:2018-06-05