黃 晶,吳星妍,李夢晗
(1.河海大學商學院,江蘇 南京 211100; 2.河海大學管理科學研究所,江蘇 南京 211100)
近年來,我國極端暴雨災害事件頻發,對城市基礎設施與公共服務、居民工作與生活,甚至人身財產安全等都造成了巨大威脅[1]。作為破壞性強、涉及范圍廣的突發公共事件,極端暴雨災害事件極易引起網民的廣泛關注。例如在2021年“7·20”鄭州特大暴雨、2019年“4·11”深圳暴雨等災害事件中,災情影響、應急救援等話題成為輿論關注的熱點,其中不乏信息誤讀和謠言傳播與發酵,從而造成了一定程度的民眾恐慌。輿情主體作為輿情事件的參與者,由于利益訴求的不同,在極端暴雨災害事件不同階段的參與積極性、關注內容和情感態度往往會表現出較大差異。因此,從多主體視角出發探尋極端暴雨災害事件網絡輿情的演化規律,有利于準確把握輿情走勢,為極端暴雨災害事件網絡輿情管控提供科學依據。
輿情主體是指輿情事件中涉及的各類主體,包括個人、組織、政府部門等,共同推動著突發事件輿情的發展與演化[2]。現有研究從主體利益關切點出發認為輿情主體主要為政府和民眾[3];而在全媒體時代,輿情主體包括政府、傳統媒體、網絡媒體、社會公眾[4];也有研究將意見領袖[5-6]、網絡推手[7]、企業[8]等多類主體納入輿情傳播。對于網絡輿情演化的研究,學者們多采用數據挖掘與機器學習算法、社會網絡分析法、系統動力學理論模型、博弈模擬仿真法等,對輿情的傳播、主題和情感的演化分析等進行研究[9-10]。其中,輿情主題和情感的演化分析是當前輿情演化研究的重點內容。在主題挖掘上,改進的隱含狄利克雷分布(LDA)主題模型常用于提取輿情熱點,如肖倩等[11]將卷積神經網絡和LDA主題模型相結合,顯著提高了熱點輿情識別的精確率和及時性。但輿情的監控不僅需要能準確發現輿情主題,還需要把握主題的演化。而基于共詞網絡分析的輿情主題挖掘方法能依據詞與詞之間的潛在關系,通過主題聚類刻畫輿情熱點的遷移與演變,如王家輝等[12]基于關鍵詞共現和社會網絡聚類探究了輿情熱點主題特征和演化規律。在情感分析上,機器學習和情感詞典法都是輿情情感研究的常用方法。利用機器學習法對評論文本進行情感傾向判斷的準確率較高,但該方法只能對情感傾向進行分類[13-14],而情感詞典法則能量化評論文本情感,根據情感值更加細致深入地對輿情情感進行分析[15]。此外,已有研究大多依據輿情生命周期將災害事件的輿情演進過程分為起始、爆發、消退等階段[16-17],并分析各階段的主題內容和時序發展趨勢,但輿情生命周期的演化相較于災害事件的發展具有一定的滯后性。不同類型災害發展過程各具特點,基于輿情生命周期的研究無法依據災害發生發展過程提前研判輿情,不利于對輿情進行前瞻性管控。
因此,為了準確把握極端暴雨災害事件全過程輿情演化的一般規律,挖掘極端暴雨災害事件中各輿情主體的演化特點,本文在對輿情主體類型進行劃分的基礎上,構建網絡輿情主題和情感演化模型,并以“4·11”深圳暴雨災害事件為例,將暴雨災害劃分為預警期、突發期、應急期和災后期,基于新浪微博評論數據,定量分析不同主體在災害不同階段關注內容、情感態度的變化及差異,進而提出暴雨災害不同階段的輿情管控策略。
為準確把握極端暴雨災害事件網絡輿情中各主體輿情主題和情感演化差異,本文將極端暴雨災害事件網絡輿情主體劃分為政府、媒體、意見領袖和網民。政府處于突發事件輿情的核心位置,對輿情事件回應的程度和處理方式對輿情的演化有著重要影響;媒體作為輿情傳播的媒介,是公眾獲取信息的重要渠道;意見領袖是一些在特定領域或社會群體中具有一定影響力和權威性的人士,其言論和態度往往能夠引導公眾的思考和行動;網民是網絡輿情最重要的組成部分,通過互聯網獲取信息和表達意見,并參與到事件的解決中來。
在新浪微博中有藍V、黃V、微博達人和大眾網民用戶,藍V為經過認證的政府機構、官方組織等,黃V屬于具有一定平臺影響力的主流媒體、自媒體,微博達人對應一些十分活躍或在專業上具有權威性的賬號,大眾網民用戶則屬于普通用戶。因此,本文的政府、媒體、意見領袖和網民輿情主體,在新浪微博中分別對應藍V、黃V、微博達人和大眾網民用戶。
極端暴雨災害事件輿情主題演化模型構建流程如圖1所示,首先在數據預處理的基礎上提取主題關鍵詞,然后基于關鍵詞的共現關系構建共詞網絡,接著對共詞網絡節點聚類挖掘其蘊含的主題社區,最后對各主題社區進行演化分析。

圖1 極端暴雨災害事件輿情主題演化模型構建流程
1.2.1關鍵詞提取
在對原始數據進行預處理的基礎上,本文采用詞頻-逆文檔(TF-IDF)[18]提取極端暴雨災害事件主題關鍵詞。TF-IDF詞語權重計算公式為
(1)

1.2.2共詞網絡構建
極端暴雨災害事件輿情共詞網絡構建如圖2所示,文本A、B、C的關鍵詞分別形成了3個獨立的共詞網絡,而文本D通過主題關鍵詞將它們共同串聯到一起,形成一個較大的共詞網絡。因此,暴雨災害事件輿情共詞網絡可以抽象為

圖2 極端暴雨災害事件輿情共詞網絡構建
G=(N,R)
(2)
式中:G為暴雨災害事件輿情共詞網絡;N為暴雨災害關鍵詞構成的節點集合;R為由共現關鍵詞之間相連構成的邊集合。
1.2.3主題社區挖掘
共詞網絡內部結構通常呈現出一定的規律,部分節點聚集在一起形成社區,社區內的關鍵詞則可以代表輿情主題的內容。本文基于Louvain算法[19]并不斷優化模塊度,實現極端暴雨災害事件輿情主題社區的挖掘。模塊度Q可表示為
(3)
式中:Aij為節點wi和wj之間的邊權重,即關鍵詞在文本中共現的次數;Ki、Kj分別為與節點wi和wj相連的邊的權重之和;m為網絡中所有邊的權重之和;Ci、Cj分別為節點wi、wj所屬的社區,當Ci=Cj時δ(Ci,Cj)函數值為1,否則為0。
1.2.4主題社區演化
本文采用王艷東等[20]提出的演化算法對輿情主題進行演化分析。對于挖掘出的某一主題,取t1和t2兩個時間段的災害主題社區分別為C1,t1和C1,t2,計算C1,t1社區在C1,t2社區中的包含量I(C1,t1,C1,t2)及C1,t2社區在C1,t1社區中的包含量I(C1,t2,C1,t1),根據I(C1,t1,C1,t2)和I(C1,t2,C1,t1)對應閾值判斷社區的生長、分裂等演化類型,并通過桑基圖展示主題演化過程。
C1,t1社區在C1,t2社區中的包含量、節點的度中心性可分別由式(4)、式(5)計算得到:
(4)
(5)
式中:W1、W2分別為社區C1,t1、C1,t2中的關鍵詞集合;P1w為節點w在社區C1,t1中的重要程度;Kwi為節點wi的度中心性,可用共詞網絡中與節點連通的邊的權重之和表示,表征節點的重要程度。
1.3.1暴雨災害領域情感詞典構建
本文采用詞匯數量適中的知網情感詞典作為基礎情感詞詞典。極端暴雨災害事件的評論文本有其自身特點,如“飛機晚點了”“要追責相關領導”中的“晚點”“追責”并未包含在知網情感詞典中。參考周莉等[21]所提出的暴雨洪澇情感詞典構建方法,同時考慮網絡用語和表情符[22]構建自定義的領域情感詞典,并將“涼爽”“平安”“戰勝”“力挺”“熱心”“點贊”等正面情感詞設置為1分,將“天災人禍”“水火無情”“悶熱”“沖走”“追責”“撈油水”“嚇死”等負面情感詞設置為-1分。
僅用情感詞來計算評論文本的情感值是不夠的,需要程度詞如“有點”“太”和否定詞如“沒有”“不”來增強、削弱或反轉其原本的情感態度,因此需要構建程度詞詞典和否定詞詞典對情感詞進行度量。本文以知網程度詞詞典為基礎,并根據已有研究[23]為各級別程度詞賦予相應的權值,同時自建了否定詞詞典,將否定詞賦值為-1分。
1.3.2情感值計算算法
構建好詞典后,根據本文的實際情況進行微博評論文本情感值的計算,具體步驟如下:①搜尋評論中的情感詞,判斷情感詞的極性,正面情感詞賦值為+1分,負面賦值為-1分,否則為0分;②尋找程度詞、否定詞,判斷程度詞的級別,考慮到可能出現多重否定的情況,需要計算否定詞的數量;③查找表情符,判斷表情符的極性,正面表情符賦值為+1分,負面賦值為1分,否則為0分;④計算每條微博評論的情感分值。由于評論文本的長度對情感值的影響較大,因此對評論情感分值取平均數,具體計算公式如下:
(6)
式中:E為整條微博評論文本的情感值;n為情感詞的數目;l為程度詞的數目;p為否定詞的數目;k為表情符的數目;svi為情感詞vi的分值;sdf為程度詞df的權重;sej為表情符ej的分值。
2019年4月11日,深圳市短時極端強降水的最大半小時雨量為73.4mm,為深圳有紀錄以來4月份最大半小時雨強。此次降雨導致深圳市多區突發洪水,暗渠、暗涵處甚至發生了作業人員失蹤和淹溺死亡事故。據統計,該事件造成11人死亡、137處內澇積水、29臺車輛被淹,福田、羅湖兩區直接經濟損失約為2253萬元。此次暴雨災害事件引起了輿論的高度關注。
獲取2019年4月11日0時至13日0時即暴雨災害發生前后,以“深圳暴雨”為關鍵詞的微博文本數據共20060條,對文本數據進行數據清洗以去除噪聲數據,最終得到13464條有效微博文本數據。其中,藍V有723條,黃V有1151條,微博達人發布了1314條,大眾網民發布了10276條。
結合事件實際情況,本文將極端暴雨災害發生發展過程劃分為預警期、突發期、應急期和災后期4個階段。4月11日20時前,氣象局連續發布了暴雨黃色預警在內的4個氣象預警,因此將0—20時劃分為預警期;短時極端強降水發生在21時前后,21—24時共發生了3起地下險情,因此將20—24時劃分為突發期;4月12日15時,強降雨逐漸減弱,第一輪應急救援工作已結束,降雨帶來的影響也得以初步解決,因此將0—15時劃分為應急期,15—24時劃分為災后期。微博數量隨災害發展的變化如圖3所示。預警期內,微博數量較少,降雨預警未引起輿論的過多關注;突發期內,微博數量快速上升,于21:00左右達到峰值后迅速下降;應急期內,微博數量在12日6:00迅速攀升并持續一段時間后下降;災后期,隨著災情影響逐漸好轉,微博數量緩慢下降。

圖3 “4·11”深圳暴雨事件的階段劃分及微博數量變化
完成數據清洗后,采用Jieba分詞工具進行中文分詞。為提升分詞效果,根據實際情況構建了自定義詞典,添加了領域專有詞如“暴雨紅色預警”“應急管理局”等,并綜合《百度停用詞表》《哈工大停用詞表》等,合并去重后構建了停用詞表,過濾掉無意義詞匯、標點符號等。
2.3.1不同主體的網絡輿情主題演化
通過對主題社區進行人工篩選與合并,最終得到普及“安全知識”“交通狀況”“警示與天氣”“應急救援”“人員傷亡”“祈禱平安”“其他損失與影響”7類輿情主題,并在此基礎上得到了各主體的輿情主題演化桑基圖,見圖4~7。桑基圖的每個長方形代表一類主題,其高度為主題間的共有詞數量,而長方形之間的連接則表示主題間關鍵詞的流動。

圖4 藍V在不同階段的主題演化桑基圖

圖5 黃V在不同階段的主題演化桑基圖

圖6 微博達人在不同階段的主題演化桑基圖

圖7 大眾網民在不同階段的主題演化桑基圖
a.藍V輿情主題演化。預警期,藍V主要關注“安全知識普及”和“警示與天氣”兩類主題。突發期內“警示與天氣”主題分裂出“交通狀況”,表明藍V由發布預警信息逐漸轉為發布暴雨導致的交通狀況。應急期以“應急救援”和“人員傷亡”主題為主,藍V憑借信息獲取優勢播報應急救援狀況和人員傷亡信息。災后期其他主題逐漸演變為“其他損失與影響”主題。
b.黃V輿情主題演化。預警期內,黃V主要關注“警示與天氣”主題。突發期內分裂出“普及安全知識”主題,但滯后于藍V,表明黃V受藍V影響開始宣傳暴雨安全知識。應急期以“人員傷亡”和“祈禱平安”主題為主,較少關注“應急救援”主題。災后期,黃V受藍V的影響,出現“交通狀況”主題。隨后“人員傷亡”主題不斷收縮,“其他損失與影響”主題不斷生長,表明黃V的關注重點由“人員傷亡”等主題逐漸轉移至“其他損失與影響”上。
c.微博達人輿情主題演化。微博達人在預警期和突發期內只有“警示與天氣”主題。在應急期,微博達人最先出現“人員傷亡”主題,表明微博達人最先開始傳播人員傷亡信息。在災后期,微博達人最先報道了大眾網民較為關注的“其他損失與影響”,表明微博達人能及時地對大眾網民所關注的話題做出反應,相較于其他主體更加敏銳。隨著暴雨災害事件的發展,“其他損失與影響”主題逐漸演化為“人員傷亡”主題,人員傷亡有關輿論在災后不斷膨脹,輿情風險較大。
d.大眾網民輿情主題演化。大眾網民在預警期和突發期內以“警示與天氣”和“普及安全知識”主題為主。在應急期,受藍V發布的交通狀況信息引導,大眾網民的關注點演化為“交通狀況”,此外“人員傷亡”主題不斷生長,“其他損失與影響”主題開始出現,反映出大眾網民較為關心影響日常出行的交通狀況、人員傷亡信息以及暴雨災害造成的損失與影響。災后期,受藍V和黃V影響出現“交通狀況”主題,隨后演化為“人員傷亡”主題,人員傷亡輿論熱度居高不下。
通過對藍V、黃V、微博達人以及大眾網民4類主體的輿情演化特點進行分析,可以發現“4·11”深圳暴雨災害事件網絡輿情的總體演化狀況為:預警期與突發期主要集中在“警示與天氣”“普及安全知識”主題,應急期演變為“祈禱平安”“人員傷亡”“應急救援”主題,災后期演變為“人員傷亡”“其他損失與影響”主題。
2.3.2不同主體的網絡輿情情感演化
基于每條評論文本數據的情感值,將文本情感傾向以0為閾值分別判定為正面、中性以及負面情感傾向,統計各個傾向的評論文本數量占比,得到各情感傾向的比重,并將各階段或主體的所有評論文本的情感值求和再除以評論數量得到情感均值,以消除評論數量差異過大的影響。
暴雨災害發展全過程輿情情感如表1所示,在預警期和突發期波動較大,負面情感主要集中在此期間,應急期和災后期的情感趨于中性。具體來說,預警期和突發期對暴雨天氣的抱怨與擔憂等負面情緒較多,情感負面率分別為0.42和0.49,高于正面率。其中,突發期情感均值最低為-0.2,且由于輿情數量巨大,這一階段的網絡空間充斥著大量的負面程度較高的情感態度。應急期對人員傷亡的悲傷與難過的負面情感和對受災人員、救災人員的祈禱與鼓勵的正面情感交織出現,情感均值為0.02,整體情感略偏正面。災后期輿論集中在探討人員傷亡原因和應急工作效果上,情感正面率和負面率持平,情感均值為-0.03,整體情感略偏負面。

表1 各演化階段情感值描述性統計
各主體輿情情感演化如圖8所示,除藍V外,黃V、微博達人和大眾網民的負面情感主要集中在預警期和突發期。其中,藍V各階段內的情感值較高,體現了其在信息傳播中積極正面的特點。黃V的情感演化趨勢和藍V大體保持一致,但情感值波動較大,表明黃V在跟隨藍V進行信息傳播的同時,也會發表自己的觀點和看法,可能存在發表情感色彩強烈的言論來博人眼球的現象,且黃V的整體情感為負面,表明其在信息傳達與回應上未能做到理性中立。此外,突發期內黃V的情感值最低,需要進行監管和引導。微博達人和大眾網民的情感演化狀況較為相似,預警期和突發期內的情感值較低,遠低于其他兩類主體。其中,微博達人的總體情感最低,表明微博達人的輿情風險較大,在暴雨災害事件發展的全過程都需要重點關注。

圖8 各輿情主體情感演化
a.暴雨災害預警期:動態監測,識別潛在輿情風險。暴雨災害預警期內,短時強降雨事件還未發生,網絡輿論主要集中在暴雨預報預警以及相關安全知識的宣傳上,輿論熱度不高,此時尚未形成輿情危機。在此期間,公眾的整體情感為負面,其中微博達人和大眾網民的情感值最低,但此時的負面輿情主要由強降雨這一自然現象引起。因此,在預警期內,政府需要聯合媒體積極發布預報預警與安全防范知識,引導意見領袖和網民加強對暴雨安全知識的關注,還需持續監測各類主體的輿情狀況,對各類主體網絡輿情進行挖掘分析,識別潛在輿情風險。及時處置虛假暴雨信息、極端負面言論等,將不利于社會安定的負面輿情信息抑制在萌發期。
b.暴雨災害突發期:提前研判,設置議題引導輿情。暴雨災害突發期內,各種誘發輿論危機的因素漸漸集聚,輿情危機萌芽并爆發。突發期的情感值最低,且輿情熱度高,這一階段聚集了大量的負面程度較高的情感態度,是暴雨災害全過程輿情管控的重點關注階段。因此,政府可以根據暴雨災害事件的狀況,及時發布災情通報,向公眾傳遞真實、準確、全面的信息。同時,對輿情進行提前研判,通過預先設置議題,第一時間搶占輿論高地,掌握公共輿論和熱點話題的話語權,從而前瞻性地引導輿情。如暴雨突發時,發布網民關注的交通狀況信息正向引導輿論;發生人員傷亡時,提前設置應急救援、祈禱平安等議題,壓縮其他負面輿論滋生的空間。
c.暴雨災害應急期:信息公開,抑制不實消息傳播。暴雨災害應急期內,暴雨災害突發后發生的人員傷亡事故極易引起輿論的關注。輿情演化結果也表明,這一階段公眾的熱點話題主要集中在祈禱平安以及人員傷亡上,尤其是人員傷亡狀況。因此,政府應提高信息公開的透明度和及時性,以積極正面的態度持續對公眾所關心的傷亡狀況進行回應,并實時播報救援動態,提高公眾對應急救援消息的關注度。媒體應充分利用其公信力配合政府進行理性、客觀的播報,尤其是應急救援動態信息的發布。網民需提升對情緒煽動性和負面虛假性信息的辨識力,理性發言,從而在平息公眾高漲的負面情緒的基礎上,有效抑制不實消息的傳播。
d.暴雨災害災后期:回應問題,疏導負面情緒。暴雨災害災后期內,暴雨災害事件帶來的影響已逐漸消退,公眾對于這一事件的關注熱度顯著降低,但公眾的整體情感略偏負面。因此,這一階段政府需要保持積極正面的情感態度做好輿情的收尾工作,聯合意見領袖作為政府與網民的溝通橋梁,設立專門發言機構或培養“紅色意見領袖”。通過對相關話題進行回應和互動,對公眾負面情緒進行安撫與疏導,從而增強公眾對政府的信任度,提升政府公信力。
a.將極端暴雨災害事件網絡輿情主體分為政府、媒體、意見領袖和網民4類,從多主體視角出發挖掘了各主體關注內容、情感態度的變化。政府、媒體、意見領袖和網民4類主體的關注內容不同,情感態度差異顯著。政府主要關注安全知識、暴雨預警和交通狀況,并回應救援動態,情感態度積極正面;媒體較少關注安全知識和救援動態,情緒值波動大,可能存在發表情感色彩強烈的言論以博人眼球的現象;意見領袖較多關注傷亡信息,情感均值最低,輿情風險較大;網民較其他主體更為關注影響日常生活的交通狀況和災情影響,負面情感占比較大。
b.政府、媒體、意見領袖和網民4類主體在極端暴雨災害事件網絡輿情演化中相互影響。政府在輿情演化全過程中起主導作用,憑借信息獲取優勢率先發布相關主題,影響了其他主體的輿情走向;媒體的主題和情感演化和政府大體保持一致,是政府信息發布和立場觀點的跟隨者;意見領袖受網民影響較大,對網民所關心的話題非常敏銳。
c.將極端暴雨災害全過程劃分為預警期、突發期、應急期和災后期4個階段,發現各主體關注內容、情感態度隨著災害事件的發展不斷變化。在預警期,輿情主題主要為安全知識和天氣預警,且大多由政府發布、網民跟隨;在突發期,政府開始關注事情造成的影響,如交通信息,而其他主體還在關注天氣信息,時間上滯后于事件本身的發展;隨著災害的蔓延,進入應急期,政府開始發布應急救援和人員傷亡等信息,其他主體的關注點從天氣信息轉向人員傷亡和祈禱平安;在災害結束后,政府和媒體較多關注災情影響,而微博達人和網民則偏向于討論傷亡信息。此外,輿情負面情感主要集中在預警期和突發期,隨著災害的發展,輿情情感逐漸趨于中性。