賈若男 王晰巍 于 雪 羅 然
(1.吉林大學商學與管理學院,吉林 長春 130022;2.湘潭大學公共管理學院,湖南 湘潭 411105;3.吉林大學大數據管理研究中心,吉林 長春 130022;4.吉林大學國家發展與安全研究院網絡空間治理研究中心,吉林 長春 130022;5.吉林省圖書館,吉林 長春 130028)
《中國互聯網絡發展狀況統計報告》指出,截至2021年6月,我國網民規模達10.11億[1]。龐大的網民數量為輿情研判提供了豐富的和可供挖掘的多重尺度時空大數據,也為動態性、全局性、精準化的輿情治理提供決策依據。智能媒體與社會數據的結合,為突發公共事件中政府在社交網絡上的調控決策提出新思路和新方案[2]。突發公共事件網絡輿情的時空數據挖掘和分析,為突發公共事件網絡輿情的引導和決策提供了新依據,是網絡輿情研判與監管部門關注的重要問題。
近年來,國內外相關學者圍繞社會網絡媒體輿情中的時間與空間特性進行了相關研究。國外研究主要通過不同的模型或者算法[3],挖掘時空數據背后的群體行為特征[4]。通過量化用戶的動態空間交互行為[5]監控緊急事件或社會問題的信息傳播狀況,并跟蹤事件發展態勢[6],提出相應的社會治理舉措,提升預警與響應能力[7]。國內學者主要將時空維度作為輿情演化分析與治理研究的重要維度[8]。通過可視化工具呈現網友關注度與話題主題的動態演化情況[9],形成輿情事件討論熱度圖譜[10],分析網絡群體集聚的跨時空演化機理[11]。通過對國內外現有研究成果的梳理,發現目前針對網絡輿情事件時空數據進行挖掘和分析的研究成果正逐漸受到國內外相關學者的關注,但分析突發公共事件中輿情時空分布特征與時空演化規律的研究成果相對較少。
本文在研究中主要解決以下3個方面的研究問題:①突發公共事件網絡輿情的時空總體分布及類型如何分析?②事件時空演化網絡的結構和關鍵城市是如何分布的?③針對事件的時空演化特征與規律能夠采取哪些治理措施?本文結合“日本核廢水排海”事件進行時空分析并構建時空演化圖譜,明確輿情事件的時空分布特征。探索和總結輿情事件演化的時空規律,為網絡輿情事件的管控和治理提供決策支持。
突發公共事件網絡輿情是指在互聯網中傳播的有關突發公共事件的評論、觀點、情感以及態度等的集合,具有“線下發生,線上傳遞”的特點[12]。學者們以多類型突發事件為研究對象,主要聚焦于輿情事件演化態勢和輿情干預治理等方面[13]。構建三維動態主題演化模型分析輿情事件中不同利益相關者的主題觀點識別與演化[14],從時間序列視角探究輿情發展過程中網民情感極性的變化及其影響因素[15]。在網絡輿情干預治理方面,利用模糊集定性比較分析、仿真實驗和案例分析等方法,提出預測方法與治理策略[16]。國內外研究利用社交媒體中海量的用戶時空數據建模,有利于輿情的動態研判、重點階段和重點地點的防控策略制定,從而實現網絡輿情線上和線下共同管理[12]。
網絡輿情中的數據具有明顯的時間和空間特征,時空數據是輿情用戶行為與關系在現實情境中的具象化呈現[17]。在時空數據研究主題上,國內外學者利用時空數據研究輿情事件的傳播特征與影響[18],發現社交網絡輿情事件在傳播態勢時間上呈階段周期性演化,空間上呈金字塔等級的擴散演化[12]。在時空大數據挖掘方法上,基于事件的時空數據模型和生成式對抗網絡模型等是輿情研判的常用模型[19],Moran’s I指數[20]、Morisita分布指數[21]是社交網絡輿情事件空間分布探索的重要統計量。GIS和知識圖譜是輿情事件時空規律可視化的常見技術[22]。把握輿情事件的時空交互規律,有助于提前感知并研判網絡輿情演化趨勢,為提出全局性、動態化和分級化的輿情治理策略提供決策支持[23]。
突發公共事件網絡輿情信息具有空間、時間和內容等多個相關的維度,在輿情中,時間與地理標記記錄可以用來研究用戶的活動模式,如流動性、聚集性或隨機性等[24]。突發公共事件網絡輿情時空演化分析,主要是將輿情事件映射到現實的時間和地理空間中,將輿情的時空數據與社交關系數據相結合,挖掘輿情在地理空間中的總體分布、輿情空間分布隨時間的演化特征與規律等。從而實現對突發公共事件網絡輿情發展的全面、動態分析和呈現,能夠幫助相關部門更好地了解輿情事件的關鍵地域、熱點區域以及潛在橋梁城市,并制定準確的輿情管控與治理策略。
本文構建了突發公共事件網絡輿情時空演化分析模型,如圖1所示。通過網絡爬蟲進行網絡輿情事件話題下時空數據的采集,并進行數據清洗與預處理。在事件時間和空間尺度劃分的基礎上進行時空演化分析。一方面,采用空間自相關,通過全局自相關分析確定時空總體分布;通過局部自相關分析確定時空聚集類型;另一方面,采用時空網絡圖算法,通過平均聚類系數分析輿情時空網絡結構;通過局部聚類系數確定網絡中的關鍵城市。最后,對突發公共事件網絡輿情時空演化特征與規律進行分析。

圖1 突發公共事件網絡輿情時空演化分析模型
空間自相關是一種根據特征位置和特征值來衡量空間事物分布的相互關聯程度及其空間分布的統計方法,可以分為全局空間自相關和局部空間自相關[25]。全局空間自相關主要檢驗整個研究區域內相鄰或相似區域單元特征值空間相關性的總體趨勢,通常使用全局Moran’s I來評估,如式(1)所示;全局空間自相關僅能判斷研究對象是否存在聚集分布,無法確定某一研究對象與其鄰近區域對象的相關程度。局部自相關分析能夠反映局部單元屬性與相鄰單元相同屬性之間的相關程度,通常使用局部Moran’s I進行衡量,如式(2)所示[26]。
(1)

(2)
式(2)中,Ii為局部Moran’s I,其余參數含義與式(1)相同。若局部空間自相關顯著,則存在4種空間聚集類型[26],分別為:高—高聚集(H-H),代表熱點區域;低—低聚集(L-L),代表冷點區域;高—低聚集(H-L),代表高值異常區;低—高聚集(L-H),代表低值異常區。
圖算法能夠幫助理解圖數據網絡,可以幫助利用節點間的關系來發現知識和信息[27]。在圖算法中,聚類系數表示網絡圖中節點間相互聯系的緊密程度,分為平均和局部聚類系數,計算如式(3)和(4)所示[28]。平均聚類系數可以幫助分析網絡結構,局部聚類系數可以幫助分析網絡中的關鍵城市。
(3)
(4)

新浪微博是國內最受歡迎的社交網絡平臺之一[29],提供了帶有時間戳和基于位置的社交網絡服務,能夠采集到用戶相關的時間和空間數據信息,有利于本文針對突發公共事件網絡輿情時空演化的分析[30]。因此,本文將其作為數據采集的來源平臺。在突發公共事件熱點輿情的選擇上,本文選取“日本核廢水排海”事件進行數據采集,日本核廢水排海決定自初步決議起便在國內外各大社交網絡平臺引起了廣泛而熱烈的討論[31]。爬取的字段包括用戶昵稱、ID、評論或轉發時間、用戶地理標簽等;數據清洗過程主要通過Access和Excel等軟件實現,共收集到原始數據80 660條,清洗后剩余數據53 504條。
按照“日本核廢水排海”事件發展順序以及事件發展期間的輿情態勢曲線,如圖2所示,事件發展具有一定的周期性特點,即當某個子話題突發時,輿情進入爆發期;隨后公眾情緒、意見達到一定閾值后,輿情態勢進入平緩回落期;隨著事件再次發展,輿情態勢波動走高;最后隨著事件接近尾聲,輿情態勢趨于平息。因此,本文將時間尺度劃分為5個階段。事件空間尺度的劃分上,將國內用戶按照地理分區及省級行政區進行劃分,包括華北、東北、華東、華中、華南、西南、西北和港澳臺8個地理分區,以及34個省級行政區;國外地區則統一劃分為其他。在后續的時空分析中,以省級行政區省會的經緯度指標作為地理位置代表和分析依據。

圖2 時間尺度劃分結果[32]
為分析該輿情的時空分布和聚集類型,按照時間尺度劃分,以熱門微博下各省級行政區中所包含的轉發和評論總量作為討論熱度[33]。采用Log函數標準化[34]對原始數據進行處理以消除數量級差異。關于空間權重矩陣的構建,由于距離是體現空間分布的重要指標,因而選取基于距離的空間權重矩陣[35]。在此基礎上進行空間自相關分析。為明確各個空間熱點、冷點以及不顯著聚集區域之間的關系,在空間自相關分析結果基礎上,進行時空網絡圖算法分析。以地區所包含的用戶之間的社交關系作為地區節點間的邊,將地區的討論熱度作為節點間邊的權重,空間聚集類型作為節點的屬性標簽,得到節點、關系和屬性表并導入Neo4j圖形數據庫中,以進行圖算法分析確定網絡結構和關鍵城市。
3.3.1 全局空間自相關結果
全局空間自相關分析結果如表1所示。全局Moran’s I均大于0,表明該輿情呈現空間聚集分布。其次,全局Moran’s I統計值大于0,但也比較接近0,說明這種聚集程度較弱。各個事件的P-value統計值均小于0.05,Z-score統計值均大于1.65,表明其置信度均在90%以上[36]。同時,聚集趨勢呈現3個階段,其中,第一階段(T1~T2)和第三階段(T3~T5)均呈現上升趨勢,第二階段(T2~T3)呈現下降趨勢,但第三階段均高于第一和第二階段。這意味著時空分布特征整體上以聚集為主,且聚集程度不斷加強。

表1 全局Moran’I及檢驗值
3.3.2 局部空間自相關結果
局部空間自相關分析結果如表2所示。數據結果表明,事件各個時間段內的聚集區域類型分布與事件整個時間周期呈現一致。事件時空分布中,高—高(H-H)聚集區域數量較多,表明事件存在討論熱度集中區域,即存在空間熱點;低—高(L-H)聚集區域伴隨著高—高(H-H)聚集區域存在,低—低(L-L)聚集區域出現頻次較低,說明事件討論熱度的空間冷點不明顯。同時,顯著聚集區總數明顯多于非顯著聚集區,說明在各個時間段中事件討論重點分布于部分地區,并不是普遍存在于全國各地。

表2 局部聚集類型統計
為了明確每個聚集類型的空間位置特征,以省會坐標為基準和代表,繪制局部聚集類型分布圖,如圖3所示。圖中僅使用文字標注了顯著聚集的省級行政區。在事件的發展過程中,高值聚集區常出現在以北京、天津為代表的華北地區,以河南、陜西為代表的華中和西北部分地區,以及以江蘇、浙江、上海、福建為代表的華東地區,并且這類空間熱點區域具有明顯的連續分布趨勢;低—高聚集類則伴隨著高值聚集區存在,如東北地區的吉林、華北地區的山西、內蒙古中部,以及港澳臺地區的中國臺灣地區等;西北地區的內陸城市新疆作為唯一顯著的低值聚集區存在,是事件的空間冷點區域。

圖3 空間局部聚集類型分布圖
3.3.3 時空網絡平均聚類系數結果
該話題下運用時空網絡平均聚類系數呈現的時空網絡如圖4所示。分析結果表明,該話題下輿情事件時空網絡均呈現以個別區域(或城市)為核心的發散結構,核心區域(或城市)周圍的關系線條較為密集,整個空間網絡中的信息流圍繞其展開。同時,這些區域(或城市)節點起到連接其他區域(或城市)節點的“信息橋梁”作用。通過這些區域(或城市)節點的屬性標簽,可以發現不顯著聚集的城市同樣能夠在時空網絡中扮演重要角色,如T1中的香港、T2中的四川等。與此同時,在這些區域(或城市)聚集類型,低—高(L-H)以及低—低(L-L)聚集區在網絡中通常處于邊緣位置,并且與其他區域(或城市)節點聯系稀疏。

圖4 輿情時空網絡
時空網絡平均聚類系數分析結果如表3所示。在平均聚類系數得分中,除T5的平均聚類系數為0.001外,其他事件的平均聚類系數均呈現高值。結合圖4,T5的空間網絡呈現以北京為核心的星型結構。除與北京之間存在直接的聯系外,各個城市節點間的聯系稀疏,網絡中信息的交流效率較低;其他事件的平均聚類系數較高,輿情時空網絡呈現網狀結構特征,網絡中節點間的聯系緊密,網絡的凝聚力也較強。

表3 時空網絡平均聚類系數結果
3.3.4 時空網絡局部聚類系數結果
時空網絡局部聚類系數分析結果如表4所示。在結果顯示中,重點關注局部聚類系數得分較低的節點,因為得分較低表明該城市在網絡中是一個結構孔[28],該城市節點可能是一個與其他網絡城市社區中的城市節點連接良好的節點,是網絡結構中潛在的“信息橋梁”。如,T1中的香港和北京,T2中的四川等。但是,當局部聚類系數為0時,表示該城市節點的相鄰節點都只與這一節點相連,彼此之間互不相連,此類節點周圍的網絡結構較為簡單,如T1中的青海、臺灣和澳門等。

表4 時空網絡局部聚類系數結果
從該突發公共事件輿情演化的時空總體分布來看,輿情演化呈現空間聚集分布,且聚集程度呈現隨輿情事件發展不斷加強的趨勢。這可能與隨著輿情的不斷發展,政府、媒體和意見領袖等關鍵用戶的介入、對輿情事件信息發布的加強,以及公眾對輿情信息的接受與關注程度的提升等有關[37]。在輿情發生的不同階段,參與輿情的用戶會有不同的信息需求和行為,并對輿情事件的熱度和傳播范圍產生影響。
因此,根據輿情時空總體分布的聚集特征和趨勢,輿情監管部門可以根據區域的聚集形勢進行有針對性的輿情引導和監管,將輿情事件的分析與對比分解和聚焦到聚集區域上,并借助政府和官方媒體的參與不斷對輿情事件波及的區域進行干預和引導,降低負面輿情在空間維度上傳播擴散的可能性。同時,利用區域中高影響力用戶及群體,對鄰近空間內其他用戶產生直接或間接的影響,提高輿情的空間聚集程度,將負面輿情帶來的影響盡量控制在最小范圍內。
該突發公共事件的網絡輿情空間熱點區域,主要分布在部分地區并非全國,網絡輿情時空演化分布具有一定的地域差異性和規模性,在重點城市群區域表現出明顯的聚集性特征。一方面,空間熱點區域的分布情況顯示出重點經濟發達地區在該輿情事件中的高價值屬性;另一方面,低—高(L-H)和低—低(L-L)聚集區的時空分布與該地區的人口聚集程度和地理位置有關,未受到該網絡輿情直接影響的區域和靠近空間熱點的區域則呈現出不同的聚集類型。
因此,根據突發公共事件的網絡輿情時空聚集類型以及其分布特征,一方面,應該加強對網絡輿情聚集效應顯著的空間熱點區域進行有針對性的分析與監測,突出空間熱點區域的靶向定位作用。通過該區域內網絡輿情的疏導與管控,實現社交網絡輿情的精準治理和全區域網絡輿情的整體控制;另一方面,對于低—高(L-H)和低—低(L-L)這類非熱點聚集區,除發揮鄰近熱點區域的領導和影響作用外,還應結合該區域自身的發展情況和地理特征,對該區域的熱點網絡輿情事件的關注和輿情用戶的情感、網絡輿情關注行為等進行分析,明確不同區域時空特征與規律差異性的原因所在,進而制定和實施更為精準的社交網絡輿情區域治理策略。
從該突發公共事件網絡輿情的時空網絡可視化分析結果和平均聚類系數結果來看,時空網絡呈現以個別節點為核心的網絡結構特征,體現了網絡輿情傳播和擴散的時空收縮效應。其中,平均聚類系數較低的時空網絡結構較為稀疏,除核心城市外,其他區域(或城市)節點間幾乎不存在關聯關系,網絡凝聚力較弱。平均聚類系數較高的時空網絡呈現網狀結構,除核心區域(或城市)外,各個區域(或城市)間存在交叉縱橫鏈接,信息流通速度相對較快,流通效率相對較高。
因此,對于上述兩種網絡結構來說,核心區域(或城市)都具有較大的信息控制權,是在緊急情況下進行的社交網絡輿情管控的重要節點。應該最大限度地發揮其在輿情中的風向標作用,通過對核心區域(或城市)的干預和引導,把握網絡輿情引導主動權和話語權,并及時、主動地占領網絡輿論的主陣地和優勢高地,進而實現對全區域范圍內其他區域(或城市)的網絡引導,消解其他區域(或城市)在輿情發展中存在的噪音和雜音,及時排解輿情風險隱患。此外,當網絡結構相對較為復雜時,還應當注重不同核心區域(或城市)之間的合作與協同,從以點帶面到整體推進,進而全面提升突發公共事件的網絡輿情治理能力與水平。
從該突發公共事件網絡輿情的局部聚類系數結果來看,在社交網絡輿情的時空網絡結構中存在局部聚類系數較低的結構孔城市,與其他城市連接相對良好,在時空網絡中充當著“信息橋梁”的角色。此類節點作為時空網絡中的關鍵城市,能夠促進輿情信息的流動和共享,并且能夠干預和控制其他區域(或城市)之間的通信和傳播,在輿情事件的時空擴散和演化中具有較強的關系優勢。同時,也存在局部聚類系數為0的城市,這類城市的相鄰節點都只與這一節點相連,但彼此之間互不相連,其周圍的網絡結構較為簡單。
因此,針對該類網絡輿情進行管控和治理時,關鍵區域(或城市)作為重要的監管節點,需要對其輿論導向進行準確識別、定向培育和積極引導,并且完善其社交網絡輿情中的民意觀察和分析機制,才能最大限度地發揮其在輿論引導中的領導和正面優勢,從而快速、及時地調動關鍵區域(或城市)中的意見領袖進行正確的輿論疏導,營造正向情感和觀點,實現輿情信息的正向流轉。局部聚類系數為0的區域(或城市)由于周圍的網絡結構相對簡單,其管控和治理則相對容易。
本文提出突發公共事件網絡輿情時空演化分析模型和算法,將空間自相關、時空網絡圖算法與輿情分析相結合,對突發公共事件網絡輿情的時空演化特征中的時空總體分布、時空聚集類型進行分析;通過社交網絡輿情中的網絡結構和關鍵城市(或區域)的平均聚類系數與局部聚類系數,呈現網絡輿情時空演化規律。本文在理論層面,通過空間自相關分析確定了突發公共事件社交網絡輿情的時空總體分布與聚集類型;利用圖算法中的平均聚類系數對時空網絡結構進行了分析,局部聚類系數確定了時空網絡中的關鍵區域(或城市),從而進一步豐富了網絡輿情研究的理論和方法體系。實踐層面,結合新浪微博“日本核廢水排海”事件下的時空數據進行實證分析,發現突發公共事件網絡輿情的時空聚集效應,重點經濟發達地區作為空間熱點區域在輿情中的高價值屬性,以及不同的時空網絡結構中,核心和橋梁城市在輿情時空演化中的引導和中介作用。最后,根據以上輿情時空特征和規律提出了相應的策略,為突發公共事件網絡輿情的管控與治理提供了實踐參考。
本文的研究仍存在一定的局限性。本文僅以微博平臺中的單一輿情事件作為數據來源,所得出的研究結論具有一定的局限性。在后續的研究中,將關注多種網絡平臺輿情的對比分析,以期為國家輿情治理體系的豐富和完善提供更多有意義的參考。另外,時空分析僅限于國內,未對國外地區進行探究,在后續的研究中,將考慮國內外輿情時空分布的對比,豐富和深化輿情時空規律。