999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

重大突發事件下網絡輿情傳播中社會群體主題演化圖譜構建研究

2024-01-01 00:00:00王晰巍李聰聰孫哲李玥琪
圖書與情報 2024年2期

摘 " 要:研究重大突發事件下網絡輿情傳播中社會群體主題演化圖譜構建,對重大突發事件的應急和維護社會穩定具有重要作用。文章基于LDA主題模型構建社會群體主題演化圖譜,基于主題時序統計和主題頻次統計構建社會群體主題熱度演化圖譜,基于JS散度和DFS算法構建社會群體主題路徑演化圖譜,并給出重大突發事件下網絡輿情傳播中社會群體主題演化圖譜構建過程模型。研究發現:利用構建的模型可以對群體主題特征、主題熱度影響因素及主題最優傳播路徑進行分析,發現重大突發事件下輿情演進態勢和識別敏感輿情話題,從而進行正向的輿情引導,為重大突發事件下網絡輿情治理提供新的參考視角。

關鍵詞:重大突發事件;網絡輿情;LDA主題模型;主題演化;社會群體

中圖分類號:G206 " 文獻標識碼:A " DOI:10.11968/tsyqb.1003-6938.2024020

Research on the Construction of Topic Evolution Graphs for Social Group in the Dissemination of Network Public Opinion during Major Emergencies

Abstract Research on the construction of social group theme evolution mapping in network public opinion communication under major emergencies plays an important role in emergency response to major emergencies and maintenance of social stability. The article constructs social group theme evolution mapping based on LDA theme model, constructs social group theme heat evolution mapping based on theme timing statistics and theme frequency statistics, constructs social group theme path evolution mapping based on JS dispersion and DFS algorithms, and gives a model of the process of constructing social group theme evolution mapping in network public opinion communication under major emergencies. It is found that the model constructed in this paper can be used to analyse the characteristics of group themes, the factors affecting theme heat and the optimal communication paths of the themes, to find out the evolution of public opinion under major emergencies and to identify sensitive public opinion topics, so as to guide public opinion in a positive direction, and to provide a new reference perspective for the management of online public opinion under major emergencies.

Key words major emergencies; network public opinion; LDA topic model; topic evolution; social groups

總體國家安全觀是習近平新時代中國特色社會主義思想的重要組成部分[5]。近年來,隨著各種自然災害、事故災難、公共衛生事件和社會安全事件的突發,社交媒體平臺成為公眾事件信息獲取、信息傳播、情感宣泄和觀點表達的重要媒介。重大突發事件下,由于公眾關注度高、信息傳播速度快、社交媒體用戶群體龐雜,極易造成大量網絡謠言、群體極化和信息窄化。因此,輿情監管部門如何從大量社交網絡數據中識別出社會群體關注的輿情主題和關鍵意見領袖,并對重大突發事件的社會群體間主題傳播路徑進行分析,進而對關鍵輿情的信息傳播進行有效引導,以保證輿情傳播朝著健康的社會輿論方向發展,成為國家安全應急管理中相關輿情監管機構和學術界關注的重要問題。

目前,國內外學者對重大突發事件中的社交網絡信息傳播已開展了相關研究。在國外,Pogrebnyakov和Maldonado對社交網絡平臺信息的文本復雜性進行實證分析,據此研究社交網絡在應急響應領域所發揮的作用[2];Simon等結合公眾、應急組織和學術機構在重大突發事件中對社交網絡工具的使用情況,分析重大突發事件中社交網絡的作用機制[3];Wirz等通過機器學習技術,研究社交網絡平臺在突發事件中加強或削弱風險認知方面的作用[4];Zhang等針對重大突發事件中政府部門發布的相關政策,通過數據分析技術,研究政府通過社交網絡進行信息發布對公眾負面情緒傳播及演化的影響[5]等。在國內,陳鳳嬌和劉德??偨Y了重大突發事件下社交網絡平臺信息發布模式,并據此構建政府部門和醫療專家不同渠道信息發布的演化博弈模型[6];程慧平等應用質性分析方法對重大突發事件下的社交網絡信息過載的成因和影響展開研究[7];徐元等歸納總結出多模態信息分析的關鍵方法和技術,分析重大突發事件下社交網絡多模態信息的特征[8];王晰巍和王楠阿雪通過采用扎根方法和主題挖掘,研究基于數據分析的全媒體融合對重大突發事件下應急管理不同發展階段的應用情況[9]。從國內外現有研究成果來看,國外研究聚焦于重大突發事件中社交網絡的作用機制和應急管理系統的完善,國內研究則主要關注重大突發事件中信息傳播影響因素和信息傳播特征的分析。整體而言,缺乏從重大突發事件下社交網絡群體主題演化圖譜方面的研究,進行主題相似度分析及主題傳播路徑識別的研究成果則相對更少。

本研究試圖解決以下兩個問題:(1)如何構建重大突發事件下網絡輿情傳播中社會群體主題圖譜,并對網絡輿情中社會群體的主題路徑演化進行分析?(2)如何針對重大突發事件下網絡輿情傳播進行主題識別,并基于主題識別進行重大突發事件輿情事件引導?根據問題,本研究在理論層面上,構建了重大突發事件下網絡輿情傳播中社會群體主題演化圖譜過程模型,從主題內容、主題熱度、主題路徑三個維度對社會群體進行分析,為社交網絡輿情主題研究提供新的研究方法。在實踐層面上,為突發事件應急管理體系中的輿情引導工作提供可參考的模型,借助模型實現突發事件社交網絡的輿情態勢感知,為相關輿情監管機構提供管理和決策支持。

1 " 相關概念及文獻綜述

1.1 " "重大突發事件

重大突發事件是指突然發生,造成或者可能造成嚴重社會危害,需要采取應急處置措施并予以應對的自然災害、事故災難、公共衛生事件和社會安全事件[10]。重大突發事件主要有突發性、特定性、復雜性和危害性四個特征。重大突發事件的發生會影響社會穩定,造成人民恐慌。當重大突發事件發生后,事物原有的發展格局突然被打亂,可能超出正常社會秩序和人們的心理慣性運行。人們往往措手不及,難以應對,整個工作和生活秩序混亂,不僅對世界各國的政治經濟造成嚴重影響,甚至會給各國人民帶來深重災難,嚴重影響各國的政治經濟秩序和人民的正常生活。習近平總書記在二十大報告中立足國情,多次強調“完善公共安全體系,提高防災減災救災和急難險重突發公共事件處置保障能力”,完善國家應急管理體系建設,為重大突發事件的應急管理和輿情疏導工作指明方向[11]。

1.2 " "主題聚類圖譜

主題圖譜是知識圖譜在領域層面的應用及深化,它存在多種類別,包括用戶交互行為圖譜、語義圖譜和事理圖譜等[12]。其中,用戶交互行為圖譜是對用戶實體及實體關系進行構建,旨在發現用戶之間交互關系種類及網絡中的重要節點等信息的關系。在行為圖譜中,實體是指參與話題討論的用戶,每個實體具有一定的屬性值,包括網絡用戶基本信息,如年齡、地域和認證信息等;實體與實體之間的關系表現為轉發、評論、提及和點贊等關系。本研究的主題聚類圖譜,是在用戶交互行為圖譜的基礎上,將海量微博用戶發布的評論轉發文本信息通過主題相似度進行劃分,不僅可以將社交網絡中的用戶通過主題分類成不同的聚類群體,還可以將相同主題下的網絡用戶聚集在一起,表現出不同網絡用戶群體對某一話題事件的轉發、評論和提及行為[13]。主題聚類圖譜采用圖的建模方式,實體為參與話題討論的網絡用戶,實體關系為不同用戶之間的轉發、評論和提及等。網絡社交媒體中的主題聚類圖譜來源于網絡用戶的評論轉發文本信息,主題聚類圖譜的構建有利于獲取社交網絡中的有效信息,如網絡用戶討論的熱點主題以及用戶意見領袖識別等。

2 " 研究設計

2.1 " "基于LDA的社會群體主題聚類演化圖譜構建

通過對社會群體的主題聚類,可以從更加全面和準確的信息視角了解在重大突發事件下輿情事件的發生、演化和影響。同時,通過對主題聚類圖譜的分析,可以了解用戶群體對輿情事件的關注點,從而準確把控輿情發展方向,更好地引導網絡輿情,避免輿情事件產生的負面影響。

本研究通過LDA模型進行主題聚類。LDA主題模型是一種可對大量文本信息特征進行主題建模的三層級貝葉斯概率圖模型[14],主要用于挖掘文本的潛在主題,并進行主題劃分。同時,采用困惑度(Perplexity,PPL)評價指標來確定文檔中最優的主題個數。困惑度是一種信息理論的測量方法,在自然語言處理中困惑度常作為衡量一個概率分布或概率模型預測樣本優劣程度的指標,可以通過困惑度數值變化來調節語言模型主題個數[15],計算公式如下:

Perplexity(D)=exp■公式(1)

其中,D表示所有文檔的集合,M表示文檔的數量,Wd表示文檔d中的詞,Nd表示文檔d中的詞數,P(Wd)表示文檔集合中詞出現的概率。困惑度數值一般隨著潛在主題數量的增加呈現遞減規律,困惑度數值越小表示該主題模型的生成能力越強,模型越好。因此,本研究選擇困惑度相對小且主題數量相對較少的主題數值,作為LDA模型訓練的最優模型參數[16]。

2.2 " "基于時序性的社會群體主題熱度演化圖譜構建

主題熱度演化是指輿情主題被公眾關注的熱點程度,隨著時間的推移呈現出爆發或者消亡等變化趨勢。對輿情事件主題熱度演化的分析有助于提高對輿情事件生命周期判斷的準確性,同時發掘出群體在輿情事件發展過程中的受關注程度。通過LDA主題模型完成用戶評論轉發文本內容的分類主題挖掘后,截取輿情事件發生后的一段時間作為分析時間,對該段時間內的不同主題的文本數量進行統計[17],從而作為輿情主題熱度演化分析的衡量依據。

關于重大突發事件中社會群體主題熱度演化分析,本研究基于主題熱度和時序性,對不同輿情主題下的時間切片內出現的主題頻次進行求和,以此來反映該主題在不同時段內的主題討論熱度,即以發文時間為橫軸,不同主題發文熱度為縱軸,構建主題熱度的演化圖譜。通過針對主題熱度演化趨勢的分析,進行重大突發事件中社會群體主題在整個輿情事件發展周期內的演化特征分析。

2.3 " "基于相似度的社會群體主題路徑演化圖譜構建

通過分析社交網絡中社會群體主題路徑演化,可以及時發現和預警潛在的輿情事件,更好地應對和處理可能出現的負面影響。同時,研究社交網絡中社會群體主題路徑演化,可以幫助國家政府更好地了解用戶的信息需求和傳播路徑,從而優化信息傳播策略,提高信息傳播效果。

社交網絡具有以下特點:(1)在社交網絡中,意見領袖節點往往代表其所在社會群體的主題傾向;(2)社交網絡中的邊權重可以看作是網絡社群在不同節點間傳播的信息損耗,即節點的主題相似度越高,它們之間的信息傳播就更為容易,信息損耗也越?。?8]。因此,為降低后續計算的復雜度,保障研究的科學性,首先挖掘不同群體意見領袖的代表其所在的群體,再計算出群體意見領袖之間的相似度代表主題之間的語義距離,并將語義距離作為主題的邊權重,最后計算遍歷各輿情主題的最短路徑,構建社會群體主題路徑演化圖譜。

PageRank算法是由谷歌公司創始人拉里·佩奇和謝爾蓋·布林于1996年推出的一種網頁分析算法[19],后被大量使用于度量社交網絡中意見領袖的影響力[20]。由于PageRank算法不僅考慮了節點的數量和質量,也考慮了不同節點之間的關聯,是一種比較綜合的排名算法,因此本研究選用PageRank值來挖掘重大突發事件中不同社會群體的意見領袖。

KL 散度也稱相對熵,是兩個概率分布間差異的非對稱性度量,計算見公式(2)。JS散度是在KL散度的基礎上演化而來的,是用于描述兩個概率分布的對稱性相似程度[21],計算見公式(3)。

從公式(3)可以看出等式是對稱成立的,也就是說JS(P||Q)=JS(Q||P)。在本研究中,P(x)和Q(x)表示不同意見領袖的概率分布,即LDA主題模型計算出的“文檔-主題”分布,JS散度的值域范圍是[0,1],P(x)和Q(x)的相似度越高,JS散度值越接近于0[22]。由此選擇JS散度來度量不同意見領袖之間的相似度。

深度優先搜索(DFS)算法是一種基于?;蜻f歸實現的搜索算法[23],可以用來解決許多圖論問題,如連通性、最短路徑、最小生成樹等問題。因而通過DFS算法來計算遍歷各輿情主題的最短路徑。

2.4 " "重大突發事件下網絡輿情傳播中社會群體主題演化圖譜構建過程模型

基于上述分析,本研究構建了重大突發事件下網絡輿情傳播中社會群體主題演化圖譜構建過程模型(見圖 1)。過程模型分為四個階段:數據處理、主題挖掘、主題圖譜構建和輿情主題分析。(1)數據處理。通過軟件和編碼對重大突發事件下網絡輿情事件數據進行爬取,爬取的數據包括用戶名、用戶評論轉發文本、評論轉發關系和發文時間,隨后對爬取到的數據進行預處理,即清洗、分詞、篩選和去重等操作,獲得預處理后的數據。(2)主題挖掘。通過困惑度評價指標確定最優主題個數,再利用LDA主題模型對預處理后的數據進行主題挖掘,隨后進行主題時序統計和主題頻次統計。通過PageRank值識別不同主題意見領袖,結合LDA主題模型得出的“文檔-主題分布”,計算出不同群體意見領袖之間的JS散度值作為主題之間相似度,通過DFS算法來計算遍歷各輿情主題的最短路徑。(3)主題圖譜構建。通過編碼和可視化軟件構建社會群體主題聚類圖譜、主題熱度演化圖譜和主題路徑演化圖譜。(4)輿情主題分析。分別對主題聚類圖譜、主題熱度演化圖譜和主題路徑演化圖譜進行主題特征分析、主題熱度分析和主題最優傳播路徑分析。

3 " 實證分析

3.1 " "數據處理

據新浪微博2022年3月公布的《新浪微博2021年全年財報》顯示,截至2021年末,微博月活躍用戶達到5.73億,同比增長10%[24]。微博平臺作為目前國內主流社交媒體平臺之一,具有用戶門檻低、信息時效性強和傳播范圍廣泛等特點。2022年3月21日,中國東方航空集團有限公司MU5735航班在廣西壯族自治區梧州市附近山林墜毀,發生重大空難事故。此次重大突發事件,給國家和人民都帶來了難以估量的危害,不僅造成嚴重財產損失和人員傷亡,也使得我國民航業再次遭受重創。隨著“3·21”東航客機事故的持續發展,其造成的嚴重人員傷亡、災后救援和事故原因等相關話題迅速引起網絡社交平臺中大量官方媒體和普通用戶的關注。

因此,本研究選擇新浪微博作為研究平臺,選取新浪微博的“3·21”東航客機事故這一具有代表性的重大突發公共安全事件作為輿情話題,采用八爪魚工具對輿情事件下的數據進行爬取,收集的數據信息主要包括用戶名、用戶ID、發文時間、評論轉發文本內容等。對收集的數據進行數據處理。首先使用Microsoft Excel軟件篩查并剔除掉無關數據,去除表情及鏈接等。其次,調用Python 3.10.6中的Jieba庫對文本進行分詞操作,然后篩選出文本中的名詞、動名詞、專有名詞、形容詞作為文本關鍵詞,再人工刪除無關詞、虛詞和停用詞,如“公司”“代表”等。再次,對同義詞進行合并,如將“家人”“親人”都合并為“家屬”,并創建常用詞典合成常用詞,如Jieba庫可能將“央視”和“新聞”分成了兩個詞,需要在常用詞典中將其合并成“央視新聞”這一詞。最后,得到微博評論轉發數據共28326條。

為更直觀地呈現出預處理后的數據結果,發現關鍵詞之間的潛在關系和微博用戶關注的熱點話題,深入了解用戶群體對輿情事件的態度和情感,在Windows10系統下,通過Python 3.10.6編碼和Microsoft Excel軟件,對數據處理后的關鍵詞進行篩選,篩選出詞頻最高的200個關鍵詞,構建網絡輿情關鍵詞共現矩陣,通過共現矩陣構建共現網絡。

Gephi是一款開源的網絡分析和可視化工具,它可以通過導入節點及邊表格或導入矩陣幫助用戶對復雜的網絡數據進行分析和可視化。本研究選擇當前最高版本Gephi 0.9.7構建“3·21”東航客機事故關鍵詞共現網絡并進行后續分析。通過Gephi可視化軟件對“3·21”東航客機事故社會群體關鍵詞共現網絡進行可視化呈現(見圖 2)。其中,以關鍵詞為共現網絡中的節點,節點大小代表關鍵詞的度中心性,共現關系為網絡中的邊,邊的粗細代表關鍵詞之間的共現次數,共獲得200個節點和5070條邊。

網絡輿情關鍵詞共現網絡,可以展示各輿情關鍵詞重要性程度,也可以展示各關鍵詞之間的關聯關系,還可以根據邊的權重展示關鍵詞之間的關聯關系程度。根據以往研究中對社會網絡的分析方法,本研究從網絡密度和網絡中心性兩個角度對“3·21”東航客機事故關鍵詞共現網絡進行分析。一方面,選擇網絡密度為分析指標,對關鍵詞共現網絡進行整體分析;另一方面,選擇網絡中心性為分析指標,對網絡結構中度中心性為前10的節點為代表性節點進行重點分析,此類節點是影響輿情事件發展的關鍵節點及關鍵要素。

通過Gephi測算“3·21”東航客機事故關鍵詞共現網絡密度,可知“3.21”東航客機事故關鍵詞共現網絡密度為0.255,數值較大。一般來說網絡密度越大,各節點的互動越頻繁。可以看出,“3·21”東航客機事故在新浪微博上傳播時,涉及的關鍵詞之間存在較強的相關性,共同出現的頻率較高,各關鍵詞間的聯絡相對較為密切,也容易吸引用戶的注意。這意味著該事故在微博平臺傳播時信息間交流多,使得用戶在接收信息時只需要花費較少時間即可全面掌握當前事故的發展態勢。同時,通過Gephi分別測算“3·21”東航客機事故關鍵詞共現網絡中點度中心性、中介中心性和接近中心性前10的節點,進行網絡中心性指標的詳細分析(見表 1)。

3.2 " "數據結果

研究結果表明,“3·21”東航客機事故輿情事件的關鍵詞共現網絡通過對網絡密度及代表性節點中心性的分析,發現重大突發事件下網絡輿情具有以下幾個特征:

(1)重大突發事件下輿情傳播主體具有很強的交互性和關聯性。通過對關鍵詞共現網絡的分析,發現不同關鍵詞節點之間邊的粗細有所不同,粗細程度代表關鍵詞節點之間的共現次數,即節點之間的邊越粗,節點之間的共現次數越多,節點關系越密切。如“事故”“原因”“調查”“調查結果”“信息”等關鍵詞節點之間的邊較粗,說明這些節點之間的聯系較為密切,體現了重大突發事件中用戶十分關注事故調查結果,渴求知曉事發原因;關鍵詞節點“乘客”與關鍵詞節點“救援”“平安”之間的邊較粗,體現了重大突發事件中社會群體對受災乘客的強烈憂心和殷切期盼。

(2)重大突發事件下輿情傳播網絡具有一定的密集性和同質性。從網絡密度分析來看,“3·21”東航客機事故關鍵詞共現網絡的整體密度偏高為0.255。由此可見,“3·21”東航客機事故在新浪微博平臺傳播時,各輿情傳播社交網絡的用戶節點之間關注的主題關鍵詞間互動聯絡都極為密切,微博用戶信息交互行為較多、關系足夠緊密,各節點存在較高的同質性,易于形成一致的表達,也提高了信息的傳播速度。

(3)重大突發事件下輿情傳播的關鍵節點具有一定的集中性。從網絡中心性分析來看,關鍵詞“事故”“飛機”“家屬”“乘客”“逝者”“空難”等均靠前排列,這些關鍵詞都是信息傳播網絡中的關鍵節點,與其他關鍵詞節點聯系密切,是重大突發事件中輿情主體傳播的核心關鍵詞?!笆鹿省薄翱针y”是此次重大突發事件的屬性,“飛機”“乘客”都是此次事故發生的主體,“家屬”“逝者”則是事故發生后社會群體的反應,表明社會群體關心事故遇難的“逝者”及其“家屬”,“3·21”東航客機重大突發安全事故引發全國民眾的熱切關注。

3.3 " "基于LDA的主題聚類圖譜

(1)確定主題聚類個數。經過數據預處理后,選用基于Python-sklearn中的LDA主題模型,對預處理后的文本進行分類訓練。主題個數太少可能不足以捕捉到數據的豐富語義結構,導致模型的表現較差。通常,至少需要兩個主題才能進行對比和觀察不同主題之間的關系[25]。而主題個數太多會導致模型過于復雜,并且可能出現過擬合現象[26],選擇一個較小的主題個數范圍可以幫助避免這種問題。因此,擬定選擇區間[2,12]內的某一整數作為候選主題數。通過調用LDA主題模型類下的Perplexity方法,得出不同模型的困惑度數值(見圖 3)。該圖表明某一文檔對于各個潛在主題的不確定程度。困惑度越低,文檔歸屬于某一潛在主題的可能性就越高,即模型的聚類效果越好。困惑度折線圖顯示,隨著主題數的增加,總體上困惑度呈現先波動下降再上升的態勢;困惑度的局部極小值點,出現在主題數為8的模型選擇上。因此,本研究輿情話題擬選取 8個潛在主題數。

(2)構建主題聚類圖譜。本研究的研究對象是“3·21”東航客機事故輿情空間下的微博用戶節點,任意兩個節點間的轉發評論關系,代表著兩個節點在同一輿情空間下的話題傾向性趨同。因此,這種轉發評論關系代表節點之間的相似性。在確定最優主題數后,將分詞后的文本數據用于LDA主題模型進行訓練,得到“文檔-主題”以及“主題-詞”兩個概率分布。通過“文檔-主題”概率分布,以“3·21”東航客機事故輿情話題中微博用戶為節點,轉發評論關系為邊,不同主題類別用不同顏色進行劃分,將最終獲得的28326條微博轉發評論數據導入Gephi 0.9.7可視化軟件中,構建出“3·21”東航客機事故微博用戶主題聚類圖譜(見圖 4)。根據顏色深淺,將“3·21”東航客機事故話題下的微博用戶主題聚類劃分為不同網絡群體。其中,節點大小與節點的度中心性成正比。節點越大,其度中心性越大,說明該微博用戶在重大突發事件下具有更高的地位和群體影響力。

通過“主題-詞”分布可確定各個主題包含的高頻關鍵詞,并以分類的主題個數確定微博用戶群體。利用LDA主題模型訓練得到8個主題,且各個主題均選取詞頻最高的前5個詞,對主題進行人工歸納和命名(見表 2)??梢钥闯觯鱾€主題的關鍵詞都占有較大的概率值,這符合微博文本主題的特點,即微博用戶在某一特定話題空間下的評論用詞習慣趨于相同[27]。同時,除了極少數不同主題高頻關鍵詞相同,各個主題的高頻關鍵詞大體上各不相同,也說明了該模型能夠較好地實現微博用戶評論轉發文本主題的劃分。

3.4 " "基于時序性的主題熱度演化圖譜

基于LDA主題模型對重大突發事件中社會群體進行主題劃分后,基于主題熱度和時序性,對不同主題和不同時間切片內出現的頻次進行求和,來反映不同輿情傳播主題在不同時段內的討論熱度,以此構建重大突發事件下的社會群體主題熱度演化圖譜??紤]到輿情事件的生命周期,事件爆發較長時間之后產生的數據量一般較少,研究價值不大,故本研究僅以“3·21”東航客機事故發生后一個月左右作為分析時間,截取2022年3月21日-2022年4月23日期間的微博用戶評論轉發文本作為研究數據。選擇主題河流圖來展示不同時間不同主題的演化情況,通過調用Python-pyecharts工具包構建主題熱度演化圖譜,其中發文時間為橫軸,輿情關注的主題熱度為縱軸,不同深淺代表不同發文主題,不同主題河流的寬度代表對應時間點的主題熱度,即主題河流所占縱軸比例越大其討論熱度越高。據此構建了“3·21”東航客機事故主題熱度演化圖譜(見圖 5)。可以看出,該事故從2022年3月21日東航航班機在廣西梧州山林墜毀開始,是整個話題空間的入口。2022年3月21日-2022年4月23日期間8個主題均出現了5個峰值,分別為3月25日、3月27日、3月30日、4月11日和4月20日。

3.5 " "基于相似度的主題路徑演化圖譜

識別不同主題群體的意見領袖,代表其所在主題的社會群體。PageRank算法基于網絡圖模型,通過綜合每個節點的點度中心性和網絡傳播特性來確定該節點的重要程度,即節點的PageRank值越高,表示該社交網絡的節點對社群的影響力越大。本研究在對主題進行劃分之后,挖掘各主題群體中PageRank值最大的節點作為其所在主題群體的意見領袖(見表 3)。

識別出各主題群體的意見領袖之后,結合LDA主題模型得出的“文檔-主題分布”,計算出不同群體意見領袖之間的JS散度值(作為主題之間相似度,代表不同主題之間的邊權重見表 4)。

根據不同主題群體意見領袖的相似度,確定不同主題意見領袖之間主題演化路徑上的邊權重,以最大主題群體1作為主題路徑演化的起點,最小主題群體5為主題路徑演化的終點,通過DFS算法計算遍歷各輿情主題的最短路徑,得到主題演化路徑為“主題1→主題4→主題0→主題3→主題6→主題7→主題2→主題5”。據此構建重大突發事件下社會群體主題路徑的演化圖譜(見圖 6)。由此可知,在選擇主題群體1進行輿情信息的傳播時,從最大主題群體1出發,最后到達最小主題群體5的主題傳播路徑,所帶來的信息損耗最小。通過確定不同主題輿情傳播的最短路徑,可以有效減少輿情傳播過程中的信息失真,同時可以更加精確地掌握輿情信息的傳播情況,及時發現和糾正謠言等負面信息,避免其不斷發酵。因此,識別輿情主題意見領袖,構建輿情事件主題路徑演化圖譜,可以減少輿情在傳播過程中的信息損耗,提高輿情管理的效率和準確性。

4 " 討論分析

4.1 " "重大突發事件中社會群體主題特征分析

根據用戶群體LDA主題聚類圖譜、主題高頻關鍵詞分布和主題概率分布,發現“3·21”東航客機事故網絡輿情發展周期內出現的社會群體主題。分析各群體主題特征分別為:主題0的用戶群體善于識別網絡謠言,主題1的用戶群體祈禱奇跡出現,主題2的用戶群體哀悼遇難者,主題3的用戶群體關注事故致因,主題4的用戶群體關注意外險賠付,主題5的用戶群體寬慰遇難者家屬,主題6的用戶群體擔憂乘客安全,主題7的用戶群體呼吁展開乘客救援。在“3·21”東航客機事故中,用戶的正面情感主要包括對調查結果的實時通報和救援進展的實時更新等。中性情感主要包括對事故發生的實況描述,對遇難者的哀悼和對遇難者家屬的寬慰等。負面情感主要集中在對事故原因的消極猜測和對保障乘客安全的懷疑態度,以及救援實時的緊張局勢等。此外,結合“3·21東航客機事故”輿情話題的演進周期,根據劃分的主題數及展現的高頻詞,不僅可以確定“客機事故調查結果”“搜救情況”“向遇難者家屬表示哀悼”等輿情子話題,還可以發現“找到黑匣子”“沒買意外險能得到賠償嗎”“如何保障乘客安全”等潛在衍生話題。

重大突發事件輿情話題往往具有一定的敏感性,用戶容易出現極端片面性。若缺乏精確的主題分析和輿情引導,容易造成負面輿情泛濫[28]。輿情監管部門通過確定不同主題下重大突發事件中社會群體的情感類型,從情感和主題兩方面入手對輿情進行有效引導,并對中性情感和負面情感主題進行重點監測及引導。中性情感主題出自用戶內生信息需求的用戶間信息共享行為,這類主題也容易產生網絡謠言,相關部門應聯合意見領袖發布科學準確的事件官方信息,杜絕虛假信息傳播[29],引導輿情向積極態勢發展。對于負面情感主題,相關機構不僅要在主題內容方面關注其輿情發展走向,更應關注重大突發事件下輿情衍生的潛在話題[30],及時在苗頭傾向性上進行遏制和引導。

4.2 " "重大突發事件中社會群體主題熱度影響因素

“3·21”東航客機事故主題熱度演化圖譜中共出現了5個峰值,從單個峰值來看,乘客“救援主題”分別占據了2022年3月25日和2022年3月27日這兩個峰值的最大討論熱度,“意外險賠付主題”占據了2022年3月30日這一峰值的最大討論熱度,“網絡謠言識別主題”占據了2022年4月11日這一峰值的最大討論熱度,探究事故致因主題占據了2022年4月20日這一峰值的最大討論熱度。通過相關事件梳理,發現以下事件是導致這5個峰值產生的原因:2022年3月25日東航客機墜毀事故救援進入第5天,在25日召開的“3·21”東航MU5735航空器飛行事故國家應急處置指揮部第五場新聞發布會上,公眾關心的諸多焦點問題得到回應,如黑匣子破譯和遇難者身份鑒定進展;2022年3月27日,“3·21”東航MU5735航空器飛行事故遇難者集體哀悼活動在事發地搜救現場舉行,對遇難者表示哀悼;2022年3月30日,據中國銀保監會消息稱“東航遇難者家屬已獲11家保險公司賠付1485萬元”;2022年4月11日,官方辟謠東航飛機失事與副駕有關,并表示MU5735事故原因還在調查中;2022年4月20日,官方公布針對東航MU5735航班失事的初步報告。

以往研究對網絡輿情主題熱度影響因素的研究,多集中于認為標志性事件的出現是影響網絡輿情主題熱度演化的主要因素之一[31],輿情事件本身的特性也對網絡輿情主題熱度產生較大影響[32]。本研究在前序基礎上,進一步驗證了官方信息公開時間、信息公開范圍、信息公開數量對網絡輿情主題熱度具有較大的影響。因此,官方輿情監管機構首先應確定輿情引導的關鍵節點,在群體情感出現整體負面趨勢時要選擇合適時機盡早介入。其次,針對社會群體信息發布行為時間具有顯著官方導向性這一特征,官方賬號應加大對網絡謠言的辟除、曝光力度,以多樣化媒體發布渠道進行事件的通報和解讀,并根據社會群體信息活動時間進行有針對性地推送。最后,做好相關意見領袖節點的輿情引導工作,注意觀察輿情走向中衍生主題事件的演化特征,對可能出現的輿情熱點高峰進行預判,以防患于未然。

4.3 " "重大突發事件中社會群體主題最優傳播路徑分析

根據數據分析結果與主題路徑演化分析發現,在話題“3·21東航客機事故”中,意見領袖“嘉人在此一方”→“酥糖e” →“嘉人在此一方” →“時空急轉灣” →“續命晴空327” →“人民日報”→“鯨鋰”→“葉落的晴天” →“三明消防”→“酥糖e”的輿情傳播路徑最短,即輿情主題1到主題5的最優傳播路徑為主題1→主題4→主題0→主題3→主題6→主題7→主題2→主題5。輿情主題通過該路徑傳播時造成的信息損耗最小、信息傳播效率最高。上述分析結果表明,在重大突發事件中可以通過確定不同群體間的最優演化路徑,利用社交網絡的連通性實現對重大突發事件下群體意見領袖的高效話題推送,從而有效減少輿情傳播過程中的信息損耗和失真,提高輿情管控的效率和準確性。

與前期相關研究成果相比,一些研究發現意見領袖對于網絡輿情管控的影響[33],并有學者討論意見領袖是信息傳播效率內在驅動之一[34],認為意見領袖的權威性和可信度是影響普通用戶轉發行為的關鍵因素[35],官方媒體在媒體平臺的討論都處于主導地位。本研究結果進一步表明,可通過主題模型識別重大突發事件下網絡輿情話題事件中的子話題與衍生話題中的意見領袖,從而讓意見領袖最大程度地發揮其在網絡輿情中的正向引導作用。在重大突發事件的輿情擴散期與爆發期,官媒、政府以及相關輿情監管部門可以通過適當的主題選擇,向意見領袖推薦多樣化的主題信息,并引入其他類別的輿情話題,避免用戶過于關注某一特定輿情信息,從而導致信息過載和群體極化,造成信息倦怠并產生負面影響,引發次生輿情事件[36]。

5 " 研究結論

本研究結合輿情關鍵詞共現網絡分析,基于LDA主題模型構建社會群體主題演化圖譜,基于主題時序統計和主題頻次統計構建社會群體主題熱度演化圖譜,基于JS散度和DFS算法構建社會群體主題路徑演化圖譜,并給出重大突發事件下網絡輿情傳播中社會群體主題演化圖譜構建過程模型,同時以“3·21”東航客機事故輿情話題為例進行實證研究。

利用本研究構建的模型,可以從主題內容、主題熱度、主題路徑三個維度對重大突發事件下社會群體的輿情主題演化進行分析,發現重大突發事件下輿情演進態勢和識別敏感輿情話題,幫助輿情監管部門準確有效地識別微博用戶群體敏感輿情話題和敏感群體,從而有效確定在重大突發事件輿情傳播中的重點輿情監管節點。為重大突發事件下社交網絡輿情主題演化分析研究提供了新的分析方法,豐富了突發事件應急情報管理的研究,同時也為輿情監管部門提供更好的社會群體主題監管方法,更好地推動重大突發事件下負面網絡輿情的疏導,營造清朗的網絡生態環境。

本研究也存在一定的局限性。選取的微博平臺雖然具有一定的代表性,但是不能涵蓋其他輿情平臺對“3·21”東航客機事故的話題內容。同時,僅結合“3·21”東航客機事故這一話題進行分析研究顯得較為單一。后續將補充更多代表性的輿情平臺,針對更多典型輿情話題進行重大突發事件中社會群體主題圖譜及演化研究。

參考文獻:

[1] "二十大報告全文來了![EB/OL].[2023-10-25].http://www.chinajsb.cn/html/202210/25/29970.html.

[2] "Pogrebnyakov N,Maldonado E.Didn’t roger that: social media message complexity and situational awareness of emergency responders[J].International Journal of Information Management,2018,40:166-174.

[3] "Simon T,Goldberg A,Adini B.Socializing in emergencies-A review of the use of social media in emergency situations[J].International Journal of Information Management,2015,35(5):609-619.

[4] "Wirz C D,Xenos M A,Brossard D,et al.Rethinking social amplification of risk: social media and zika in three languages[J].Risk Analysis,2018,38(12):2599-2624.

[5] "Zhang W,Wang M,Zhu Y.Does government information release really matter in regulating contagion-evolution of negative emotion during public emergencies?From the perspective of cognitive big data analytics[J].International Journal of Information Management,2020,50:498-514.

[6] "陳鳳嬌,劉德海.重大傳染病多渠道疫情信息發布模式的演化路徑分析[J/OL].中國管理科學:1-15[2023-02-01].https://doi.org/10.16381/j.cnki.issn1003-207x.2021.0793.

[7] "程慧平,于歡歡,蔣星.重大突發公共衛生事件中社交媒體信息過載的前因后果模型研究[J].情報科學,2023,41(3):45-46.

[8] "徐元,毛進,李綱.面向突發事件應急管理的社交媒體多模態信息分析研究[J].情報學報,2021,40(11):1150-1163.

[9] "王晰巍,王楠阿雪.數智驅動的重大突發事件應急情報管理:新機遇、新挑戰、新趨勢[J].圖書情報工作,2022,66(16):4-12.

[10] "國家突發公共事件總體應急預案[EB/OL].[2023-10-20].https://www.mem.gov.cn/xw/jyll/200602/t20060220_230269.shtml.

[11] "二十大報告提出完善國家應急管理體系,應該怎么做?[EB/OL].[2023-10-17].https://baijiahao.baidu.com/s?id=174693

0162528500001amp;wfr=spideramp;for=pc.

[12] "王晰巍,李珗琪,邱程程,等.直播平臺用戶信息交互行為圖譜及特征研究[J].圖書情報知識,2021,38(4):15-26,61.

[13] "丁緒武,吳忠,夏志杰.社會化電子商務用戶興趣圖譜構建的研究[J].情報理論與實踐,2015,38(3):90-94.

[14] "張東鑫,張敏.圖情領域LDA主題模型應用研究進展述評[J].圖書情報知識,2022,39(6):143-157.

[15] "Hagen L.Content analysis of e-petitions with topic modeling:how to train and evaluate LDA models?[J].Information Processing amp; Management,2018,54(6):1292-1307.

[16] "張柳,王晰巍,黃博,等.基于LDA模型的新冠肺炎疫情微博用戶主題聚類圖譜及主題傳播路徑研究[J].情報學報,2021,40(3):234-244.

[17] "霍朝光,董克,司湘云.國內外LIS學科主題熱度演化分析與預測[J].圖書情報知識,2021(2):35-47,57.

[18] "Sahoo S R,Gupta B B.Multiple features based approach for automatic fake news detection on social networks using deep learning[J].Applied Soft Computing,2021,100:106983.

[19] "BRINS.The Page Rank citation ranking:bringing order to the web[J].Proceedings of ASIS,1998,98:161-172.

[20] "郭博,許昊迪,雷水旺.知乎平臺用戶影響力分析與關鍵意見領袖挖掘[J].圖書情報工作,2018,62(20):122-132.

[21] "Lamberti P W,Majtey A P.Non-logarithmic jensen-shannon divergence[J].Physica A-Statistical Mechanics and Its Applications,2003,329(1-2):81-90.

[22] "Zareie A,Sheikhahmadi A,Jalili M.Identification of influential users in social networks based on users’interest[J].Information Sciences,2019,493:217-231.

[23] "Li B,Feng Y,Xiong Z,et al.Research on ai security enhanced encryption algorithm of autonomous iot systems[J].Information Sciences,2021,575:379-398.

[24] "微博2021年營收達22.6億美元,用戶量級與活躍度均有上漲[EB/OL].[2023-10-03].https://baijiahao.baidu.com/s?id=1726274843200311246amp;wfr=spideramp;for=pc.

[25] "李倩,王帥.LDA模型下我國公共圖書館微信平臺閱讀推廣內容主題研究[J].圖書情報工作,2022,66(8):72-83.

[26] "蔣甜,劉小平,劉會洲.基于關鍵詞關聯度指標(KRI)進行LDA噪聲主題過濾的方法研究[J].圖書情報工作,2020,64(3):92-99.

[27] "Alexa.Traffic detail (sina.com.cn)[EB/OL].[2023-10-15].http://www.alexa.com/siteinfo/www.sina.com.cn.

[28] "吳江,趙穎慧,高嘉慧.醫療輿情事件的微博意見領袖識別與分析研究[J].數據分析與知識發現,2019,3(4):53-62.

[29] "Hagen L,Keller T,Neely S,et al.Crisis communications in the age of social media:a network analysis of Zika-related tweets[J].Social Science Computer Review,2018,36(5):523-541.

[30] "Huang W D,Wang Q,Cao J.Tracing public opinion propagation and emotional evolution based on public emergencies in social networks[J].International Journal of Computers Communications amp; Control,2018,13(1):129-142.

[31] "Cai M,Luo H,Meng X,et al.Network distribution and sentiment interaction:information diffusion mechanisms between social bots and human users on social media[J].Information Processing amp; Management,2023,60(2):103197.

[32] "Qian C,Mathur N,Zakaria N H,et al.Understanding public opinions on social media for financial sentiment analysis using ai-based techniques[J].Information Processing amp; Management,2022,59(6):103098.

[33] "Deep Prakash C,Majumdar A.Analyzing the role of national culture on content creation and user engagement on twitter:the case of indian premier league cricket franchises[J].International Journal of Information Management,2021,57:102268.

[34] "Wiesenberg M,Tench R.Deep strategic mediatization:organizational leaders’ knowledge and usage of social bots in an era of disinformation[J].International Journal of Information Management,2020,51:102042.

[35] "Haouari F,Elsayed T,Mansour W.Who can verify this?Finding authorities for rumor verification in twitter[J].Information Processing amp; Management,2023,60(4):103366.

[36] "Haihong E,Hu Y X,Peng H P,et al.Theme and sentiment analysis model of public opinion dissemination based on generative adversarial network[J].Chaos,Solitons amp; Fractals,2019,121:160-167.

作者簡介:王晰巍,吉林大學商學與管理學院、吉林大學大數據管理研究中心、吉林大學網絡空間治理研究中心教授,博士生導師;李聰聰,吉林大學商學與管理學院碩士研究生;孫哲,吉林大學商學與管理學院本科生;李玥琪,吉林大學商學與管理學院博士研究生。

主站蜘蛛池模板: 国产swag在线观看| 国产爽歪歪免费视频在线观看| 波多野结衣一二三| 91久久青青草原精品国产| 91无码国产视频| 国产v精品成人免费视频71pao| 精品人妻无码区在线视频| 亚洲婷婷丁香| 亚洲精品无码高潮喷水A| 免费激情网站| a网站在线观看| 亚洲综合极品香蕉久久网| 亚洲国产午夜精华无码福利| 国产毛片高清一级国语 | 亚洲国产天堂在线观看| 色综合天天娱乐综合网| 日本精品视频一区二区| 女人18毛片久久| 国产欧美日韩精品第二区| 久久精品中文字幕少妇| 久久综合五月婷婷| 四虎成人精品在永久免费| 亚洲三级电影在线播放| 热99精品视频| 亚洲an第二区国产精品| 国产成人一区二区| 免费看av在线网站网址| 国产在线观看第二页| 67194在线午夜亚洲 | 无码福利日韩神码福利片| 日韩二区三区| 亚洲手机在线| 欧美一级黄色影院| 亚洲视频在线观看免费视频| 日韩欧美色综合| 亚洲欧美日韩中文字幕在线一区| 看国产毛片| 亚洲中字无码AV电影在线观看| 丰满的少妇人妻无码区| 国产菊爆视频在线观看| 亚洲第一成年人网站| 国产精品第5页| 77777亚洲午夜久久多人| 国产精品自在在线午夜| 韩日午夜在线资源一区二区| 亚洲高清无码精品| 欧美日韩中文字幕二区三区| 天天操精品| 精品国产香蕉伊思人在线| 欧美不卡视频在线观看| 国产福利在线观看精品| 国产乱肥老妇精品视频| 国产色婷婷| 九色视频在线免费观看| 欧美有码在线| 亚洲精品无码不卡在线播放| 亚洲午夜综合网| 九九精品在线观看| 精品国产自| a级毛片网| 欧美黄色网站在线看| 国产18在线播放| 久久精品电影| 热九九精品| 日韩精品免费在线视频| 国产丰满大乳无码免费播放| 一本一道波多野结衣一区二区| 久久精品亚洲热综合一区二区| 91精品专区国产盗摄| 久久精品人妻中文视频| 国产在线视频欧美亚综合| 亚洲天堂自拍| av午夜福利一片免费看| 一级毛片免费播放视频| 97精品国产高清久久久久蜜芽| 欧美高清日韩| 亚洲国产成人麻豆精品| 久草网视频在线| 欧美视频在线播放观看免费福利资源| 亚洲一级毛片在线播放| 欧美日韩亚洲国产主播第一区| 欧美成在线视频|