999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類方法的突發公共事件網民情緒分析

2022-10-20 03:41:02王軍呂廣旭盧加奇王小英
現代信息科技 2022年13期
關鍵詞:情緒疫情情感

王軍,呂廣旭,盧加奇,王小英

(1.故宮博物院保衛處,北京 100009;2.防災科技學院,河北 三河 065201)

關鍵字:數據挖掘;機器學習;聚類

0 引 言

微博作為輿情產生和爆發的主要陣地,錯綜復雜的信息真假難以分辨,正不斷影響用戶情緒甚至于國家安全。境外勢力利用疫情熱點事件發動“認知戰”,引導輿論走向、破壞社會穩定。信息化時代,網絡信息內容同質化加劇,虛假信息漫天飛舞、層出不窮,缺乏社會管控和自我約束。

突發事件發生后,媒體和廣大群眾都可在信息平臺第一時間發布和獲取信息,平臺成為熱點事件傳播的重要媒介。熱點事件在短時間收獲巨大流量的同時,伴隨參差不齊的巨大信息流,同樣會傳播情緒,其中不乏負面情緒,持續發酵容易造成社會恐慌和混亂局面。通過大數據分析和可視化展示,挖掘重要信息并分析網民情緒變化情況,為政府機關部門如何引導輿論提供決策支持,對于維護網絡環境安全、加強輿論管理具有重大意義。

1 研究進展

在分析網民情緒的過程中,許多學者對不同時期的流行案例進行了分析和研究。2017年,周莉等人以“巴黎暴恐”事件為例,提出使用情緒評估理論模型對網絡情緒進行量化分析,分析效果重點關注了文化差異表達出的差異。2018年,姜金貴等人對“紅黃藍虐童事件”進行輿情分析,運用Word2vec模型針以基于主題和情緒之間的聯系為主要抓手,對微博情緒走向和輿情演化方向進行分析,更好對微博情緒進行治理。2019年,丁曉蔚等人在輿情分析中加入社會心理學內容,借助大數據利用時間序列更加客觀對熱點事件風險進行評估和監控。2020年,郭爽等人使用SIR 演化博弈模型研究網民情緒和政府工作之間的風險影響關系,極大幫助政府對于網絡輿情的管控。2022年,王月等人以酒店安全事件為角度,利用系統動力學建模方法通過仿真模擬對真實事件下輿情提供指導意見。

在疫情背景下,不僅要共同對抗疫情,還要了解疫情下的民眾情緒變化。因此,更加有必要構建相關的網民情緒分析模型,研究和了解疫情背景下社交平臺網民情緒變化情況,并及時有效動態分析網民情緒意見并有效引導。本文建立疫情下特殊情感詞典,結合TextRank 算法關鍵詞提取算法,用SO-PMI 方法進行多維情感分析,并使用聚類方法對疫情期間相關話題下的評論和信息進行情感分類,生成動態情感變化曲線。

2 數據來源及研究方法

2.1 數據來源

本文數據集包括官方競賽平臺(DataFountain)以及北京市政務數據資源網公開分享數據,數據均為開源數據且進行脫敏處理。對于其中數據進行手動標注約20 萬條,采集對象包括官方媒體、熱門話題等。數據信息包含微博ID、評論時間、微博中文內容、轉發次數、話題內容等信息。

2.2 研究方法

2.2.1 數據預處理

預處理的過程主要是通過使用Python 第三方庫進行數據處理,對收集到的微博有關疫情數據中的冗余數據及錯誤數據等信息進行修復和刪除,其中微博正文有很多特殊字符和絕大多數表情是為文本內容服務的,起到一個加強文本預期的作用,可以將其處理掉,來減少后序任務的復雜性。選取近6 個月的數據,處理相關數據約43 萬條。

首先使用基于PageRank 算法進一步優化的TextRank 算法對目標語句關鍵詞進行提取。其主要方法是將獲得的評論內容進行分詞、去停用詞等預處理步驟拆分成若干詞匯,然后利用共現關系構造詞匯網絡即如果任意兩點在長度為的窗口中同時出現,則認為兩點間存在邊,不斷迭代至收斂,對詞權重排序可獲得關鍵詞順序。

公式(1)中(V)表示詞匯的權重,通過計算每個相鄰詞匯對目標詞匯的影響程度來實現。表示為阻尼系數,本文設置為0.85。

2.2.2 多維情感分析

由于情感的多樣性,需要對與疫情相關的新聞、評論進行多維分析,對熱點事件涉及情感進行詳細闡述。使用SOPMI(情感點互信息)方法對候選詞語情感方向進行甄別,SO-PMI 方法源于PMI 算法,PMI 算法基本思路是計算兩個詞語在文本中同時出現的概率,若概率越大,其相關性越緊密,則關聯程度越高。

對于詞匯,計算其情感:

其中>0,選定詞語積極影響大于消極影響,具有正向情感,判定為積極詞;當=0,將選定詞語認定為中性詞;若<0,則選定詞語積極影響小于消極影響,判定為消極詞,具有一定負面情緒。

情感計算需要結合情感詞表,否定詞和程度詞三方面的內容,本文采用Boson 情感詞典展現情感類型和強度,此外基于SO-PMI 算法,對原有詞典進行補充,將發現新詞按強度值為1 拓展了原有詞典。在程度詞部分:本文根據程度大小將程度副詞分為五個等級,并根據反映程度的大小設置權重,如表1所示。情感值計算需考慮情感詞之外,還需要考慮和否定詞與程度詞的組合情況來計算:

表1 程度詞權重設定

式(4)中:代表最終情感值結果;為是否定詞出現次數;表示為情感詞對應的情感值;是程度副詞程度值。

3 實驗分析

3.1 實驗設計

通過對時間跨度為6 個月的43 萬條數據進行分析,使用聚類方法快速精準判斷疫情事件熱門話題,為疫情防控和輿論引導提供決策方向。由于大量和疫情相關詞匯含有較為特殊的情緒,需要在原有詞匯情緒分類中生成疫情下特殊情緒詞典,結合特殊情緒詞典進行多維情感值計算,使用聚類方法精準判斷和預測疫情事件下熱點內容及情緒情感劃分。若在文本句子中含有疫情下特殊詞典內容,則在計算多維情感值基礎上重構情感之,相應方向情感值增加5%。文本中多次出現詞典內容時,需要進行累加,積極情感為正向,消極情感為負向,公共安全事件下特殊情緒詞典如表2所示。

表2 公共安全事件下特殊情緒詞典

使用Agglomerative 層次聚類、K-means 算 法、DBSCAN 密度聚類等聚類方法對對情緒進行分類,為了對比區分不同聚類數對于上述算法的影響,分別對其計算了輪廓系數(Silhouette Coefficient),CH 分數(Calinski Harabasz Score)和戴維森堡丁指數(DBI,davies_bouldin_score)。

3.2 實驗結果分析

通過對Agglomerative 層次聚類、K-means 算法、DBSCAN 密度聚類三種方法進行分析,實驗結果如圖1所示。

圖1 不同聚類方法評價指數變化圖

可以從上圖看出,在層次聚類中:DBI 指數在聚類數設置為3或6時較低,CH值在2或3時較高,輪廓系數較為明顯,呈現先增加后減少的趨勢,總之聚類數選3比較適宜。K-means聚類算法容易陷入局部最優陷阱,有關疫情情感數據分布不均衡,對值選取影響較大。圖中分別取2,3,5 時的聚類效果中,可以看出取2 時分類效果較好。DBSCAN 算法是一種基于密度的聚類算法,它在聚類前不需要預先指定簇的個數,所以最終簇的個數也不確定,它認為樣本數據點的周圍的數據點同屬一類,即將緊密相連的樣本劃分為一類,就得到了一個簇。此類算法需要不斷的調整參數eps 以求得最好的效果,發現DBI 值呈明顯上升趨勢,而CH 值和輪廓系數效果不明顯,所以DBSCAN 聚類算法參數eps 暫取0.01。

將上文中分析好的情感分析數據進行匯總,統計了話題下的情感變化,制作情感變化曲線和匯總餅圖,如圖2所示,可以看到在本次疫情事件中網民情緒中“悲傷”和“恐懼”占絕大部分。

圖2 情感變化曲線展示

4 結 論

本文通過對微博等社交平臺數據進行挖掘,對于微博環境下疫情事件對網民情緒的影響及熱點話題影響力進行了分析。首先進行微博平臺的數據挖掘,利用TextRank 算法進行關鍵詞的提取,并使用SO-PMI 方法對候選詞語極性進行判斷,建立微博疫情語境下特殊情緒詞典,進行多維情感分析,最后使用多種聚類方法對情感及熱門話題進行分類,并對疫情期間情感變化進行分析。針對分析內容可幫助相關部門利用社交平臺數據精準判斷熱門話題,更好了解熱點事件下民眾情緒變化,做好輿情管理。除此之外,通過設定閾值提高發現虛假、暴力、誘導等內容信息在民眾間的傳播程度能力,及時進行疏導和管控。

猜你喜歡
情緒疫情情感
戰疫情
如何在情感中自我成長,保持獨立
抗疫情 顯擔當
人大建設(2020年5期)2020-09-25 08:56:22
疫情中的我
37°女人(2020年5期)2020-05-11 05:58:52
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
如何在情感中自我成長,保持獨立
小情緒
小情緒
主站蜘蛛池模板: 免费全部高H视频无码无遮掩| 成年看免费观看视频拍拍| 中文毛片无遮挡播放免费| 波多野吉衣一区二区三区av| 国产一区二区三区在线观看免费| 欧美日本二区| 久久亚洲美女精品国产精品| 日韩二区三区| 免费毛片视频| 91美女在线| 美女国内精品自产拍在线播放| 全免费a级毛片免费看不卡| 亚洲最猛黑人xxxx黑人猛交| 亚洲中文字幕无码爆乳| 丰满人妻久久中文字幕| 9久久伊人精品综合| 国产精品自在自线免费观看| 欧美日韩一区二区在线播放| 国产a v无码专区亚洲av| 亚洲高清中文字幕在线看不卡| 麻豆精品在线| 亚洲精品爱草草视频在线| 国产中文一区a级毛片视频| 午夜成人在线视频| 午夜精品福利影院| 亚洲人在线| 日韩色图区| 久综合日韩| 玖玖精品视频在线观看| 日本福利视频网站| 欧亚日韩Av| 亚洲一区黄色| 欧美日韩亚洲国产主播第一区| 国产在线观看一区二区三区| P尤物久久99国产综合精品| 91久久国产成人免费观看| 亚洲第一网站男人都懂| 国模私拍一区二区| 色欲色欲久久综合网| yy6080理论大片一级久久| 日本在线视频免费| av一区二区三区高清久久| 五月天综合婷婷| 久久国产毛片| 91精品国产自产91精品资源| 在线中文字幕网| 国产精品网拍在线| AV无码国产在线看岛国岛| 青青草一区| 精品综合久久久久久97超人| 欧美性爱精品一区二区三区 | 欧美日韩专区| 国产亚洲现在一区二区中文| 极品av一区二区| 亚洲欧美精品一中文字幕| 91麻豆国产视频| 亚洲成年网站在线观看| 97国产精品视频人人做人人爱| 成人在线天堂| 免费视频在线2021入口| 亚洲午夜国产片在线观看| 国产日韩精品欧美一区喷| 国产欧美日韩另类精彩视频| 国产亚洲视频中文字幕视频| 久久精品中文字幕免费| 国产精品第页| 成人中文在线| 久久午夜影院| 国产屁屁影院| 欧美日韩精品在线播放| 高潮毛片免费观看| 国产高清在线观看| 亚洲精品另类| 一本综合久久| 国产高清精品在线91| 国产精品福利在线观看无码卡| 青青青国产视频手机| 国产无遮挡猛进猛出免费软件| 91亚洲视频下载| 欧美狠狠干| 亚洲日韩精品伊甸| 国产喷水视频|