999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的微博輿情監(jiān)測模型研究與實現(xiàn)

2023-12-18 18:13:49成哲丞
計算機時代 2023年11期
關鍵詞:情感模型

成哲丞

關鍵詞:Java 分布式爬蟲;Elasticsearch;注意力機制;Bi-LSTM;輿情預警

中圖分類號:TP391.1 文獻標識碼:A 文章編號:1006-8228(2023)11-124-03

0 引言

網(wǎng)絡空間不是法外之地,網(wǎng)絡輿情監(jiān)管和應對是一個非常棘手的問題。目前針對網(wǎng)絡輿情監(jiān)測的研究主要存在以下問題。

⑴ 針對單一事件:當前對網(wǎng)絡輿情的監(jiān)測往往都是針對已發(fā)生的且有著負面影響的事件,通常研究的輿情事件比較單一[1]。

⑵ 實時性差:由于網(wǎng)絡事件所帶來的海量數(shù)據(jù),當前對事件進行輿情監(jiān)測時不能夠很及時,且往往沒有考慮當數(shù)據(jù)量大時,系統(tǒng)的運行效率問題[2]。

⑶ 準確率低:當前對網(wǎng)絡輿情事件的預警研究較少,且由于評論數(shù)據(jù)的多樣性、復雜性,導致輿情預警的準確率不夠高。

針對上訴問題,且為了提升輿情監(jiān)測系統(tǒng)的性能和準確率,以新浪微博作為數(shù)據(jù)源,本文在傳統(tǒng)輿情監(jiān)測系統(tǒng)架構和情感分析方法的基礎上提出了一種基于深度學習的微博輿情監(jiān)測模型。本模型旨在監(jiān)測和分析微博熱搜的輿情信息,了解公眾對某個話題或事件的態(tài)度和反應,及時對發(fā)生負面輿情的事件進行監(jiān)測。

1 熱搜數(shù)據(jù)采集與處理

1.1 基于Java 的分布式數(shù)據(jù)爬取框架

本節(jié)針對性地設計實現(xiàn)了一個基于Java 的分布式數(shù)據(jù)爬取框架,該框架可快速爬取新浪微博熱搜榜的全部評論數(shù)據(jù)。該框架的結(jié)構如圖1 所示。

該框架重要組成部件的相關功能作用如下:

⑴ 爬蟲定時器(SpiderTimer):爬蟲定時器負責定時地調(diào)用爬蟲啟動器;

⑵ 爬蟲任務池(SpiderTask Pool):爬蟲任務池負責管理子爬蟲任務的權值,權值越大的子爬蟲任務會被優(yōu)先相應;

⑶ 爬蟲管理器(SpiderManager):爬蟲管理器會將子爬蟲任務分配給爬蟲線程池。同時爬蟲管理器還會將爬蟲返回的結(jié)果交給結(jié)果處理器;

⑷ 爬蟲線程池(SpiderThread Pool):爬蟲線程池負責將得到的子爬蟲任務分配給池內(nèi)空閑的線程,一條線程對應一個爬蟲。

1.2 數(shù)據(jù)預處理

爬取到的原始評論數(shù)據(jù)可能存在著沒有結(jié)構化,格式不規(guī)范等問題。為了之后更好地進行情感分析,提高情感分析模型的準確性,“純凈”的數(shù)據(jù)集是十分必要的,因此需要對爬取到的原始評論數(shù)據(jù)進行規(guī)范化處理。規(guī)范化處理主要包括三個部分:數(shù)據(jù)清洗、文本分詞和去除停用詞。經(jīng)過上述規(guī)范化處理之后,將會得到“純凈”的標準化數(shù)據(jù)。

1.3 基于Elasticsearch 的分布式搜索存儲方法

考慮到輿情監(jiān)測模型的實際需求,基于Elasticsearch[3]的分布式搜索存儲方法會維護一個熱搜哈希表。熱搜哈希表中存儲的是登上過新浪微博熱搜榜的熱搜信息。哈希表的Key 值為熱搜名,Value 值為熱搜的相關信息。熱搜的相關信息包括熱搜名、導語、話題閱讀次數(shù)、話題討論次數(shù)、媒體報道次數(shù)、通用唯一標識符、年齡和情感狀況。

哈希表中的一條數(shù)據(jù)對應一條熱搜,也對應著Elasticsearch 中的一個索引庫。該方法的存儲邏輯如圖2 所示。

考慮到實際環(huán)境下評論總數(shù)每天可達數(shù)十萬,甚至上百萬條。及時地刪除過時話題的數(shù)據(jù),釋放服務器資源是十分必要的。方法的刪除邏輯如圖3 所示。

2 融合改進注意力機制的Bi-LSTM 情感分析方法

2.1 方法原理

為了對用戶評論進行情感分類,本章提出了一種融合改進注意力機制的Bi-LSTM 情感分析方法。該方法會降低熱搜話題自身所帶情感度的影響,更關注用戶自身評論,更精確地分析用戶評論的情感傾向。該方法所用模型的結(jié)構圖如圖4 所示。

由圖4 可知,各層的工作內(nèi)容為詞嵌入層:通過Word2vec 中的Skip-Gram 模型[4]對熱搜話題和評論進行向量化處理;語義特征提取層:通過引入雙向長短期記憶神經(jīng)網(wǎng)絡(Bi-LSTM)來獲取評論中上下文之間的信息;改進注意力層:通過引入改進注意力機制[5]來降低話題自身所帶情感度的影響。輸出分類層:將上一層的輸出結(jié)果進行全連接,再通過Softmax 函數(shù)進行情感分類。其中改進注意力機制的工作流程如圖5 所示。

由圖5 可知,先計算計算話題詞(query)與用戶評論詞(key)的相似度。再選擇某種方式將相似度轉(zhuǎn)換成最終的注意力得分(目的降低話題詞的權重),這里可以選擇將相似度取反的方式。接著通過softmax 函數(shù)對注意力分數(shù)做一個歸一化,得到每個key-value 的注意力權重,將注意力權重與每個key 對應的value相乘,再求和,就可以得到最后的輸出結(jié)果。

2.2 對比實驗結(jié)果

本實驗選用了CNN 和Bi-LSTM 兩種當下最為常用的深度學習模型來做對比實驗。實驗數(shù)據(jù)集選用了CCIR 2020“疫情期間網(wǎng)民情緒識別”評測活動數(shù)據(jù)集和微博情感分析數(shù)據(jù)集,并把上述兩個數(shù)據(jù)集都進行了8:1:1 的劃分。實驗指標選用了準確率(Accuracy)、查準率(Precision)和F1 值(F1-Score)三種。實驗結(jié)果對比情況如圖6 所示。

從圖6 實驗結(jié)果可以看出,融合改進注意力機制的Bi-LSTM 情感分析方法在公開數(shù)據(jù)集一和二上的效果都明顯優(yōu)于CNN 和Bi-LSTM 兩個模型。

3 基于情感分析的輿情預警等級計算方法

基于情感分析的輿情預警等級計算方法[6]先利用用戶評論的情感極性、點贊數(shù)和轉(zhuǎn)發(fā)數(shù)計算出熱搜話題的情感度。再根據(jù)熱搜話題的閱讀量、評論數(shù)、熱搜話題情感度和熱搜話題類型來計算話題的輿情預警等級。輿情預警等級計算方法的原理如圖7 所示。

3.1 熱搜話題情感度計算

先計算熱搜話題下所有評論的情感傾向得分之和,其中正向情感得分為1,中性情感得分為0,負向情感得分為-1。再根據(jù)得分之和和評論數(shù)量計算熱搜話題的平均情感傾向得分Score。為了減小不同話題之間平均情感傾向得分的差異,便于更加直觀的得出熱搜話題的情感度,最后利用Sigmoid 函數(shù)將平均情感傾向得分映射到(0,100)區(qū)間中,得到熱搜話題的情感度E。熱搜話題情感度的計算公式如下:

3.2 熱搜話題輿情預警等級計算

參考網(wǎng)絡輿情預警等級的劃分,本方法將新浪微博熱搜話題輿情預警等級分為了無風險、低風險、中風險、高風險和緊急預警這五種等級。熱搜話題的情感度是定性的,決定了熱搜話題的情感度好壞情況。熱搜話題情感度[0,50)被認為是負面話題,[ 50,100]被認為是正面話題。而話題閱讀量、話題評論量、媒體報道數(shù)、話題類型等數(shù)據(jù)是定量的,會影響熱搜話題的輿情狀況,但不會改變熱搜話題的情感極性。熱搜話題輿情預警等級計算公式如下:

其中,β1、β2、β3分別是話題閱讀量、話題評論量、媒體報道數(shù)各自相較于其他熱搜平均水平的百分比,同時還需對這些百分比設定一個最高值限制。β4表示話題類型的權重值,不同的話題類型設有不同的權值。計算完輿情預警等級分數(shù),就可以將輿情預警等級分數(shù)映射到不同的輿情預警等級標簽上。

4 總結(jié)

隨著互聯(lián)網(wǎng)的普及和社交媒體的興起,網(wǎng)絡輿情監(jiān)測和管理變得越來越重要。本文提出的基于深度學習的微博輿情監(jiān)測模型可以實時監(jiān)測微博上的輿情狀況,了解公眾對某個事件或話題的態(tài)度和看法,從而幫助企業(yè)、政府等各方面做出更加準確的決策,預防發(fā)生輿情危機。

猜你喜歡
情感模型
一半模型
如何在情感中自我成長,保持獨立
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
被情感操縱的人有多可悲
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
如何在情感中自我成長,保持獨立
3D打印中的模型分割與打包
情感移植
主站蜘蛛池模板: 欧美日韩精品综合在线一区| 91精品国产一区自在线拍| 亚洲一欧洲中文字幕在线| 美女免费黄网站| 九色综合伊人久久富二代| 2018日日摸夜夜添狠狠躁| 91久久国产热精品免费| 日韩欧美中文字幕一本| igao国产精品| 国产美女精品在线| 一本大道视频精品人妻 | 久久综合伊人77777| 亚洲性日韩精品一区二区| 亚洲中文字幕23页在线| 午夜综合网| 亚洲天堂.com| 亚洲AV无码乱码在线观看裸奔| 人人爱天天做夜夜爽| 国产精品区视频中文字幕| 多人乱p欧美在线观看| 久久久久国产一区二区| 久久精品中文无码资源站| 免费国产一级 片内射老| 伊人五月丁香综合AⅤ| 国产日本一区二区三区| 人妻熟妇日韩AV在线播放| 国产精品久久国产精麻豆99网站| 久久福利片| 亚洲第一成人在线| 国产精品99久久久久久董美香| 无套av在线| 久草性视频| 熟妇丰满人妻av无码区| P尤物久久99国产综合精品| 国产高颜值露脸在线观看| 久久性视频| 亚洲欧美日本国产综合在线| 久久黄色毛片| 中文字幕无码av专区久久| 日韩高清在线观看不卡一区二区| 福利在线不卡| 国产91精品调教在线播放| 91在线视频福利| 婷婷午夜天| 日韩欧美高清视频| 噜噜噜久久| 国语少妇高潮| 亚洲欧美日韩久久精品| 一级片一区| 永久免费av网站可以直接看的| 国产精品永久免费嫩草研究院| 69综合网| 亚洲成aⅴ人在线观看| 国产在线自揄拍揄视频网站| 午夜国产大片免费观看| 区国产精品搜索视频| 日韩精品免费一线在线观看| 国产chinese男男gay视频网| 久久视精品| 亚洲天堂自拍| 国产成人一区在线播放| 国产极品美女在线播放| 免费看一级毛片波多结衣| 久久国产拍爱| 蜜臀av性久久久久蜜臀aⅴ麻豆| 老司机午夜精品网站在线观看| 无码又爽又刺激的高潮视频| 亚洲香蕉在线| 91九色最新地址| 免费人成视频在线观看网站| 女人18毛片一级毛片在线 | 国产极品美女在线| 四虎在线观看视频高清无码| 99热这里只有精品在线播放| 激情乱人伦| 无码久看视频| 一级毛片基地| 在线精品视频成人网| 国产无遮挡裸体免费视频| 91视频日本| 波多野结衣二区| 免费女人18毛片a级毛片视频|