999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于公眾情緒上下文的LSTM情感分析研究

2020-06-01 08:15:36陳凌宋衍欣
現代情報 2020年6期

陳凌 宋衍欣

摘 要:[目的/意義]近年來,由于微博等社交媒體的活躍,其在事件時空建模的潛在用途受到了廣泛關注。在新媒體環境下研究用戶情感可以分析用戶情感的演變,將會幫助有關部門采取針對性的措施控制輿情。[方法/過程]本文構建了一種用于分析用戶情緒上下文的長短期記憶模型(LSTM),對網絡輿情用戶情感傾向性和公眾情感趨勢進行分析與預測。[結果/結論]以新浪微博中,臺風“利奇馬”事件的相關推文為研究對象,通過多層次時間序列分析,驗證社交媒體在自然災害之前、期間和之后所扮演的角色;繼而通過剖析用戶情感演化規律,力圖為合理控制輿情信息傳播提出相應建議。

關鍵詞:LSTM模型;情感分析;臺風“利奇馬”;新浪微博

Abstract:[Purpose/Significance]In recent years,due to the activeness of social media such as Weibo,its potential use in event space-time modeling has received widespread attention.Studying user sentiment in the new media environment can analyze the evolution of user sentiment and will help relevant departments take targeted measures to control public opinion.[Method/Process]This paper built a long-short-term memory model(LSTM)for analyzing the users emotional context,and analyzed and predicts the online public opinion users emotional tendency and public emotional trend.[Results/Conclusion]Taking the relevant tweets of the Typhoon“Lichma”incident on Sina Weibo as the research object,through multi-level time series analysis,verified the role of social media before,during and after natural disasters;By analysing the evolution of users emotions,they tried to put forward corresponding suggestions for the reasonable control of the spread of public opinion information.

Key words:LSTM model;sentiment analysis;super typhoon“Lekima”;Sina Weibo

隨著互聯網的發展,越來越多的用戶喜歡在社交媒體上發表自己的觀點,分享生活中的小事,以及諸如人物、事件、產品等有價值的評論信息。這些評論信息表達了人們的各種情感色彩和情感傾向性,如喜、怒、哀、樂、批評以及贊揚等,因此網絡產生了大量的由用戶發布的主觀性文本。由于主觀性文本應用價值的廣泛性,情感分析近年來引起了很多研究人員的興趣。

文本情感分析(Sentiment Analysis)又稱意見挖掘,是指利用自然語言處理和文本挖掘技術,對帶有情感色彩的主觀性文本進行分析、處理和抽取的過程[1]。簡而言之,是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程,情感分析主要可以分為基于詞典的分類方法和基于機器學習的方法。最早從事情感分析研究的Pang等將文本的N元語法(N-Gram)和詞性(POS)等作為情感特征,使用有監督的機器學習的方法將電影評論分為正向和負向兩類。結果顯示支持向量機在幾種分類方法中效果最好,分類準確率達到80%[2]。長短期記憶網絡LSTM(Long Short-Term Memory)是一種時間遞歸神經網絡,適合于處理和預測時間序列中間隔和延遲相對較長的重要事件,它成功地克服了原遞歸神經網絡的缺陷,成為目前最流行的遞歸神經網絡[3],在語音識別、NLP等領域取得了良好的效果。

本文將采用長短期記憶神經網絡(LSTM)作為情感分析模型,對近期發生的重大突發事件進行網絡輿情用戶情感分析,并構建了一種用于分析用戶情緒上下文的LSTM模型,對模型的有效性進行了一系列的評價,發現LSTM在句子表示方面表現較好,并將情感方面和極性的推理過程進行建模,關注目標表達中情感突出的部分,并生成對文本情感更準確的表示。從龐大嘈雜的微博流中識別出與災害相關的微博信息,對所有與災害相關的微博情緒進行分類識別。將長短期記憶神經網絡模型引入微博情感分析階段,探索與災害相關的情緒有關的信息,并關注輿情生態系統下的用戶負面情緒,以期為輿情生態系統的治理提供及時有效的幫助,加強輿情災害管理能力。

1 分析用戶情緒上下文的LSTM模型構建與實現

1.1 數據準備

本文中選取臺風“利奇馬”事件為例。2019年8月4日,第九號臺風“利奇馬”誕生于西北太平洋洋面上,經過3天的海上“流浪”,成長為超強臺風并加速了靠近我國的步伐。10日凌晨,“利奇馬”以超強臺風姿態登陸浙江,中心附近最大風力16級(52米/秒),在浙江停滯20小時后,穿過江蘇移入黃海,成為滯留浙江時間最長的超強臺風。11日夜間,再次登陸山東,中心附近最大風力9級(23米/秒,熱帶風暴級),迅速穿過山東半島后進入渤海,繼續它的海上流浪。自登陸以來,它共在陸地停留44個小時,是個相當長壽的臺風。超強臺風“利奇馬”兩次登陸我國,兩次入海,最終在渤海緩緩結束一生。它登陸強度強、陸地滯留時間長、降雨強度大且極端性顯著、大風影響范圍廣且持續時間長,使華東及環渤海等地遭受嚴重風雨影響,浙江、安徽、江蘇、山東等地均出現不同程度的城鄉積澇、中小河流洪水、山洪和滑坡等災害。

因其造成的影響巨大,因此我們選取了事件發生前后2019年8月4日至8月18日之間微博用戶發表的數據信息,此時間段在政府微博和微博大V的轉發評論等多方面因素的影響下,網民討論和轉發活躍度極高,部分讀取數據如表1所示。為了提取這些信息,本文基于keras框架開發了Python腳本,爬取到20 258條數據,包括發表用戶、時間、轉發量以及評論數等數據信息。

1.2 數據預處理

數據爬取完畢后,共得到20 258條相關評論信息。對這些信息進行繁體字簡化、刪除垃圾廣告、無效評論等數據清洗工作,最后得到20 038條有效數據,使用結巴分詞,去除停用詞等。預處理包括以下內容:1)所有HTML標簽,使用“Beautiful Soup”Python庫刪除標點符號。2)此外,數字和鏈接分別由標簽NUM和LINK代替。3)使用結巴分詞刪除停用詞。4)每個單詞的詞形還原。

單詞嵌入的起源可以追溯到1986年,稱為Hinton提出的分布式表示。通過詞嵌入模型以無監督學習方式得到作為文本特征的詞向量,可避免人工設計特征的缺點[4]。單詞嵌入能夠將單詞更改為低維實數向量,并允許我們基于余弦方法發現單詞的相似性。Mikolov T等[5]在他的研究中提出了CBOW和Skip-gram。它不僅可以簡化復雜性并縮短計算時間,還可以將數萬億個單詞轉換為單詞嵌入。詞袋模型(Bag-of-words)模型是信息檢索領域常用的文檔表示方法。單詞嵌入技術是目前將文本表示為數字向量的最佳技術之一。它是一種習得的表示法,在這種表示法中,具有相似含義的單詞被賦予相似的表示法。因此,本文使用BOW將文本向量化,之后基于Onehot提取文本特征。最后,將每個單詞映射到向量,對于一個文檔,我們得到一個N維向量序列,作為LSTM遞歸神經網絡的輸入。

1.3 模型構建

眾公民作為社會的傳感器,是分析災害管理情緒的重要因素。社交媒體信息的傳播總是比官方新聞報道更深入、更快。但是,社交媒體信息更難處理,社交媒體是一種獨特的災害事件信息。可見,情緒分析為傳統的調查方法解釋公眾對自然災害的意見提供了一種實用的方法。

因此本文將數據集包括兩個類別:

積極的

消極的

我們使用人工標注驗證集數據作為本文數據集的預培訓。具體來說就是我們將模型中第一次驗證的數據擬合到第二個驗證數據的預培訓中,然后將第二個驗證數據擬合到同一個模型中。這種預培訓是為了檢驗,在獨立情緒分析數據上進行預培訓是否有用,即使標簽不匹配。

本文使用人工標注的微博語料數據集,其中正向和負向評論各20 000條,我們將其分成訓練集和驗證集。之后將預先訓練好的字向量輸入到長短期記憶神經網絡中,得到的準確率為95%。LSTM是一種時間遞歸神經網絡,是RNN用于解決消失梯度問題的方法。RNN的基本結構如圖1所示,其中(a)是簡單的RNN,(b)是LSTM網絡。LSTM僅使用一個LSTM網絡以形成單詞的上下文表示。最后一個隱藏的向量用作句子表示,并輸入Softmax函數來估計每個情感標簽的概率。

在實驗中,我們在遞歸神經網絡(RNN)中使用LSTM模型來模擬微博評論的觀點趨勢。首先,我們需要通過詞袋模型將語料庫更改為嵌入詞。之后,我們根據正面和負面訓練建立預測模型。表2顯示了語料庫的分布情況。可以看出,使用各20 000條正向和負向訓練分類器,使用20 000條正向和負向測試建立的模型。深度學習情感分析的實驗結果達到了85%的準確率。

我們在基于LSTM神經網絡模型上進行了一系列實驗。我們使用相同的訓練數據集(見表2)共有9 640條評論。分類是使用另一個包含2 785條評論的數據集獨立進行的,這些評論在培訓期間沒有使用。因此,為了不使用基于模型的不同數量的訓練周期,我們決定使用一個固定的數字—10,隨著訓練時間的延長,損失值并沒有顯著提高。

1.4 模型實現

情緒分析的主要目的是通過確定主觀性、極性(正負)和極性的程度,然后對主題進行分類,從而量化文本中潛在情緒的強度。情感分析依賴于語言資源的使用,為每個詞賦值。然后,機器學習技術通過允許計算機根據可用數據對行為建模來確定文本主體的情感[6]。下面的數字直觀地反映了在正面和負面評論中出現頻率最高的詞語,通過分析圖2和圖3,我們可以看到,有些詞可以清楚地識別出兩極分化的情緒。然而,這并不適用于許多其他單詞,這些單詞有時甚至包含在具有完全相反含義的評論中。因此,僅僅根據某些詞語的出現與否對評論進行簡單的分類是不夠的,這時需要機器學習技術(如本文使用的技術)來分析詞語之間的關系。

基于詞云,生成情緒文本可視化,如圖4、圖5所示。從圖4中我們可以看出,救災、山東、浙江、救援、安全等詞被用來表示用戶非常關注臺風的進程。一線、志愿者、香港等詞則表達了對臺風

受災地區和鄰近地區的關注和關心。圖5顯示的是臺風“利奇馬”事件中的負面情緒詞語,像出現頻次較高的像損失、受災、暴雨、死亡等詞大多數用來表述臺風來臨時的恐懼和對生活環境的擔心。除了對臺風的關注和對生活環境的擔心外,我們還發現了一些有趣的模式,例如,所挖掘的句子結構包括“正在…”、“希望…”和“祝福…”等通常用于表達期望和愿望,例如“危險”這樣的附加問句是對這一事件的強烈不滿。這些研究發現,情感分析為用戶更好地理解公眾意見的語義提供了一種有效的方法。

根據實驗結果得到的情感狀態分布如圖6所示,可以看出,臺風來臨前后公眾對臺風的情緒,大多是負面情緒,表示對受災地區和人民的擔心;當地居民對出行、生活環境的擔憂;以及對地標性建筑毀壞的唏噓。關注公眾的負面情緒有助于及時有效地引導輿情朝良好的方向發展。

臺風來臨前后,公眾對臺風的關注程度也是不同的。從發帖量(見圖7)可以看出,8月4日,第9號臺風“利奇馬”在菲律賓以東洋面生成,于6日加強為強熱帶風暴級,各類媒體開始報道“臺風即將來臨”,并請“各單位做好防范準備”,公眾這時對臺風事件關注度較低;8月10日凌晨,臺風登陸浙江中北部,受此影響,8月11日,“利奇馬”攜帶大量水汽北上,山東和江蘇將成為大暴雨的核心區域,多處鐵路出現列車停運狀況,公眾關注度開始上升,并達到第一個小高峰;8月12日到14日,北方的一股冷空氣正好和臺風“利奇馬”迎頭相撞,環渤海區域的京津冀和遼東半島,山東半島暴雨如注。8月13日,中央氣象臺發布消息稱,“利奇馬”減弱為熱帶低壓,并于當日14時停止編號。8月14日,公眾的發文量達到最高點,超出之前的發文量10倍之多,根據8月14日的情緒強度,多數微博用戶表達了負面情緒。這是因為用戶可能會在臺風過后在微博上討論與災難有關的其他問題,例如新聞機構和普通用戶在微博上討論了臺風對當地居民的不利影響。隨著時間的推移,人們表達了復雜的情緒(包括積極的和消極的);一些人在微博上談論臺風的后果,而另一些人則對當地政府和志愿者的活動表示總體滿意,他們能夠為當地人民籌集資金,為他們提供食物和水等等。8月15日后發帖量逐步減少,說明公眾情緒得到平復,各方單位應對有效,到8月18日,公眾關注度又達到了一個高點,這時的公眾大多關注在臺風引起的各種生活上的不便,感慨生活,希望災后生活便利。從情感分析結果來看,從災害發生到結束期間,公眾的負面情緒不斷擴散,而且占超過一半的比重,因此我們應重點關注災害期間公眾的負面情緒。

2 結果與建議

社會化媒體用戶在進行評論時的情緒狀態往往受突發公共事件驅動,許多研究發現在不同突發事件中民眾表達的情緒具有差異,開始重點分析事件特性與情緒類型之間的關聯[7]。在研究中發現在可預見性和可控性都比較強的危機情境下,社交媒體用戶主要表達憤怒情緒;在可預見但不可控的危機情境下主要表達悲傷情緒;在不可預見且不可控的情境中恐懼情緒占據主導,在可預見性低但可控性強的危機情境下主要體現焦慮情緒。

網民負面情感在網絡輿情事件發展過程中有著至關重要的影響[8],若不加以調節,任其發展,不僅可能引發新的輿情事件,甚至激起現實社會更極端的群體行為[9],如埃及、摩洛哥、烏克蘭等國家的顏色革命。突發事件發生后,很多人會不明真相,因而個人輿論觀點嚴重受到網絡中其他人的感情色彩的影響而表現一定的傾向性[10],因此平復民眾負面情緒是應急管理的重要工作,對民眾負面情緒實時監控預警是防止衍生群體事件發生的關鍵[11]。從上文的分析結果中,我們可以看出,在災害發生前后,公眾的負面情緒占絕大部分,而且對社會安全,生活環境與周圍人的生命健康尤其擔憂。圖8顯示了負面情緒博文的分布情況,可以看出對周邊生活環境和周圍人的擔憂占絕大部分,其次是對于災后救援工作的關注,同時也有很多人因為災害的來臨,對政府公信力和社會業界的救援工作產生了質疑,這些負面情緒如果不能得到很好的控制,很可能會影響政府災害救助工作和經濟社會的穩定。

通過新浪微博搜索API進行收集,并對災后公眾行為和響應數據進行匯總分析。我們對臺風“利奇馬”期間微博上的用戶發帖進行了情感分析,并將這些情緒可視化。我們展示了用戶的情緒是如何變化的,災害發生時公眾的情感發生了怎樣的變化,以及負面情緒波動。對來用戶推文進行識別,并對最常出現的詞匯進行排名。結果表明,這些數據揭示了在危機事件期間用戶組的興趣、需求和關注的重要信息。從微博發布內容數量的時間變化可以看出,隨著時間的推移,公眾的注意力發生了轉移,有助于理解危機期間的公眾行為和反應。最后,在整個觀察期間進行情感分析。

隨著信息普及、環境意識和媒介素養的強化,公民既是日趨理性的環境保護者又是意見和情緒的表達者。情感分析的一個重要結果是由于災難性事件,人們更容易表達消極的態度,這時候需要引導公眾以更積極的情緒看待對地方政府的作為和志愿服務活動。負面情緒的大肆傳播不利于政府形象的建立,政府應該從以下幾個方面努力:堅持公信力,即公共機構應該時刻尊重公眾的知情權和表達權,公正公開地傳播真實有效的信息,獲得公眾的信任和信心;更加理性對待環境群體性事件中的網絡輿情,不應將網民情緒表達進行過度解讀;充分尊重公民參與公共事務的權利。

既然網絡輿情信息的不可控性的確對于社會信息發展形勢具有一定的負面干預作用。那么政府機關便應該盡量在網絡輿情形成前,對網絡中的不良信息加以控制和抵制[12]。在群體性事件爆發時,政府、相關機構和企業要因地制宜地進行危機傳播管理,認真聽取公眾建議,積極落實措施和政策,保持信息渠道暢通,提供信息咨詢服務和政策支持;強化新媒體在輿論引導中的作用。運用新媒體對熱點事件及時公布,強化公正公開透明的信息管理,引導合法有效的輿情抗爭。

3 總 結

網絡輿情生態是一個復雜多變的社會生態系統,系統內輿情主體因素、輿情客體因素及輿情環境因素相互影響、相互作用、相互制約,發生著多維度、多層次、立體化的互動。健康的輿情生態系統應該是特定網絡輿情各構成要素間、網絡輿情間、網絡輿情與外部環境間相互關聯制約而達到的一種具有相對平衡的結構狀態的復雜系統[13]。社交媒體作為輿情生態系統中的重要組成要素,通過對其合理監督和控制能夠有效提高輿情生態系統平衡指數。

基于輿情生態系統,利用情緒分析來發現大型非結構化數據集的極性已成為自然語言處理研究領域的熱點,我們發現社交媒體是圍繞災難事件的豐富數據來源。越來越多的人在災難發生之前、期間和之后使用社交媒體來描述他們的經歷、表達他們的需求,并與其他受影響的人交流。這種在線討論模式是一個豐富的信息寶庫,如果及時有效地采取相應措施,可能有效地控制輿情的散播并對災害應對起到積極作用。由于社交媒體的性質,信息貢獻者不再是旁觀者。識別用戶的情緒變化,有助于了解災難期間大型社交媒體信息傳播的情感類別,并能更好地為應急管理人員以最快的方式接觸最廣泛的受眾提供最佳決策。

筆者將在后續的研究中收集更多來自其他類型的具有更大影響的災難(如颶風、海嘯)的數據,并測試頻繁使用的詞匯、發布內容的時間變化和用戶情緒。這一新的方向將有助于更好地了解危機情況下的公眾情緒,并幫助應急管理人員采取必要的措施控制災害輿情。另外集成更復雜的模型或設計新的模型來改進情緒分類以及細粒度的情緒檢測將是非常有必要的,并且可以關注地理地圖情緒分析如何在災難中發揮不同作用的,了解情緒波動如何影響在災難事件期間社交媒體上的信息,并以此傳遞對緊急響應人員和地面人員有用的信息。

參考文獻

[1]Deng S,Sinha A P,Zhao H.Adapting Sentiment Lexicons to Domain-specific Social Media Texts[J].Decision Support Systems,2017,94:65-76.

[2]Davidov D,Tsur O,Rappoport A.Enhanced Sentiment Learning Using Twitter Hashtags and Smileys;Proceedings of the Proceedings of the 23rd International Conference on Computational Linguistics:Posters,F,2010[C]//Association for Computational Linguistics.

[3]Hochreiter S,Schmidhuber J.Long Short-term Memory[J].Neural Computation,1997,9(8):1735-80.

[4]Collobert R,Weston J,Bottou L,et al.Natural Language Processing(Almost)from Scratch[J].Journal of Machine Learning Research,2011,12(8):2493-537.

[5]Mikolov T,Chen K,Corrado G,et al.Efficient Estimation of Word Representations in Vector Space[J].arXiv Preprint arXiv:13013781,2013.

[6]Hijazi M H A,Libin L,Alfred R,et al.Bias Aware Lexicon-based Sentiment Analysis of Malay Dialect on Social Media Data:A Study on the Sabah Language;Proceedings of the 2016 2nd International Conference on Science in Information Technology(ICSITech),F,2016[C]//IEEE.

[7]唐雪梅,朱利麗.社會化媒體情緒化信息傳播研究的理論述評[J].現代情報,2019,39(3):115-121.

[8]Choi Y,Lin Y-H.Consumer Responses to Mattel Product Recalls Posted on Online Bulletin Boards:Exploring Two Types of Emotion[J].Journal of Public Relations Research,2009,21(2):198-207.

[9]李勇,蔡夢思,鄒凱,等.社交網絡用戶線上線下情感傳播差異及影響因素分析——以“成都女司機被打”事件為例[J].情報雜志,2016,35(6):80-5.

[10]王雪猛,王玉平.基于情感傾向分析的突發事件網絡輿情預警研究[J].西南科技大學學報:哲學社會科學版,2016,33(1):63-6.

[11]劉志明,劉魯.面向突發事件的民眾負面情緒生命周期模型[J].管理工程學報,2013,(1):15-21.

[12]段亞楠.群體性突發事件的網絡輿情問題及政府治理策略[J].湖北函授大學學報,2018,31(18):114-5.

[13]李昊青,蘭月新,張鵬,等.網絡輿情生態系統的失衡與優化策略研究[J].現代情報,2017,37(4):20-6.

(責任編輯:郭沫含)

主站蜘蛛池模板: 国内精品久久久久久久久久影视| 制服丝袜一区| 超碰免费91| 国产成人精品一区二区免费看京| 欧美一级在线看| 99人妻碰碰碰久久久久禁片| 欧美日韩亚洲国产| 直接黄91麻豆网站| 亚洲欧洲自拍拍偷午夜色| 欧美www在线观看| 中国一级毛片免费观看| 中文字幕调教一区二区视频| 欧美a网站| 99久久国产综合精品2020| 国产好痛疼轻点好爽的视频| 国产噜噜在线视频观看| 伊人成人在线| 最新精品久久精品| 色噜噜久久| 无码内射在线| 日韩欧美中文字幕一本| 久久福利网| 欧美日韩中文国产va另类| 99热这里只有免费国产精品 | 在线观看亚洲国产| 国产不卡在线看| 四虎永久免费地址在线网站| 一级黄色片网| 亚洲黄色视频在线观看一区| 国产成人亚洲精品无码电影| 亚洲无码高清视频在线观看| 亚洲女同欧美在线| 小13箩利洗澡无码视频免费网站| 午夜视频免费试看| 久一在线视频| 亚洲日韩AV无码一区二区三区人 | 青青草国产精品久久久久| 最新国产麻豆aⅴ精品无| 拍国产真实乱人偷精品| 国产欧美日韩视频怡春院| 亚洲一级毛片免费看| 日韩毛片免费视频| 亚洲日韩精品综合在线一区二区| 777午夜精品电影免费看| 亚洲人成网站在线播放2019| 久久无码av三级| 人妻中文久热无码丝袜| 婷婷综合缴情亚洲五月伊| 亚洲A∨无码精品午夜在线观看| 久久这里只有精品2| 久久一本精品久久久ー99| 国内精品手机在线观看视频| 久久人妻xunleige无码| 欧美一道本| 天堂成人在线| 欧美成在线视频| www.精品国产| 国产又爽又黄无遮挡免费观看 | 亚洲最大在线观看| 国产第一色| 欧美成一级| 亚洲国产午夜精华无码福利| 日本午夜在线视频| 日本一区二区三区精品国产| 免费在线看黄网址| 美美女高清毛片视频免费观看| 波多野结衣一区二区三区四区 | AV片亚洲国产男人的天堂| 久久精品人人做人人爽| 久久久久青草大香线综合精品| 亚洲人成网站在线观看播放不卡| 欧美日韩精品综合在线一区| 国产爽妇精品| 免费aa毛片| 另类欧美日韩| 国产免费黄| 国产综合色在线视频播放线视 | 国产美女无遮挡免费视频网站| 大学生久久香蕉国产线观看| 亚国产欧美在线人成| 日韩欧美国产三级| 红杏AV在线无码|