999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的地震輿情信息提取及時空可視化

2023-11-04 03:36:16王晨雨葉妍君邱英俏杜美慶
自然災害學報 2023年5期
關鍵詞:文本情感信息

王晨雨,葉妍君,2,邱英俏,杜美慶

(1.河北工程大學 地球科學與工程學院,河北 邯鄲 056038; 2. 中國科學院地理科學與資源研究所資源與、環境信息系統國家重點實驗室,北京 100101; 3. 山東正元數字城市建設有限公司,山東 煙臺 264670;4. 煙臺市智慧城市及物聯設施工程技術研究中心,山東 煙臺 264670)

0 引言

地震是造成破壞最為嚴重的自然災害之一,重大地震發生會對民眾的生命和財產安全構成威脅,還會引發滑坡、泥石流等次生自然災害[1-2],有效的災害應急管理和防災減災策略迫在眉睫。傳統的災情信息獲取方式具有時間周期長、工作量大、滯后于災情等特點,不能滿足政府開展實時性救援工作的需求。因此,震后黑箱期內及時獲取災情信息并采取有效應急策略是救援部署工作開展的關鍵[3-5]。據中國互聯網絡信息中心(China Internet Network Information Center, CNNIC)2021年9月15日發布的第48次《中國互聯網網絡發展狀況報告》顯示[6]:截止2021年6月,我國網民達10.11億,互聯網普及率達71.6%,統計結果表明,隨著“互聯網+”時代的到來,網絡使我們獲取信息的方式更便捷、更迅速,社交媒體平臺受到網友廣泛關注,人們可以通過互聯網社交平臺分享日常、發表觀點、互動交流,社交媒體數據來源于公眾,這些數據背后隱藏的輿情信息反映了人的態度、情感傾向、社會行為,在進行災情研判和救援處置時更具針對性,CHENG等[7]基于2011年日本9.0級地震,將公眾和媒體對災害的看法進行研究,分析了地震對災后感應和行為產生的不同影響。社交媒體平臺—新浪微博以隨時隨地發布身邊事的特點獲得公眾認可,2020年9月微博用戶月活躍量達5.11億,日活躍量達2.24億,網友可以在微博發表文字、圖片和視頻等,這種方便快捷的表述更加符合現代人的生活方式,還可以隨時隨地進行留言、對來訪者的評論進行回復,具有良好的互動性[8]。地震事件發生后,大量用戶在微博平臺發布言論,表達自己的情感、態度,海量數據匯集成為震后應急救援開展的一手資料。

目前已有國內外學者利用新浪微博數據研究地震事件,其成果主要包括實時地震系統構建、災情影響范圍、災情時空分析等,鄭嶸等[9]基于微博數據構建了災害實時處理系統,并在實際地震中驗證了系統可行性;曹彥波等[10]基于微博數據挖掘四川九寨溝地震災情信息并與實際災評結果進行空間對比,對救災決策部署提供一定參考;徐敬海等[11]利用位置微博提取地震災情的方法,實現了點集微博災情向面狀災情的轉化;SAKAKI等[12]使用支持向量機算法分析了日本地震相關推文。微博平臺是獲取災害事件中公眾情緒的有效跟蹤工具,重大災害的發生會使公眾產生恐懼、懷疑和悲傷等情緒,這種狀態不及時調節會給災區民眾帶來不同程度的精神和心理問題,可見災后針對公眾情感情緒研究的重要性。楊騰飛等[13]基于深度學習算法抽取的情感信息結合時空信息為應急救災提供了一定參考;曹彥波[14]基于微博數據采用情感詞典與規則相結合的方法,分析了災區民眾情感極性特征和情緒反映時空變化;萬巖等[15]基于微博數據建立了一個新的情感分析模型,提高了細粒度情感分類的準確率;林筱妍等[16]、張巖等[17]基于微博文本特征分析了臺風事件公眾情感傾向,有助于政府掌握和引導災害輿情;ALFARRARJEH等[18]、NEPPALLI等[19]利用多源社交媒體數據對桑迪颶風等災害進行情感分析并可視化。

重大地震發生會給人們帶來極大精神壓力和心理傷害,產生不同程度的心理應激反應,趙高鋒等[20]、羅興偉等[21]、范方等[22]和耿富雷等[23]通過大量調查研究發現,震后民眾會出現心理失衡狀況,尤其會對地震親臨者的心理應激情緒帶來重大影響,嚴重影響他們未來的生活,還可能產生負面社會心理效應,對社會穩定構成威脅[24-26]。一般情況下,地震對于我們來說是短暫的、瞬時的,然而,這種災害對于地震親臨者的傷害卻是持續的、長期的,震后72 h生命黃金救援期也是心理救援的關鍵期。“5·12”汶川地震的救援工作,使人們深刻體會到災后應急管理和社會救援工作中心理干預的重要性,雖然此次地震的心理危機干預工作得到高度重視,但由于響應機制缺失、缺乏專業隊伍,依然存在較多問題[27],因此,針對震區心理危機干預方法的研究尤為重要,青少年作為震后災區重點心理干預對象,災后教育重建中應加以重視[28],譚友果等[29]、胡麗等[30]和張曉林等[31]利用班級團體結合個別輔導、體育鍛煉等方式對震區學生進行干預,同時,一些針對地震災區現場實施的心理干預方式也取得良好效果[32-37],楊一等[38]提出心理干預是一項長期系統工作,應構建“醫院-學校-行業”等多元主體協同的專業化研究團隊;與此同時,政府在心理危機干預中發揮了不可忽視的作用,政府的正確引導保障了社會救援的通暢,何江新等[39]、曹蓉等[40]和宋曉明等[41]學者已從事件預防、響應、恢復等多方面為政府提出可行性建議。

為了應對心理危機干預、了解公眾關注熱點、掌握并正確引導網絡輿論,如何從海量、非結構化的微博文本信息中快速挖掘輿情信息,國內外學者已從多方向進行研究:LI等[42]基于微博數據利用卷積神經網絡進行文本信息提取,并應用于武漢和深圳暴雨事件的監測上;楊辰等[43]基于自然語言處理算法提取分析報警災情描述信息,進一步分析了氣象災害的時空特征及致災條件;WANG等[44]結合LDA模型和SVM算法對暴雨主題文本流進行了分類;陳璦璦等[45]對社交媒體文本中的位置淺語義特征進行提取,并與地理空間結合,對于場所感知和城市規劃有積極意義;譚永濱等[46]提出的微博文本位置信息識別與提取模型可進行文本位置挖掘分析;王艷東等[47]提出的基于共詞網絡社區演化進行災情態勢感知方法可輔助了解災情發展過程;馬瑩雪等[48]和蘇曉慧等[49]采用機器學習算法提取災害熱點話題,為災害應急管理提供幫助,目前學者已從文本分類、信息抽取等方面進行輿情分析,但對社交媒體數據中蘊含的更細粒度地震主題信息提取并分類的研究存在不足。

本文以2021年5月21日“大理漾濞6.4級地震”事件為例,基于新浪微博數據,研究了一種利用卷積神經網絡(convolution neural network, CNN)提取地震主題信息并分類的方法,并將結果以地震主題時空演變特征可視化,為震后災情研判、救援部署工作提供重要參考。

1 研究區域與數據

1.1 研究區域

2021年5月21日云南漾濞發生6.4級地震,截至2021年5月22日15時,此次地震共造成15.9萬人受災,3人死亡、32人受傷,多處房屋開裂甚至倒塌,地震造成的坍塌和滑坡導致道路受損、交通中斷。因此,本文以漾濞彝族自治縣6.4級地震為研究對象,以大理白族自治州為研究區域,地震震中位于25.67°N,99.87°E,如圖1所示。

圖1 研究區域

1.2 數據獲取與處理

漾濞6.4級地震在震后一段時間內一直是新浪微博的熱點話題,并登上微博熱搜榜第一,震后人們反響強烈,紛紛在微博表達自己的態度、情感,期間網友發布的微博包含了大量與此次地震相關的輿情信息,如:救援信息、傷亡情況等。本文以新浪微博平臺為數據源,使用Python軟件爬取微博熱搜話題數據,數據獲取形式為發布時間、用戶名、性別、位置、點贊數、博文內容等,如表1所示,采集時間為震后48 h(2021年5月21日21時48分—23日21時48分),為解決爬取的數據重復率高、無關內容多等問題,使用Excel等統計軟件和人工判讀對數據進行篩選、分類和統計,最終獲取#大理漾濞6.4級地震#數據7972條。

表1 微博數據獲取格式

其中,地理定位為用戶發布微博時所處位置,以文本描述的形式存在,如:“大理·大理大學(古城校區)”、“大理·大理古鎮”等,為了便于分析,需要將這些文本數據轉換為坐標數據。通過Python語言編程,使用https://mapjiqrxxcom/jingweidu/網站中的位置轉坐標功能,將地理位置轉換為地理坐標,如表2所示。研究區域為大理白族自治州,故表中展示了大理市部分地點坐標。

表2 地理定位轉換結果示例

通過對微博文本進行閱讀,并參照微博災情信息分類指標[50]、地震現場災情信息分類代碼表[51]和位置微博地震災情分類映射表[9],結合漾濞地震后災區實際情況將地震文本分為正能量祈禱、動作狀態、場景描述、預警信息、救援處置、震情信息和傷亡受災七類主題,如表3所示。為滿足CNN模型訓練的需要,每條微博文本通過人工標注方式得到一個主題,即每條訓練文本對應一個地震主題。

表3 微博主題分類表

2 研究方法

基于新浪微博數據,利用構建的卷積神經網絡模型可從大量文本中識別出救援、傷亡和震情等與此次地震事件相關的信息;對地震數據集做分詞和去停用詞處理,構建文本向量矩陣作為卷積神經網絡的輸入層;通過不斷測試和優化得到地震輿情信息提取結果,最后將訓練完成后的模型應用于新的地震數據集分類中。

2.1 基于CNN的地震輿情信息提取

隨著深度學習技術的發展,其已應用于不同研究領域,如災害信息自動提取與分類[52]、空間情緒感知評價[53]等。常用的深度學習算法包括卷積神經網絡(CNN)和循環神經網絡(recurrent neural networks, RNN),RNN對信息分類是依據整個文本或文本間存在較長的語義關系的詞語加權和,而CNN是將文本中具有明顯特征的關鍵詞或短語作為分類依據[54]。微博數據以短文本為主,具有口語化、碎片化等特點,由于微博文本中包含了大量與地震輿情有關的特征詞,基于卷積神經網絡構建的多分類模型有較好的特征詞識別能力,且據研究CNN在文本分類中具有明顯優勢,且比較穩定[55],因此,本文使用CNN提取地震輿情信息,圖2為主題信息提取流程。

圖2 地震主題信息抽取流程

2.1.1 微博文本特征信息獲取

文本向量矩陣是文本特征信息獲取的重要部分,主要思路為:

1)讀取地震主題相關語料庫,使用結巴分詞工具對獲取的微博文本進行分詞、去停用詞操作;停用詞是與本次研究無關、無實際意義的詞,比如“呀”、“啊”等語氣詞,“這些”、“那么”等沒有反映災情的詞。

2)利用Python軟件Gensim包的word2vec模塊構建Skip-gram模型生成詞向量空間。word2vec主要有Skip-gram和CBOW這2種模型,基于微博數據的特點Skip-gram模型適用于小語料庫,在處理效果上更具優勢,該模型通過對大量文本進行訓練,可依據當前詞計算出上下文的語義關系,并以向量的形式表示[56]。Word2vec依據語料庫使用Skip-gram模型進行訓練,得到詞向量空間。

3)將每條微博文本單獨分詞,這些詞對應詞向量構成了詞向量列表,根據列表轉換為文本矩陣。由于微博文本不超過140個字符,所以設置詞向量維度為140,文本中的詞匯從上向下排列,長度不足的微博文本用“0”補齊,此方式解決窗口滑動時會遇到文本長短不一的問題。文本向量矩陣如圖3所示。

圖3 微博文本向量矩陣結構

2.1.2 卷積神經網絡模型構建與訓練

本文構建的卷積神經網絡模型使用了基于Tensorflow的keras深度學習框架,卷積層和池化層沒有重復疊加,結果表明簡單的模型可防止過擬合,達到最優效果,如圖4所示。

圖4 用于文本分類的CNN結構

1)輸入層:將每條地震災害相關微博文本分詞嵌入詞向量中,變量x和y分別為地震災害微博文本和地震主題類別,將訓練文本對應矩陣輸入到卷積層中。

2)卷積層:利用固定窗口的過濾器對嵌入的詞向量進行卷積,過濾器的寬應與詞向量維度一致,設置窗口大小,每次窗口覆蓋連續的幾個詞。卷積可提取相鄰的離散文本特征,如單一詞語“交通”、“中斷”,結合后的詞“交通中斷”作為新的特征詞出現,突出了文本中的震情信息,這樣的詞還有很多,如“震感”和“明顯”等。

3)池化層:池化是對卷積操作后的結果進一步篩選,常用的池化方法有最大池化和平均池化,研究表明,最大池化的效果比平均池化好[55]。本文使用最大池化使卷積后的輸出值作為池化層的輸入值,輸出矩陣中最大的元素,為卷積之后具有最明顯的特征。

4)全連接層和分類層:把池化層的結果做一個拼接,加一個reluctant非線性映射,對標準主題分類與拼接結果求一個交叉熵損失,損失值越小效果越好;使用Softmax函數計算輸入文本的主題類別,輸出每個主題可能的概率值,最終確定的地震主題為概率值最大的一類。

2.2 輔助輿情分析方法

基于提取的地震主題類別,結合輔助輿情分析方法:熱度分析、關鍵詞挖掘和核密度估計等方法將震情可視化。

2.2.1 地震熱度分析方法

對地震輿情熱度進行量化分析,統計每20 min內有關地震事件的討論次數,并結合不同時段的關鍵詞進行分析,其中,微博話題熱度=微博點贊數+評論數+轉發數,將每次微博用戶行為都視為一次熱度。

微博文本特征提取的方法有詞頻—逆文檔(TF-IDF)和信息熵等,本文使用Jieba分詞的TF-IDF算法進行關鍵詞挖掘,計算公式為:

TF-IDF=TF×IDF=tfi,j×idfi

(1)

(2)

(3)

式中:tfi,j為頻率;ni,j為某個詞i在文本j中出現的次數; ∑knk,j為數據集k中文本j包含特征詞i的總數,tfi,j值越大表明該特征詞對文本的貢獻越大;idfi為逆文檔頻率,表示一個特征詞i在數據集k中出現的概率,主要用于降低一些常見卻對文檔影響不大的詞;N為數據集中文本總數;Ni為數據集中包含特征詞i的文本總數。

2.2.2 情感分析方法

將大連理工大學信息檢索研究室研發的中文情感詞匯本體庫作為基礎詞典,綜合考慮句法對語義表達的影響,結合知網HowNet否定詞和程度副詞詞典,構成一個新的地震輿情情感詞典。每個詞在每個情感下對應一個極性,情感詞的情感極性有“正面、負面、中性”三類,情感極性大于0的賦值為1,代表正面情緒;情感極性等于0的直接作為中性情緒;情感極性小于0的賦值為-1,代表負面情緒,詞匯的情感值如式(4):

Sw=VwPw

(4)

式中:Sw為詞匯情感值;Vw為詞匯情感強度;Pw為詞匯情感極性。

(5)

Sk=∑Sentik

(6)

式中:k∈{1,2,3,4,5,6,7}分別為好、樂、哀、怒、懼、惡、驚7種情感;αki、βki分別為k類情感詞的強度和修飾該情感詞的程度副詞強度;n為否定詞個數;N為情感詞個數。

2.2.3 核密度估計法

核密度估計(kernel density estimation, KDE)是一種基于非參數密度估計的對點要素進行地理空間分析的方法[58],其幾何意義是以樣本點xi為中心,計算每個樣本點在指定半徑范圍內的密度值,越靠近中心點處的密度越高。在地震主題研究中,核密度估計值越大地震主題在空間上的分布就越聚集,計算公式如式(7)[58]:

(7)

3 地震主題信息精度評估

基于1.2節七類地震主題信息,人工閱讀并標記了2100條帶有地理定位的數據做為訓練樣本,每個主題對應300條數據,由于“傷亡受災”類主題的微博數量不足300條,故從新浪微博爬取#青海發生7.4級地震#熱搜話題數據作為補充數據集,數據采集時間范圍為2021年5月22日2時4分—23日2時4分。將標記的主題數據按5∶1劃分為卷積神經網絡模型的訓練集和測試集,訓練樣本劃分為訓練集和測試集以便構建誤差最小的模型,保證每個地震主題的完整性。本次研究主題信息分類通過召回率(Recall)、準確度(Precision)和綜合評價指標(F1-score)值3個指標進行衡量,各項指標計算公式如式(8)~式(10):

(8)

(9)

(10)

模型優化是神經網絡訓練的重要步驟,通過多次迭代尋求最合適的參數,其中,詞向量維度設為140,滑窗大小設置為3,丟棄正則化參數設為0.3,padding設為same,地震主題分類精度評估結果如表4所示,F1值處于精確度和召回率之間,數值達到85.4%,整體精確度達到89.7%,說明模型在地震主題提取中有一定效果。

表4 文本主題分類精度評估

針對每個主題分別計算其精度評估結果,據漾濞地震評估結果:精確度、召回率和F1值都在80%以上,說明大部分文本內容可以被準確識別。為了對模型進行驗證,從青海瑪多地震數據集中抽取800條人工標記的微博數據作為驗證集,對數據進行分詞、去停用詞以及文本向量矩陣轉化等處理,將800條文本輸入主題分類模型中進行分類,結果如表5所示,整體精度高于80%,主題“正能量祈禱”、“場景描述”、“震情信息”的精度達到90%,CNN模型在新的地震數據集上也有較好表現,說明分類器有自動提取文本特征的能力,在災害信息提取方面具有可行性。

表5 漾濞地震和青海地震主題信息精度評估結果

4 輿情分析及可視化

4.1 數據描述

調用Python中的結巴分詞庫、詞頻統計庫等庫對獲取的地震數據進行中文分詞和詞頻統計,結合地震主題類別進行分析,如圖5所示。主題“正能量祈禱”的微博數量最多,比例達38%;震后高頻形容詞“平安”出現3189次,位居第一,“希望”一詞出現1507次,與地震主題信息提取結果相符。

圖5 漾濞6.4級地震主題對應微博數量及所占比例

如表6所示,主題“動作狀態”占比25%,震后“下樓避險”、“在籃球場中央瑟瑟發抖”、“手抖腳軟”等一系列動作狀態表明當時公眾害怕、惶恐不安。主題“場景描述”和“震情信息”分別占比15%和11%,結合震后高頻名詞和動詞統計結果:“救援”一詞出現1693次、“應急”一詞出現652次、“警報”一詞出現333次、“震感”一詞出現327次、“自救”一詞出現265次,表明無論何時我們都應該提高警惕,面對突如其來的災害不要慌張,公眾自身平時要多加防范;此次地震出現人員傷亡情況,政府及相關部門應提高重視,宣傳防震避震知識,并做好應急措施以及預警預報。

表6 漾濞地震高頻特征詞統計(排名前15)

4.2 時序變化

震后48 h地震微博熱度達到401360,以20 min為單位分析地震討論熱度(從地震發生后登上微博熱搜開始計算,20 min為劃分單元,以此類推),對圖中局部熱度峰值進行關鍵詞分析,該峰值20 min內對應的微博博文作為分析對象,TF-IDF所得結果進行標注,如圖6所示。從圖中可看出,以20 min為劃分單元的輿情熱度時序討論與實際地震輿情時序變化相符,震后0~24 h一直保持較高的討論熱度,震后3 h是話題討論高峰期,熱度值最高的為中國地震臺網發布的官方震情、祈禱祝福、對震后救援的肯定、贊美;隨著地震事件在微博熱度減小,24~48 h 2次地震話題討論度明顯減少,余震發生時會出現小的起伏。以一天24 h為區間來看,熱度變化隨公眾日常作息呈現出規律性變化,凌晨0—6時,輿情熱度逐漸迅速下降,凌晨6時之后,輿情熱度出現上升趨勢;一天內討論熱度最高時期為早晨7時前后和中午12時前后,晚上18時前后也會出現話題討論小高峰。

圖6 2021年5月21日21時48分—23日21時48分地震討論熱度

為了進一步驗證各類地震主題在實際減災中的作用,通過統計每個地震主題的數量變化,得到各時段公眾對地震的響應情況,有助于了解地震輿情發展規律。

本文對5月21日21∶48—5月23日21∶48時間段之間的數據進行時序分析,震后每個主題隨時間變化的趨勢,如圖7所示,直觀反映了地震輿情基本情況和發展規律。從圖中可知,大部分微博主題數量隨地震事件發生經歷了較大起伏,震后數小時微博數量居高不下,余震發生后微博數量也會出現小高峰,說明基于微博數據抽取地震主題與實際地震發生階段相符。總體來看,白天時段微博發布量略高于在晚上時段,呈現出“晝多夜少”的特征,地震發生后的6 h和次日上午微博數量最多,夜間和下午微博發布量相對較少;隨著時間推移熱度降低,5月23日微博發布數量明顯減少,之后一段時間基本沒有發布量。“正能量祈禱”和“動作狀態”2個主題的微博數量最多,震后地震親臨者和網友紛紛在微博傳播正能量信息,相互鼓勵,提醒大家注意安全并宣傳轉發防震自救等相關微博; 發布 “場景描述”和“震情信息”的微博發布量也較多, “震情信息”類微博在余震發生后會有所上升。22∶49∶00用戶名為“婷婷婷婷婷在這呢”發布微博:“一晚上震十幾次 我真的太慌了 救命SOS 看見整棟樓都在搖 我真的怕了!”此條微博包含了場景描述信息“整棟樓都在晃”和震情信息“一晚上震好幾次”以及地震親臨者的感受“慌”和“怕”。“救援處置”類微博數量增多趨勢晚于“傷亡受災”類微博主題,隨著救援工作持續進行,救援和傷亡信息逐漸減少,民眾情緒得到平復。此次大理漾濞地震震級較大,影響范圍廣,存在人員傷亡,通過不同的地震主題變化趨勢,有助于從多角度分析震后輿情演變。

圖7 2021年5月21日21時48分—23日21時48分地震主題時序變化

4.3 空間分布特征

為了直觀地震后公眾輿情態勢,運用地理統計分析方法,篩選出大理白族自治州范圍內帶有地理定位的微博數據,對網友發布的微博進行解析發現,微博數量空間分布總體呈現出不均衡的特征,大理白族自治州微博數量最高的地區為大理市,其次為發震地點漾濞彝族自治縣,距離震中較遠的鶴慶縣、南澗彝族自治縣微博數量最少。主要原因是大理市經濟發達,信息傳播快,有大理古城、蒼山洱海等著名景區,當地民眾和外來旅客聚集,公眾對熱點事件關注度高,震后通訊設施未受到重大破壞,微博數量較多;漾濞彝族自治縣附近地區由于無線電通訊設備受損,信號中斷,影響震區民眾與外界聯系,加之人口密度低,微博發布量較少。

由圖8微博核密度空間分布可知,漾濞地震輿情高值區為大理市,距離震中較近的漾濞彝族自治縣城區、區域a、區域b的核密度值也較高;區域c、區域d、區域e、區域f雖遠離震中,但也表現出較周圍區域更高的密度分布,震后災區開展應急管理時,地震輿情高值區可為政府把握輿情信息、合理分配救災物資提供重要參考,加強對該區域的地震監測和震情管理可在震后黑箱期內預防意外發生。

圖8 2021年5月21日21時48分—23日21時48分地震輿情空間分布

帶有定位的微博數據包含了地理位置,一條微博文本對應一個地震主題類別,故每條微博可被認為是帶有一個主題的實體點。4.2節微博主題時序變化,抽取微博數量最高的3個時段:21日21時—22日3時、22日6時—22日12時、22日17時—22日23時作為研究對象,結合3個時段對應情感類別分析地震輿情。

如圖9(a)所示震后第一個時段,該時段微博主題數量多且分布范圍廣,具有分散性,整個大理白族自治州除云龍縣和鶴慶縣都有分布,主要集中在大理市和震中附近,地震主題以“正能量祈禱”和“動作狀態”為主;永平縣和賓川縣出現主題“救援處置”,抽取這一時間段微博主要關鍵詞:“云南”、“震中”、“大家”、“余震”等,表明此次地震對公眾的影響較大,漾濞6.4級地震前后,又發生數次余震,此時網友的情緒主要表現為恐懼、憤怒,分別占比17%、14%,懷疑情緒占比達10%,如圖10所示,人們比較擔心是否還會有重大地震和余震發生,震后部分網友通過關注中國地震臺網、云南省地震局等官方微博了解最新震情。如圖9(b)所示震后第二個時段,地震主題主要集中在大理市,“震情信息”、“動作狀態”和“場景描述”等主題明顯減少,云龍縣、彌渡縣、劍川縣出現“正能量祈禱”主題,結合關鍵詞“抗震”、“避震”、“救援”、“安好”等可知,震后公眾情緒逐漸恢復,祝愿和安心情感占比增加,懷疑和恐懼情感占比明顯減少;震中附近區域和大理市還存在主題“救援處置”,結合關鍵詞“搶險”、“救援”、“帳篷”等表明震區還需要一些應急物資,這是震后對個人需求的滿足,是對震后精準救援的直接反饋。震后第三個時段見圖9(c),各類主題信息明顯減少并聚集在大理市,公眾發布正能量祈禱信息居多,結合關鍵詞“平安”、“安好”、“希望”等可知,震后人們“祝平安”“報平安”為災區祈禱,互相鼓勵、安慰;如圖10所示,從情感占比角度看,祝愿和安心情感達59%,從側面說明了公眾對震后救援取得成效的肯定;值得注意的是,該時段悲傷情感占比21%,雖然震后救援保障了災區民眾生命安全,但地震造成的持續性心理傷害卻沒有減退,因此,將地震主題信息與公眾情感相結合有助于政府關注震區情況及公眾的心理變化,為震后災區應急管理提供一定參考。

圖9 不同時段地震主題的空間分布

圖10 不同時段各情感類型占比

2021年5月24日,云南省地震局發布了云南漾濞6.4級地震烈度圖,此次地震的最大烈度為VIII度(8度),對大理白族自治州6個縣市造成嚴重影響。將主題信息與地震影響場、交通路網等數據結合(所涉及的交通路網數據根據高德地圖的路網柵格底圖矢量化得到),分析不同類別地震主題在應急管理中的作用。如圖11所示,地震主題主要集中在震中所在的漾濞彝族自治縣、大理市、祥云縣、賓川縣等縣城、鄉鎮及道路沿線區域,呈條帶狀和團塊狀分布:條帶狀即主要沿交通路網分布,通過大理市的214國道、連接大理市和漾濞彝族自治縣的215國道,保證了震后救援的通達性;大理市、永平縣和賓川縣等地區的微博呈團塊狀分布在城區附近。通過地震烈度區可以確定地震影響范圍,在烈度VIII度區內,漾濞縣城受此次地震影響最大,出現最多的主題為“正能量祈禱”和“救援處置”,由于距離震中近,震感強烈,地震造成的破壞較嚴重,應劃為震后救援重災區,秀嶺村及西北部發布的“救援處置”信息最多,震中多山環繞的復雜地形可能會加劇二次災害發生,也加大了救援工作難度,因此,震后應根據主題“救援處置”的位置做出應急響應,以減少人員傷亡。在烈度VII度區內,太平鄉以及平坡鎮附近村莊發布的主題多為“正能量祈禱”、“動作狀態”。在烈度VI度區內,大理市的主題信息分布最為密集,大理古城、大理蒼山世界地質公園、太邑彝族鄉、村落瓦世恒等附近均出現主題“正能量祈禱”和“動作狀態”,震后公眾“抱頭”、“下樓避險”、“打開手機”等一系列動作反應表明震后公眾自救意識強,這與政府日常宣傳防震抗震自救等知識密切相關。花椒箐隧道和雙廊鎮附近出現主題“場景描述”,結合微博內容多為游客發布的輿情信息,5月21日23時49分,微博用戶名為“有妖眸的巫婆”發文稱“雙廊古鎮感受強烈,震了好幾次,最明顯的那次整個地都在晃”,可見當時雙廊鎮震感明顯,器物、建筑物出現明顯晃動。在烈度VI度區外,村落白馬廟和廟前村出現主題“救援處置”,東山國家森林公園均出現主題“動作狀態”,大甘莊出現主題“傷亡受災”,救援醫療隊應在震后第一時間趕往該區域,進行傷亡救援。利用同樣的方法可為其他災區災情監測、應急處置提供決策依據。

圖11 地震影響場主題信息空間分布

5 結論與展望

本文基于微博平臺爬取包含文本、時間、位置的數據,通過人工判讀和數據處理軟件對數據進行結構化整理,便于后期分析研究。結合災情信息分類知識閱讀微博文本,判別不同類型的地震主題信息,對帶有地理定位的數據集進行標記。以2021年5月21日“大理漾濞6.4級地震”事件為例,構建了一個基于CNN模型的主題信息提取流程框架,通過設置不同參數對模型進行優化訓練,整體精度達到80%以上,各個主題精度也達到預期效果。將新獲取的青海地震數據集輸入模型進行驗證,2次地震驗證結果說明,該模型在災害主題信息提取中具有可行性,最后將地震輿情可視化,得出以下結論:

1)時序變化:地震主題時序變化反映了震后各階段輿情關注點的變化,大部分地震主題隨地震事件的發生產生較大起伏,主題“正能量祈禱”數量最多,比例達38%,余震發生后微博數量會出現小高峰,總體呈現出“晝多夜少”的特征,與實際地震發生階段相符。

2)空間特征:地震主題信息分布范圍廣,具有分散性;隨著時間推移,地震事件在微博的熱度逐漸消退,更多主題信息集中在大理市。不同市(縣)區域對地震主題的關注度不同,越靠近震中公眾對地震事件的響應程度越高。微博數量除與地震事件影響范圍外,還與經濟水平、交通便捷程度、人口密度有密切關系。

本文提出的利用卷積神經網絡提取地震主題信息并分類的方法,對地震主題進行了更細粒度劃分,這些地震主題信息是人本身對災后輿情的直接反饋,深入挖掘主題信息有助于把握公眾輿情傾向,彌補震后心理危機干預快速增長的需求,更有針對性的安撫受災民眾,疏解重大災害帶來的心理恐慌,提高公眾心理應急能力,提升社會救援效率,為震后災情研判、救援部署提供重要參考,同時,也為其他地區災害事件監測和應急管理提供新思路。結合各時段文本關鍵詞、公眾情感情緒有助于政府關注震區情況及公眾的心理變化,為震區應急管理提供參考。

盡管此研究方法在救援減災中具有很好的效果,但還存在一些不足:僅僅依靠微博數據分析地震輿情具有單一性,后期可將手機信令、抖音等多源數據綜合考慮進行分析;震后并非每位網友發布微博時都會開啟定位,導致用于空間分析的地理位置數據不全面,后期考慮智能化算法提取文本中可能包含的位置信息。

猜你喜歡
文本情感信息
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 免费一级毛片在线观看| 99热这里都是国产精品| 亚洲码在线中文在线观看| 精品国产三级在线观看| 中国国产A一级毛片| 特级精品毛片免费观看| 香蕉eeww99国产在线观看| 老司机aⅴ在线精品导航| 四虎精品免费久久| 99久久精品久久久久久婷婷| 国内黄色精品| 国产乱视频网站| 成人精品在线观看| 国产色婷婷| 国产一级一级毛片永久| 三区在线视频| 中文字幕久久亚洲一区| 日本精品一在线观看视频| 国产精品自拍露脸视频| 国产va欧美va在线观看| 国产91九色在线播放| 99无码中文字幕视频| 无码精品国产dvd在线观看9久| 国产激爽爽爽大片在线观看| 先锋资源久久| 男人天堂伊人网| 黄色三级网站免费| 欧美日韩动态图| 欧美日韩久久综合| 成人福利在线看| 无遮挡一级毛片呦女视频| 中文字幕66页| 激情五月婷婷综合网| 国产精品55夜色66夜色| 午夜不卡视频| 毛片免费网址| 亚洲激情99| 国产迷奸在线看| 国产亚洲精品在天天在线麻豆| 成人国产一区二区三区| 亚洲精品麻豆| 亚洲自拍另类| 最新国产午夜精品视频成人| 九九香蕉视频| 91福利国产成人精品导航| 爱做久久久久久| 成人日韩精品| 亚洲一区二区成人| www.99在线观看| 三上悠亚一区二区| 一级毛片免费高清视频| 欧美亚洲一二三区| 亚洲天堂成人| 成人午夜视频网站| 免费高清a毛片| 毛片一级在线| 无码在线激情片| 欧美激情一区二区三区成人| 久久美女精品| 日韩欧美国产综合| 不卡国产视频第一页| 原味小视频在线www国产| 午夜性爽视频男人的天堂| 久久久久亚洲AV成人网站软件| 亚洲国产清纯| 亚洲最大看欧美片网站地址| 中文字幕欧美日韩| 在线亚洲精品自拍| 欧美、日韩、国产综合一区| 国产福利免费视频| 女人18毛片久久| 国产亚洲视频免费播放| 亚洲国产欧美自拍| 国产欧美精品午夜在线播放| 午夜国产理论| 亚洲欧美精品日韩欧美| 欧美日韩国产在线观看一区二区三区 | 欧美人人干| 无码一区18禁| 波多野结衣一区二区三区88| 亚洲av无码人妻| 成人韩免费网站|