李軍利,蔣 浩,何宗宜,何靜磊,甘瑞杰
(1. 安徽省智慧城市與地理國情監測重點實驗室,安徽 合肥 230061; 2. 安徽農業大學資源與環境學院,安徽 合肥 230036; 3. 武漢大學資源與環境科學學院,湖北 武漢 430079)
天氣情感地圖是一種表達情感相關的專題地圖[1],開展災害性天氣條件的微博語義情感地圖設計,有助于理解群體時空行為模式與地理位置的相關性,居民感知災害的受損程度。近年來,已有學者開展了相關研究。一方面,社交媒體可以探測個體行為,折射人類的情感[2-3]。如利用Twitter數據分析個人情感[4-5],挖掘微博識別熱點事件發生所在位置[6],微博用戶情感的地圖表達[7],感知人群在城市不同場所的活動、態度、偏好等[8-9]。另一方面,社交媒體有助于災害事件的應急響應[10-11]。如Sandy颶風軌跡與Twitter活動位置相關性討論[12]、2011年日本東京大地震居民情感變化與交通行為模式探討[13]、北京“7·21”特大暴雨事件中社交媒體應急響應等[14]。上述研究均從不同角度闡述了社交媒體可以映射人的情感變化,理解災害事件不同階段群體情感行為變化。但之前多數情感相關研究探討的是一維的,即正面的或負面的、積極的或消極的、高興的或悲傷的等[15],而實際上用戶情感多數是復雜多維的,不能簡單刻畫,用戶情感都是快樂、信任、恐懼、驚訝、悲傷、厭惡、憤怒和期待等主要情感表達的混合體[16-17]。
本文將2016年一段持續性暴雨天氣過程的微博用戶情感變化作為研究對象,利用合肥市新浪微博原始數據,采用語義分析的方法,提取暴雨天氣過程中用戶情感屬性,將情感劃分為8類,結合強暴雨天氣前、中、后期,微博用戶的情感時空變化特征,以期探索災害性天氣條件下群體情感變化的不同模式。
利用程序獲取合肥市區2016年6月20日至2016年7月10日暴雨期間帶有地理位置信息的新浪微博原始數據共計61 686條,再結合氣象局官方網站提供同期逐日天氣數據。將本次暴雨天氣劃分為3期:暴雨天氣過程前期,天氣特征為燥熱,多陰雨;暴雨天氣過程中期,合肥地區進入大范圍持續暴雨天氣;暴雨后期,天氣逐漸轉好。本次試驗篩選暴雨主題微博文本中包含“下雨”“暴雨”“陰天”“積水”等詞匯,對與暴雨情感相關的微博文本詞性進行人工判讀,將這些詞匯分類匯編為暴雨情感語料庫,清洗掉重復無關微博,篩選出內容表達與暴雨情感有關的微博數據,將整理好的微博數據轉換成一個四元組(時間戳,用戶ID,情感類別,緯度和經度),轉存到地理空間數據庫。
依據文獻[16—17]的情感理論,將情感分成8類:(a)喜悅(橘色)、(b)悲傷(天藍)、(c)期盼(黃色)、(d)恐懼(草綠)、(e)厭惡(深藍)、(f)氣憤(紅色)、(g)信任(墨綠)與(h)無奈(紫色),如圖1所示。對暴雨前、中、后期各8種情感的微博數據進行分析,發現存在兩種偏差:一是空間上的偏差,在城郊邊緣地帶,由于微博用戶數量較少和居住分散,有效樣本有限;二是時間上的偏差,在暴雨天氣過程的前、中與后期3個階段,微博數量存在較大差異,暴雨前期日均微博數量是中后期日均微博量的近2倍。這種偏差可能會放大格網劃分的前期情感強度,本文采用一種標準化的方法來消除偏差[15],將暴雨前期日均微博數量與中后期的數量進行比例數值修正,中后期分類修正值分別為1.87和1.78。同時,避免在偏遠郊區的少量情緒分布被過分強調,引入1%為情感閾值[15],低于情感閾值的情感不予顯示。
將整個暴雨過程3個階段微博情感標準化后,應用核密度分析方法[18-19]識別與分析熱點和冷區。格網設計中確定微博量字段、輸出像元大小、搜索面積3個參數,其中,微博量字段設置為標準化點權重,輸出像元大小設置為180 m,搜索面積設置為3000 m,對不同時期不同情感類別分別進行計算[15]。采用HSV顏色空間模型,基于“色調”“飽和度”和“值”的基本特征確定顏色[17],并對計算結果分別進行區域方差統計,以便清晰顯示不同尺度下情感分布的趨勢變化情況。
在空間分布上,全暴雨時段微博用戶情感展現較為密集的區域主要集中在蜀山區、包河區、瑤海區及廬陽區,其他區域分布稀疏。高密度地區具有人流量大、基礎設施較為完善、商圈多及路網密集的特征。在時間分布上,暴雨前期,喜悅和悲傷的情感占據居民情感分布的主要組成部分,如圖2所示。天氣的異常表現引發了微博用戶對于合肥天氣狀況的較強關注,面對雨期來臨的天氣現象,具有復雜的情感,一方面存在好奇和對天氣突然降溫的欣喜;另一方面極力厭惡災害性天氣帶來的糟糕的交通現狀,影響工作與生活,微博用戶對于暴雨突發時的情感反應較為強烈。
暴雨中期,面對持續的降水天氣,微博用戶由開始時的喜悅和期盼,情緒逐漸減弱,恐懼和無奈的情感情緒呈上升趨勢,如圖3所示。同期,面對降水帶來的生活和工作上的不適,厭惡及氣憤的情感情緒也逐漸攀升。由于持續降雨,造成城市大面積雨洪,特別是影響居民交通出行,情感語義地圖顯示氣憤和悲傷的情感分布較廣。信任的情感情緒也逐漸攀升,在多數信任感的微博語義中,對天氣持續涼爽,降雨也并未影響其生活與工作,該情緒的微博量也呈擴散趨勢。
暴雨后期,喜悅情感的微博量快速上升,占據了用戶情感主流情緒,這與持續陰雨之后的天氣逐漸放晴,微博用戶情緒由壓抑轉變成愉悅相關,如圖4所示。同期,厭惡與氣憤的情感情緒也逐漸下降,但仍然存在一些負面情緒微博,這與暴雨引起的經濟損失和糟糕的路況,給生活與工作帶來不方便相關;氣憤、信任與期盼情緒的微博量也較暴雨中期呈下降趨勢,這與暴雨天氣過程結束,一切恢復正常,微博用戶情緒也逐漸恢復正常相關。
本文提出了一種基于微博語義的天氣情感地圖設計方法,基于程序獲取具有地理位置的新浪微博,通過數據清洗及標準化處理,利用情感詞庫,并結合人工判讀,對暴雨天氣過程相關情感微博文本數據進行主題情感識別。將暴雨期間微博數據分為8種情感類別,并設計了8種情感著色,結合GIS格網技術將相關微博定位到格網單元,結合核密度分析制成暴雨天氣過程前、中、后期情感地圖。較以往情感地圖單一維度,如正面或負面的情感地圖,本文研究將暴雨天氣過程中微博用戶多維情感空間分布及情感時間序列細粒度變化表達出來。在突發性天氣災害過程中,結合社交媒體的社會感知特性,天氣情感地圖可為政府相關部門制定救助與決策提供一種新的視角去感知微博用戶情感變化及行為模式。
由于微博大數據本身存在有偏性,如微博用戶偏好、適用人群、城市與鄉村空間差異等諸多特征局限,后續研究將探索不同尺度下的微博用戶情感變化與公共行為模式,融合多源數據,如社會感知大數據與傳統調查數據等進行綜合分析。