姜 偉,郝 智 輝,王 艷 東,曹 衛 東*,夏 江,吳 浩 澤,樊 成
(1.安徽師范大學地理與旅游學院,安徽 蕪湖 241003;2.武漢大學測繪遙感信息工程國家重點實驗室,湖北 武漢 430079;3.武漢市疾病預防控制中心,湖北 武漢 430022;4.武漢市衛生健康委員會,湖北 武漢 430014)
新型冠狀病毒肺炎疫情(簡稱“新冠疫情”)[1,2]的暴發與全球流行,不僅對人的生命健康構成嚴重威脅,也導致社會經濟出現巨大損失[3]。新冠疫情多次局部暴發[4],不僅考驗社會的疾病預防控制工作,也影響當地民眾的生命安全和心理健康[5],導致民眾出現恐懼、悲傷、憤怒等多維負面情感響應[6],這些負面情感如果得不到及時發現和治理,會直接妨礙防控措施的有效實施,加重社會集群式恐慌,影響社會和諧穩定[7]。深入理解城市大規模人群疫情情感響應時空特征及其影響因子,可為民眾情感治理策略制定以及疫情防控措施優化提供科學依據。
目前國內外學者多采用實地調研等方法挖掘疫情暴發時人們的情感響應特征[8,9],但實地調研方法難以在疫情防控期間大范圍實施,無法即時采集大規模人群的疫情相關情感信息。隨著社交媒體的普及,情感研究由實體空間映射到網絡空間[10]。網絡用戶可在社交平臺隨時、隨地發布自己的情感響應和認知狀態信息,這些信息為即時掌握大規模群體在疫情防控期間的多維情感響應強度及其時空特征提供了可能[11]。目前,社交媒體數據已廣泛用于網絡用戶群體情感響應研究并不斷取得新進展[12-16],但多數研究僅將社交文本的情感類別劃分為積極、中性、消極3類[12,13,17],對用戶群體表達的情感維度擴展不夠,且缺乏對疫情防控期間用戶群體多維情感強度的定量化評估方法研究。此外,聚焦國內多地疫情暴發現狀,不僅要注重全國層面省市大空間尺度下情感響應探索[3,14,15,18],對城市內部情感響應時空分布特征的精細化研究也亟待開展。鑒于此,本文基于社交媒體大數據,結合實地問卷調查,提出城市用戶群體疫情情感響應時空特征分析框架,該框架重點構建用戶群體對于疫情的多種情感強度的精確評估方法,細粒度且高效反饋用戶群體情感響應信息;在此基礎上,挖掘城市用戶群體在多次疫情暴發期間情感響應的動態變化以及在城市空間中的分布特征,探究影響情感響應的顯著性因子。
武漢市是國家中心城市之一,也是全國重要的工業基地、科教基地和綜合交通樞紐[19],2019年12月-2020年4月武漢市曾受新冠疫情影響,出現公共衛生事件危機[20,21];石家莊市是京津冀地區重要的中心城市之一[22],2021年1月該市連日新增新冠肺炎確診病例及多例無癥狀感染者,疫情防控工作壓力巨大。因此,本研究以武漢市和石家莊市為案例城市,選擇武漢市主城區(江岸區、江漢區、硚口區、漢陽區、青山區、武昌區、洪山區)和石家莊市新華區、裕華區、橋西區、長安區、藁城區、正定縣為研究區域,所選區域人口較為集中,受疫情影響較大。
新浪微博是國內應用最廣泛的社交媒體平臺之一,20歲以下、21~30歲、31~40歲、41~50歲、51歲及以上5個年齡段的新浪微博用戶分別約占總用戶的30%、48%、18%、3%、1%,青年用戶占比最大。本研究基于新浪微博開放平臺提供的數據接口,采集并存儲2020年1月1日至2月14日在武漢市和2021年1月1日至2月14日在石家莊市發布的帶有地理標簽的社交媒體數據,最后分別采集微博用戶在武漢、石家莊市內發布的136 235、500 162條新浪微博數據,并存儲為原始數據集。為保證數據質量,本文應用噪聲過濾方法[23]對數據進行降噪(剔除用戶轉發的和由機器人發布的微博以及廣告),最終保留91 168條武漢市微博數據和112 954條石家莊市微博數據。
在兩個案例地疫情形勢穩定后,本研究對當地民眾進行問卷調查,以驗證基于微博數據評估城市用戶群體多維情感響應結果的準確性。兩個案例地分別發放1 000份問卷,每份問卷包含20條微博文本,以李克特5分量表[24,25]對微博文本的憤怒、恐懼、悲傷和喜悅情感強度進行描述。考慮到社交媒體數據可能受人口地理空間分布特征和網絡用戶年齡段較集中等因素的干擾[26],為提高問卷調查數據的可信度,本次調查問卷均由調研人員在研究區域內隨機發放[27]。最終回收有效問卷1 574份,其中,武漢市877份(男性受訪者425人、女性受訪者452人),石家莊市697份(男性受訪者352人、女性受訪者345人),有效問卷回收率為78.7%。基于兩市的有效回收問卷,進一步提取情感評估所需的問卷數據集合。首先,融合微博平臺發布的用戶發展報告與文獻[28],厘清新浪微博用戶的年齡構成比例;其次,將兩市收集的有效調查問卷分別根據被調查者的年齡信息,劃分為20歲以下、21~30歲、31~40歲、41~50歲、51歲及以上5個年齡段;然后,按照微博用戶年齡構成比例,從劃分好年齡段的調查問卷中抽取300份調查問卷,形成問卷調查子集(共600份),確保該子集中的受訪者年齡構成比例與新浪微博用戶年齡構成比例一致;最后,利用該問卷調查子集,對情感響應評估結果進行驗證。
本文以社交媒體數據為基礎數據,以實地問卷調查數據為驗證數據,進行多維情感響應評估并驗證評估精度;在此基礎上構建時空分析指標,用于挖掘情感響應時空特征,并探索城市用戶群體多維情感響應特征的影響因素,具體流程如圖1所示。

圖1 方法流程Fig.1 Flowchart of the proposed method
精確評估城市用戶群體在疫情防控期間的多維情感響應強度,是進行情感時空特征及其影響因素分析的重要前提。本文首先建立疫情背景下的情感詞典,然后構建顧及程度副詞、否定詞等語法因素的情感計算規則,最后利用問卷調查數據驗證基于微博數據評估用戶群體情感響應強度的準確性。
2.1.1 疫情場景專有情感詞典構建 現有情感詞典可分為一般場景情感詞典和特殊場景情感詞典兩大類[29]。本文在已有一般場景情感詞典基礎上,構建疫情場景專有情感詞典。采用的一般場景情感詞典為國內應用較廣泛的中文情感詞匯本體庫(http://ir.dlut.edu.cn/),該詞庫總結了大量生活中通用的中文詞匯及短語,并規范其詞性種類、情感類別等屬性信息。已有研究表明[30],憤怒、恐懼、悲傷和喜悅4種情感可以基本反映公眾對于疫情感知的情感變化動態,因此,本文結合武漢疫情防控專家的相關意見,抽取該情感詞匯本體庫中憤怒、恐懼、悲傷、喜悅4個維度情感,利用每個維度對應的情感詞匯構建初步情感詞典;然后從兩方面對初步情感詞典進行擴充:一是擴充疫情相關的情感詞匯(如“窒息”“野味”“漏報”等),二是擴充近年來的網絡流行詞匯(“藍瘦”“淚目”“坑爹”等)。在詞典擴充過程中,通過招募20名志愿者對1萬條微博文本中的詞匯進行情感詞匯篩選并判別情感維度,將分類后的詞匯擴充到初步情感詞典中,在憤怒、恐懼、悲傷、喜悅4個情感維度上分別擴充105、166、183、212個詞匯,最終構成疫情場景多維情感詞典。部分情感詞匯示例如表1所示(1)完整新增詞庫網址:http://miaochunhuaixia.top/wenjian/ %E5%AE%8C%E6%95%B4%E6%96%B0%E5%A2%9E%E6%83%85%E6%84%9F%E8%AF%8D%E5%85%B8.rar。

表1 情感詞匯庫示例Table 1 Instances of emotional vocabularies
2.1.2 多維情感評估規則構建 中文中的副詞、否定詞對城市用戶群體的情感強度評估結果存在顯著影響[31,32]。本文首先引入已有研究構建的否定詞和副詞詞庫[33],然后基于情感詞、否定詞和副詞詞庫建立顧及否定詞、副詞影響的多維情感評估規則:1)對于出現否定詞的句子,進一步計算否定詞的數量。若否定詞為奇數,則不統計其后出現的情感強度;若否定詞為偶數,則按照正常規則統計其后出現的情感強度。2)程度副詞。藺璜等[34]根據程度副詞表達強烈程度的不同,將程度副詞劃分為不同量級,構建具有強度差異的程度副詞分類表。部分學者基于該分類表開展顧及程度副詞強度差異的多維情感量化評估,研究結果表明,該強度分類可顯著提高情感強度評估結果的準確度[32,33,35,36]。因此,本文基于藺璜等對程度副詞的強度分類,添加少量程度副詞,構建研究所需的程度副詞賦值體系,部分程度副詞如表2所示。針對包含程度副詞的句子,本文將副詞的倍數與相連情感詞的強度相乘,乘積結果作為該句子的最終情感強度。基于上述規則,針對用戶發布的微博文本T,通過統計該文本在q情感維度上的總強度Tq(式(1)、式(2)),實現城市用戶群體的多維情感強度評估。

表2 程度副詞分類Table 2 Classification of degree adverbs

(1)
(2)

2.1.3 多維情感響應強度評估 本文對問卷調查數據進行歸一化處理,將基于社交媒體數據的情感強度與問卷調查中的情感強度映射至0~1范圍內。針對每個情感維度,利用均方根誤差(RMSE)衡量評估的準確度,得到憤怒、恐懼、悲傷、喜悅4個維度的RMSE分別為0.172、0.201、0.189、0.217,可見微博數據雖不能反映所有民眾的響應(如非網民群體、老年者等),與群體特征覆蓋較完善的問卷調查結果存在一定誤差,但二者偏差較小,表明本文構建的多維情感響應評估方法準確性較高。
本文構建城市用戶群體的多維情感時序指標(H)、多維情感空間指標(K)和主體情感空間指標(Q),在時空維度上研究城市用戶群體疫情情感變化特征。其中,H反映用戶每天各維度的情感強度,可刻畫用戶群體的情感時序變化趨勢,由每天城市用戶群體各維度情感強度總值與當天反映該情感微博總數之比計算(式(3));K可定量反映用戶各維情感在空間單元上的分布強度,由每個空間單元內用戶群體各維度情感強度總值與該單元內反映該情感微博總數之比計算(式(4))。

(3)


(4)

已有研究表明,微博用戶發布空間信息的最大誤差為1 km左右[37]。為防止空間誤差影響分析結果,同時盡可能保證展示空間差異性,本文設定1.25 km×1.25 km 的規則格網為基本空間分析單元[38];為避免小樣本問題,本文僅考慮發布微博數大于等于10的空間單元[39]。
Q通過比較目標空間單元中用戶多維情感空間指標(K)在各維度情感的指標大小,反映該空間單元呈主導地位的一種或兩種情感維度。具體計算過程為:1)根據式(4)計算各空間單元不同情感維度的強度值;2)統計各空間單元內最高和次高情感強度值及其對應的情感維度,并計算最高和次高情感強度之差;3)繪制全部情感強度差值箱形圖[40],基于箱形圖的數值分布,將下邊緣截斷點的數值設定為情感強度閾值;4)若空間單元中最高、次高兩情感強度之差小于設定的情感強度閾值(0.3),則判定其屬于極小異常值[41],表明該空間單元最高、次高兩情感強度的差異很小,屬于兩種并列情感,將其作為該空間單元主體情感,否則,將情感強度最高值對應的情感維度作為該空間單元的主體情感(式(5))。

(5)
式中:(Kqx)max、(Kqy)2nd_max分別為空間單元g中最高強度qx情感和次高強度qy情感對應的情感強度值。
城市用戶群體疫情情感響應時序變化受多種因素影響[42]。通過微博詞頻構建詞云,可從實時、大量的微博文本中提取用戶群體討論的高頻詞匯,從而挖掘微博內容中有關社會熱點、民眾關切等主題信息,有利于識別情感變化的潛在影響因素[43,44]。因此,本文采用上述研究方法識別用戶疫情情感變化的潛在影響因素。首先,提取各維度情感局部極值發生時間點對應的微博數據;其次,通過統計微博詞頻并構建詞云對社交媒體文本進行探索;然后,根據詞云圖中的高頻詞匯推斷用戶群體情感變化潛在因素,并將因素分為政府行動、疫情發展、傳統節日以及公眾事件4類(表3);最后,分別研究4類因素對憤怒、恐懼、悲傷及喜悅四維情感時序變化的影響。

表3 群體疫情情感響應時序變化的影響因素Table 3 Factors influencing the groups′ emotional sequential changes
(1)憤怒。政府行動對用戶群體的憤怒情感響應影響顯著。如圖2所示,2020年1月27日李克強總理到武漢市考察、2021年1月12日河北省委書記調研石家莊市防控工作、1月20日石家莊市完成第三次核酸檢測等政府行動均顯著降低了用戶群體的憤怒情感強度,表明政府積極的防控措施可有效安撫城市人群的憤怒情感。武漢市疫情防控期間,1月23日武漢封城并未導致憤怒情感強度的提升,這表明當地用戶群體對武漢封城持贊同和理解態度,有力駁斥了外國媒體的歪曲報道。相反,政府相關部門行為不當卻會引起憤怒情感強度的提升,如1月3日武漢市啟動對不明原因肺炎的調查和2月1日紅十字會物資分配中存在的問題引發用戶群體產生強烈的憤怒情感響應。除政府行動外,公共事件也是影響憤怒情感強度的重要因素。武漢市疫情中,2月7日英雄人物因公殉職事件備受關注,奮斗在抗疫一線的醫務工作者犧牲,促使用戶群體產生憤怒情感;石家莊市疫情防控期間,由于個別超市哄抬物價引起民眾不滿,導致1月10日石家莊市用戶群體的憤怒情感強度達到峰值。

圖2 憤怒情感強度值的時間分布對比Fig.2 Comparison of temporal changes of anger emotion index
(2)恐懼。城市用戶群體的恐懼情感與疫情發展緊密相關。如圖3所示,2020年1月9日武漢市出現首例不明肺炎死亡病例、1月17日武漢市持續發現新冠肺炎病例等疫情相關因素引起城市用戶群體恐懼情感強度顯著提升,其中,1月17日持續發現新冠肺炎病例促使用戶群體產生最強烈的恐懼情感。1月27日,李克強總理考察武漢,使用戶群體恐懼情感得到顯著緩解;1月27日以后,由于疫情得到有效控制,武漢市用戶群體的恐懼情感波動較弱。此外,武漢封城未引起城市內用戶群體恐懼情感的劇烈變化。如圖3所示,1月5日石家莊市連續多日新增確診病例以及1月14日新增死亡病例均引起恐懼情感強度提升;1月20日,全市開展第三次核酸檢測,用戶群體恐懼情感強度顯著下降;1月30日以后,全市復工復產,城市用戶群體恐懼情感強度逐步下降。通過兩地對比發現,石家莊市微博用戶群體的平均恐懼情感強度比武漢市下降81.09%,表明在武漢市疫情得到有效控制的背景下,民眾對政府的防治措施更加信任,疫情再次暴發產生的恐懼情感強度大幅下降。

圖3 恐懼情感強度值的時間分布對比Fig.3 Comparison of temporal changes of fear emotion index
(3)悲傷。城市用戶群體的悲傷情感受城市封閉式管理以及重要人物逝世等公眾事件的顯著影響。如圖4所示,2020年1月23日武漢市封城,政府果斷的決策起到了遏制病毒傳播的作用,得到了廣大民眾的理解和支持。雖然未引發用戶群體的極端負面情感響應,但是人們依然對封城之后的生活感到憂傷。2月7日英雄人物因公殉職成為備受關注的公眾事件,奮斗在抗疫一線的烈士犧牲引起了廣大用戶群體的悲傷情感。在2021年石家莊市新冠疫情中,1月16日石家莊全市累計確診病例超過600人,達到新高,促使城市用戶群體產生悲傷情感;1月23日石家莊市分區分級管控導致用戶群體悲傷情感強度顯著提升;石家莊市解封后,該市部分過年返鄉人員的行程依舊受阻,在2月2日上升為受網絡用戶群體關注的公共事件,促使悲傷情感強度上升。

圖4 悲傷情感強度值的時間分布對比Fig.4 Comparison of temporal changes of sadness emotion index
(4)喜悅。城市用戶群體的喜悅情感強度與政府行動及傳統節日有關。如圖5所示,2020年的元旦、春節和元宵節,武漢市用戶群體的喜悅情感強度均處于高值,表明疫情防控期間傳統節日對武漢市民眾喜悅情感強度有顯著提升作用。此外,政府行動也會提升人們的喜悅情感強度,1月27日總理考察武漢促使用戶群體產生喜悅情感;2021年1月21日石家莊市調低風險等級及1月29日石家莊市解封,表明當地疫情已經得到控制,民眾生活逐步回到正軌,均促進喜悅情感強度增長;2月12日(春節期間)石家莊市微博用戶群體喜悅情感強度達到最大值。

圖5 喜悅情感強度值的時間分布對比Fig.5 Comparison of temporal changes of happiness emotion index
綜上發現:1)政府行動和公眾事件對用戶群體的憤怒和悲傷情感影響顯著,政府嚴格的疫情防控措施不僅不會引起城市內用戶群體的憤怒等負面情感強度上升,反而對用戶群體的負面情緒具有安撫作用;2)連續確診病例及死亡病例出現等疫情發展因素會顯著提升城市內用戶群體的恐懼情感強度;3)在疫情防控期間,傳統節日及政府行動對于用戶群體喜悅情感強度的提升具有一定促進作用。
由武漢市、石家莊市用戶群體的多維情感和主體情感空間分布(圖6、圖7)可以發現,相比其他情感維度,憤怒情感空間分布范圍最小,表明用戶群體的憤怒情感僅在特定空間區域內產生;其次,兩城市的喜悅情感空間分布范圍最廣且強度較高,表明在疫情防控期間城市用戶群體的積極情感仍占據主流;兩城市主體情感的空間分布顯示,喜悅情感是多數空間單元中唯一的主體情感,表明疫情防控期間城市用戶群體的主導情感是積極、正向的,且在多數空間單元中喜悅情感強度遠高于其他維度情感;武漢和石家莊市區以及部分市郊出現兩種情感共同作為主體情感的現象,這些區域內用戶群體的主導情感中包括悲傷或恐懼等負面情感,由于區域內用戶數量較多、情感響應差異較大以及研究時間跨度較長等,需要進一步加強對此區域的情感監測和分析。

圖6 武漢市群體四維情感和主體情感響應空間分布Fig.6 Spatial distribution of groups′ four-dimensional and dominant emotion response in Wuhan

圖7 石家莊市群體四維情感和主體情感響應空間分布Fig.7 Spatial distribution of groups′ four-dimensional and dominant emotion response in Shijiazhuang
本文在空間分布特征挖掘的基礎上,進一步研究城市用戶群體恐懼情感的影響因素。根據已有的武漢市新冠疫情風險模擬模型[45],探索武漢市用戶群體恐懼情感強度與新冠疫情風險水平之間的關系。通過對比圖8a與圖8b,發現風險等級較高的A、B、C、D、E區域,其恐懼情感強度值也處于高值水平,表明疫情風險可能是促使用戶群體產生恐懼情感的重要原因。除上述5個區域外,F區域的恐懼情感強度值也較高,通過解析該區域內的設施分布,發現其內部存在部分新冠確診病例收治醫院(武漢同濟醫院、武漢市第一醫院和協和醫院)。結合研究團隊實地走訪調查,發現附近居民廣泛認為收治醫院的聚集會增加其患病風險,從而導致恐懼情感強度提升。

圖8 武漢市新冠疫情風險模擬與群體恐懼情感響應空間分布Fig.8 Spatial distribution of the COVID-19 risk simulation and groups′ fear emotion response in Wuhan
本文根據已有新冠肺炎患者居住小區數據,進一步解析石家莊市恐懼情感的空間分布影響因素。如圖7所示,石家莊市疫情主要分布在主城區內、藁城區東部及正定縣機場周邊,而恐懼情感的空間分布與新冠肺炎患者居住小區的一致性較高。城區由于人口密度大,人口流動速度快,更有利于疫情擴散,雖然引起民眾情感響應的因素較多,但地理空間因素對民眾恐懼情感響應的影響作用不容忽視[3]。相關研究表明,無論是外地輸入還是本土出現的新冠肺炎感染者,都會引起感染者本人或家庭成員以及與病患有可能近距離接觸人群的緊張與擔憂[46]。因此,大規模群體的恐懼情感響應空間特征與疫情傳播有關的地理因素(如新冠肺炎患者所在小區、村鎮)分布密切相關,并且恐懼情感強度未必會因空間距離出現線性增強或衰減,而是受多種因素影響,在地理空間中呈現出情感強度差異。
綜上發現:1)疫情防控期間,城市用戶群體的憤怒情感空間分布范圍較小,喜悅情感空間分布范圍較廣,喜悅是多數空間單元中的主體情感;2)城市內用戶群體恐懼情感的空間分布與疫情風險、收治醫院、肺炎患者所在小區緊密相關。
本研究以武漢市和石家莊市為案例地,結合社交媒體數據及問卷調查數據,構建疫情防控期間城市用戶群體多維情感精確評估方法,探索城市內部疫情情感時空分布特征,進而解析多維情感影響因素。主要研究結論如下:1)本研究提出的基于疫情情感詞典的情感響應評估方法能夠精確量化城市群體疫情防控期間喜悅、恐懼、悲傷等多維情感響應強度;2)政府嚴格的疫情防控措施可有效緩解群體負面情感響應,使群體恐懼、憤怒等負面情感強度顯著下降;3)喜悅情感在疫情防控期間分布范圍最廣且強度較高,是城市群體的主體情感;4)疫情再次發生不會引起城市群體負面情感響應強度的顯著上升。
本文為增強疫情中民眾情感監測能力、提升情感治理水平,提出如下建議:1)在整個疫情發展過程中,政府部門應注重收集、發布與事件有關的信息,積累能夠反映大規模群體情感響應的資料,使面向國外的輿論宣傳更具真實性,占有主動權。2)重視在疫情高風險區域及新冠肺炎患者定點收治醫院密集分布區域的情感調節工作;根據不同地點針對性開展疫情防控工作及風險信息的精準發布,注重情感調節資源在空間上的合理分布,進一步向街道社區、居委會和村委會等基層單位部署,做好精細化的情感疏導和實際幫扶工作。3)政府等相關部門應繼續堅持嚴格的疫情管控政策,有效保護民眾的生命安全,降低民眾的憤怒等負面情感,化解疫情防控期間民眾心理情感問題。
本文研究成果豐富了目前情感響應研究的理論與方法體系,可為政府部門的疫情防控措施優化以及民眾情感治理政策制定提供科學依據。今后研究需重點考慮以下兩方面:1)引入更多維度情感,對城市用戶群體產生的疫情情感響應類型進行全面描述;2)綜合多種數據源(如面部表情數據、視頻監控數據等)挖掘人們的情感強度信息,從而支撐空間指標的時序動態分析。