□ 冒婷婷 孫新紅 湯育春 李啟明
突發公共衛生事件是指突然發生、造成或者可能造成社會公眾健康嚴重損害的重大傳染病、群體性不明原因疾病、重大食物和職業中毒以及其他嚴重影響公眾健康的事件[1]。2020年,面對突發公共衛生事件迅猛而至,我國立即采取了積極有效的防疫和治疫措施,如封鎖交通運輸、封閉式管理社區等阻止疫情更廣傳播,建設方艙醫院、調動醫療物資等治療患者。但復雜的防疫治疫措施帶來的社會影響給城市基礎設施功能帶來巨大挑戰:醫療設施能否接診所有患者、物流基礎設施壓力劇增、必要的交通管控與民眾出行矛盾,等等。面對這場大考,基礎設施能否承受極端壓力,兼顧“平疫”需求,從而保障人們在面對風險災害時期的正常生活運行,基礎設施與其供應社會服務的優劣直接關系特殊情形下城市運行與社會穩定。目前,基礎設施分類尚未得到統一,本文研究的關鍵基礎設施包括醫療、交通、物流、福利(紅十字)及社區基礎設施這五類基礎設施。面對突發事件帶來的不確定性和風險概率不斷增加,基礎設施應對危機能力和防災減災能力顯得尤為重要,基礎設施韌性概念應運而生。不同的研究人員對基礎設施韌性的內涵定義不同,但普遍認同的是把基礎設施韌性概念化為系統吸收災害事件沖擊和維持或恢復系統正常運作的能力。本文研究基礎設施系統在遭受突發公共衛生事件時具備的維持或迅速恢復其社會服務供應功能的能力,并將這種能力定義為“基礎設施社會韌性”。定量評估基礎設施社會韌性,有助于量化和提升基礎設施對災害的抵御與恢復能力,維持及改善社會服務供應功能,同時增強韌性研究的科學性和完整性。
常見的定量評估基礎設施韌性的方法之一是基于系統的性能曲線,系統性能大小是代表基礎設施提供的社會服務功能的優劣。由于社會服務功能水平的抽象性與難以度量,目前大多研究學者采用社交媒體數據進行輿情分析,以反映基礎設施社會服務優劣。但現有的輿情分析普遍采用情感分析來反映輿情的演化趨勢,缺乏對情感分析準確度的校正,也極少監測公民對基礎設施社會服務供應能力的情感傾向。面向突發公共衛生事件的基礎設施韌性研究較少關注基礎設施的社會效益,即供應社會服務的功能,且研究對象單一集中在醫療基礎設施,研究方法偏定性層面。
為此,本文針對新浪微博上網民對關鍵基礎設施社會服務供應能力的情感傾向,利用深度學習模型進行輿情分析,結合基礎設施韌性的評價模型,建立了基于情感挖掘的基礎設施社會韌性評價模型。最后以典型突發公共衛生事件為例,驗證了本文提出的基礎設施韌性評價模型的準確性;根據基礎設施韌性評價結果,給出了相應的維持或改善基礎設施社會服務供應功能的措施與建議。
“韌性”的概念最早出現在物理學研究中,Holling將韌性的概念引入系統生態學中,以定義生態系統穩定狀態的特征,其核心內涵是系統在受到外界擾動時,維持系統穩定性能,并且能在及時恢復性能的基礎上進一步提升系統性能的能力。Bruneau[2]指出韌性包含技術、組織、社會和經濟四大維度,其中社會維度關注了由于地震造成的關鍵服務損失而遭受的負面后果。基于韌性的內涵和特點,本文研究基礎設施的社會韌性,將基礎設施視為系統,基礎設施供應的社會服務水平視為系統性能,定義社會韌性為基礎設施系統受到突發公共衛生事件干擾時,應該具備的維持或迅速恢復其提供社會服務的能力。
基礎設施提供社會服務的能力難以直接獲取和評價,需通過間接的方式獲取。而基礎設施服務的對象就是群眾,群眾滿意與否可以表征基礎設施提供社會公共服務情況。當基礎設施的社會服務能力發生變化時,人們將表達自己的情緒態度,情緒被頻繁、廣泛地共享,累積形成群眾對該事件的集體情緒,本文用集體情緒來表征基礎設施的社會服務能力。集體情緒是個人在感知到具體風險后,通過情緒表達累計得到的。風險感知是個體面對特定風險時直觀的態度與感受,在經歷了自然災害、恐怖襲擊、公共衛生事件沖擊等創傷之后,個體通過共享的信息感知到具體災害的風險,之后開始分享意見[3]。人們感知風險并將意見和態度發表在社交媒體平臺上,社交媒體平臺上存儲了大量的輿情信息。
綜上,當個人感知到具體災害風險時,會通過社交媒體發表相關意見,形成輿情,輿情內含的集體情緒可以有效反應基礎設施提供社會服務的能力有效反應。研究表明挖掘社交媒體輿情信息評估損害程度具有可行性,受災害影響嚴重的地區,社交媒體活躍程度越高,且有較高的負面集體情緒[3]。因此本文依托新浪微博研究假設:受突發公共衛生事件影響嚴重的基礎設施預計會受到更高的微博關注度,并且把集體情緒視為個人情緒的同步收斂,基于集體情緒的輿情傳播反映基礎設施社會韌性的吸收—抵抗—恢復過程。
從突發公共衛生事件的輿情分析相關文獻可以看到,學者們對社交媒體輿情傳播機制和傳播模型進行深入研究。本文以突發公共衛生事件為例,基于SIR(Susceptible-Infected-Recovered)模型分析了輿情傳播相似性,結合生命周期理論,證實輿情傳播過程符合系統韌性的涌現過程。SIR傳染病模型以較為簡化的數學方式模擬傳播過程經歷的三種狀態:易感態S(處于健康狀態,但能夠被感染)、感染態I(已經被感染,具有傳染性)及恢復態R(已經被治愈個體)[4]。社交媒體輿情分析和其傳播模型有較大的相似之處,包括易感染用戶(沒有發布輿情但持續關注公共衛生事件)、感染用戶(分布或轉發相關信息)及免疫用戶(對相關信息不感興趣)。及時評估突發公共衛生事件的輿情傳播和情感傾向,對輿情的傳播控制具有較強的指導意義[5],本文將突發公共衛生事件對基礎設施社會服務功能的影響表征為公民對基礎設施社會服務功能的輿情變化。
利用生命周期經典理論,突發公共衛生事件社交媒體輿情的生命周期劃分為潛伏期、爆發期、蔓延期、恢復期、穩定期五個階段[6],且基礎設施韌性包括系統對擾動的吸收、抵抗、恢復和適應四個階段[3]。可以看出,社交媒體輿情的傳播周期符合系統社會韌性的生命周期。因此,本文以公民對基礎設施社會服務功能的輿情傳播過程來反映基礎設施韌性過程,由于目前公共衛生事件還在蔓延和擴散,系統還沒完全至適應階段,本文重點研究吸收—抵抗—恢復階段。
本文提出的基于情感挖掘的基礎設施社會韌性評價模型含數據獲取方法、情感分析方法、社會韌性評價方法等,包括了如圖1所示的若干步驟,并在下文詳細說明。

圖1 基于情感挖掘的基礎設施社會韌性評估模型
在大數據時代,社交媒體平臺的使用正在普及,龐大的用戶群體積極地在平臺上發表意見、表達情緒、共享信息,使得這些平臺儲存了海量的文本數據。新浪微博是全球最大的中文社交網絡平臺,是熱點事件發生時國人獲取信息、發表觀點、表達情感的重要渠道。
3.2.1 數據采集
第一步:采用Python語言中的自動化測試工具Selenium爬取微博數據。數據爬取前,需制定檢索詞,由于本文探究突發公共衛生事件擾動下的醫療等五類基礎設施的社會韌性,便以“擾動+基礎設施+社會服務”來確定每類基礎設施的檢索詞。本文中微博采集的時間區間為2019年12月31日至2020年3月8日:2019年12月31日,武漢市衛生健康委員會通過官網發布了情況通報;2020年3月8日,29個省區市確診病例零新增。采集的范圍包括含檢索詞的微博信息、對含檢索詞微博的評論信息與轉發信息三部分。
由于本文的研究對象是國內基礎設施的社會韌性,需要對采集的微博數據進行必要的預處理,以方便后續的內容挖掘和情緒分析工作。
3.2.2 刪除國外相關微博
第二步:刪除關于國外疫情微博,聚焦國內研究對象。根據國外情況,制定了外國地名詞典,把包含詞典內容的微博刪除,將研究對象聚焦到突發衛生事件擾動下的國內基礎設施。
3.2.3 中文分詞
第三步:采用Python的jieba中文分詞工具進行分詞。中文文本中,詞與詞之間沒有明顯的界線,需要對微博文本進行分詞處理。目前使用較多的中文分詞工具有jieba分詞、中科院NLPIR分詞等。
3.2.4 過濾停用詞和特殊字符
第四步:過濾停用詞和噪聲數據。在進行中文分詞的過程中,將會重復出現對語義無關的詞,即停用詞,如介詞、冠詞之類的詞語。為了有效節約儲存空間和提高文本分析效率,需過濾停用詞。此外,中文微博中還有一些內容對情感分析的貢獻很小,本文也將該部分噪音數據予以處理,包括:第一,刪除微博中的“@用戶名”和“#主題#”內容;第二,刪除外部鏈接;第三,刪除特殊字符和特殊文字;第四,刪除“哈哈哈”等連續重復的語料。通過上述數據清洗和過濾,最終得到規范化、可分析的有效數據,以進行后續的文本挖掘工作。
傳統的微博情感分析方法分為基于情感詞典的方法和基于機器學習的方法,前者實現簡單速度較快但精確度不高,構建情感詞典難度大;后者依賴于人工特征選擇和特征提取質量。近年來興起的深度學習方法能夠很好彌補上述不足,其不依賴于人工特征,能夠端到端地對輸入文本進行語義理解,并基于語義表示進行情感傾向的判斷。本文是采用基于Bi-LSTM的深度學習情感分析系統Senta,結合監督學習方法實現微博文本的情感分類。
3.3.1 文本表示方法
第五步:利用詞袋模型進行文本數學表示。本文利用采集的數據構建突發公共衛生事件下微博輿情語料庫,進行預處理后文本語料還需進行數學化處理,使用數字符號表示方法作為Bi-LSTM神經網絡的輸入。由于輸入到模型中的文本是一個矩陣向量的形式,因此要將文本數據進行向量化,每個詞訓練為其對應的Embedding詞向量,如[w1,w2,……]形式。
3.3.2 Bi-LSTM模型提取特征
第六步:Bi-LSTM模型進行文本深度表示。傳統的遞歸神經模型(RNN)在中文文本情感分析中無法描述序列前后的相關性,且信息不能進行持久化存儲,長短記憶人工神經網絡模型(LSTM)[7]通過引入輸入門i、輸出門o、遺忘門f和記憶單元來克服RNN模型的缺陷。遺忘門f通過sigmoid函數輸出計算結果r∈[0,1],判斷對上個LSTM單元輸出結果ht-1情感狀態的保留情況;輸入門i結合遺忘門保留部分、利用sigmoid函數計算丟棄值以及結合tanh函數得到替補丟棄值候選內容來更新神經單元,微博文本產生情感的轉折變化時,更新的內容也較多;輸出門o通過sigmoid函數選擇輸出部分,結合tanh函數實現輸出值ht。通過LSTM模型可以得到與句子長度相同的隱藏狀態序列{h1,h2,……hn-1},如圖2所示。

圖2 LSTM原理圖與Bi-LSTM模型示意圖
LSTM可以通過記憶單元解決長距離依賴問題,但在傳統的RNN和LSTM模型中,信息只能向前傳播,時間t的狀態僅依賴于時間t之前的信息,為了使每個時刻都包含上下文信息,本文采用雙向長短期記憶神經網絡模型Bi-LSTM捕獲上下文信息,進行文本特征提取。Bi-LSTM模型中前向輸出向量和反向輸出向量的計算與單向LSTM中的輸出相同,但最終輸出的文本的特征向量由前向輸出向量和反向輸出向量合并而得。
3.3.3 標注語料庫作為訓練語料
第七步:標注訓練語料進行監督學習,提高置信度。本研究人工標注部分已知情感極性的微博文本語料庫,加入訓練集中。大量的標記樣本可以供深度神經網絡模型進行監督訓練,訓練出高效的分類器后,再對新的文本進行分類,提高情感分類的置信度。
3.3.4 情感計算及情感極性判斷
第八步:情感計算及情感極性判斷。由Bi-LSTM模型得到微博文本深度表達后,將輸出值作為分類器的輸入,得到最終分類結果。本文采用Softmax分類器進行分類,Softmax歸一化指數函數是將Bi-LSTM全連接層的多個輸出,映射到(0,1)區間內,且保證所有元素之和為1。Softmax函數通過Python語言編程實現。
計算softmax函數值作為微博文本的情感預測最終結果,文本情感極性的判斷標準是Softmax值在0~0.4區間為負面情感;0.4~0.55區間內為中性,0.55~1區間內正面情感。
本文使用基礎設施韌性三階段(吸收—抵抗—恢復)分析框架[8]來定量評估基礎設施的社會韌性,具體包括繪制系統性能曲線圖和利用公式計算基礎設施社會韌性。
3.4.1 繪制系統性能曲線圖
第九步:依據真實系統性能數據繪制性能函數曲線。系統性能水平可以使用不同的度量標準來衡量,本文中基礎設施系統性能量化為突發公共衛生事件期間五類基礎設施相關的微博文本的集體情感值,以反映基礎設施提供的社會服務功能優劣。本模型是使用真實的系統性能數據分別繪制五類基礎設施的性能函數曲線圖,如圖3所示。

圖3 基礎設施系統性能曲線圖
3.4.2 計算5類基礎設施的社會韌性
第十步:利用公式計算基礎設施的社會韌性。本模型基于系統性能函數曲線圖,計算受災后性能曲線與時間軸所圍合的面積與正常情況下機能曲線與時間軸圍合面積的比值作為衡量韌性的標準,計算公式如下:

式中,R代表基礎設施社會韌性值,P(t)是基礎設施受擾動后實際性能函數,TP(t)是基礎設施常態性能函數,為常數值;展開后的公式中n代表擾動的次數,A(n)代表該次擾動下系統性能與常態性能圍成的實際損失的面積值。
3.4.3 利用關注度集成基礎設施社會韌性
第十一步:結合關注度集成計算社會韌性值。基礎設施社會韌性評價模型最后是引入比率指標K來集成各類基礎設施的社會韌性值R,比率指數是反應公眾對各類基礎設施的關注程度,計算公式如下,其取值范圍是0~1,高比率指數意味著公眾對某類基礎設施高度關注。

利用Python技術收集到五類關鍵基礎設施社會韌性的相關原創微博數據量共22350條,微博評論數共259620條。為提高數據分析效率,對數據進行預處理操作,步驟包括方法論詳細描述的刪除國外微博、過濾停用詞等。最后收集的“微博+評論”數據共278267條。
情感分析是利用深度學習模型,對收集到278267條數據逐條輸出情緒分值和置信度值,并通過標記樣本進行監督訓練,提高模型的置信度。情感分析模型的準確率達0.862,即可采納該模型的情感分析結果。
本文以集體情緒來反映基礎設施提供社會服務的能力,對微博數據按時間匯總得到每日集體情緒。考慮到每日微博數量參差不齊,本文選取當日微博及評論總量達200條及以上的當日情緒值,認為其涌現了集體情緒;依據集體情緒涌現過程性,未涌現集體情緒的當日情緒值以附近日期的集體情緒值代替。
本文基于微博情感分析結果與韌性評價模型,繪制了五類基礎設施社會韌性的性能函數曲線圖,如圖4至圖8所示。各類基礎設施的性能曲線圖中的韌性研究時間段與具體擾動事件,社會韌性值的計算如表1所示。

圖4 紅十字基礎設施系統性能曲線圖

圖5 交通基礎設施系統性能曲線圖

圖6 物流基礎設施系統性能曲線圖

圖7 社區基礎設施系統性能曲線圖

圖8 醫院基礎設施系統性能曲線圖

表1 各類基礎設施性能曲線研究時間段與擾動事件
綜上,集成各類基礎設施的社會韌性值R=∑Ri*Ki=0.744。
以突發公共衛生事件為例,基于情感挖掘的基礎設施社會韌性評價結果表明在應對突發事件時,基礎設施社會韌性處于相對較高的水平,其可以較快適應擾動事件,并采取措施恢復性能,正常提供基礎設施社會服務。交通基礎設施受突發公共衛生事件影響相對較小,影響中等的醫院設施,社區設施采取了快速的恢復措施,包括醫院基礎設施在無法滿足接診容量時,參照抗擊非典時“北京小湯山醫院”模式快速建成火神山、雷神山等特殊性質的應急醫院,集中收治患者;社區設施集中力量,結合大數據有效實現不同階段的突發公共衛生事件防控。而相對影響較大的紅十字設施、物流設施在此期間持續恢復社會服務功能,紅十字福利設施問題一經爆發,紀檢監察機關嚴肅追責問責,強化監督以及紅十字總會親自指導工作,恢復紅十字社會物資管理的社會服務功能;物流設施因交通管制、突發公共衛生事件防控等要求受影響時間較長,但通過無接觸配送等先進科技手段逐漸恢復運輸快遞的服務功能。
基礎設施抵抗突發公共衛生事件擾動的全過程中,仍然存在提升空間來優化基礎設施韌性。例如,通過合理安排城鄉客運交通彈性運行與豐富交通運輸應急管理手段來提升交通基礎設施和物流基礎設施韌性能力;投入必要的資源來建設韌性社區,使得社區面對突發事件時具備維持基本運營的能力;從城市規模、傳染病暴發概率等多方面綜合考慮,將傳染病醫院設施作為城市應急系統不可或缺的一項內容進行獨立建設,使醫院基礎設施具備抵抗重大災害的韌性能力。
以上是本文的初步研究成果,研究基礎設施經受自然災害、恐怖襲擊、突發公共衛生事件等擾動事件后的韌性能力,有助于我們審視我國基礎設施在面對不同類型擾動時系統功能的不足,從而不斷完善基礎設施性能,實現建成適應力高、恢復力強的具有“韌性”的城市基礎設施的目標。至此,基礎設施韌性問題后續有待于進一步深入分析與探究。