余 正,黃加坡,陳袁芳,陳炳蓉,徐 剛,王 晶,龍 程
(1.溫州設計集團有限公司,浙江 溫州 325000;2.鹿城區人民政府,浙江 溫州 325000;3.中南大學地球科學與信息物理學院,湖南 長沙 410083)
2019年底,武漢市衛健委通報我國首例新型冠狀病毒肺炎病例,隨之而來的春節期間“返鄉潮”進一步增大了病毒大范圍傳播風險[1]。捕捉疫情時空傳播規律,能夠輔助相關政府部門科學制定針對性的疫情防控方案,從而最大限度控制疫情蔓延,減少疫情對社會、經濟等方面的負面影響[2]。
目前,國內外眾多學者對疾病時空分布格局演化分析進行了深入研究,主要集中在:①基于區域統計的方法。該方法首先對研究區域按照行政區或規則形狀劃分成若干單元,進一步按照時間序列統計每個單元的疾病數據,分析疾病數量、位置等屬性的時空變化規律。如文獻[3]在小區尺度繪制平均中心點演變軌跡,發現深圳市疫情防控中心點集中在龍華區、南山區和福田區且呈逆時針演變;文獻[4]通過對我國城市每天疫情確診、死亡和治愈專題屬性進行分類,分析3個屬性的時空變化;中國疾病預防控制中心官方網站以全國和各省市為單元,統計區域內的病例數據[4]。②基于聚類的方法,相關研究表明地理現象具有空間相關性和空間異質性[5-6],然而基于區域統計的方法缺乏對疾病數據的空間約束,難以深層揭示疾病時空演化規律,因此有學者基于聚類的思想探索疫情時空演化過程。現有疾病空間信息具有面和點兩種表達方式。針對疾病面數據,Moran’s I[7]、Getis’s G*[8]和LISA[9]等指標是探測數據空間分布的常用統計量。針對疾病點數據,文獻[10]使用核密度估計算法和時空掃描統計方法分析杭州市多類型疾病時空熱點分布變化情況;文獻[11]采用空間掃描統計探測埃塞俄比亞南部結核病每年的聚集分布格局,結合2007—2016年多年份數據分析其聚集趨勢變化。
通過分析發現,現有基于區域統計的方法和針對疾病面數據聚類的方法對區域劃分規則敏感,且我國目前亟需在有效防控疫情的前提下,努力保持城市和經濟平穩運行,因此需要從微觀層面剖析我國此次COVID-19疫情的時空演化規律。對此,本文根據溫州市疫情態勢,提出一種結合先驗知識的DBSCAN自適應聚類方法,分析其疫情時空分布格局演化過程,以輔助溫州市政府部門更精細地部署疫情防控措施。
本文采用的溫州市確診病例數據和基礎地理信息數據由溫州市大數據管理局、自然資源和規劃局、鹿城區人民政府提供,確診病例數據時間范圍為2020年1月5日至2月7日,共計438例。每個確診病例記錄了確診病人的發病地點、出生日期、性別、職業和發病時間等信息,發病時間屬性分辨率為天。
DBSCAN是一種經典的基于密度且對噪聲穩健的空間聚類算法,旨在將具有足夠密度的區域劃分為一個簇,能夠發現任意形狀的空間簇[12]。首先給出DBSCAN的相關定義。①核心點:以空間點Xi為圓心,若其空間半徑ε范圍內至少有NminP個空間點,則稱空間點Xi為核心點;②噪聲點:若空間點Xi既不是核心點,也不在核心點的空間半徑為ε的范圍內,則稱空間點Xi為噪聲點;③直接密度可達:若空間點Xh在核心點Xi的空間半徑為ε的范圍內,則稱Xh由Xi直接密度可達;④密度可達:存在核心點P1,P2,…,Pn,Pi+1由Pi(1≤i≤n-1)直接密度可達,且空間點Xj由Pn直接密度可達,則稱Xj由P1密度可達;⑤密度相連:若空間點Xk和Xm均由核心點Xi密度可達,則空間點Xk和Xm稱密度相連。
DBSCAN算法將密度相連的空間點的最大集合定義為空間簇,主要包括兩個步驟:①掃描區域中的全部空間點,構建核心點集合,選取未標記為任何簇的一個核心點,搜索所有與其密度可達的空間點集合,構成一個空間簇;②逐步選擇另一個沒有加入任何空間簇的核心點,生成下一個空間簇,直到所有核心點均被標記,將未加入任何空間簇的空間實體標記為噪聲點。
DBSCAN通過空間半徑ε和密度閾值NminP兩個參數描述數據空間分布緊密程度,在缺乏相關領域先驗知識的前提下,難以設置合適的參數值。因此,本文結合數據分布,實現DBSCAN參數自適應設定。
由于城市居民日常活動軌跡存在時空交集,因此COVID-19可以通過呼吸道在人群中迅速傳播,其中這一空間交集點稱為傳播中心。在疫情傳播過程中,距離傳播中心越遠,感染概率越小。溫州市衛健委表明,甌海區和鹿城區多起確診病例均是由確診病人在鹿城區銀泰世貿店就職或購物引起。本文通過分析甌海區和鹿城區確診病例距銀泰世貿店距離的頻數和累計頻率分布,發現半徑為9 km的范圍內包含90%確診病例,因此,本文將空間半徑ε設置為9 km。進一步結合DB指數[13]確定參數密度閾值NminP。給定空間半徑ε和密度閾值NminP,聚類結果的DBI計算公式為
DBI(ε,NminP)=
(1)
式中,M為聚類結果的空間簇數量;avgDist(Ci)和avgDist(Cj)分別為簇Ci和Cj內空間點與各自簇中心距離平均值;ui和uj分別為簇Ci和Cj中心;d()為距離函數。DBI指越小,聚類結果越好。給定多個密度閾值候選值,使得DBI最小的NminP為最優值。
溫州市確診病例數據時間分布如圖1(a)所示,1月5日起確診病例數量持續上升,于1月25日達到峰值,處于疫情暴發期。隨著武漢“封城”及相關防疫工作展開,1月25日之后確診病例逐漸減小,COVID-19態勢得以控制。圖1(b)為采用本文方法得到的空間聚類結果,共有5個聚類空間簇,空間簇1—5中分別包括125、31、48、114和13例確診病例。

圖1 溫州市確診病例時空分布
由于空間簇5確診病例數量較少,因此本文針對空間簇1—4,分析確診病例性別、年齡和職業屬性結構。通過分析空間簇的性別屬性結構,發現各個簇中男女發病率相近。圖2和圖3分別為4個空間簇中確診病例的年齡和職業屬性玫瑰圖。分析發現:①整體上,溫州市新型冠狀病毒易在處于40~59歲壯年人群中傳播,其中空間簇1、3和4中20~39歲的青年人群也具有較高的確診數量。青壯年人群相比于其他年齡段人群交際頻率較高,接觸人員混雜,導致這兩類人群具有較高的確診數量,因此溫州市政府需要加強對青壯年人群的管控力度。②所有職業中商業服務人群確診病例數量較多,其中空間簇1和3中此類人群占比尤其高(39例和18例)。此類人群確診數量大主要包括兩個原因,一是由于我國疫情暴發源頭武漢市內有大量溫州戶籍商人,其在武漢市內頻繁的人群接觸增大了感染風險;二是本次疫情暴發于春節期間,居民購買能力提升,各大商場人群聚集程度增大,導致商業服務人員具有較大感染風險。③圖3中空間簇2和4位于樂清市內,農民和工人類人群確診數量顯著高于其他職業人群。傳染病動力學模型表明,疫情擴散與區域人口數量和傳染率等密切相關,其中傳染率與人群接觸次數(即人群流動強度)密不可分,區域中政府宣傳力度、防控措施以及居民重視程度等因素決定城市內部人群流動強度。由于12個研究區域均位于溫州市內,其政府宣傳力度、防控措施基本處于同一水平,結合溫州統計年鑒公布的2018年末人口數據[14],可以發現,瑞安市常住人口(125.34萬人)與樂清市相近(130.89萬人),然而瑞安市確診病例(70例)顯著低于樂清市(145例),這是由于樂清市內農民和工人防范意識較差,從而導致疫情在該區域內肆意蔓延。因此,建議溫州市政府著重加強對農民和工人進行防控意識教育。

圖2 空間簇確診病例年齡屬性玫瑰圖

圖3 空間簇確診病例職業屬性玫瑰圖
依據國家衛健委公布的COVID-19潛伏期最長14 d,多為3~7 d的知識,以3 d為步長,將溫州市疫情數據劃分為12個時間片段,進一步采用本文方法識別每個片段中的疫情聚集模式。結果表明,1月5日至1月10日以及2月7日共計3個時間片段中無聚集現象,其他9個時間片段中確診病例空間上均具有聚集現象。下面通過分析9個時間片段中空間簇中心點的時空變化規律,揭示溫州COVID-19時空演變過程。
圖4展示了9個時間片段的空間簇中心分布,分析發現:①空間上,空間簇中心點主要分布在鹿城區、樂清市和瑞安市,其中鹿城區空間簇中心點持續分布于銀泰商貿附近,樂清市中心點分布于凱達國際城商貿中心、名爵酒店(飛虹南路店)以及鑫晶大酒店附近,瑞安市中心點分布于時代廣場購物中心附近。②時間上,空間簇中心點數量整體呈現先增加后減小的趨勢,結合COVID-19潛伏期最長14 d的知識,1月23日武漢“封城”前輸入至溫州市的病例將于2月3日全部確診,2月4日起空間簇中心點數量明顯降低,表明我國采取的武漢“封城”措施有效從源頭上切斷了疫情傳播。③時空上,鹿城區和樂清市在整個疫情期間空間簇中心點數量較多,且空間偏移程度較小,因此兩個地區疫情暴發點持續且集中;瑞安市和平陽縣在疫情前中期(1月5日至2月3日)確診病例快速增長,后期(2月4日至2月7日)得以控制;龍港市、永嘉縣和文成縣在疫情中期(1月20日至2月3日)出現短時間聚集性暴發。由于研究區域一定范圍內疫情暴發持續時間越長,則該范圍內空間簇中心點數量越多,其點密度越大,因此本文對所有空間簇中心進行核密度估計,從而發現溫州市疫情傳播潛在高風險地區,結果如圖5所示。通過分析核密度結果發現,溫州市存在3個明顯空間熱點,分別位于鹿城區銀泰商貿附近、瑞安市西部(時代廣場購物中心附近)及樂清市南部(凱達國際城商貿中心附近),這3個區域疫情傳播風險較高;此外,永嘉縣、樂清市中北部、文成縣、平陽縣和龍灣市均探測到多個低密度熱點,這些地區疫情持續周期較短,感染人數較少,疫情發生后防疫措施到位,控制得當,傳播風險降低。綜上所述,本文建議溫州市在后續防疫工作中針對圖5中的鹿城區、瑞安市和樂清市潛在高風險區域進行重點防控。

圖4 空間簇中心點時空分布

圖5 空間簇中心點核密度估計
感知COVID-19疫情時空分布格局,分析疫情時空演化規律對制定有效的疫情防控措施具有重要作用。本文結合疫情傳播先驗知識,利用DBSCAN自適應聚類算法,分析溫州市新冠肺炎疫情的時空分布格局與演化過程。研究表明:①溫州市男女發病率相近,疫情擴散與人群性別屬性無關;COVID-19主要在交際頻率較高,接觸人員混雜的20~59歲青壯年人群傳播;商業服務人員感染比例明顯大于其他職業人員,樂清市區域內農民和工人防疫意識較差,此類人群感染率高于其他職業人員。②以2月4日為時間節點,溫州市空間簇中心點數量在時間上呈現先增加后減小的趨勢,表明控制人群流動能夠有效阻斷疫情的傳播。③永嘉縣、樂清市、文成縣、平陽縣和龍灣市先后出現多個位置的短時段疫情暴發,疫情傳播風險較低;而鹿城區銀泰商貿、樂清市凱達國際城商貿中心、瑞安市時代廣場購物中心及其附近區域被識別為疫情高風險區域,需要政府加強相關防疫措施實施力度。
本文從地理學視角分析城市內部疫情分布格局演化,精細感知疫情演變過程,以輔助相關政府部門科學制定針對性的疫情防控方案。下一步,將結合確診病例移動路徑評估區域內疫情傳播風險,以期能夠為傳染病的傳播和防治提供更有價值的參考。