黃 志 輝,黃 波,,汪 炯 驊
(1.西南交通大學地球科學與環境工程學院, 四川 成都 611756;2.香港中文大學地理與資源管理學系,香港 999077)
自2020年3月11日世界衛生組織將新冠肺炎(COVID-19)定義為全球大流行以來,世界各國將限制人口流動作為防控疫情蔓延的主要措施[1,2]實施后,多數國家COVID-19傳播率出現不同程度的降低[2-4]。因此,研究人口流動對COVID-19傳播的驅動效應對地區疫情防控具有重要意義。目前,人口流動對COVID-19傳播的影響得到廣泛關注[5,6]。Saez等[3]利用廣義線性模型(Generalized Linear Model,GLM)研究西班牙人口流動對COVID-19疫情的影響,發現實施封鎖措施后COVID-19新增病例下降3.05%;趙梓渝等[4]利用傳染病動力學模型評估我國人口流動限制對控制COVID-19傳播的有效性,發現人流限制使我國新增感染病例波峰日推遲1.9倍;Badr等[7]利用普通最小二乘(Ordinary Least Square,OLS)模型研究美國COVID-19疫情的影響因素,發現多個縣的人口流動變化與COVID-19傳播率顯著正相關;Xu等[8]基于OLS模型和地理加權回歸(Geographical Weighted Regression,GWR)模型研究發現,武漢市流出人口對其他城市COVID-19病例的影響存在空間異質性。然而,人口流動和疾病傳播存在時空聚散模式[9,10],既有研究僅從單一空間或時間維度探究兩者的關系,忽略了人口流動對疾病傳播影響的時空異質性[11,12];同時,現有研究主要關注總體人口流動變化對疫情擴散的影響,缺乏對不同場所人流效應的探討。鑒于此,本文基于Google人口流動大數據,結合時空地理加權回歸(Geographical and Temporal Weighted Regression,GTWR)模型,定量探究不同場所人流對COVID-19傳播影響的時空機制,以期為我國疫情風險評估、防疫資源和力量的時空配置以及政策優化等提供理論和實踐參考。
截至2020年11月30日,美國COVID-19累計確診病例13 348 058人,累計死亡264 362人,是全球確診人數和死亡人數最多的國家[13]。作為世界第一大經濟體,其疫情發展很大程度上影響著全球疫情的走向和經濟發展,故本文選取美國本土49個州作為研究區(不包括阿拉斯加州和夏威夷州,并將哥倫比亞特區看作一個州)。
(1)COVID-19病例數據,來自美國疾病控制與預防中心,該數據集包含自發現第一例病例以來各州每日累計確診病例。本文選取時間段為2020年3月1日-11月30日(圖1),利用當天累計病例減去前一天的累計病例,并考慮地區病例上報的延遲性,采用7天窗口滑動平均對數據進行平滑[14],從而獲得當日新增確診病例。

圖1 2020年美國累計確診病例和每日新增病例Fig.1 Cumulative confirmed cases and daily new cases in the United States in 2020
(2)Google人口流動數據[15],反映美國各州疫情防控期間與疫情暴發之前不同場所人口流動強度隨時間的變化,基線值為2020年1月3日-2月6日每周相應時間的中位數,正值表示流動性增加,負值表示減少(圖2)。場所分為:零售與娛樂場所,包括餐廳、購物中心和電影院等;藥店與雜貨店,包括雜貨市場、農貿市場和藥店等;公園,包括國家公園、公共海灘和公共花園等;交通站點,包括地鐵、公共汽車站和火車站等;工作場所,包括公司、辦公處等;住宅區,包括居住小區、公寓等。

圖2 2020年美國阿拉巴馬州人口流動強度變化Fig.2 Changes in population mobility intensity in Alabama in 2020
(1)COVID-19實時傳播率(Effective Reproduction Number,Rt),指在易感和非易感人群中,單個病例會產生的平均二級病例數[16]。假設當前傳播率與之前每天的傳播率存在相關關系,基于貝葉斯定理,可利用每日新增確診病例估計傳播率[17],計算公式為:
P(Rt│k)=P(k│Rt)P(Rt)/P(k)
(1)
P(k│λ)=λke-λ/k!
(2)
λ=kt-1eL(Rt-1)
(3)
P(k│Rt)=λke-λ/k!
(4)
式中:P(k│Rt)為給定傳播率的時間點觀察到k個病例的可能性;P(Rt)為研究開始時對P(Rt)的先驗信息;P(k)為某天觀察到k個病例的概率;L為連續時間間隔的倒數,根據流行病學研究,連續時間間隔一般被認為是7 d[5,18,19]。
(2)地理加權回歸(GWR)模型。GWR模型以傳統回歸模型為基礎,嵌入數據的空間特性,可對模型參數的空間局部變異進行估計[20,21],計算公式為:
yi=β0(ui,vi)+∑βk(ui,vi)xik+εi
(5)
(6)
w1ij=exp[-(d1ij/h1)2]
(7)

(3)時間加權回歸(Temporal Weighted Regression,TWR)模型。與GWR模型不同, TWR模型僅考慮各參數在時間維度上的變化,計算公式為:
yi=β0(ti)+∑βk(ti)xik+εi
(8)
(9)
w2ij=exp[-(d2ij/h2)2]
(10)

(4)時空地理加權回歸(GTWR)模型。該模型在GWR模型上進一步拓展,同時考慮參數在空間和時間上的變化,揭示因變量與自變量的關系如何隨時空變化而改變[22,23],計算公式為:
yi=β0(ui,vi,ti)+∑βk(ui,vi,ti)xik+εi
(11)
(12)
(13)
w3ij=w1ij×w2ij
(14)
式中:(ui,vi,ti)為樣本點i的時空位置;β0(ui,vi,ti)為截距;βk(ui,vi,ti)為回歸系數;W3(ui,vi,ti)為時空權重矩陣,其對角線元素w3ij為點i與j的時空權重;d3ij為點i與j的時空距離;λ和σ分別為用于平衡空間距離和時間距離的比例因子。
2.1.1 時間演變特征 利用式(1)-式(4)得到美國49個州275天的13 475個COVID-19傳播率值。依據“地區當日傳播率是否大于1”可判定疫情是否得到控制[16],故本文將傳播率大于等于1的時間點定義為“風險日”,以評估不同地區疫情發展狀況。2020年3-11月美國共計200天為“風險日”,占比73%,說明美國COVID-19長時間處于快速傳播狀態。如圖3所示,從傳播率均值的時間變化看,“風險日”集中于3個階段:第一階段為3月至4月初,原因在于疫情暴發初期,政府未采取有效應對措施,民眾對疾病還未形成防范意識[2,3],而在各州政府相繼出臺封鎖政策之后,傳播率迅速下降;第二階段為5月中旬至7月中旬,主要是因為5月開始,美國多個地區爆發“反封鎖、反口罩”游行,加之政府對疫情形式的誤判,為保證經濟發展,滿足民眾正常出行訴求,各州相繼解除封鎖政策,導致疫情迅速反彈[24,25];第三階段則從8月初持續到11月,這期間美國大規模舉行總統競選演講集會,加劇了人口聚集,導致疫情進一步擴散[26]。

圖3 2020年美國COVID-19實時傳播率時間變化趨勢Fig.3 Time trend of the effective reproduction number of COVID-19 in the United States in 2020
2.1.2 空間演變特征 根據每月“風險日”天數將各州劃分為5個風險等級:極低(0~6 d)、較低(7~12 d)、中等(13~18 d)、較高(19~24 d)、極高(25~31 d)。由每月不同風險地區的空間分布(圖4)可以看出,極高風險地區數量呈現“上升—下降—上升—下降”變化特征,總體數量急劇增加,這與政府政策和防疫態度存在很大關系。3-4月疫情暴發初期,極高風險區從零星8個向周圍擴散,增至23個;4-7月經過第一輪封鎖,5月下降至8個,政府隨即解除封鎖,極高風險區數量迅速反彈,上升至28個;7-10月極高風險區經過8月降至8個后,美國2020年總統競選演講在全國各地舉行,極高風險區飆升至44個,幾乎覆蓋美國本土全境;11月北部部分州開始實行第二次人流封鎖措施,極高風險區降至30個,北部疫情有所緩解。

圖4 2020年3-11月地區風險等級空間分布Fig.4 Spatial distribution of regional risk levels from March to November in 2020
2.2.1 不同模型參數估計結果對比 本文以7 d為時間間隔對數據進行采樣,并根據疾病潛伏期設置一周時間延遲[18,19,27],對比OLS、GWR、TWR和GTWR各模型回歸結果(表1)發現:GTWR模型的殘差平方和(RSS)和赤池信息準則(AICc)最低,調整R2最大,可解釋美國COVID-19疫情變化的79.0%,表明該模型的擬合結果最優。OLS模型的擬合優度較低(43.8%);GWR和TWR模型的調整R2分別升至0.625和0.727,AICc值分別降至4 263.25和3 506.86,說明人口流動對COVID-19傳播率的影響作用存在時空異質性,并且時間異質性強于空間異質性。同時,殘差Moran′sI指數表明各模型殘差均存在顯著空間正相關,但3種局部回歸模型的該項指數遠低于OLS模型,且GTWR的殘差Moran′sI指數最小,表明在分析時空異質性和處理殘差空間自相關問題上,GTWR模型優于其他3種回歸模型。綜上所述,基于本案例GTWR模型在描述COVID-19傳播率及其影響因子的時空非平穩性上更理想。

表1 模型回歸結果對比Table 1 Comparison of regression results of different models
2.2.2 人口流動作用系數統計 對GTWR模型回歸系數的最小值、均值和最大值進行統計(表2),所有樣本點均在95%置信區間內顯著。零售與娛樂場所、藥店與雜貨店、交通站點和工作場所的平均回歸系數分別為0.125、0.020、0.461和0.598,表明這4類場所人口流動對COVID-19傳播具有顯著促進作用;公園和住宅區的平均回歸系數分別為-0.038和-0.176,表明公園和住宅區對疾病傳播具有顯著抑制作用。住宅區流動性增加,表明人們在疫情防控期間減少出行,因而有效減少了疾病傳播;同時,有研究發現綠色暴露度增加會導致COVID-19傳播率下降[28],國家公園、公共花園等是城市中綠化設施最集中的場所,對疾病傳播起抑制作用。此外,根據平均回歸系數的絕對值大小可以看出,工作場所人口流動是美國COVID-19傳播率變化的最主要驅動因素,其次是交通站點、住宅區和零售與娛樂場所,公園和藥店與雜貨店則影響微弱。

表2 GTWR模型各變量回歸系數描述性統計Table 2 Descriptive statistics of regression coefficients for each variable in the GTWR model
2.2.3 作用系數空間變化特征 將不同場所人口流動作用系數分為高值、次高值、中值、次低值和低值5個等級進行可視化(圖5)。零售與娛樂場所(圖5a)的作用系數由西向東遞減,西部呈現促進作用,東部呈現抑制作用,造成這一差異的原因是西部地區人口稀少,低層建筑較多,在零售與娛樂場所產生高聚集的情況普遍,人口流動對疾病傳播的促進作用表現更顯著[29]。藥店與雜貨店、公園、工作場所和住宅區(圖5b、圖5c、圖5e、圖5f)在美國東南部地區均呈現最強促進作用,而對西部地區促進作用最弱,甚至表現為抑制作用,原因在于:相比于西部地區,東南部人口密度更高,從而導致人們密切接觸的可能性更大[29];同時,東南部各州(如佛羅里達州、密西西比州和南卡羅來納州等)均為共和黨的支持州,美國前總統特朗普在疫情防控期間一直推行放開流動管制和“拒絕佩戴口罩”政策,支持者對其政策的擁護和踐行導致出行時被感染的概率大大增加,而西部則是民主黨的支持州(如華盛頓州、加利福尼亞州和內華達州等),這些地區的大多數民眾能遵守社交疏離措施和堅持戴口罩出行,所以人口流動對西部地區傳播率的促進作用較弱,甚至呈現抑制作用[30]。對所有州而言,交通站點人口流動均表現出對傳播率的促進作用,強度呈現由西向東“低—高—低”格局,由東部和西部向中南部收縮增大,究其原因:首先,美國南部地區民眾出行方式多傾向于公共交通,從而增加了傳播風險[31];其次,南部得克薩斯州、路易斯安那州和俄克拉荷馬州民眾對戴口罩、社交疏離等防疫措施非常排斥,因而增大了人口流動帶來的感染風險。

圖5 不同場所人口流動作用系數的空間分布Fig.5 Spatial distribution of effect coefficients of population mobility for different sites
2.2.4 作用系數時間變化特征 利用箱型圖對各因子作用系數的逐月變化趨勢進行可視化(圖6)可知:3-6月零售與娛樂場所的人口流動對傳播率呈明顯的促進作用,但強度逐月遞減,7月降至負數后,8月反彈為正值,隨后保持相對平穩直至11月;藥店與雜貨店的作用系數呈現近似“倒U形”變化趨勢,3-7月系數從0.066升至0.325,并且作用系數的分散性逐漸增加,說明空間異質性逐漸擴大,7-11月作用系數逐漸降至-0.050,空間異質性遞減。公園、工作場所和住宅區的作用系數均呈下降—上升—下降的“倒N形”變化趨勢,并且變化的拐點與美國防疫政策實施時間重合,3月初國家和各州頒布“封鎖令”,5月系數下降至最低點;隨著5月各州陸續重新開放,作用系數逐漸遞增,最后第二次“封鎖令”實施,11月全部降至負數,呈抑制作用;同時,工作場所和住宅區作用系數的空間異質性與大小變化呈同步性(共同增加和減小),而公園則表現為異步性。3-11月交通站點作用系數中位數均為正數,說明交通站點人口流動對疫情擴散影響明顯,并且呈上升—下降—上升的“N”形變化趨勢,表明疾病傳播到一定程度,交通站點的促進作用會減弱,存在邊際遞減效應。

圖6 不同場所人口流動作用系數的時間變化Fig.6 Temporal variation in effect coefficients of population mobility for different sites
本文運用GTWR模型,基于COVID-19病例數據和Google人口流動數據,探究了美國COVID-19疫情的時空演變,并對不同場所人口流動對COVID-19傳播率影響的時空模式進行了定量分析。結果表明:1)截至2020年11月30日,美國COVID-19疫情總體呈現逐步嚴重趨勢;2)相比OLS模型、GWR模型和TWR模型,GTWR模型能更精準揭示不同因子的時空驅動效應;3)零售與娛樂場所、藥店與雜貨店、交通站點和工作場所的人流對COVID-19傳播呈現促進作用,而公園和住宅區人流呈抑制作用,其中工作場所人流是最主要的驅動因素;4)除零售與娛樂場所外,其余場所人口流動對美國COVID-19傳播率的作用系數呈現“西低東高”的空間分布格局。
美國在經濟、醫療資源、科技等方面相對于我國優勢明顯,但自2020年以來,其COVID-19新增確診、重癥及死亡病例居高不下,這與美國松散的防疫政策和民眾消極的防疫態度有很大關系,為我國應對突發性公共衛生事件提供了警示。探究美國疫情發展的時空演變以及人口流動對其影響的時空差異,有助于我國公共衛生部門在日后的COVID-19疫情或其他公共衛生事件中快速識別主要驅動因素,以最低的防疫成本獲得最好的防疫成效。相比已有的人口流動對COVID-19傳播影響研究,本文的主要貢獻在于:1)突破了傳統研究模型未考慮人口流動對COVID-19影響的時空非平穩性的局限性,從時空角度挖掘不同地區影響力的維度差異性;2)傳統的人口流動數據往往僅包含地區總體人流強度,而本文將人口流動劃分為不同場所,提升了研究結果的多維性和細致性。
本文存在以下不足:1)受數據限制,僅從各州內部分析不同場所人口流動強度與COVID-19傳播率的時空關系,缺乏對跨地區人口流動影響的探索。2)本文采用GTWR模型,重點關注人口流動對新冠傳播影響力的時空非平穩性,尚未考慮這種非平穩性在不同時空尺度上的差異。盡管多項研究顯示多尺度地理加權回歸(Multiscale Geographical Weighted Regression,MGWR)模型對空間異質性的建模能力優于GWR模型[21,32,33],但同時考慮時空維度時,GTWR的擬合效果卻優于MGWR[33];同時,就本文研究案例而言,在大數據量的情況下多尺度時空地理加權回歸(Multiscale Geographical and Temporal Weighted Regression,MGTWR)模型復雜度高,計算速度緩慢[33],難以在有限的計算資源下完成求解。因此,運用MGWR/MGTWR模型探索不同時空尺度上的非平穩性差異將作為后續重點研究方向。