陳 璐,朱大明
(昆明理工大學國土資源工程學院,云南昆明 650093)
鼠疫是一種人畜共患的傳染性疾病,其病原體為鼠疫桿菌(Yersiniapestis),主要宿主為嚙齒類動物,傳播媒介為跳蚤[1-3]。作為長期穩定存在的自然疫源性疾病,實踐證明,鼠疫只能控制,無法根除。在自然疫源地內,宿主種群密度一旦恢復,在特定環境下鼠疫可能繼續流行,甚至蔓延到人群中。近年來,世界人口飛速增長、城市面積加速擴張,使得人類對鼠疫自然疫源地的侵擾和破壞不斷加劇,人類與鼠疫動物宿主的接觸愈發頻繁。作為威脅世界人類生命健康的第四大傳染性疾病,鼠疫已成為威脅人類生命健康的巨大隱患。
目前人們對鼠疫時空傳播規律仍缺乏充分認識,為更好地控制與預防鼠疫的流行,空間流行病學通過融合時空統計分析方法、傳統統計回歸模型、傳染病動力學模型、生態位模型等,在鼠疫傳播機制探索、危險因素識別、疫情發生與流行預測、時空風險制圖等研究中的應用越來越廣泛,有效促進了鼠疫防控與監測預警工作的開展。
作為一種大規模傳染病,世界歷史上曾發生過三次鼠疫大流行,均給人類與動物群體帶來巨大災難,甚至改變了人類的社會結構[4-5]。20 世紀50 年代,鼠疫在我國得到了有效控制,90 年代人間鼠疫在世界范圍內盛行,流行范圍超過25 個國家,疫源地遍布亞、非、美58 個國家和地區[6],我國的人間鼠疫病例也顯著上升。2017 年以來,非洲的馬達加斯加,中亞的印度、緬甸、哈薩克斯坦,北亞的蒙古,我國的云南、四川和內蒙古都曾出現散發的人間鼠疫病例,但未造成大規模的鼠疫流行,此后全球鼠疫進入新的靜息期[7-8]。10 月26 日,中國云南勐海縣發現兩例腺鼠疫病例,昭示著國內鼠疫有復蘇跡象。
鼠疫是我國嚴重危險人類健康安全與社會發展的甲類烈性傳染病之一[9],我國鼠疫防控以監測為主。自20 世紀80 年代起,通過建立全國范圍的縣級疫情監控網和系統對全國疫點進行定期監測,主要工作包括:記錄當地人間疫情和動物疫情發病情況的人間鼠疫疫情監測;采集當地嚙齒動物和跳蚤標本進行血清分型、細菌和生物分型及毒力基因檢測的動物間疫情監測[10-12]。
空間流行病學(Spatial Epidemiolopy)是健康地理學的一個分支,其研究對象為環境地理和人類疾病,內容涵蓋人類疾病的時空分布和影響因素,涉及的數據包含時間、空間和屬性等多維信息。空間流行病學融合了信息技術、計算機技術、3S 技術等,同時隨著信息理論與景觀生態學理論等基礎理論的不斷發展,為未來的流行病研究打下了良好基礎。鼠疫流行具有區域性、季節性和周期波動性等特征,為空間流行病學在鼠疫防治中的應用提供了前提條件[3],其中對于大區域尺度的研究以遙感影像數據作為基礎數據支撐。GIS 技術的引入則通過地圖直觀展示疾病的空間分布情況,實時、動態地顯示疾病的時空變化特征;對疾病分布進行可視化展示,結合回歸統計和空間分析技術研究疾病病因及各種影響因素,分析疾病的空間聚集性,探索流行病生態系統的分布格局及演化過程[13-14]。
空間流行病學在鼠疫防控預警中的應用主要包括以下3 方面內容:①基于計算機仿真技術與回歸統計方法的鼠疫傳播機制探索;②基于時序分析與GIS 空間分析方法的潛在危險因素識別及疫情預測;③基于遙感信息處理與貝葉斯統計的鼠疫風險探測及預測。
傳染病動力學模型是一種根據種群增長特性和傳染病在種群內的傳播機制與疾病風險因素而建立,以反映傳染病傳播動力學特征的數學模型。該模型主要基于計算機仿真技術和模型預測方法,定量模擬與分析傳染病的傳播途徑、流行動態及重要風險因素。
鼠疫傳染病動力學模型的構建最早可追溯到Kermack等[15-16]對1665-1666 年倫敦黑死病流行規律研究中的SIR(Susceptible-Infected-Recovered)模型和SIS(Susceptible-Infected-Susceptible)模型,同時提出的決定傳染病流行是否發生的“閾值理論”奠定了后續傳染病傳播動力學研究的理論基礎。此后,Samia 等[17]構建了巴基斯坦地區完整的跳蚤—野生動物—人類—鼠疫動力學模型,該模型包含了嚙齒動物增長率模型、跳蚤負擔模型、季節性野生動物疫源地模型和人間鼠疫模型;Dean 等[18]建立了人類傳染性—媒介寄生蚤的SIR 模型,將該模型與肺鼠疫和鼠蚤傳播模型進行比較分析,并利用貝葉斯估計方法對第二次鼠疫大流行期間動物鼠疫每次暴發過程中的重要參數——基本繁殖數進行了預估;White 等[19]為研究第一次鼠疫大流行期間肺鼠疫的傳播機制,通過專家經驗假設初始化條件和估計參數,構建了肺鼠疫SIR 與SEIR 模型、腺鼠疫SIR 與SEIR 模型、腺鼠疫/肺鼠疫SEIR 模型等7 個模型;Sichone等[20]使用系統動力學建模軟件Vensim 對2015 年Nyimba 鼠疫發病模式進行仿真建模,利用SEI 模型估計易感人群中單個感染個體在感染期間的平均繼發感染數等。
目前基于鼠疫傳染病動力模型的應用研究主要集中于國外,眾多學者通過構建預測模型實現對鼠疫傳播機制的深入挖掘,明確鼠疫歷史流行事件的傳播途徑。模型模擬精度越高,納入模型中的因素則越多,對鼠疫傳播規律的認識程度將極大地影響閾值參數設置與因素選取的客觀性和準確性。采用仿真軟件對鼠疫歷史傳播過程進行模擬與模型驗證需要時空數據庫的支持,其中涉及計算機圖形處理、數據庫、模型仿真等相關技術。目前國內對鼠疫傳播動力學機制的探索尚處于空白階段,因此還需作進一步研究。
鼠疫作為一種自然疫源性疾病,其潛伏、發生、傳播及流行均與本地自然疫源地的生態環境緊密相連[21]。因此,可通過融合區域的多源遙感數據和地理信息數據,采用統計回歸和空間分析方法探索分析氣候、環境、生物等因素與鼠疫之間的相關關系,以此預測某地是否存在鼠疫風險及其風險指數。
回歸分析可根據疾病數據的分布規律,建立疾病數據與環境因子的統計回歸數學表達式,進行潛在因素的識別與疾病發生數預測。時間序列分析根據歷史發生疾病的時間序列數據,采用曲線擬合和參數估計建立數學模型,以反映疾病在時間上的傳播規律。結合時間序列分析與回歸分析方法,可根據預測對象與影響因素之間的相關性預測未來鼠疫發生情況。已有鼠疫預測研究中較為經典的方法有:多元logistic 回歸模型、結構方程模型、零膨脹的廣義相加模型等。在鼠疫疫情預測及因子分析應用方面,可分為以下兩部分:
(1)人間疫情預測。Sun 等[22]采用零膨脹廣義相加模型研究第三次鼠疫大流行期間全國物種豐富度與每年鼠疫發生病例數之間的關系。首先將整個中國區域劃分為一度的公里格網,并統計格網內每年平均人間病例數和物種豐富度以及環境變量屬性均值。由于格網內人間鼠疫病例數存在大量零值,分別選擇零膨脹二項分布和零膨脹泊松分布統計模型,研究顯示嚙齒類動物物種多樣性與人間鼠疫病例數和流行強度均呈正相關關系。同時,以歷史氣象數據為數據源的小波分析作為一種時間序列分析方法,近年來也常被用于探索歷史氣候條件對鼠疫發生的影響。如Tennant 等[23]采用小波分析確定了在第三次鼠疫大流行期間英屬印度人間鼠疫的傳播是由濕度變化引起的,且疫情發生前一個月的大氣濕度與當前月份鼠疫的發生呈正相關關系。
(2)動物間疫情預測。錢全[24]應用logistic 回歸和靜息二元時間序列分析方法建立鄂托克前旗長爪沙鼠鼠疫預測模型,研究顯示當年秋季平均氣溫與鼠疫流行之間具有較強的相關性,降水對長爪沙鼠鼠疫流行的影響具有2~3年的年際滯后效應。此外,基于系統發生學與層次分析理論的結構方程模型的引入,也為區域疫源地內鼠疫的環境因子探索提供了內在動力。如Xu 等[25]利用結構方程模型識別氣候與內蒙古沙鼠鼠疫及達里爾松鼠鼠疫的相關性,采用自下而上和自上而下的傳播路徑,研究溫度、降水、植被覆蓋度對嚙齒動物—媒介—鼠疫的系統性影響,明確了降水和溫度對當地兩種宿主動物間疫情的發生均有積極影響,而植被覆蓋度對當地動物間鼠疫發生的影響存在明顯的種群差異。
綜上所述,在統計回歸中,以鼠疫病例數為因變量的回歸建模需要考慮鼠疫數據的統計學特征,再選擇合適的數學模型。傳統回歸模型往往忽視了微生態環境以及時空相關性和交互性的影響,導致預測結果不太符合實際情況,后續研究需要結合空間分析方法,加入時間和空間變量。時空地理加權回歸和時空插值等時空統計分析方法的引入,能更好地解決鼠疫數據的時空自相關問題。同時,建模中考慮到空間分異的影響,對具有分層異質性的環境變量采用如地理探測器Q 統計方法進行時空分層,再建立多水平時空模型進行因子識別與疫情預測。
空間流行病學研究內容包括疾病風險探測、危險因素識別和聚集性分析。其中,用于鼠疫疫情風險探測的空間流行病學方法包括時空聚集性分析以及生態位模型與貝葉斯時空模型。
3.3.1 時空聚集性分析
基于時空分析與風險制圖技術的時空聚集性分析是目前空間流行病學中最常用的時空統計方法之一,旨在識別疾病在時間、空間或時空上分布的聚集趨勢和傾向,幫助找出疾病發病風險較高的地段和時間段,主要識別的疾病有:腎綜合征出血熱[26]、H7N9 禽流感[27]、新冠肺炎[28]等傳染病和慢性疾病。在疾病探測中,該方法主要應用于3個方面:時間聚集性探測、空間聚集性探測和時空聚集性探測。
(1)時間聚集性探測。只考慮疾病在時間上的聚集效應,常用方法有圓形分布法、集中度法與時間序列分析方法。其中,時間序列分析可通過已有的疾病發病時間規律預測未來發病情況。自回歸滑動平均模型(ARIMA)是一種常用的時間序列方法,該方法采用差分階數(Gap),通過繪制時間序列的自相關函數圖和偏自相關函數圖并與標準圖進行對比,從而識別疾病的時間滯后效應。如Ben-Ari 等[29]采用一種基于時間相似度原理對疫情發生點進行時間序列分組的聚類方法,將中國鼠疫疫源地分為4 個部分和南北兩大類。
(2)空間聚集性探測。可分為全局空間聚集性和局部空間聚集性探測,前者探測區域整體聚集程度,后者用于定位聚集區。其中,空間自相關法主要根據空間位置的遠近度量空間現象或事物的相似及相關程度。空間聚集性探測主要用于自然鼠疫疫源地劃分和病灶識別。如李海蓉等[30]通過空間聚類分析,按照形成環境將我國的鼠疫疫源地劃分為3 類;Galanaud 等[31]基于空間自相關方法和歷史流行病信息,繪制了15 世紀初期3 種流行病中的鼠疫死亡分布圖。
(3)時空聚集性探測。主要目的在于獲取疾病的高發期和聚集位置,如Sun 等[32]采用基于機器學習的時空聚類方法重構了1772-1964 年間中國區域鼠疫流行的傳播路線,并將中國分為2 個核心區和13 個聚類,這些研究可為未來鼠疫及其他傳染病防控與決策提供參考。
綜上所述,疾病時空聚集性分析為近年來較為熱門的一個研究方向,可用于探索鼠疫發生的時空分布模式,包括熱點探測和流行高發時區識別。目前在鼠疫風險探測研究中,可采用自相關分析、核密度估計、時空掃描統計等空間分析方法聯合進行分析,利用GIS 技術和計算機技術通過可視化地圖進行時空展現,將進一步推動鼠疫時空分布模式信息的表達與傳播。
3.3.2 生態位模型
生態位模型(Ecological Niche Models,ENM)是一種用于預測生態風險和物種地理分布的模型,已在如腎綜合征出血熱[33]、血吸蟲[34]等傳染病傳播研究中得到了廣泛應用。其中,最大熵模型(Maxent)和規則集遺傳算法(GARP)模型在鼠疫研究中應用最為廣泛[35]。Maxent 模型輸入分布數據為存在點數據,基于機器學習算法選擇分布點環境信息熵最小的最優擬合模型進行物種潛在分布預測。GARP 模型在Maxent 模型數據基礎上還需要增加不存在點,采用預設預測規則的遺傳算法從所有樣本點提取的環境特征中選擇具有最優規則集合的組合模型,總結物種分布生態需求,以預測物種潛在分布。
Maxent 模型和GARP 模型在鼠疫監測預警中的主要應用包括以下兩方面:
(1)疫源地內鼠疫潛在風險預測。Walsh 等[36]利用Maxent 模型預測2000-2015 年美國西部鼠疫風險及重要共生宿主的潛在空間分布時發現,對宿主分布有較大影響的因素為海拔、最干季降水量和最濕季降水量及土地覆蓋率。為提高中國長爪沙鼠疫源地動物間疫情潛在分布的預測精度,閆東等[37]采用Maxent 和GARP 兩個生態位模型,模型中只考慮氣候因素對鼠疫的影響,通過比較分析,顯示Maxent 模型預測精度更高。
(2)宿主和媒介生物物種的適生區預測及疫源地識別。如Ben-Ari 等[29]為了確定中國鼠疫可能存在的新自然疫源地,同時采用GARP 和Maxent 兩個生態位模型進行鼠疫適生區識別,發現了至少4 個獨立疫源地;閆東等[38]采用Logistic 回歸篩選禿病蚤蒙冀亞種的氣候環境因素,利用GARP 模型預測禿病蚤蒙冀亞種的適宜分布區。
綜上所述,Maxent 模型和GARP 模型對于小樣本鼠疫分布預測具有極大優勢,可適用于大范圍的鼠疫疫源地和宿主/媒介分布預測,但針對小范圍區域的預測精度較低。多源遙感數據是生態位模型主要的數據源,未來將融合遙感信息技術、數據庫技術、計算機圖像處理技術和GIS 空間分析技術等,建立歷史鼠疫監測數據庫及精度更高的多源遙感數據庫,采用廣義相加模型(Genneral Additive Model,GAM)、廣義線性模型(Genneral Linear Model,GLM)等基于回歸統計的生態位模型實現疫情風險和物種分布定量預測。
3.3.3 貝葉斯時空模型
貝葉斯時空模型是一種基于貝葉斯統計的時空回歸模型,可分析疾病的空間效應、時間效應與時空交互效應及其環境風險因素,幫助人們了解疾病的地理分布,并預測發病趨勢。目前主流的貝葉斯時空模型有3 種:BYM(Besag,York and Mollie Mode)模型、層次貝葉斯時空模型和FBM(Familiar Bayesian Spatio-temporal Model)模型。BYM 模型可有效解決時空交互和過度離散化等問題;層次貝葉斯時空模型將分級結構納入BYM 模型中,對于多水平結構數據具有良好的穩定性,但只適用于空間多尺度分析[39];FBM 模型充分考慮了疾病周期性變化和傳播的空間異質性,進行分區時間趨勢估計,使得模型更加精準,因此在未來的空間流行病研究中有著廣闊的應用前景[40]。
貝葉斯時空模型對于較小區域范圍的疾病空間分析有著較大優勢。近年來,隨著計算機技術的發展以及馬爾科夫鏈蒙特卡羅方法(MCMC)的引入,貝葉斯時空方法主要應用于癌癥[41]、布魯氏疾病[42]、手足口病[43]、瘧疾[44]等空間流行病研究中。張俊輝等[42]在研究北方六省布魯氏菌病的時空分布特征時,從縣區和地市兩個尺度構建層次貝葉斯時空模型,發現分層多尺度聯合模型可單獨分析地區傳染病和慢性疾病,為同類研究提供了一種新的方法作為參考;Sn?ll 等[45]基于宿主—寄生蟲系統的聯合空間動力學原理,提出一種適用于黑尾土撥鼠的區域長期鼠疫動態和種群動態研究的分層貝葉斯模型。但目前國內仍缺少基于貝葉斯時空模型的鼠疫疫情相關研究。
綜上所述,鼠疫作為傳染性疾病,其傳播流行在空間和時間單元上具有尺度依賴性。采用分層貝葉斯時空模型可實現多尺度空間的鼠疫疫情探索,研究不同區域鼠疫相對風險的時間變化規律,同時結合不同歷史時期的環境因子數據實現對危險因素的識別。貝葉斯統計在我國鼠疫研究中尚處于空白,因此在未來的空間流行學研究中,采用貝葉斯時空模型對鼠疫流行規律的時空信息進行挖掘具有較高的應用價值。
目前,國內外學者針對鼠疫疫情預測、危險因素識別和風險評估等方面已開展了大量工作,但深度仍遠遠不夠。我國空間流行病學在鼠疫監測中的應用多集中于疾病風險制圖領域,在鼠疫時空傳播方面的研究尚處于初級階段。分層貝葉斯時空模型、結合時序分析的傳染病動力學模型和時空聚集性分析方法等在鼠疫時空分析中的應用將是未來鼠疫預測預警研究的主要方向。在應用研究方面,至今仍缺乏對中國區域歷史鼠疫大流行事件的傳染性動力學探究,主要原因在于我國鼠疫宿主媒介種類多,傳播機理十分復雜,先驗參數難以確定。貝葉斯估計方法等方法的應用將對動力學參數估計具有一定啟發作用。未來可通過結合多源遙感數據和空間流行病學方法研究鼠疫的環境風險因素,建立時空傳播與分析模型,將能更深入地探索鼠疫的時空傳播規律和發病機理,對鼠疫自然疫源地內的鼠疫疫情防控與決策具有重要意義。