郭志榮,張 華,姜道旭
(1.揚州職業大學數學系,江蘇 揚州 225009; 2.揚州市婦幼保健院,江蘇 揚州 225000)
我國通過采取積極的醫療救治與預防控制措施,使新型冠狀病毒肺炎得到了極為有效的控制,社會、經濟秩序得到了有序恢復,但是新冠肺炎仍在部分國家和地區蔓延。由于新冠肺炎傳染性強、傳播途徑廣并具隱蔽性,人群普遍易感,因此在復工復產復學導致流動人口激增的情況下,需要厘清傳染病突發事件發生機理、傳播規律,運用科學思維方式,預防和控制傳染病的傳播,這是全球公共衛生管理部門迫切需要解決的問題[1-3]。
數學模型是解釋傳染病流行的一種重要模式,通過數學建模能有效預測疫情的傳播趨勢,為傳染病的防控決策提供科學依據。從傳染病發病原因、傳播途徑入手,立足于尋找影響疫情傳播的因素,通過建構傳染病傳播的預測模型,發現疫情傳播規律,切斷疫情傳播途徑。
傳染病的預測模型主要經歷了以下三個發展階段:
A.疫情預測的經典模型。
傳染病疫情預測的經典模型主要包括兩類,一是依據偏微分方程來構建預測模型,二是依據變量在時間序列的線性變化建構預測模型。
依據偏微分方程來構建預測模型。1926年,Kermack和Mc Kendrick提出SIR倉室傳播模型,建立傳染病動力學的閾值理論來研究1665-1666年倫敦黑死病的傳播規律,取得了重大成果[4]。2007年,Eichner等人開發Influ Sim仿真工具,模擬依據偏微分方程來構建的傳染病預測模型,幫助管理部門提出疫情的最佳處置方案,成功遏制了流感的傳播[6]。由于經典的微分方程預測模型需要設定感染區域的總人數固定不變,無法考慮復雜的現實因素,因此依據偏微分方程來構建的預測模型使用范圍受限。
依據變量在時間序列的線性變化建構預測模型。通過分析傳染病發病率的一維時間序列來對傳染病進行預測,主要包括ES模型(Exponential Smoothing)、MC模型(Markov Chain)等。依據變量在時間序列的線性變化建構的預測模型是從分析變量在時間序列上的數據著手,通過參數估計、曲線擬合來描述疫情變化趨勢,一旦采集的數據比較離散、不規則,此類模型就無法發揮作用了。
B.基于互聯網的疫情預測模型。
人們一旦患病,經常會使用互聯網檢索與病癥相關的資料。而互聯網使用痕跡是可以追蹤的,通過追蹤用戶在網絡和社交媒體搜索的關鍵詞頻率,可估計傳染病的發生率,從而建立基于互聯網的疫情預測模型。百度等中國互聯網公司運用此模型為疫情防控作出了重要貢獻。對比疫情預測的經典模型,基于互聯網的疫情預測模型特點明顯,能在第一時間對傳染病疫情進行預測,但因數據采集的不規范和不可控,預測是否準確還需要進一步分析。
C.基于機器學習的疫情早期預測模型。
基于機器學習的疫情早期預測模型,其目標是利用機器學習分析導致新型傳染病的最突出因素,借助可視化工具來說明導致疫情的因果關系。從2000年至今,建立基于機器學習的疫情預測模型取得了重大進展,IBM公司從電子病歷、傳染病疫情監測和疫情傳播的圖像數據入手,實現了對疫情傳播的預測。
綜上所述,從研究內容來看,少有服務于地方突發傳染病防控的操作性研究。從研究方法來看,少有將計算機軟件運用于傳染病疫情的實證研究。從研究視角上看,少有對疫情不同階段管理側重點的操作性研究,特別是缺少指導各地公共衛生管理部門在面對疫情時,應該“如何建設”“怎樣建設”的操作性研究。
利用IBM開源大數據的流行病學時空建模平臺(Spatio-Temporal Epidemiological Modeler,STEM),對新冠肺炎疫情的預測模型建立和最佳防控策略選擇進行了深入研究,建立了動態反饋仿真模型,將其作為新冠肺炎疫情應急管理的核心依據與方法,為各地公共衛生管理部門制定預防措施提供科學參考。主要成果:基于STEM平臺的新冠肺炎風險預測模型的建立,通過各地數據擬合、算法優化,擴展了模型的使用范圍,提高了疫情預測的準確性。新冠肺炎疫情的非藥性防控策略設計與實現,在復工復學導致外來人口激增的現實條件下,特別是無癥狀感染者成為流動人員的情況下,實施常規防控措施并達到理想效果難度較大。本項目借助STEM建模平臺提供的防控策略選項,反復模擬演練,給出了新冠肺炎疫情防控的的最佳措施。
圖1為模型作出的累計確診病例的logistic回歸圖,左圖為全國的,中圖為江蘇省的,右圖為揚州市的,采用數據截止日期是2020年4月8日。從圖中可以看到,全國累計確診病例模擬峰值為78 000例左右,江蘇省模擬峰值在620例左右,揚州市的模擬峰值在20例左右,與實際情況比較吻合。模型顯示,我國防控措施到位,短時間內控制了疫情的傳播與蔓延,達到峰值的天數中,江蘇揚州區間在20~30 d,中位數是25 d;江蘇省區間在25~35 d,中位數是30 d;全國區間在30~40 d,中位數是35 d。
圖1 確診病例的logistic回歸圖Fig.1 Logistic regression of confirmed cases
基于STEM平臺的COVID-19疫情風險預測模型的研究對提高各地應對新冠肺炎疫情水平、促進疫情常態化管理、穩步推進復工復學具有良好的社會效益。通過構建一種新的傳染病風險評估模型,為疫情防控提供了有價值的參考,具有重要的社會意義。