孫榮璞,尹凱倩,薛瑞
(山東科技大學 數學與系統科學學院,山東 青島 266590)
世界衛生組織將新型冠狀病毒(2019-nCoV)定性為國家關注的突發問題公共事件,因此,研究和分析病毒在人群中的蔓延趨勢具有重大意義。許多學者已通過生物數學模型進行了分析預測,其中耿輝[1]等利用SEIR模型對疫情開始階段做出了初步預測;李承倬[2]等則利用SIR和樣本再生數對浙江疫情進行了建模分析。但以上學者均為對疫情初期進行預測,疫情初期的現實情況相當復雜,會產生較大的誤差。新型冠狀病毒在高峰期后已經趨于穩定發展,因此在模型的擬合上誤差相對較小。本研究選定全國疫情高峰期后即2月18日之后建立SIR模型,并對相關參數和方程初值進行最小二乘法優化處理,預測湖北感染人數的變化趨勢。
通過疫情實時大數據來獲取疫情期間湖北省的感染人數、治愈率、死亡率等相關統計實時數據[5]。隨著國家相關部門防控工作的不斷進行,感染高峰后,疫情已得到了有效控制,因此認定湖北自疫情高峰期過后已經趨于平穩階段。
SIR模型將總人口分為以下三類:一是易感染者,其數量記為S(t),表示t時刻未染病但有可能被該類疾病傳染的人數。二是染病者,其數量記為I(t),表示t時刻已被感染成為病人而且具有傳染力的人數。三是退出者,其數量記為R(t),表示t時刻已從染病者中移出的人數(即包括治愈和死亡患者)。對于一般情況,設總人口為N,則有N=S(t)+I(t)+R(t)。疫情高峰前后,疫情處于穩定控制階段,無其他過于復雜因素的干擾,因此認為SIR模型在這里是合理的。
現做出以下假設:(1)新型冠狀病毒的傳播方式為近距離與病原體直接接觸。(2)疫情高峰后,湖北省無人口流動,總人口是一個常數N,保持不變,而且不考慮出生和正常死亡等自然影響。(3)盡管被治愈的患者存在二次感染的情況,但其感染原因無法確定(如未能徹底治愈等)且所占比例較小,故忽略不計,所以治愈的患者不會被二次感染。(4)對于染病者進行嚴格隔離,所以染病者不再傳染健康者。(5)此模型僅考慮一般人群,像身份特殊的醫護和科研人員等不予考慮。模型遵守以下原則并建立微分方程動力學系統:(1)在一段時間內,健康者人數變化率的絕對值同傳染者和移出者人數的乘積成正比,比例系數為有效接觸率α。(2)移出者人數的變化率與傳染者人數成正比,比例系數為移出率β,于是得到了SIR傳染病模型:
由疫情實時大數據信息可知[5],一般的感染者治愈時間為2周~1個月,而此次疫情的死亡率遠低于治愈率,因此將病毒感染者的退出周期估計為21 d,即有β=1/21。
對于α和S0的取值,根據文獻[4],可以得出2019-nCoV病毒感染者和健康者的最大有效接觸率計算方法為:
(1)
式中:mS0,mE0,mI0分別為初始時刻健康者、潛伏者、感染者的人數,d0為初始時刻病毒攜帶者的相對死亡率,mS1,mE1,mI1,d1為初始時刻的一組臨近值。
對于S0,這里不取整個湖北省的健康人口主要是人們大都居家隔離,而且每個感染者能夠接觸的人是有限的,人們對2019-nCoV病毒有著較好的防護,對于α和S0取值進一步使用了最小二乘法進行處理[3]。
在SIR模型中,對未知參數α和S0,設θ=(α,S0),如果給定參數β,若觀測區間為[1,M],感染人數的實際觀測值為I={Ii|1≤i≤M},感染人數的模擬值為Y(θ)={yi(θ)|1≤i≤M},則殘差表示為V=Y(θ)-I,于是殘差平方和為
(2)
其目標為求得一組α和S0使SSE的值最小,并對式(2)關于α和S0求偏導,則有:
(3)
(4)
令(3)和(4)式分別等于零,計算求得的對應的α和S0值即為對α和S0的最小二乘估計。通過公式(1)可以計算出整個疫情期間α的最大值為5.4×10-6,于是α的取遍歷范圍為[1.0×10-6,5.0×10-6],對于S0取遍歷范圍[5 000,3 000],最后借助MATLAB計算不同α和S0組合下的SSE取值,得到α和S0的最小二乘估計取值分別為α=-3.12×10-6,S0=5 531
實證分析和疫情預測。通過上述對參數的最小二乘法估計,需結合2月18日---3月8日的疫情實時大數據對感染人數進行擬合處理,還應進一步采用外差法得出3月8日后湖北省感染人數預測的大致走向,如圖1所示。

圖1 基于SIR模型對湖北省疫情的預測圖像Fig.1 Prediction image of Hubei Province epidemic situation based on SIR model
由圖1可以看出,對于通過最小二乘法求得的α和的取值,其感染人數與現實擬合的較好,基本可以反映出在所設區間內湖北疫情的走向。自疫情高峰期后,湖北省感染人數已經處于完全下降的趨勢,約在40 d后的四月中旬,湖北省的疫情基本可以得到全面控制,感染人數完全穩定。對于全國而言,大致在五月后可得到全面控制。