








摘 要:在COVID-19疫情環境下,為精準預測不同癥狀狀態的人群人數和區域級別的發展趨勢,以SIR傳染病模型為基礎,基于馬爾可夫鏈預測時空相關的特性,設計了感染人群狀態與管控措施相關的K-SIRD傳染病預測模型.根據COVID-19疫情人群之間傳染性的特征及受距離影響造成有效傳染數Re的變化而導致不同的癥狀狀態改變的轉移規律,實時精準預測了不同狀態的人員人數變化,并根據同一區域人群癥狀狀態分布情況不同,針對不同級別的區域采用不同等級的管控措施.
關鍵詞:K-SIRD模型; COVID-19; 馬爾可夫鏈; 有效繁殖數
中圖分類號:O236.2
文獻標志碼: A
Prediction of the areal trends of COVID-19 epidemic based on markov-chain
WANG Xin *, WANG Ling-ge, SHI Peng-rou
(School of Electronic Information and Artificial Intelligence," Shaanxi University of Science amp; Technology, Xi′an 710021, China)
Abstract:In the COVID-19 epidemic environment,in order to accurately predict the number of people with different symptom states and the development trend at the regional level,based on the SIR infectious disease model and the spatio-temporal correlation under Markov chain prediction,designs the K-SIRD infectious disease prediction model related to the infected population state and the control measures.According to the characteristics of the contagiousness among the COVID-19 epidemic population and the transfer law of different symptomatic state changes caused by the changes in the effective number of infectious Re affected by distance,the real-time accurate prediction of the changes in the number of people in different states,and according to the distribution of the symptomatic state of the population in the same area is different,different levels of control measures are used for different levels of the area.
Key words:K-SIRD model; COVID-19; Markov-chain; the effective reproduction number
0 引言
自2019年12月以來,恰逢中國春節,COVID-19疫情在全國迅速蔓延,已波及到全球所有公民[1-4].由于COVID-19具有高傳染性并且在潛伏期很難發現患者的特性,全球感染人數呈爆炸式增長,傳播范圍不斷擴大.在此期間,六大洲114個國家、領土或地區不同程度地受到疫情影響,國內外疫情增長趨勢不容樂觀.截至2022年7月15日,世界衛生組織(World Health Organization,WHO)共收到了確診病例557 917 904例,死亡病例6 358 899例.截至2022年7月11日,全球共接種疫苗12 130 881 147支[5,6].因此在當前形勢下,分析疫情發展規律,預測疫情發展趨勢,對有效防控疫情至關重要[7,8].
SIR模型是傳統的流行病模型之一,被廣泛應用于各種環境[9-12].該模型表示恒定規模人群中三類個體相對比例的發展:易感者S,能夠感染疾病并具有傳染性的人群;感染者I:自身表現患病癥狀并能夠使易感者患病的人群;抵抗者R:在愈合或死亡后永久免疫或者不存在患病可能性的人群.根據人群分類不同情況,可建立SI或者SEIR等模型反應參數之間的約束關系.這些傳統的傳染病模型具有較強的疾病預測能力[13-15],根據感染人數的動態變化來分析傳染病的感染率,通過常微分方程模型擬合過程,可以估計一些關鍵參數,然后利用下一代矩陣的概念,根據這些參數推導出病毒基本繁殖數R0[16,17],進而預測傳染病的傳播和發展趨勢.然而,傳統模型無法動態刻畫政府防控措施[18-23]的變化對疫情發展趨勢的影響,與此同時,其參數一旦確定則無法更改,缺乏了預測人員癥狀狀態改變這一隨機事件信息的動態統計特性.其次,雖然大多數常微分方程模型能夠預測感染的轉折點,但很少有模型能夠預測第二波或第三波何時以及如何開始[24-27].隨COVID19 疫情的發展,人們逐漸認識到傳播系數是一個隨時間變化的術語[28].
基于馬爾可夫鏈的傳染病預測模型符合現狀.針對COVID-19傳染病的特殊性,根據政府提出的隔離政策和居民位置的移動變化,結合流行病經典模型中核心參數在刻畫癥狀不同狀態人數的變化的重要影響,使用歷史數據根據改進的K-SIRD模型統計計算下一時刻的癥狀狀態人數數量,達到實時統計的準確性.針對數據模型的更新,馬爾可夫鏈可以根據時間結合距離等的物理背景,更準確的考慮在COVID-19疫情過程中,傳播系數的動態變化對傳染病模型的影響,周期性的調整參數,對馬爾可夫狀態轉移矩陣進行更新,從而更精確預測同一區域在未來不同時刻的管控等級,從而采取不同等級的管控措施.
1 基于馬爾可夫鏈的 K-SIRD 模型系統框架
在流行病背景下,患者癥狀的嚴重程度差異、距疫區位置距離遠近以及自身抗體具備的能力,會導致個體傳染概率的差異、傳染結果的不同,從而使患者癥狀人數有所變化.其中,人員與患者的接觸距離是導致病癥人數改變的主要因素.針對位置距離、疾病傳染率和治愈率與人員是否被隔離對傳染病傳播的結果,通過改進的K-SIRD模型統計算下一時刻七種癥狀狀態的人數數量,然后根據該實時狀態數量,利用擬合的參數構建馬爾可夫狀態轉移矩陣,預測同一區域在未來不同時刻的管控等級,從而提出對應的管控措施的方法.系統框架如圖1所示.
1.1 COVID-19流行病模型中的人群狀態
易感者S,主要表現為不存在抗體且可被感染的人群,被感染后也存在感染別人的可能,其中包括未隔離的易感人數S1和已隔離的感染人數Sq;感染者I,主要表現為已患傳染病且會使易感者患病的人群,經一段時間患者可通過治療痊愈或自動痊愈,存在抗體不在患病或者依然有再次被感染的可能,其中包括隔離且得到治療的感染人數I1、隔離未治療的感染人數I2和未隔離且未治療的感染人數或稱為無癥狀人數I3;抵抗者R,主要表現為經歷感染后擁有抗體不會再被感染,同時也不會感染其他人的人群,其中包括含抗體人數R1和死亡人數Rdead.患者人群狀況示意圖如圖2所示.
1.2 管控區劃分標準與人群狀態人數的對應關系
在t時刻,針對無感染風險且不會感染他人的群體,(包括抗體者R1(t)和死者Rdead(t)),所在區域采取無管控措施,該區域被稱為0度管控區,記為Area0;針對已隔離但存在感染風險的群體,(包括易感者Sq(t)),所在區域采取溫和管控措施,該區域被稱為1度管控區,記為Area1;針對未隔離但存在感染風險的群體,(包括易感者S1(t)),所在區域采取較溫和管控措施,該區域被稱為2度管控區,記為Area2;針對已隔離但對他人仍存在感染風險的群體,(包括感染者I1(t)和I2(t)),所在區域采取嚴格管控措施,該區域被稱為3度管控區,記為Area3;針對未隔離且對他人存在感染風險的群體,(包括感染者I3(t)),所在區域采取極其嚴格管控措施,該區域被稱為4度管控區,記為Area4.管控區劃分標準與人群狀態人數的對應如圖3所示.
2 基于馬爾可夫鏈的 K-SIRD 模型具體算法
基于馬爾可夫鏈的流行病模型預測方案包括三個部分:計算病毒有效繁殖數Re、設計馬爾可夫鏈模型和設計狀態轉移矩陣模型.
2.1 計算有效傳染數Re
假設人員的位置坐標為(x,y),其中x為位置橫坐標,y為位置的縱坐標.統計一段時間內兩個人的位置發生重合的次數,用以計算不同情況下人員接觸的可能性.假設c1為百分數,表示被隔離在同一區域的情況下,兩個人發生接觸的可能性;c2為百分數,表示在未隔離的情況下,兩個人發生接觸的可能性.定義符號D(i,j)為非負數,表示第i個人和第j個人之間的距離,其中第i個人和第 j個人的位置坐標分別為xi,yi和 xj,yj,則D(i,j)= (xi-xj)2+(yi-yj)2,m(i,j)為第i個人和第j個人的接觸密度,如式(1)所示:
m(i,j)=c1D(i,j)隔離區,第i個人和第j個人的接觸密度c2D(i,j)非隔離區,第i個人和第j個人的接觸密度
(1)
假設M為某一百分數,表示人員發生交互的可能性,如式(2)所示:
M=1N∑Ni∑Njm(i,j)
(2)
式(2)中:N為某一非負整數,表示某個區域中的總人數.
假設β為百分數,表示COVID-19疫情的傳染率;r為百分數,表示COVID-19疫情的治愈率.通過交互的可能性計算傳染病的有效傳染數.有效傳染數如式(3)所示:
Re=β*M-(1-n)*r*N
(3)
式(3)中:n為百分數,表示患者治愈后含有抗體且不再患病的人數比例.
2.2 構造K-SIRD傳染病模型
假設ε為百分數,表示隔離的易感者轉向未隔離的易感者的比例;根據是否被隔離,將易感者分為隔離的易感者和未隔離的易感者,定義k1為隔離的易感者在易感者總人數的占比,即k1=S1S;1-k1為未隔離的易感者在易感者總人數的占比,即(1-k1)=SqS;ε為隔離的易感者轉為未隔離的易感者的占比.根據是否被隔離和治療,本方案將感染者分為已治療、隔離未治療和未隔離未治療的感染者,定義λ為經受治療的感染者人數在感染者總人數的占比,即λ=I1I;1-λ為未受治療的感染者人數在感染者總人數的占比,即(1-λ)=I2+I3I;k2為在隔離情況下,未治療的感染者人數在未治療感染者總人數的占比,即k2=I2I2+I3;1-k2為在未隔離情況下,未治療的感染者人數在未治療感染者總人數的占比,即(1-k2)=I3I2+I3.定義α為含抗體者人數在抵抗者人數的占比,即α=R1R;1-α為死者人數在抵抗者人數的占比,即1-α=RdeadR.各狀態人員人數占比如圖4所示.
每日發病病例數估計:本研究采用K-SIRD模型對一段時間內的發病病例數和累計病例數進行擬合,對下一時間段的發病病例數進行預測.假設在t時刻,區域內的總人數為N(t),未隔離的易感人數為S1(t),已隔離的感染人數為Sq(t),隔離且得到治療的感染人數為I1(t),隔離未治療的感染人數為I2(t),未隔離且未治療的感染人數為I3(t),含抗體人數為R1(t),死亡人數為Rdead(t).其微分方程如式(4)所示:
dS1(t)dt=εSq(t)-K1R0(I1(t)+I(t)1+I3(t))S1(t)+Sq(t)N(t)
dSq(t)dt=nr(I1(t)+I(t)1+I3(t))-εSq(t)-(1-K1)R0(I1(t)+I(t)1+I3(t))S1(t)+Sq(t)N(t)
dI1(t)dt=λR0S1(t)+Sq(t)N(t)(I1(t)+I(t)1+I3(t))-(1-n)rI1(t)-nrI1(t)
dI2(t)dt=k2(1-λ)R0S1(t)+Sq(t)N(t)(I1(t)+I(t)1+I3(t))-(1-n)rI2(t)-nrI2(t)
dI3(t)dt=(1-k2)(1-λ)R0S1(t)+Sq(t)N(t)(I1(t)+I(t)1+I3(t))-(1-n)rI3(t)-nrI3(t)
dR1(t)dt=(1-n)r(I1(t)+I(t)1+I3(t))α
dRdead(t)dt=(1-n)r(I1(t)+I(t)1+I3(t))(1-α)
(4)
式(4)中:N(t)為恒定值,且N(t)=S1(t)+Sq(t)+I1(t)+I2(t)+I3(t)+R1(t)+Rdead(t).
2.3 設計狀態轉移矩陣模型
根據上述設計,管控區劃分標準與人群狀態人數的對應如下:在t時刻,針對無感染風險且不會感染他人的群體(包括抗體者R1(t)和死者Rdead(t)),所在區域采取無管控措施,記此事件為μ0,該區域被稱為0度管控區,記為Area0;針對已隔離但存在感染風險的群體(包括易感者Sq(t)),所在區域采取溫和管控措施,記此事件為μ1,該區域被稱為1度管控區,記為Area1;針對未隔離但存在感染風險的群體(包括易感者S1(t)),所在區域采取較溫和管控措施,記此事件為μ2,該區域被稱為2度管控區,記為Area2;針對已隔離但對他人仍存在感染風險的群體(包括感染者I1(t)和I2(t)),所在區域采取嚴格管控措施,記此事件為μ3,該區域被稱為3度管控區,記為Area3;針對未隔離且對他人存在感染風險的群體(包括感染者I3(t)),所在區域采取極其嚴格管控措施,記此事件為μ4,該區域被稱為4度管控區,記為Area4.根據參數擬合結果對不同事件,得到對未來時刻區域管控級別的預測,相關參數擬合的馬爾可夫狀態轉移矩陣模型如圖5所示.
其中,t∈[1,7],已知在t時刻,區域管控等級從狀態i在下一時刻轉移到狀態j的概率計算如式(5)所示:
Pij=P(μt+1=μj,|μt=μi)
(5)
由此可得馬爾可夫狀態概率矩陣P如式(6)所示:
P=P00P01P02P03P04
P10P11P12P13P14
P20P21P22P23P24
P30P31P32P33P34
P40P41P42P43P44
(6)
現已知t時刻研究區域的各狀態的人數,根據公式(5)、公式(6)和圖5計算當前時刻的區域管控等級,因此,在t+1時刻,對研究區域的傳染病所處管控等級的概率預測如式(7)所示:
μk(t+1)=μk(0)*Pt+1
(7)
式(7)中:符號μk(0)和μk(t+1)分別表示研究區域k管控等級的初始狀態分布和預測的t+1時刻的管控等級分布,取μk(t+1)預測矩陣中概率分布最大的狀態作為管控等級預測結果.若 μk(t+1)=[0,1,0,0,0],則根據預測,該區域在下一時刻采用的管控措施為溫和管控,其所研究的區域被確定為1度管控區.
3 實驗結果與分析
3.1 位置數據集
使用國家衛生健康委員會(衛健委)官方網站和WHO-中國聯合調查組COVID-19報告中獲取中國北京2022年11月19日至12月8日的每日報告病例和報告死亡病例數.
3.2 實驗設置
基于馬爾可夫鏈的傳染病預測模型是在 Windows 11環境下Python3.8.12、pytorch 1.10.0, CUDA 10.0的編程環境下實現的.
3.3 結果及其分析
以11月19日中國北京各狀態人群的人數設置為初始值對未來14天各狀態人數變化進行預測,經多次實驗,在各參數滿足以下初始值時,得到多組參數的解.選取預測誤差值小于1%的一組參數擬合值,如表1所示.其中初始值設定為N=21 886 000,S1=21 867 489,Sq=492, I1=6 581,I2=3 798,I3=2 600,R1=5 030,Rdead=10.本部分內容利用MATLAB軟件完成.各參數擬合的折線圖如圖 6(a)~(g) 所示.
3.3.1 北京市疫情預測
利用擬合的參數,預測了2022年12月2日至2022年12月8日期間北京六個不同狀態下的人口數量.預測結果如圖7(a)~(f)所示.
由預測結果可以看出模型有良好的預測性能,通過結合疫情傳播中人群的隔離率等因素,模型能夠準確預測疫情的發展趨勢,有較高的準確性和可靠性.這為政策制定者、公共衛生機構和科研人員提供了重要的參考依據,有助于更好地應對新冠疫情的挑戰.
中國政府一直高度重視疫情防控工作,采取了多項措施來控制疫情.中國政府在疫情初期就采取了積極的措施來控制疫情,包括采取大規模的社交隔離、加強醫療衛生體系建設、推廣健康生活方式等.這些措施有效地減緩了病毒傳播的速度,使得北京市2022年11月19日至2022年12月8日死亡人數Rdead較少并較為穩定,其結果統計圖如圖8所示.
3.3.2 北京市疫情管控等級預測
根據上述參數的擬合結果,構建馬爾科夫狀態轉換矩陣如下:
P=10000
4.5×10-69.8×10-17.5×10-88.3×10-33.1×10-3
4.4×10-44.5×10-40.898.1×10-23.0×10-2
6.6×10-35.5×10-34.0×10-100.620.37
3.2×10-32.7×10-32.0×10-102.3×10-50.99
根據不同條件預測未來的管控等級,當前區域轉變為0度管控區所需的時間如表2所示.
根據以上描述,由于中國有效的管理政策,疫情得到了很好的控制.中國政府一貫高度重視疫情防控工作,采取了多項措施控制疫情.在疫情初期,中國政府迅速采取主動措施,包括實施大規模社會隔離,加強醫療衛生體系建設,倡導健康生活方式等.這些措施有效地減緩了病毒的傳播,使各地最終從其他管控區域轉變為Area0.
4 結論
通過隔離率k1、k2、傳染率β、治愈率r、人員間距離D(i,j)等參數的刻畫,K-SIRD模型對未來一段時間內疫情發展結果的預測準確度高,適用于COVID-19流行病背景下,針對不同狀態人員人數發展趨勢的預測.通過MATLAB參數擬合實驗對比,實際數據和預測數據在K-SIRD模型下都能很好地捕捉到疫情發展的趨勢,證實了該模型的可靠性.同時,考慮到隔離率對疫情傳播的影響,根據參數擬合結果構造馬爾可夫狀態轉移矩陣,對當前的疫情區域管控進行預測.實驗證明,針對任何級別的管控措施最終都會回歸到無管控區域,與理論研究一致,當有效繁殖數Relt;1時,傳染病將會逐漸消失.利用該模型對管控區域進行預測,為今后的疫情防控提供了有益的參考.通過對不同因素的分析和研究,有助于制定更加科學合理的防控策略,以提高應對疫情挑戰的有效性.
參考文獻
[1] Kumar A,Singh R,Kaur J,et al.Wuhan to world:The COVID-19 pandemic[J].Frontiers in Cellular and Infection Microbiology,2021,11:596 201.
[2] He S,Peng Y,Sun K.SEIR modeling of the COVID-19 and its dynamics\.Nonlinear Dynamics,2020,101:1 667-1 680.
[3] Chen J,Wu L,Zhang J,et al.Deep learning-based model for detecting 2019 novel coronavirus pneumonia on high-resolution computed tomography[J].Scientific Reports,2020,10(1):19 196.
[4] Ahmed I,Ahmad M,Rodrigues J J P C,et al.A deep learning-based social distance monitoring framework for COVID-19[J].Sustainable Cities and Society,2021,65:102 571.
[5] World Health Organization.A systematic approach to monitoring and analysing public health and social measures in the context of the COVID-19 pandemic:Underlying methodology and application of the PHSM database and PHSM Severity Index:Updated July 2022[R].World Health Organization,Regional Office for Europe,2022.
[6] Rahman M Z,Akbar M A,Leiva V,et al.An intelligent health monitoring and diagnosis system based on the internet of things and fuzzy logic for cardiac arrhythmia COVID-19 patients[J].Computers in Biology and Medicine,2023,154:106 583.
[7] Zakary O,Rachik M,Elmouki I.On the impact of awareness programs in HIV/AIDS prevention:An SIR model with optimal control[J].International Journal of" Computer Applications in Technology,2016,133(9):1-6.
[8] Rizkalla C,Blanco Silva F,Gruver S.Modeling the impact of Ebola and bushmeat hunting on western lowland gorillas[J].EcoHealth,2007,4:151-155.
[9] Wang X,Shi P,Li J,et al.Privacy-preserving mechanisms of continuous location queries based on LBS:A comprehensive survey[C]//2022 27th International Conference on Automation and Computing(ICAC).Bristol,United Kingdom:IEEE,2022:1-6.
[10] Berge T,Lubuma J M S,Moremedi G M,et al.A simple mathematical model for Ebola in Africa[J].Journal of Biological Dynamics,2017,11(1):42-74.
[11] 成云云,白艷萍,續 婷,等.基于SSA-PSO-GSA-SVR的全球新冠肺炎疫情分析及預測[J].陜西科技大學學報,2022,40(3):192-199,206.
[12] Wang J ,Liu Y ,Liu X ,et al.A modified SIR model for the COVID-19 epidemic in China[J].Journal of Physics:Conference Series,2022,2 148(1):012 002.
[13] Efimov D,Ushirobira R.On an interval prediction of COVID-19 development based on a SEIR epidemic model[J].Annual Reviews in Control,2021,51:477-487.
[14] Gu B.Forecast and analysis of COVID-19 epidemic based on SEIR model[C]//Journal of Physics:Conference Series.IOP Publishing.Busan,South Korea:IEEE,2021:042 050.
[15] Zheng N,Du S,Wang J,et al.Predicting COVID-19 in China using hybrid AI model[J].IEEE Transactions on Cybernetics,2020,50(7):2 891-2 904.
[16] Randolph H E,Barreiro L B.Herd immunity:Understanding COVID-19[J].Immunity,2020,52(5):737-741.
[17] Britton T,Ball F,Trapman P.A mathematical model reveals the influence of population heterogeneity on herd immunity to SARS-CoV-2[J].Science,2020,369(6 505):846-849.
[18] Xu Z,Zhang H,Huang Z.A continuous markov-chain model for the simulation of COVID-19 epidemic dynamics[J].Biology,2022,11(2):190.
[19] Khan M A,Shah S W,Ullah S,et al.A dynamical model of asymptomatic carrier zika virus with optimal control strategies[J].Nonlinear Analysis:Real World Applications,2019,50:144-170.
[20] He S,Tang S,Rong L.A discrete stochastic model of the COVID-19 outbreak:Forecast and control[J].Math.Biosci.Eng.,2020,17(4):2 792-2 804.
[21] Tang B,Bragazzi N L,Li Q,et al.An updated estimation of the risk of transmission of the novel coronavirus (2019-nCov) [J].Infectious Disease Modelling,2020,5:248-255.
[22] Allotey J,Fernandez S,Bonet M,et al.Clinical manifestations,risk factors,and maternal and perinatal outcomes of coronavirus disease 2019 in pregnancy:Living systematic review and meta-analysis[J].BMJ,2020,370:m3 320.
[23] Li Y,Zhao R,Zheng S,et al.Lack of vertical transmission of severe acute respiratory syndrome coronavirus 2,China[J].Emerging Infectious Diseases,2020,26(6):1 335.
[24] Toprceanu A,Precup R E.A novel geo-hierarchical population mobility model for spatial spreading of resurgent epidemics[J].Scientific Reports,2021,11(1):14 341.
[25] Cacciapaglia G,Cot C,Sannino F.Multiwave pandemic dynamics explained:How to tame the next wave of infectious diseases[J].Scientific Reports,2021,11(1):6 638.
[26] Menda K,Laird L,Kochenderfer M J,et al.Explaining COVID-19 outbreaks with reactive SEIRD models[J].Scientific Reports,2021,11(1):17 905.
[27] Beira M J,Sebastio P J.A differential equations model-fitting analysis of COVID-19 epidemiological data to explain multi-wave dynamics[J].Scientific Reports,2021,11(1):16 312.
[28] Martsenyuk V,Bernas M,Klos Witkowska A.Two-strain COVID-19 model using delayed dynamic system and big data[J].IEEE Access,2021,9:113 866-113 878.
【責任編輯:蔣亞儒】