梁晴 宋彥辰
摘 要:埃博拉病毒所致疾病傳播速度遠遠高于其控制的速度,本文通過分析其傳播過程建立了埃博拉病毒傳播模型,并使用拉丁超立方抽樣對疾病傳播進行預測估計。首先,根據Sir Epidemic動態系統-seiifr模型建立了一個模型,在這個模型中,考慮了暴露于人群中的易感人群、埃博拉病人以及患者的自愈恢復。為了確定最優參數,構造了最小二乘法優化方案。結果顯示該模型短期預測效果較好。
關鍵詞:埃博拉病毒傳播 拉丁超立方抽樣 最小二乘法
引言
2014年西非全面爆發的埃博拉疫情(EVD)是世界近年來見證的規??涨?、規模巨大、范圍廣泛和嚴重后果的公共衛生危機。本輪埃博拉疫情主要突擊西非幾內亞、利比里亞和塞拉利昂三個國家。 這是自1976年人類首次發現并命名埃博拉病毒以來歷史上最嚴重的公共衛生災難,顯示出與過去的許多不同特征。
1 埃博拉傳播模型
為了研究埃博拉病毒傳播的規律性,本文建立了分階段的埃博拉傳播模型,明確納入疾病的自然病史和動態ETU能力,同時考慮到諸如報告率、癥狀評分和高危人群比例問題等因素??梢允褂帽疚哪P蛠碓u估預測病例的不確定性、死亡和床位預測,估計疾病的每個階段對傳播的影響,并檢查ETU能力供應,減少傳染病對EVD爆發的影響動態的關系。
從圖1所示的結構模型可看出,該模型包括分階段感染過程,以反映隨著感染進展而增加的感染癥狀和傳播。埃博拉經常經歷多個階段的疾病:第一階段是感染的初始階段,并且癥狀趨于輕微,并且常常發展成腹瀉和嘔吐;第二階段是更嚴重的階段,伴有更嚴重的癥狀(例如出血和多器官衰竭),典型的進展約5-7天。受感染的人最有可能在第一階段復原,而第二階段通常是致命的。圖1的相應等式:
其中S代表易感人群比例,E代表暴露人口比例,R代表最近恢復的人口F代表已經死亡和正在被埋葬的人的比例。
最后,將模型與世衛組織提供的關于累計病例和死亡的數據聯系起來。
2參數估計
本文期望有一個廣泛的模型參數,特別是截至10月1日的數據仍處于指數增長階段,在這個階段,它只能有兩個參數。 這個想法已被用于開發簡單的雙參數預測模型的流行,這代表了這一流行期間內在的不可識別性問題,因為大量參數值可用于產生相同的初始流行病增長率,但在流行病動態開始偏離指數增長時可能有不同的時間點。
因此,本文使用拉丁超立方(LH)抽樣方法,其中抽取了實際范圍內的大部分參數,然后對于每個樣本,只計算兩個參數,即傳輸參數和總體死亡率。這使我們能夠檢查與數據和所有參數的已知實際范圍一致的潛在模型行為范圍。
實際值的范圍非常廣泛,上限為1(代表完美報告和完全處于危險中的人群),并且其下限通過取得仍然產生良好擬合的最低值來確定。本文對每個案例(采樣了1000個參數集,同時測試數據中每個范圍的極值,以說明模型在實際范圍內產生的全部潛在行為。
圖中,紅色表示累計病例總數,綠色表示累計死亡總數,藍色×表示實際的累計病例總數,紫色×表示實際累計死亡總數。
從圖中可以看出,自2014年11月12日以后,該模型計算得到的數據與利比亞的實際數據非常吻合,表明該模型具有較好的適應性。
結論
本文模型中存在大量參數,并且僅使用簡單的加速度方法可能無法獲得全局最優解。且擬合結果仍然存在一些差異,應該引入更多變量,并且對于參數估計,選擇遺傳算法如群算法進行求解,從而可以得到更好的全局最優解。
參考文獻:
[1]World Health Organization.Ebola response roadmap - Situation report,http://www.who.nt/csr/disease/ebola/situation-reports/en/, 2014.
[2]Marisa C.Eisenberg,Joseph N.S.Eisenberg,JeremyP.DSilva,EdenV.wells.”Modeling surveillance and interventions in the 2014 Ebola epidemic”The Lancet Infections Diseases(2015)