李盈科 趙時(shí) 樓一均 高道舟 楊琳 何岱海?
1) (新疆農(nóng)業(yè)大學(xué)數(shù)理學(xué)院, 烏魯木齊 830052)
2) (香港中文大學(xué)賽馬會(huì)公共衛(wèi)生及基層醫(yī)療學(xué)院, 香港 999077)
3) (香港理工大學(xué)應(yīng)用數(shù)學(xué)系, 香港 999077)
4) (上海師范大學(xué)數(shù)學(xué)系, 上海 200234)
5) (香港理工大學(xué)護(hù)理學(xué)院, 香港 999077)
一種新型冠狀病毒感染導(dǎo)致的肺炎自2019年12月至今在我國(guó)以及200多個(gè)國(guó)家和地區(qū)傳播.本文旨在介紹近期關(guān)于新型冠狀病毒肺炎的幾個(gè)重要流行病學(xué)參數(shù)的研究進(jìn)展和估計(jì)方法, 包括基本再生數(shù)、潛伏期和代間隔, 同時(shí)還介紹兩個(gè)動(dòng)力學(xué)模型及其結(jié)果.這些參數(shù)刻畫了新型冠狀病毒肺炎的傳播特點(diǎn), 影響控制策略的制定和有效性.簡(jiǎn)要來說, 新型冠狀病毒肺炎的基本再生數(shù) R0 的中位數(shù)為2.6, 潛伏期均值約為5.0 d,代間隔均值約為5.5 d.這表明新型冠狀病毒肺炎傳播速度快.諸如對(duì)確診病人的隔離治療、對(duì)疑似病例的隔離、對(duì)密切接觸者的追蹤、對(duì)疾病信息的宣傳和采取自我防護(hù)等防控措施能有效降低疾病暴發(fā)的風(fēng)險(xiǎn)和規(guī)模.
綜述
2020年1月30日, 世界衛(wèi)生組織將新型冠狀病毒疫情列為國(guó)際關(guān)注的突發(fā)公共衛(wèi)生事件(PHEIC).2月8日, 中國(guó)國(guó)家衛(wèi)健委將這種肺炎暫命名為“新型冠狀病毒肺炎(novel coronavirus pneumonia, NCP)”, 簡(jiǎn)稱“新冠肺炎”.2月11日,世界衛(wèi)生組織將新型冠狀病毒感染的肺炎命名為“ coronavirus disease 2019 (COVID-19)”.3月11日, 世界衛(wèi)生組織將此次疫情定性為全球大流行(pandemic), 意味著此次疫情的影響范圍已遠(yuǎn)超2003年的非典疫情, 達(dá)到全球性傳播.這是20世紀(jì)以來首次由一種冠狀病毒導(dǎo)致的大流行,此前的幾次大流行全部是由甲型流感病毒引起的.其中1918-19 A/H1N1流感導(dǎo)致全球約三千萬人死亡, 1957-58 A/H2N2 流感和 1968 A/H3N2 流感各導(dǎo)致1百萬至4百萬人死亡.截至2020年4月10日新冠肺炎已經(jīng)導(dǎo)致160多萬病例和9萬多人死亡.在實(shí)施有效措施等前提下, 我國(guó)的本地疫情已經(jīng)基本受控, 目前以輸入病例為主.防控的成功與對(duì)病毒傳播特點(diǎn)的了解密不可分.本文旨在介紹描述新冠肺炎傳播特點(diǎn)的幾個(gè)關(guān)鍵參數(shù)和建模的一些經(jīng)驗(yàn).
武漢金銀潭醫(yī)院的Huang等[1]發(fā)表在醫(yī)學(xué)期刊《柳葉刀》上的研究結(jié)果給出了受新型冠狀病毒感染的41位早期入院治療病人的流行病學(xué)特征.他們指出, 對(duì)這種新型冠狀病毒的起源、傳播途徑、人類傳播持續(xù)時(shí)間和疾病臨床表現(xiàn)等方面認(rèn)識(shí)尚不夠清楚, 需要進(jìn)一步研究以增進(jìn)認(rèn)識(shí).中國(guó)疾控中心的Li等[2]發(fā)表在《新英格蘭醫(yī)學(xué)雜志》和香港大學(xué)Joseph等[3]發(fā)表在《柳葉刀》上的文章給出了疾病早期傳播特征和流行病學(xué)重要指標(biāo).這三篇文章被后來的研究者廣泛引用.
基本再生數(shù) R0(basic reproduction number)是傳染病學(xué)中最核心的指標(biāo)之一, 表示一個(gè)典型的感染者(一代)在其傳染期內(nèi), 在一個(gè)完全易感的人群中所能感染人數(shù)(二代)的期望.通常地, 如果R0>1, 則表明傳染病會(huì)流行.反之, R0<1 則表明傳染病將會(huì)逐漸消失.基于傳染病傳播特征, 建立倉室微分方程模型, 再在無病平衡態(tài)處線性化系統(tǒng)得到下一代矩陣, 最后通過計(jì)算下一代矩陣的譜半徑得到基本再生數(shù)[4].實(shí)際中, 也可以通過擬合傳染病數(shù)據(jù)(基于確診日期或發(fā)病日期的每日新增病例數(shù)據(jù)), 得到早期指數(shù)增長(zhǎng)階段的增長(zhǎng)率(記為r), 再利用增長(zhǎng)率和其他參數(shù)(如代間隔)來估計(jì)基本再生數(shù).根據(jù) R0的定義, 大體有三種估計(jì)方法: 第一, 直接從病例調(diào)查報(bào)告看一個(gè)一代病例會(huì)導(dǎo)致幾個(gè)二代病例(假定所有人都易感), 這是一線公衛(wèi)人員的常用方法.第二, 因?yàn)橐咔槌跗诟腥救藬?shù)往往指數(shù)增長(zhǎng)(流行病的特點(diǎn)), 所以用指數(shù)函數(shù)擬合初期一段時(shí)間的病例數(shù)據(jù)得到增長(zhǎng)率r.R0等于代間隔的概率分布(通過分析病例調(diào)查報(bào)告得到)的矩量生成函數(shù) (moment generating function)在 ? r 取值的倒數(shù).第三, 在了解傳染病傳播的特點(diǎn)后, 寫出其傳播的動(dòng)力學(xué)模型, 這時(shí) R0等于疾病傳播速度乘以病人平均傳染期, 通過擬合動(dòng)力學(xué)模型到每日新增病歷數(shù)據(jù), 從而得到 R0的估計(jì).考慮到防控措施的影響, 有效再生數(shù) Re(effective reproduction number)可以更好地刻畫傳染病動(dòng)力學(xué)[5],它的計(jì)算方法與基本再生數(shù)類似.
有證據(jù)顯示新冠肺炎病人在潛伏期后期有明顯的傳染性, 所以有必要介紹一下潛伏期的概念.潛伏期常被用作 incubation period和 latent period的中文翻譯, 但事實(shí)上兩者有著顯著差異.一般地, incubation period是從個(gè)體感染病原體到出現(xiàn)癥狀的這段時(shí)間, 而latent period是從個(gè)體感染病原體到具有傳染性所經(jīng)歷的時(shí)間段(也可以稱為潛隱期).換句話說, incubation period 是通過臨床上有無癥狀來刻畫的, 但是latent period是通過是否有傳染性來刻畫的.一般來說, latent period 可以比 incubation period 短, 也可以一樣.潛伏期的估算對(duì)防疫有重大意義.譬如從最后一個(gè)病例連續(xù)兩次檢測(cè)為陰性起, 連續(xù)觀察兩個(gè)最大潛伏期沒有新增病例, 通常看作是本地疫情結(jié)束的標(biāo)志.目前新冠肺炎的疫情數(shù)據(jù)是基于臨床癥狀統(tǒng)計(jì)的, 所以本文所述潛伏期估計(jì)主要針對(duì)incubation period[6?8].
代間隔 (generation interval, GI)指一代病例被感染的時(shí)間到二代病例被感染的時(shí)間之間隔.代間隔對(duì)于衡量疾病的傳播速度具有重要作用[9,10].因?yàn)橥ǔ2恢啦∪吮桓腥镜臅r(shí)間, 所以代間隔不可觀測(cè).而有癥狀的病人發(fā)病時(shí)間(首次出現(xiàn)癥狀)通常是可知的.所以通常用相鄰兩代病例出現(xiàn)癥狀的時(shí)間差來近似, 也稱為代間隔(serial interval,SI).實(shí)際上這兩者有差別, 然而因?yàn)榍罢咄ǔ2灰子^測(cè), 所以在實(shí)踐中常以后者來代替.關(guān)于新冠肺炎, 有些文獻(xiàn)發(fā)現(xiàn)代間隔接近或者短于潛伏期, 由此推斷染病者在潛伏期后期即具有傳染性[11].有工作發(fā)現(xiàn)43%的傳染是發(fā)生在癥狀出現(xiàn)前[12].
Wallinga和Lipsitch[9]從種群增長(zhǎng)的角度由Lotka-Euler公式導(dǎo)出的基本再生數(shù) R0的計(jì)算公式為

由常微分方程刻畫的傳染病動(dòng)力學(xué)模型, 以van den Driessche 和 Watmough[4]提出的計(jì)算基本再生數(shù) R0的方法被普遍使用.在此基礎(chǔ)上, 基本再生數(shù) R0的計(jì)算方法推廣到年齡結(jié)構(gòu)模型、周期微分方程模型、反應(yīng)擴(kuò)散方程模型以及時(shí)滯微分方程模型等.

表1 不同模型或分布下的基本再生數(shù) R0 的計(jì)算公式Table 1.The formula of the basic reproduction number R0 under different models or distributions.
增長(zhǎng)率r也可通過其他方法得到.在這次疫情中, 國(guó)內(nèi)外的多個(gè)團(tuán)隊(duì)利用在海外確診的病例數(shù)、病例從暴露到被檢測(cè)到的時(shí)間、以及向海外人員輸出流量估計(jì)出武漢市在不同時(shí)間的可能感染人口規(guī)模和基本再生數(shù)[13?15].我們?cè)?PubMed, bio-Rxiv, medRxiv 和 Google Scholar等數(shù)據(jù)庫及預(yù)印本平臺(tái)分別按關(guān)鍵詞“basic reproduction number& 2019-nCoV (COVID-19, NCP)” , “ incubation period (latent period) & 2019-nCoV (COVID-19,NCP)”, “serial interval & 2019-nCoV (COVID-19, NCP)” 進(jìn)行搜索, 時(shí)間段是 2019年11月1日至2020年2月10日左右, 篩選獲取的關(guān)于前述3個(gè)參數(shù)的信息匯總見表2—表4[1,2,3,5?7,11,16?25].
厘清關(guān)鍵參數(shù)的定義和最新估值是非常重要的.比如在疫情初期Li等[2]根據(jù)6例病人得到代間隔 7.5 d.因?yàn)椴±龜?shù)少, 估計(jì)的可靠性偏弱.后期的大樣本統(tǒng)計(jì)發(fā)現(xiàn)7.5 d可能高估了.但是相當(dāng)多的建模仍然繼續(xù)使用初期估計(jì).而且有發(fā)現(xiàn)代間隔SI為負(fù)的情況(一代病例出現(xiàn)癥狀的時(shí)間晚于二代病例出現(xiàn)癥狀的時(shí)間), 但是要注意, 根據(jù)定義, 真正的代間隔GI是不可能為負(fù)的(一代病例被感染的時(shí)間必然早于二代病例被感染的時(shí)間).只有在充分了解定義后, 才能明白此時(shí)那些負(fù)的觀測(cè)是不能用于估計(jì)GI的分布的.只有理解潛伏期(以癥狀論)與潛隱期(以傳染性論)的差別, 才能寫出簡(jiǎn)潔合理的動(dòng)力學(xué)模型.所以, 對(duì)傳染病基本參數(shù)的理解和估計(jì)是極其重要的.
表2 新冠肺炎基本再生數(shù)總結(jié)Table 2.Summary of the basic reproduction number R0 for COVID-19.

表2 新冠肺炎基本再生數(shù)總結(jié)Table 2.Summary of the basic reproduction number R0 for COVID-19.
注: 表2—表4中參考文獻(xiàn)數(shù)據(jù)均來自國(guó)家衛(wèi)健委、湖北衛(wèi)健委、中國(guó)CDC等網(wǎng)站及已發(fā)表文獻(xiàn).
?

表3 新冠肺炎潛伏期統(tǒng)計(jì)Table 3.Summary of the incubation period for COVID-19.

表4 新冠肺炎的代間隔統(tǒng)計(jì)Table 4.Summary of the serial interval for COVID-19.
經(jīng)過兩個(gè)多月的努力, 武漢市的新冠肺炎疫情得到了全面有效的控制, 終于在2020年4月8日迎來解封.但是對(duì)武漢市的新冠肺炎疫情的研究在一段時(shí)間內(nèi)仍然是重要的.比如1918年流感一直被研究, 已經(jīng)有一百多年了.針對(duì)武漢市的新冠肺炎疫情, 根據(jù)疫情的發(fā)展階段、研究動(dòng)機(jī)以及模型呈現(xiàn)形式, 目前已經(jīng)有不少出色的建模研究.下面簡(jiǎn)要介紹本課題組所做的部分工作, 分別稱之為概念模型(conceptual model)和模擬動(dòng)力學(xué)模型(imitation dynamics model).
3.1.1 模型及其參數(shù)
團(tuán)隊(duì)成員此前對(duì)1918年流感在英國(guó)倫敦的三波疫情的研究于2013年發(fā)表在英國(guó)皇家學(xué)會(huì)的通訊上[26], 受到媒體廣泛關(guān)注, 被認(rèn)為首次揭示了這一現(xiàn)象背后的機(jī)理.此次新冠肺炎輕微癥狀患者的比例高和代間隔相對(duì)短的特征與非典(SARS)和中東呼吸綜合征(MERS)相差較大, 而與1918年流感在倫敦流行的特點(diǎn)有相似之處, 體現(xiàn)在具有相近的基本再生數(shù)與粗感染死亡率(raw infection fatality rate).有臨床工作發(fā)現(xiàn)兩種病毒從病人呼吸道排出的時(shí)間規(guī)律也相似.同時(shí)注意到, 此次疫情發(fā)展過程中政府的控制措施和民眾的反應(yīng), 諸如封鎖城市、延長(zhǎng)假期、隔離患者和入院治療等措施都影響新冠肺炎的流行趨勢(shì).綜合這些因素, 根據(jù)倉室建模的思想, 提出了以下概念模型[27]:

其中β(t)= β0(1? α)(1?D/N)κ.
模型基于經(jīng)典的 SEIR (易感-暴露-染病-移出)模型, 這里環(huán)境傳染源F (來自動(dòng)物的病毒),總?cè)丝跀?shù)N, 對(duì)危重和死亡病例的重視人數(shù)D, 累積病例數(shù)C (包含報(bào)告和漏報(bào))的耦合.模型基于以下3條假設(shè): 1) 2019年12月前疾病的傳播方式是動(dòng)物感染人(由F刻畫), 這之后主要是人傳人(由 β (t) 刻畫); 2) 政府的階段性控制措施效力主要發(fā)生在 2020年1月23日之后, 由 β (t) 中 α 刻畫,如2020年1月23日—29日期間 α =0.4249 , 在這之后 α =0.8478.β (t) 中 κ 主要用來刻畫民眾對(duì)疫情的響應(yīng)強(qiáng)度; 3) 武漢市居民出城主要集中在2019年12月31日至 2020年1月22日之間.病例數(shù)據(jù)主要來自官方公開數(shù)據(jù)和公開發(fā)表文獻(xiàn)數(shù)據(jù), 模擬過程中也考慮了報(bào)告數(shù)據(jù)的不完整性和滯后性等因素.模型中的一部分參數(shù)由合理假設(shè)給出, 如兒童病例較少, 可假設(shè)易感人群占總?cè)丝诒壤秊?0%, 其他參數(shù)由病例數(shù)據(jù)擬合而得, 詳見概念模型[27]中表1.
此模型強(qiáng)調(diào)了公眾采取自我保護(hù)措施的重要性, 這一非藥物手段的作用已被許多國(guó)內(nèi)外研究者所認(rèn)可, 也符合邏輯.同時(shí)在模擬過程中考慮確診率和確診延遲也非常重要, 但仍有相當(dāng)多的工作忽視它.確診率在1月3日以前可能只有2%, 因?yàn)槿藗儗?duì)于這種新病毒認(rèn)知有限, 而不可避免地出現(xiàn)錯(cuò)漏.但是隨著人們對(duì)病毒認(rèn)識(shí)的增加和檢測(cè)能力的改善, 到封城前確診率已達(dá) 14%.事實(shí)上, 早期武漢市的新冠肺炎病人采樣需要送北京檢測(cè), 后來才可以在武漢本地檢測(cè).檢測(cè)能力從開始的每天200例, 到2月5日增長(zhǎng)到每天上萬例.只有快速檢測(cè)確診, 病人才能及時(shí)收治, 疫情才可能得到控制.我們關(guān)注的是能否通過模型模擬確認(rèn)檢測(cè)能力的變化.在不清楚檢測(cè)能力的情況下, 認(rèn)為不能簡(jiǎn)單地追求擬合的好壞.錯(cuò)誤的假設(shè)(比如認(rèn)為檢測(cè)能力是恒定的)往往得出錯(cuò)誤的結(jié)論.概念模型的新穎之處包括: 考慮了公眾自我保護(hù)行為的效果,考慮了確診延遲(即模型的結(jié)果在早期要后推兩周才能與報(bào)告新增病例對(duì)比), 考慮了確診率的變化(沒有直接擬合, 而且通過對(duì)比模型結(jié)果與報(bào)告新增反推檢測(cè)率的變化), 使用了較合理的潛隱期(從而考慮了潛伏期末期的傳染性), 考慮了封城前人口的移出, 考慮了12月前環(huán)境到人的傳播等.
3.1.2 概念模型結(jié)果
排除政府舉措強(qiáng)度和公眾響應(yīng)強(qiáng)度一方或者雙方不發(fā)揮作用的兩種極端情形.考慮兩種強(qiáng)度均存在的情形, 主要模擬結(jié)果如下 (這與其他研究團(tuán)隊(duì)的研究結(jié)果基本一致).
(I) 相對(duì)于最初動(dòng)物感染的41例病例, 我們預(yù)測(cè)有145例, 得到確診的報(bào)告率約為28%.
(II) 截止2020年1月18日, 武漢市的累積病例為4648人.
(III) 相對(duì)于香港大學(xué)專業(yè)團(tuán)隊(duì)估計(jì)的2020年1月27日的累積病例數(shù) 25630 (95% CI: 12260—44440), 我們預(yù)測(cè)為16589例, 估計(jì)值處于此置信區(qū)間內(nèi).
(IV) 武漢市的累積病例在2020年4月底將會(huì)達(dá)到84116例(其中包含無癥狀和未登記的).
(V)在 2月17日后, 基本再生數(shù) R0降為 0.疫情的確診率隨時(shí)間的仿真結(jié)果見圖1.
圖1(a)展示了概念模型結(jié)果與實(shí)際報(bào)告病例的比對(duì).注意概念模型關(guān)注的是整體上的符合, 并不是完美的擬合, 而圖1(b)展示了確診率的變化.這個(gè)模擬的確診率的變化是政府強(qiáng)有力控制措施的一個(gè)體現(xiàn).只有確診率達(dá)到一定程度, 武漢市的疫情才能在相對(duì)短的時(shí)間內(nèi)得到控制.早期的快速擴(kuò)散正是由于確診能力不足導(dǎo)致的.有沒有考慮確診率的變化嚴(yán)重影響模型的擬合和對(duì)結(jié)果的解釋.當(dāng)一種新的傳染病出現(xiàn)時(shí), 開始人們對(duì)疾病的病原學(xué)和流行病學(xué)認(rèn)識(shí)有限, 導(dǎo)致確診率不高, 隨著對(duì)傳染病的逐步了解, 檢測(cè)試劑盒的研發(fā)與投放, 檢測(cè)能力逐步提升.這些情況在建模和擬合數(shù)據(jù)時(shí)都應(yīng)該考慮, 否則得到的結(jié)論很可能與實(shí)際情況產(chǎn)生較大偏差.

圖1 (a)每日新增病例模擬與確診報(bào)告對(duì)比; (b) 每日確診報(bào)告率Fig.1.(a) Daily new cases simulated versus reporting; (b) daily reporting rate.
在模擬動(dòng)力學(xué)模型[28]中我們進(jìn)一步考慮了公眾的行為改變.實(shí)際上是用不同的建模思想再次強(qiáng)調(diào)公眾的行為改變(我們假定是自主的, 實(shí)際上有部分是政府引導(dǎo))的重要性.這里仍以武漢市為例.我們強(qiáng)調(diào)模型應(yīng)該考慮公眾的行為改變, 這樣得到的預(yù)測(cè)結(jié)果(比如疫情規(guī)模)才能比較合理.不能簡(jiǎn)單地套用經(jīng)典的傳染病模型.因?yàn)榻?jīng)典的傳染病模型給出的疫情規(guī)模往往是高估的, 疫情規(guī)模(在一次暴發(fā)中被感染人口占總?cè)丝诘谋壤? 假定初始所有人易感)記為 z, 則 z =1?exp(?R0z) 給出 z與 R0的關(guān)系[29].這個(gè)關(guān)系再次突出了 R0的重要性.在1918年流感和2009年流感中, 一年后感染率都遠(yuǎn)低于理論上的預(yù)測(cè), 其中一個(gè)重要原因是理論預(yù)測(cè)忽視了公眾行為的改變對(duì)疫情發(fā)展的影響.
3.2.1 模型及其參數(shù)
根據(jù)人們采取的防護(hù)措施(如戴口罩、勤洗手、減少聚集性活動(dòng)等)的意愿和防護(hù)效果的不同,我們?cè)趥鹘y(tǒng)的SEIR模型的基礎(chǔ)上, 將易感人群分成采取防護(hù)措施者M(jìn)和沒有采取防護(hù)措施者U兩部分.此時(shí)總?cè)丝?N =U+M+E+I+R.另外加入?yún)?shù)p用來描述人們?cè)敢獠扇》雷o(hù)措施的概率.疫情的有效控制在很大程度上也取決于民眾采取防護(hù)措施意愿的大小, 模型如下[28]:

這里 β 是傳播系數(shù), α 表示采取防護(hù)后傳染系數(shù)減少的幅度, ξ 表示對(duì)采取防護(hù)措施與否態(tài)度的轉(zhuǎn)變量, κ 為態(tài)度轉(zhuǎn)變后的得失的敏感系數(shù).
3.2.2 模型結(jié)果
選擇歐拉固定步長(zhǎng)多項(xiàng)式分布(Euler fix-step multinomial distribution)來模擬自然系統(tǒng)的噪聲,選取泊松分布作為似然函數(shù)來模擬觀察噪聲和擬合數(shù)據(jù), 并且以此選取置信區(qū)間的評(píng)判準(zhǔn)則以及初值等.同時(shí)也將估計(jì)的參數(shù)值和模型輸出結(jié)果(如病例數(shù)等)和文獻(xiàn)中的發(fā)現(xiàn)做對(duì)比, 來檢驗(yàn)我們的分析結(jié)果.通過調(diào)整得失系數(shù) κ 和措施有效性系數(shù)α來模擬它們對(duì)武漢市的新冠肺炎疫情高峰、規(guī)模等的影響.主要結(jié)果為:
(I) 武漢市的新冠肺炎的基本再生數(shù) R0= 2.5(95% CI: 2.4—2.7);
(II) 高峰時(shí)期 1000 人中大約有 0.28 (95% CI:0.24—0.32)個(gè)染病者, 人群中最終大約有1.35%(95% CI: 1.00%—2.12%)的染病者;
(III) 疫情大體在 2月9日 (95% CI: 01/31/2020—03/27/2020)得到了遏制(此時(shí)有效再生數(shù)Re<1);
(IV) 民眾提高認(rèn)知(增加 κ )和加強(qiáng)阻斷傳播(減少 α )可以有效控制新冠病毒的傳播.
這里只簡(jiǎn)要介紹建模思想、模型方程和主要結(jié)果.我們認(rèn)為經(jīng)典模型一般不適用于疫情最終規(guī)模的預(yù)測(cè), 應(yīng)該考慮公眾行為的改變(有部分是政府措施導(dǎo)致).確診率隨時(shí)間的變化也應(yīng)該在對(duì)比模型結(jié)果與實(shí)際報(bào)告數(shù)據(jù)時(shí)加以考慮, 才有可能得出較合理的疫情發(fā)展趨勢(shì)和規(guī)模預(yù)測(cè).規(guī)模的預(yù)測(cè)是相當(dāng)困難的課題, 通常需要血清學(xué)研究來證實(shí).
在厘清概念的基礎(chǔ)上, 有很多現(xiàn)成的程序包可以使用.比如EpiEstim R程序包就是基于(1)式的R程序包.我們研究中除使用這個(gè)程序包外, 同時(shí)結(jié)合一個(gè)數(shù)據(jù)包nCoV2019, 它提供的實(shí)時(shí)各國(guó)每日新增確診數(shù)據(jù), 總確診數(shù)前40位的國(guó)家的疫情顯示在圖2和圖3中.這里的粉紅色曲線代表瞬時(shí)再生數(shù), 就是在一個(gè)時(shí)間窗口內(nèi)使用(1)式.當(dāng)瞬時(shí)再生數(shù)高于1時(shí), 每日新增會(huì)快速增長(zhǎng).當(dāng)瞬時(shí)再生數(shù)低于1時(shí), 每日新增會(huì)逐漸下降.瞬時(shí)再生數(shù)通過1對(duì)應(yīng)的時(shí)間為拐點(diǎn).隨著各國(guó)局部出現(xiàn)一定程度的群體免疫(感染人口增加、易感人口下降)及社交距離擴(kuò)大, 一部分國(guó)家已經(jīng)出現(xiàn)拐點(diǎn).同時(shí), 仍然有一部分國(guó)家處于上升階段.由圖2和圖3可知, 再生數(shù)曲線(紅線)在綠線以下, 即當(dāng)時(shí)的瞬時(shí)再生數(shù)小于1, 表明此時(shí)疫情得到控制.在3月30日之后, 奧地利、意大利、澳大利亞和挪威等國(guó)家疫情基本得到控制.而巴西、印度、日本和塞爾維亞疫情形勢(shì)依然嚴(yán)峻.中國(guó)自3月份以來,盡管再生數(shù)在一段時(shí)間有大于1的情況, 但這段時(shí)間主要是輸入病例, 與以本地病例為主的其他國(guó)家不同.總的來說, 進(jìn)入 4月份, 全球疫情出現(xiàn)放緩趨勢(shì), 但巴基斯坦、秘魯和法國(guó)等國(guó)也出現(xiàn)了反彈,各國(guó)家仍需警惕.中國(guó)控制新冠肺炎的經(jīng)驗(yàn)值得其他國(guó)家借鑒.
我們的統(tǒng)計(jì)分析表明, 在疫情初期, 基本再生數(shù) R0的均值為 3.4, 中位數(shù)為 2.6, 潛伏期均值約為 5.0 d, 世代間隔均值為 5.5 d.利用 van den Driessche和Watmough[4]提出的下一代矩陣的方法, 在疫情暴發(fā)初期由概念模型得到的基本再生數(shù)R0=2.8, 但整個(gè)疫情過程中有效再生數(shù) Re隨時(shí)間在變化.新冠肺炎的病死率與1918年大流感的病死率2%大體一致.

圖2 累積病例最多的前20個(gè)國(guó)家的日確診病例和瞬時(shí)再生數(shù)的曲線關(guān)系圖Fig.2.Curves of daily confirmed cases and instantaneous reproductive number of the top 20 countries with the most cumulative cases.

圖3 累積病例最多的第21—40國(guó)家的日確診病例和瞬時(shí)再生數(shù)的曲線圖Fig.3.Curves of daily confirmed cases and instantaneous reproductive number of the 21st ? 40th countries with the most cumulative cases.
對(duì)基本再生數(shù) R0、代間隔(SI)和潛伏期的估計(jì)的準(zhǔn)確性一方面受到所建立的數(shù)學(xué)模型及其假設(shè)的影響, 另一方面也取決于收集到的數(shù)據(jù)數(shù)量和質(zhì)量、數(shù)據(jù)的分布形式的假設(shè)、數(shù)據(jù)的完整性和純粹性等因素.Guan等[11]對(duì)早期1099例入院患者進(jìn)行的研究表明潛伏期的中位數(shù)可能較短, 為4 d.除了基本再生數(shù)、潛伏期和代間隔, 倍增時(shí)間(doubling time, 感染人口規(guī)模加倍所花費(fèi)的時(shí)間)也是研究傳播力的重要參數(shù)[2,3].醫(yī)學(xué)及健康大數(shù)據(jù)分析和建模在此次疫情的防控過程中得到體現(xiàn)[30,31].有團(tuán)隊(duì)利用騰訊或百度平臺(tái)得到人口在城市間的流動(dòng)數(shù)據(jù), 還有團(tuán)隊(duì)利用了手機(jī)數(shù)據(jù)[32].
疫情暴發(fā)早期, 新增病例以指數(shù)增長(zhǎng), 這個(gè)指數(shù)體現(xiàn)了基本再生數(shù)和代間隔的概率分布的關(guān)系.隨時(shí)間變化的新增病例、基本再生數(shù)和代間隔的概率分布這3個(gè)量, 理論上知道其中兩個(gè)可以求出第3個(gè).通常是根據(jù)新增病例的時(shí)間序列、代間隔的概率分布求出基本再生數(shù)(在疫情初期成立).隨著疫情的發(fā)展, 也可以根據(jù)新增病例的時(shí)間序列和代間隔的概率分布, 求出瞬時(shí)再生數(shù).以3月9日至4月6日期間公開的數(shù)據(jù)為基礎(chǔ), 我們繪制出了目前累積病例全球前40位的國(guó)家的再生數(shù)隨時(shí)間的變化圖(見圖2和圖3).
疫情能否得到控制取決于把有效再生數(shù)降到1以下.通過疫情數(shù)據(jù), 結(jié)合報(bào)告率(reporting rate)可以擬合推斷出病例的增長(zhǎng)速度, 再結(jié)合代間隔的分布, 就可以準(zhǔn)確地估計(jì)基本(有效)再生數(shù).防疫措施能降低有效再生數(shù), 通過 Re=1 決定所需要采取的措施的強(qiáng)度.假設(shè)研發(fā)出安全便宜的疫苗, 且有效性為 100%, 根據(jù) Re=ρR0, 其中 ρ 為易感人群占總?cè)丝诘谋壤? 臨界接種率為 1 ?1/R0.即當(dāng)疫苗接種率大于這個(gè)臨界值時(shí), 有效再生數(shù)Re將小于1, 傳染病將逐漸滅絕.通過防疫措施,如對(duì)確診病例的及時(shí)隔離和治療、對(duì)疑似病例和密切接觸者進(jìn)行隔離和檢查、提高個(gè)人的防疫意識(shí),能在一定程度上降低有效再生數(shù).利用優(yōu)化方法可以更加合理地統(tǒng)籌調(diào)配各種防疫資源, 最大程度地降低有效再生數(shù).此外防疫目標(biāo)也需要考慮其他的重要指標(biāo), 如病死率 (case fatality rate, 在流行病學(xué)中指一定時(shí)期內(nèi)因患某種疾病的死亡人數(shù)占總患者的比率)和倍增時(shí)間等[33], 這些都是新冠肺炎防疫的重大課題.
基于流行病學(xué)的大數(shù)據(jù)分析和統(tǒng)計(jì)建模, 在疫情暴發(fā)早期及時(shí)對(duì)傳染病的傳播速度、模式和流行規(guī)模作出準(zhǔn)確估算, 對(duì)防控政策及時(shí)地進(jìn)行評(píng)估,這些都對(duì)早期疫情控制起到了重要作用.隨著疫情的發(fā)展, 政府也實(shí)施了一些強(qiáng)有力的防控措施, 我們相信大數(shù)據(jù)分析和數(shù)學(xué)建模將會(huì)繼續(xù)在后續(xù)的防控措施效力評(píng)估和疫情預(yù)測(cè)中發(fā)揮重要作用.