趙露露,李 星,金新政
(華中科技大學同濟醫學院醫藥衛生管理學院,湖北 武漢 430030)
冠狀病毒是一個大型病毒家族,已知可引起感冒、中東呼吸綜合征(MERS)和嚴重急性呼吸綜合征(SARS)等較嚴重疾病[1]。新型冠狀病毒是以前從未在人體中發現的冠狀病毒新毒株,可以在人與人之間傳染,主要的傳播途徑是呼吸道飛沫傳播和接觸傳播,各個年齡段的人均易感。
2019年12月,湖北省武漢市發現多起新冠肺炎感染者,隨后新冠肺炎開始在武漢市內大范圍的傳播、爆發。隨之,中國其他地區也出現感染者。截至2020年6月,國內新冠肺炎疫情已經得到了很好的控制。但是,此次新冠肺炎疫情對我國人民的生活和經濟發展造成了嚴重的影響。此類突發公共衛生事件具有波及方式多元、規模大、危害性嚴重等特點[2]。數學建模對傳染病傳播過程的描述、分析、預報和控制能起到積極的作用,為降低以后此類突發公共衛生事件對人民生活和社會經濟的影響程度,有必要對新冠肺炎疫情數據建模后進行回顧性分析。鑒于新冠肺炎是一種新型的傳染病,對它知之甚少,在前期不可能擁有太多的案例的情況下,本研究采用灰色模型的思想來對其數據進行建模預測,事實證明,灰色預測模型在此類突發公共衛生事件的預測中具有較高的準確性,現將具體研究情況報告如下。
從國家衛生健康委員會官方網站[3]選取2020年2月6日-4月2日全國(除湖北省外)每日本土新增的新型冠狀病毒感染的肺炎患者數據,數據真實可靠、可信度高。
本文采用灰色預測模型中的GM(1,1)模型來預測傳染病病毒感染的患者人數的變化[4],主要是預測該傳染病病毒感染的患者人數為零的時間點,即“勝利日”的具體時間,并與實際“勝利日”數據做對比,以分析GM(1,1)模型在預測此類突發公共衛生事件受感染患者人數是否具有科學性。
GM(1,1)模型中的兩個“1”分別代表的是模型中包含1個變量,且這個變量近似符合1階線性微分方程[5]。建立GM(1,1)模型的具體步驟如下:
首先確定原始的數據組,假設原始數據組包括n個數據,那么數據可以表示為:
X(0)={X(0)(1),X(0)(2),X(0)(3)…X(0)(n)}
(1)
然后假設X(1)為X(0)做1-AGO生成得到的數據組,則X(1)表示為:
X(1)={X(1)(1),X(1)(2),X(1)(3)…X(1)(n)}
(2)
接下來用X(0)與X(1)來建立矩陣B和YN矩陣,具體計算方法如下:
(3)
(4)
然后使用最小二乘法,通過B和YN計算出a和b:
(5)
接著將a和b代入時間序列方程之中,這樣就可以得到GM(1,1)模型的方程:
(6)
最后,可以通過下列式子計算出相應的模型預測值:
(7)
為了檢驗GM(1,1)模型的精準性,需要對該模型的精度進行測試,主要包括小誤差概率P和后驗差比值C,首先計算小誤差概率P。
假設該模型的殘差為F(K),也就是實際值與預測值之差:
(8)
同時,計算出原數據組X(0)的方差S0:
(9)
然后根據殘差的方差S0乘以0.6745確定一個標準,小誤差概率P計算的就是殘差與殘差平均值差的絕對值落在這個標準內的概率:
(10)
然后計算后驗差比值C,根據數據的殘差F(K),計算出殘差的方差S1,再根據后驗差比值等于原數據的方差除以殘差的方差,計算出C:
(11)
(12)
計算出來的后驗差比值C與小誤差概率P,結合擬合等級檢驗評判表(見表1),可以判斷模型的擬合等級,以此為依據來檢驗該模型是否具有科學性,以及是否可以外推用于預測。

表1 GM(1,1)模型擬合程度等級檢驗評判表
全國(除湖北省外)2月6-10日新型冠狀病毒感染的肺炎每日新增確診病例數(見表2)為原始數據X(0):X(0)={X(0)(1),X(0)(2) ,X(0)(3),X(0)(4)}=(696, 558, 509, 444, 381);對原始數據X(0)處理累加得X(1):X(1)={X(1)(1),X(1)(2) ,X(1)(3),X(1)(4)}=(1254, 1763, 2207, 2588);接下來結合公式(5)及相應數據計算出參數a=-0.1248554,b=687.3141;將X(0)(1)、a、b等帶入公式計算,最終得新型冠狀病毒肺炎感染的患者每日新增確診病例數GM(1,1)灰色預測模型X(1)(k+1)=5,504.88-480,888e-0.124855k。根據所得預測模型測得2月6-18日全國(除湖北省外)新型冠狀病毒感染的肺炎確診病例數,并與2月6-18日全國(除湖北省外)新型冠狀病毒肺炎病例實際數值進行比較,計算得出殘差和相對誤差,相關數據見表3。

表3 全國(除湖北省外)2020年2月6-18日
為了檢測模型的精度,根據GM(1,1)模型精度評判標準計算后驗差比值C和小誤差概率P來判斷模型的精度等級。根據以上數據的計算以及公式(10)和公式(12),得到上述模型中的C=0.061965026,P=1,參考擬合等級檢驗評判表可知C≤0.35,P≥0.95,該模型的精度等級為優,平均相對誤差經計算結果為1.19%。因此,可以認定本文的GM(1,1)模型可以較為精準地描述該市傳染病感染者每日新增人數的變化趨勢,也可以用該模型進行未來的傳染病感染者每日新增人數的預測,見圖1。
通過表3可以發現,全國(除湖北省外)新型冠狀病毒感染肺炎的新增人數一直呈現遞減的態勢,且在2月14-18日新增數持續小于模型預測值,并且差值逐漸增大,說明全國(除湖北省外)居家封閉式管理等措施成果顯著,疫情持續向好發展。
利用模型對疫情勝利日進行預測,從圖1可以看出,全國(除湖北省外)新型冠狀病毒感染的肺炎每日新增人數在4月初趨近于零,即模型預測的疫情“勝利日”為4月初。而實際情況是,除湖北外的全國疫情在3月底(除去境外輸入病例)接近結束。

圖1 全國(除湖北省外)新型冠狀病毒感染的肺炎患者每日新增人數預測
如圖2所示,全國(除湖北省外)2月6日到4月2日新型冠狀病毒感染的肺炎患者每日新增人數預測值與實際新增人數對比,模型預測時間與實際時間相差不大,說明灰色預測模型在類似傳染病等公共衛生事件中,能進行基于歷史數據的分析,通過對數據的計算分析出公共衛生事件的大致結束時間。
灰色預測GM(1,1)模型的成功應用,解決了生產、生活和科學技術等領域的大量實際問題,應用范圍已經擴展到設計、能源、軍事、金融、醫學、環境、體育等領域。近年來,大量研究者對GM(1,1)算法的優勢與局限性進行深入的研究,使其應用于諸多領域。馬寧等[6]用灰色模型GM(1,1)預測全國及遼寧省2015-2018年手足口病發病趨勢,與實際情況較為符合,模型預測精度為優,能較好的為手足口病防治工作提供參考和科學依據。高凡[7]應用灰色系統理論研究高速列車ATO(列車自動駕駛)系統速度控制器模型,建立的GM(1,1)模型通過實際線路驗證了速度控制器的仿真結果,表明該方法具有較高的預測精度,生成的策略能有效地控制列車。康永等[8]利用灰色系統建立GM(1,1)預測模型,將預測結果與實際市場銷售量進行對比,發現預測結果與實際市場銷售量相吻合,利用灰色預測模型預測銷售量,從而減少了制定生產計劃中的盲目性,有利于企業的生產調控。

圖2 全國(除湖北省外)2月6日-4月2日新型冠狀病毒感染的肺炎患者每日新增人數預測與實際新增人數對比
自從鄧聚龍教授創立灰色系統理論開始,經過20多年的發展,灰色系統理論已成為研究的前沿熱點,它涉及多個研究領域,基于“小樣本”“貧信息”進行預測的灰色預測方法與其他預測方法相比具有自己的優勢。在事件發生初期,信息量有限時,不需要大量數據,只需4、5個統計數據,灰色預測模型就可以預測某特征量隨著時間推移變化的規律以及將來的發展趨勢。灰色預測模型利用單一的變量建立起來的一階線性微分動態時間序列模型,可以掌握數據之間的規律,對數據未來的變化規律進行預測[9]。在本文的研究中,基于前期少量的數據建立GM(1,1)模型后利用模型預測疫情的勝利日,與實際日期非常接近,說明灰色預測模型的精確性較好。未來灰色預測模型可以用于醫學研究領域,進行疾病發病率、死亡率、新增感染人數等方面的研究分析。