濰坊醫學院公共衛生與管理學院(261053)
劉玉潔 毛 倩 管佩霞 馮佳寧 王曉璇 朱高培 王素珍△ 石福艷△
【提 要】 目的 建立灰色馬爾科夫預測模型,對湖北省新冠肺炎每日出院人數進行預測。方法 基于2020年3月1日~3月21日的湖北省衛生健康委員會官網新冠肺炎疫情直報數據,構建灰色預測模型,馬爾科夫模型修正預測結果,擬對3月22日~3月24日的湖北省新冠肺炎每日出院人數進行預測。結果 2020年3月22日~3月24日的灰色預測值分別為635、594、555,而實際值分別為490、447、444,其平均相對誤差為29.16%。修正后,修正值分別為556、520、486,其平均相對誤差為13.02%,誤差降低55.17%。灰色預測模型的C=0.30599,P=3.5,灰色馬爾科夫模型的C=0.10699,P=3.5。結論 灰色馬爾科夫模型的精確度高于單一的灰色預測模型,能夠較好地預測每日出院人數。
截至2020年3月21日,湖北新冠肺炎確診人數已達到67800例,隨著政府的統一調配與全國各地對湖北的支援,其出院人數也在逐步增加。此次疫情中每日出院人數受到許多不確定性因素的影響,具有明顯的灰色系統特點[1]。準確預測湖北省的每日出院人數,推斷其未來的變動幅度,可以提升湖北省乃至全國人民對于疫情控制的信心,降低患者與患者家屬對疫病的恐懼感,提高民眾對醫院與醫療技術的信任,減少瞞報甚至逃離醫院等情況的發生,并且對政府科學調配新冠肺炎醫療資源和人群防治有著重要參考意義。此類傳染性疾病的常用預測方法有ARIMA分析法[2-3]、人工神經網絡法[4]、灰色模型預測法[5]、馬爾科夫鏈預測法[6]等。但是,用傳統的單一預測方法往往預測準確度偏低。考慮到灰色預測模型要求原始數據序列需呈單調遞增或遞減趨勢[7-8],且到3月時,湖北的醫療資源充足,疫情趨于平緩,隨著現存確診病例的逐漸消耗,每日出院人數逐漸減少。因此本文利用2020年3月1日至3月21日的湖北省衛生健康委員會官網新冠肺炎疫情直報數據構建灰色模型,再由馬爾可夫模型予以修正,組成灰色馬爾科夫模型以提高單一模型預測的精確度[9-10]。對在醫療資源充足,疫情控制良好的情況下的每日出院人數進行短期預測,為衛生應急醫療資源的配備和管理作出快速反應,并可豐富公共衛生應急管理預測和決策模式的內容。
本文選擇2020年3月1日至2020年3月24日湖北省新冠肺炎每日出院人數為研究對象,數據來源于湖北省衛生健康委員會官網(http://wjw.hubei.gov.cn/)的每日疫情通報。
(1)建立灰色GM(1,1)模型



④灰色預測模型的檢驗


表1 精度檢驗等級參考表
(2)馬爾科夫模型修正
馬爾科夫模型是一個基于狀態轉移的動態系統,系統的狀態始終是隨機的,與先驗狀態無關,這種特性稱為無后效性。可利用先前多個時間段的狀態之間的轉移規律,對系統未來的發展狀態和方向進行預測[12]。
①區間劃分

②狀態轉移概率矩陣


③馬爾科夫性檢驗

④計算馬爾科夫修正預測值

(3)統計分析方法
本研究采用SAS 9.4統計軟件構建新冠肺炎每日出院人數的灰色預測模型,隨后利用Matlab軟件建立灰色預測值的相對值的馬爾科夫鏈模型,以修正灰色預測值。
利用2020年3月1日-21日的湖北省新冠肺炎每日出院人數數據作為原始數據序列,建立灰色模型,結果見表2。

表2 湖北省每日出院人數預測結果及誤差
對表2中3月1日-2020年3月21日實際值與灰色預測值的相對值,根據相對值的分布情況,按照組間距劃分為4個狀態,即狀態1為E1(0.8,0.95),狀態2為E2(0.95,1.05),狀態3為E3(1.05,1.15),狀態4為E4(1.15,1.35),具體情況見表3;由此,即可得到湖北省每日出院人數實際值與灰色預測值之間的相對值馬爾科夫狀態轉移情況,見表4。

表3 狀態劃分情況

表4 3.22-3.24日灰色預測值的相對值狀態轉移概率
由表1的數據以及表3的狀態劃分情況,即可得到湖北省每日出院人數預測結果與實際值之間的相對值的一步狀態轉移頻數矩陣f1以及一步狀態轉移概率矩陣p1:
同理,2步、3步的狀態轉移概率矩陣p2、p3為:

由表2可知,3月21日的狀態為E1,則初始狀態分布向量p(0)=(1,0,0),一步狀態轉移矩陣p1,利用P(0)×p1即可得到3月22日湖北省每日出院人數GM(1,1)預測值的相對值的狀態轉移概率p(1),同理可得3月23日與3月24日的相對值的狀態轉移概率p(2)與p(3)。具體情況見表4,由此可知3月22日灰色預測值的相對值的狀態為E1的可能性最大。同理,3月23日與3月24日的所屬狀態均為E1。
由表2可知,3月22日-3月24日的灰色預測值分別為635、594、555,而根據湖北省衛生健康委員會疫情直報所知,實際值分別為490、447、444,其平均相對誤差為29.16%。利用表4對灰色預測值進行馬爾科夫修正,修正值分別為556、520、486,其平均相對誤差為13.02%,誤差降低55.17%,減少了一半還多,可見修正后預測效果較為理想,灰色馬爾科夫模型比灰色預測模型的預測結果更加準確。同理可對3月1日-21日灰色預測值進行馬爾科夫修正,結果見表5。
表5中,在進行馬爾科夫修正前,灰色預測值的相對誤差值有9個大于15%,其平均相對誤差為4.82%。經修正后,除3月23日外,其模型相對誤差均小于15%,平均相對誤差為2.48 %。修正前的灰色預測模型的后驗差比值C=0.31,小誤差概率P=3.5,經修正后的灰色馬爾科夫模型后驗差比值C=0.11,小誤差概率P=3.5,模型的精度有效升高,且由圖1可見馬爾科夫修正值與灰色預測值相比,與實際值更擬合,預測效果更好。

表5 3月1日-24日馬爾科夫修正前后模型精度對比

圖1 3月1日-3月24每日出院人數的實際值、預測值與修正值比較
本文利用2020年3月1日-3月21日的湖北省衛生健康委員會官網新冠肺炎疫情直報數據,預測3月22日-3月24日的湖北省新冠肺炎每日出院人數。通過構建灰色預測模型,并利用馬爾科夫模型進行修正。
灰色馬爾科夫模型比灰色預測模型的預測結果更準確,模型精度更優,是一種每日出院人數短期預測效果較為理想的預測模型。
灰色預測模型是主要用于分析少數據、貧信息、不確定性問題的方法[15],其最大的優點就是數據序列較短也可以建模。此次疫情中每日出院人數受到許多不確定性因素的影響,具有明顯的灰色系統特點,并且假設近期數據對每日出院人數的影響較大,因此選取了2020年3月1日-21日的21個數據進行建模。此外,灰色GM(1,1)模型其預測圖形的形態趨勢是一條平滑的指數型曲線,所以它對數據的波動性信息無法充分提取[5],因此,對于波動性較大的數據序列,灰色GM(1,1)模型的擬合效果較差,預測精度也較低[15-16]。而馬爾科夫模型是一個隨機動態系統,具有無后效性[14]。它是利用先前多個時間段的狀態之間的轉移規律,對系統未來的發展狀態和方向進行預測,適合于波動性較大的數據序列,這剛好可以彌補灰色模型的缺點,因此,把這兩者進行組合,形成灰色馬爾科夫模型,與單一的灰色模型或馬爾科夫模型相比,可大大提高模型的擬合程度和預測精度[17-23],并且相對解決了數據波動性過大所造成的預測精度過低的問題[24-25],同時又兼顧了灰色模型原有的優點,使得預測過程不再需要較長的時間序列資料,只需要較短的時間序列便能進行建模預測[26-28]。
將灰色模型和馬爾科夫模型結合,形成的灰色馬爾科夫模型,能夠較為準確地預測出新冠肺炎疫情中的每日出院人數。由于灰色馬爾科夫模型只需要較短的時間序列便能進行建模,且可獲得較為準確的預測結果。因此,在疫情中,獲得較短的時間序列數據之后,即可進行模型預測,無需等待較長時間,是新冠狀肺炎每日出院人數短期預測的較為理想的預測模型。此外,準確預測湖北省的每日出院人數,推斷出其未來的變動幅度,可以提升湖北省甚至全國人民對于疫情控制的信心,降低患者與患者家屬對疫病的恐懼感,提高民眾對醫院與醫療技術的信任,減少瞞報甚至逃離醫院等情況的發生,對政府科學調配衛生應急醫療資源和人群防治有著重要的參考意義。