康育慧,郎麗麗,曹文君
傳染病預測是傳染病防控過程中的關鍵環節,意義在于為傳染病防控部門制定應對策略提供科學依據.灰色預測和馬爾科夫鏈預測是兩種應用較為廣泛的時間序列預測模型,并在傳染病預測[1-3]、市場占有率[4]、商品銷量預測等領域取得了較好的預測效果[5-6].本文嘗試將上述兩種預測模型結合起來,應用灰色馬爾科夫模型對我國法定乙類傳染病細菌性和阿米巴性痢疾發病率進行擬合和預測,并與GM(1,1)模型進行比較,探討灰色馬爾科夫預測模型在細菌性和阿米巴性痢疾發病率預測中的應用價值并為制定干預措施提供參考.
2005—2018年我國細菌性和阿米巴性痢疾發病率資料源于國家衛生和計劃生育委員會出版的《2019中國衛生健康統計年鑒》[7],2019年數據資料來源于國家衛生健康委員會網站[8].
灰色馬爾科夫模型分灰色GM(1,1)建模和馬爾科夫修正兩個過程.
(1)GM(1,1)建模.①設原始非負序列為X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),對序列X(0)作1階累加生成,得序列X(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其 中,k=1,2,…,n.②對序列X(1)作緊鄰均值生成,得序列Z(1)=(z(1)(2),z(1)(3),…,z(1)(n)),其中z(1)(k)=,k=2,3,…,n.③根 據累加序列建立灰色模型的白化微分方程,其中a,b為參數,且可根據白化方程由最小二乘法估計:(a,b)T=(BTB)-1BTY,其中,…,x(0)(n))T.④求得白化方程的解為:x?(1)(k+,k=1,2,…,n.⑤對作累減還原得灰色模型的預測值,k=1,2,…,n.⑥模型檢驗.對建立的灰色預測模型進行精度和擬合度的檢驗.利用后驗差法,計算后驗差比值C和小誤差概率P.其中,S1、S2分別為數列x(0)(k)和殘差序列ε(k)的標準差.精度檢驗等級如表1所示.

表1 精度檢驗等級表
(2)馬爾科夫修正[9-11].①狀態劃分.將GM(1,1)模型的相對誤差值劃分為i個狀態,記為E1,E2,…,Es,列出各年份相對誤差對應的狀態,構建馬爾科夫鏈.狀態數與區間跨度不但與樣本數量有關,而且與擬合結果的誤差范圍有關,一般取3~5個為佳,且保證每個區間都有數據[9].②構造狀態轉移概率矩陣,其中表示系統由狀態Ei經過m步轉移到狀態Ej的次數.③確定預測值并修正.根據建立的狀態轉移概率矩陣確定系統下一時刻轉向狀態Ei,并取狀態區間Ei的中位數作為系統下一時刻預測值,則馬爾科夫修正值,其中為t時刻灰色預測值,Ei-和Ei+分別為狀態Ei的左右端點.
全文數據處理與分析使用MATLAB R2014a軟件.
對2005—2017年全國細菌性和阿米巴性痢疾發病率數據進行擬合,對2018年和2019年的發病率數據進行預測,并與GM(1,1)模型比較以檢驗灰色馬爾科夫模型的精度.發病率數據如表2所示.
(1)建立GM(1,1)模型.2005—2017年全國細菌性和阿米巴性痢疾發病率呈逐年降低趨勢,采用MATLAB R2014a軟件編程得到GM(1,1)模型的參數a,b值,a=0.124 6,b=37.811 4,由 此 得 到 預 測 模 型 為x?(1)(k+1)=-268.587 4e-0.1246k+303.507 4,k=1,2,…,n.利用該模型得到2005—2017年發病率擬合值及2018年和2019年發病率預測值,并計算各年發病率的相對誤差.結果如表2所示.
(2)馬爾科夫修正.將表2中2005—2017年GM(1,1)模型相對誤差值分為四個狀態E1~E4,狀態的區間范圍分別為:(-5,-3],(-3,0],(0,3],(3,6],并得到GM(1,1)模型歷年相對誤差值所處狀態(表2),由此建立1~4步狀態轉移概率矩陣,m=1,2,…,4.


利用1~4步狀態轉移概率矩陣計算2018年和2019年發病率相對誤差所處狀態區間,2018年發病率相對誤差狀態預測如表3所示.
將表3中2014—2017年各狀態列轉移概率相加,得到2018年發病率預測相對誤差轉向各狀態的概率分別為1.417 4、0、2.582 6、0.表明2018年發病率預測相對誤差轉向狀態E3的概率最大,即相對誤差位于區間(0,3]內,故2018年發病率預測值為7.06×≈6.95.同理,以2015—2018年數據預測2019年發病率相對誤差所處狀態為E3,故發病率預測值為≈6.14.結合模型中2005—2017年各年份相對誤差狀態可以得到表2中的灰色馬爾科夫模型擬合值及相對誤差情況.

表2 各年份發病率數據及兩種模型預測結果

表3 2018年發病率相對誤差狀態預測
根據表2數據對兩種模型的精度進行比較,結果如表4所示.

表4 兩種模型精度對比
由表4可以看出,經馬爾科夫修正后的灰色馬爾科夫模型各項檢驗指標均優于GM(1,1)模型,表明灰色馬爾科夫方法預測更準確,故采用GM(1,1)-Markov模型預測未來發病率.
采用灰色馬爾科夫模型,以2005—2019年細菌性和阿米巴性痢疾發病率數據預測2020年和2021年發病率.GM(1,1)預 測 模型為(k+1)=-266.626 1e-0.1260k+301.546 1,k=1,2,…,n,由此得到2005—2019年發病率相對誤差并分為四個狀態區間(-6,-4],(-4,-1],(-1,2],(2,7].計算1~4步狀態轉移概率矩陣,利用狀態轉移概率矩陣推算2020年發病率相對誤差所處狀態為E4,得2020年發病率預測值為5.17.同理,推算2021年發病率相對誤差所處狀態也為E4,得2021年發病率預測值為4.56.
本研究構建了以GM(1,1)模型為基礎的灰色馬爾科夫模型,并運用該模型對我國2005—2019年細菌性和阿米巴性痢疾發病率進行擬合和預測以考察模型的可行性.首先由GM(1,1)模型得到2005—2019年發病率的發展趨勢,進一步計算發現GM(1,1)模型擬合與預測的相對誤差都較大,且相對誤差序列隨機波動較大,故對相對誤差序列再采用馬爾科夫方法修正.結果表明,經馬爾科夫修正后的灰色馬爾科夫模型兼顧發展趨勢和隨機波動兩方面因素,因此其擬合值與預測值都更接近實際值,修正前后的后驗差比也由0.076 7降為0.026 4,修正后模型精度相比傳統GM(1,1)模型有很大提高.因此,本研究采用灰色馬爾科夫模型對我國細菌性和阿米巴性痢疾發病率的預測,結果更加客觀、合理、準確,可供有關部門參考.