董選軍 余運賢 朱列波
義烏市手足口病流行趨勢組合預測模型研究
董選軍1余運賢2朱列波1
目的 構建義烏市手足口病流行趨勢最優預測模型。方法 通過對義烏市2009-2011年手足口病按月發病數進行ARIMA時間序列、GM(1,1)灰色模型以及2者的組合模型進行建模,并預測2012年1-5月份發病數與實際比較。結果 ARIMA(1,1,1)模型的 r(曲)91.26%,GM(1,1)灰色模型的r(曲)為1.86%,組合預測模型的 r(曲)為94.55%;ARIMA(1,1,1)預測的 MAPE為 56.39%、MSPE為 27.28%,GM(1,1)預測的 MAPE為 42.09%、MSPE為22.91%,組合預測模型預測的MAPE為53.29%、MSPE為25.10%。結論 在進行手足口病流行趨勢建模中,組合預測是一個較好的方法。
手足口病 ARIMA GM(1,1) 組合預測
1.義烏市疾病預防控制中心(322000)
2.浙江大學公共衛生學院
手足口病是多種腸道病毒(以EV71和COXA16型為主)感染引起的一種常見急性傳染病,好發于嬰幼兒及學齡前兒童,以發熱和手足口臀部丘疹或皰疹為主要癥狀,該病傳染性強,傳播速度快,短時間內可在人群密集的地區引起大流行,因此了解手足口病的流行趨勢,建立模型并進行預測有利于更好地防控手足口病。本文對義烏市2009-2011年的手足口病按月發病數進行ARIMA時間序列、GM(1,1)模型和組合模型建模,預測2012年1-5月份發病數,并與實際進行比較,結果如下。
1.資料來源 2009年1月-2012年5月義烏市手足口病疫情資料來源于中國疾病監測信息報告管理系統。
2.方法 對2009-2011年義烏市手足口病流行趨勢進行描述性統計分析和按月手足口病發病數建立ARIMA、GM(1,1)和組合預測模型。
3.統計分析 使用DPS7.05軟件進行ARIMA時間序列、GM(1,1)和組合預測模型分析,SPSS19.0進行有關系數計算。
1.疫情概況 2009-2011年義烏市共報告6122例,報告發病率分別為48.95/10萬、179.23/10萬和95.00/10萬,年報告平均發病率108.47/10萬。2012年1-5月共報告4500例,遠遠超過歷年同期平均水平,并呈現逐月上升趨勢。
2.時間分布 2009-2011年每月均有發病,4-7月份和11-12月份呈現2個小高峰,其中4-7月份占63.85%。
3.ARIMA時間序列模型分析
用DPS7.05軟件對2009-2011年手足口病按月進行ARIMA模型擬合,根據多次擬合,ARIMA(1,1,1)相對較好,得擬合方程Z(T+L)=-0.0021+0.30Z(T+L-1)+e(T+L)-0.058e(T+L-1)。曲線相關r(曲)=1-(Q/Lyy),其中Q為實際值與擬合值差的平方和,Lyy=∑(Y-)2,得到ARIMA模型的r(曲)為91.26%。預測得平均絕對百分比誤差為56.39%,均方百分比誤差
4.GM(1,1)灰色模型分析
用DPS7.05對2009-2011年手足口病進行灰色模型分析,得Z(K+1)=135.18e-0.014k,r(曲)為1.86%,預測的MAPE為42.09%,MSPE為22.91%。
5.組合模型
設Y11,Y12分別是 ARIMA(1,1,1)和 GM(1,1)模型的預測值,Yt是最優組合預測值,預測誤差分別為e1t、e2t、et,以預測誤差平方和最小為最優準則,即使E=取最小,k1,k2(k1+k2=1)為相應的權系數,則有:et=k1e1t+k2e2t,將k2用1-k1代入可得:

對于E==∑[k1(e1t-e2t)+e2t]2
關于k1求偏導數,則∑2(e1t-e2t)[k1(e1t-e2t)+e2t]=0,得k1= -[∑(e1t-e2t)e2t]/[∑(e1t-e2t)2],得組合模型為Yt=0.84Y11+0.16Y12,r(曲)為94.55%,預測的MAPE為53.29%,MSPE為25.10%。
6.三種模型和預測比較
從 ARIMA(1,1,1)、GM(1,1)和組合模型比較,組合模型的曲線相關系數94.55%大于ARIMA(1,1,1)的91.26%和GM(1,1)的1.86%,擬合情況詳見圖1。

圖1 3種模型與實際比較圖
在衛生統計研究中,需要從大量的數據中尋找出隱藏的規律,最好能夠用數學模型表示出來〔1〕。不同的預測模型各有其優點和缺點,組合預測模型綜合利用每種預測方法提供的有用信息,對所組合的各單項預測方法取長補短,在當前預測領域是一個研究熱點〔2〕。而基于數據挖掘的組合預測模型可以從原始數據中挖掘出更多的信息,有利于解決不同情況下的實際應用問題〔3〕。
ARIMA時間序列分析因突出時間序列暫不考慮外界因素影響,當外界發生較大變化時,常會有較大偏差,因而時間序列預測法對于中短期預測的效果要比長期預測的效果好〔4〕,同樣 GM(1,1)模型也不太適宜作長期預測〔5〕。本文用ARIMA、灰色模型和二者的組合模型對2009-2011年義烏市手足口病疫情進行了建模,并進行了比較,得出雖然灰色模型遠遠不如ARIMA模型,但是當用適當的方法把灰色模型和ARIMA模型組合起來的時候,所達到的效果最好,這也為我們優化模型提供了新的方向。
1.管總平,陳芳,吳衛紅,等.基于組合預測模型對門診量的預測.中國醫院統計,2009,16(3):226-230.
2.郭秀英.預測決策的理論與方法.化學工業出版社,2010.
3.張世強.基于數據挖掘的組合預測模型的建模方法.中國衛生統計,2009,26(5):470-471.
4.劉曉東,景睿,孟祥臻,等.ARIMA模型對中國入口死亡率預測的研究.中國衛生統計,2008,26(5):630-631.
5.任正洪.孕產婦死亡率的灰色預測,中國衛生統計,2005,22(1):22-22.
(責任編輯:郭海強)