劉 濤 王顯軍 姜寶法 丁淑軍 王連森 孫大鵬 裴耀文 林 藝 王建醒 逄博
SARIMA模型預(yù)測(cè)山東省手足口病發(fā)病趨勢(shì)*
劉 濤1,2王顯軍3△姜寶法1△丁淑軍3王連森3孫大鵬3裴耀文3林 藝3王建醒3逄博3
目的 建立山東省手足口病發(fā)病的SARIMA模型并進(jìn)行預(yù)測(cè)。方法 應(yīng)用SPSS17.0軟件對(duì)山東省2005年1月至2011年12月手足口病月發(fā)病率進(jìn)行SARIMA模型建模擬合。結(jié)果 SARIMA(1,0,1)(0,1,0)12能較好地?cái)M合既往時(shí)間段的發(fā)病率,對(duì)2011年各月的預(yù)測(cè)值符合山東省手足口病實(shí)際發(fā)病率變動(dòng)趨勢(shì),對(duì)2012年手足口病發(fā)病率進(jìn)行了預(yù)測(cè)。結(jié)論 SARIMA模型能較好地模擬手足口病發(fā)病率在時(shí)間序列上的變動(dòng)趨勢(shì),用其對(duì)未來的發(fā)病率進(jìn)行預(yù)測(cè),可為手足口病防治工作提供參考。
手足口病 SARIMA模型 時(shí)間序列分析
*:國(guó)家重大科學(xué)研究計(jì)劃資助(2012CB955502);山東省2009年科技發(fā)展計(jì)劃資助攻關(guān)項(xiàng)目(2009GG10002055)
1.山東大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)研究所(250012)
2.煙臺(tái)市疾病預(yù)防控制中心
3.山東省疾病預(yù)防控制中心
△通信作者:姜寶法,Email:bjiang@sdu.edu.cn;王顯軍,E-mail:xjwang62@163.com
手足口病(hand-foot-mouth disease,HFMD)是由多種腸道病毒引起的常見傳染病,以嬰幼兒發(fā)病為主。大多數(shù)患者癥狀輕微,以發(fā)熱和手、足、口腔等部位的皮疹或皰疹為主要特征。少數(shù)患者可并發(fā)無菌性腦膜炎、腦炎、急性弛緩性麻痹、呼吸道感染和心肌炎等,個(gè)別重癥患兒病情進(jìn)展快,易發(fā)生死亡[1]。山東省是手足口病的多發(fā)省份,2000年、2003年、2005年、2007年煙臺(tái)、泰安、濟(jì)寧、臨沂等市的局部地區(qū)發(fā)生爆發(fā)流行[2]。由于全國(guó)手足口病的發(fā)病形式相當(dāng)嚴(yán)峻,2008年5月2日衛(wèi)生部將其列入《中華人民共和國(guó)傳染病防治法》規(guī)定的丙類傳染病[3]。本次研究利用2005-2011年山東省手足口病發(fā)病資料,采用季節(jié)性求和自回歸滑動(dòng)平均模型法(seasonal auto regressive integrated moving average,SARIMA)建立山東省手足口病發(fā)病率預(yù)測(cè)模型,為有關(guān)部門防制手足口病提供依據(jù)。
數(shù)據(jù)為2005-2011年山東省手足口病報(bào)告病例數(shù),資料來自于“國(guó)家疾病監(jiān)測(cè)信息報(bào)告管理系統(tǒng)”。人口資料來自于2006-2011年山東省統(tǒng)計(jì)年鑒。
利用SPSS17.0軟件中的ARIMA模型分析方法,對(duì)山東省近6年的手足口月發(fā)病率數(shù)據(jù)進(jìn)行處理和分析。首先利用2005年1月-2011年12月的發(fā)病率數(shù)據(jù)進(jìn)行建模,用2011年1月到12月的數(shù)據(jù)對(duì)模型進(jìn)行回顧性驗(yàn)證,最后再用模型對(duì)2012年的月發(fā)病率進(jìn)行預(yù)測(cè)。
求和自回歸滑動(dòng)平均模型法(SARIMA)是將時(shí)間序列視為一組依賴于時(shí)間(t)的隨機(jī)變量,這組隨機(jī)變量所具有的自相關(guān)性表征了預(yù)測(cè)對(duì)象發(fā)展的延續(xù)性,而這種自相關(guān)性一旦被相應(yīng)的數(shù)學(xué)模型描述出來,就可以從時(shí)間序列的過去值及現(xiàn)在值預(yù)測(cè)其未來的值[4]。ARIMA模型綜合考慮了序列的趨勢(shì)變化、周期變化及隨機(jī)干擾。本研究中采用的模型是考慮季節(jié)變化的季節(jié)性ARIMA模型(SARIMA),其結(jié)構(gòu)為(p,d,q)(P,D,Q),其中的p、q分別為自回歸和移動(dòng)平均階數(shù),d為非季節(jié)差分次數(shù),P、Q分別為季節(jié)性自回歸和移動(dòng)平均階數(shù),D為季節(jié)性差分次數(shù)[5]。
SARIMA模型建模的基本步驟可以分為四步[6]:①序列預(yù)處理:SARIMA模型的應(yīng)用需要時(shí)間序列符合平穩(wěn)性和非白噪聲的要求;②模型的識(shí)別:主要根據(jù)自相關(guān)系數(shù)(ACF)和偏相關(guān)函數(shù)(PACF)圖的特征,提出幾種可能的模型作下一步分析;③模型參數(shù)估計(jì)和模型診斷:對(duì)提出的模型進(jìn)行參數(shù)估計(jì)和診斷,如模型不合適,則回到第二階段,重新選定模型;④預(yù)測(cè)應(yīng)用:2005-2011年的數(shù)據(jù)用于建立模型,利用2011年的數(shù)據(jù)用于驗(yàn)證模型的擬合效果[7],并預(yù)測(cè)2012年手足口病的發(fā)病率。
繪制2005年1月-2011年12月山東省手足口病發(fā)病率的時(shí)間序列圖,如圖1。從圖中可知,手足口病發(fā)病率有逐年上升趨勢(shì),并且每年的5月至7月份是發(fā)病高峰期,存在明顯的季節(jié)性。
(1)序列平穩(wěn)性
一個(gè)平穩(wěn)的隨機(jī)過程應(yīng)符合以下要求:均數(shù)不隨時(shí)間變化;方差不隨時(shí)間變化;自相關(guān)系數(shù)只與時(shí)間間隔有關(guān),而與所處的時(shí)間無關(guān)[8]。如圖1所示,從2007年開始序列的波動(dòng)幅度加大,并且從整體上看山東省手足口病發(fā)病率呈上升趨勢(shì),同時(shí)序列呈現(xiàn)出一定的季節(jié)周期性,說明序列是非平穩(wěn)序列。故需要對(duì)序列進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換和差分,轉(zhuǎn)換成為平穩(wěn)的時(shí)間序列。

圖1 2005-2011年山東省手足口病逐月發(fā)病率時(shí)序圖
(2)模型的識(shí)別
為了使時(shí)間序列平穩(wěn),首先進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換,其次進(jìn)行差分。差分分為一般差分和季節(jié)性差分。由圖1可知,該序列發(fā)病率的季節(jié)性明顯,需進(jìn)行一階季節(jié)性差分。差分后,該序列的ACF圖、PACF圖(圖2),可認(rèn)為該時(shí)間序列通過一階季節(jié)性差分后達(dá)到平穩(wěn)序列。此時(shí),可以構(gòu)建SARIMA模型。
(3)模型參數(shù)估計(jì)和模型診斷
SARIMA(p,d,q)(P,D,Q)12中,根據(jù)差分結(jié)果,d=0,D=1。由ACF圖可知,q=0,由PACF 圖可知,p=1。季節(jié)模型的參數(shù)P、Q判斷較為困難,但根據(jù)文獻(xiàn),參數(shù)超過二階的情況很少見[8],可以分別取0、1、2由低階到高階逐個(gè)試驗(yàn),結(jié)合Ljung-Box方法檢驗(yàn)殘差白噪聲,淘汰非白噪聲模型,計(jì)算剩余模型的BIC值,挑選其中BIC最小的模型作為最佳模型。經(jīng)過篩選符合條件的SARIMA模型有九個(gè),見表1,最終確定最佳模型 SARIMA(1,0,1)(0,1,0)12。該模型經(jīng)過Ljung-Box方法檢驗(yàn)殘差白噪聲,得到統(tǒng)計(jì)量為14.909,P值為 0.531(>0.05),殘差的 ACF圖(圖3)、PACF圖(圖3)、Q-Q圖(圖4)如下,殘差為白噪聲;模型中的參數(shù)檢驗(yàn)具有意義(表2)。用該模型預(yù)測(cè)2011年山東省手足口病各月發(fā)病率結(jié)果如表3所示,2011年各月的實(shí)際發(fā)病率雖然與預(yù)測(cè)值不完全一樣,但各月實(shí)測(cè)值都落入了預(yù)測(cè)值的可信區(qū)間范圍。可以看出模型預(yù)測(cè)值的動(dòng)態(tài)趨勢(shì)與實(shí)際情況基本一致,模型對(duì)未來的情況進(jìn)行了很好的跟蹤和預(yù)測(cè)。

圖2 進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換和一次季節(jié)差分后ACF圖和PACF圖

表1 殘差檢驗(yàn)符合條件的各模型的BIC值

圖3 殘差A(yù)CF和PACF圖

圖4 殘差Q-Q圖

表2 山東省手足口病發(fā)病率模型參數(shù)估計(jì)
(4)預(yù)測(cè)應(yīng)用
利用 ARIMA(1,0,1)(0,1,0)12模型,對(duì) 2005 年1月到2011年12月全省逐月發(fā)病率進(jìn)行擬合。結(jié)果如圖5,可見實(shí)測(cè)值與擬合值重合程度高,顯示模型擬合較好。進(jìn)一步用該模型對(duì)2012年各月的發(fā)病率進(jìn)行預(yù)測(cè),結(jié)果見表4。

表3 2011年1-12月山東省手足口病發(fā)病率與采用ARIMA模型預(yù)測(cè)發(fā)病率比較(1/10萬)

圖5 山東省手足口病各月發(fā)病率ARIMA模型擬合預(yù)測(cè)圖

表4 2012年山東省手足口病各月發(fā)病率(1/10萬)預(yù)測(cè)值
手足口病傳播速度快,傳染性強(qiáng),尤其是對(duì)5歲以下兒童危害嚴(yán)重,至今尚無疫苗預(yù)防,亦無特異性治療方法。目前,防治手足口病主要采取早預(yù)防、早發(fā)現(xiàn)、早診斷、早治療手段。由于過度的預(yù)防會(huì)導(dǎo)致衛(wèi)生資源的浪費(fèi)和不恰當(dāng)?shù)氖褂谩Mㄟ^模型的預(yù)測(cè)可以了解疾病的發(fā)展態(tài)勢(shì),提早采取措施,有針對(duì)性地做好疫點(diǎn)、疫區(qū)的衛(wèi)生處理和傳染源管理工作,遏制疫情蔓延。此外,手足口病多為散發(fā),發(fā)病率按照既往的變化規(guī)律(季節(jié)性)發(fā)生變化。如果實(shí)際發(fā)病率在預(yù)測(cè)值95%可信限范圍內(nèi)波動(dòng),表明當(dāng)月疫情基本正常;如果超出預(yù)測(cè)值95%可信限范圍,表明當(dāng)月疫情已不同于以往流行規(guī)律,應(yīng)警惕傳染病暴發(fā)或流行的可能[7]。該研究中2012年山東省1-4月的發(fā)病率實(shí)際值均落在預(yù)測(cè)值的95%置信區(qū)間內(nèi),說明2012年山東省前四個(gè)月的手足口病的發(fā)病率基本正常。通過SARIMA模型發(fā)現(xiàn),2012年夏季手足口病的發(fā)病率要高于2011年,這應(yīng)該引起有關(guān)部門的注意。
用于手足口病預(yù)測(cè)的模型主要包括回歸分析預(yù)測(cè)模型和時(shí)間序列分析預(yù)測(cè)模型兩類。SARIMA模型是目前最常用的時(shí)間序列預(yù)測(cè)方法,已被廣泛應(yīng)用到預(yù)防醫(yī)學(xué)各個(gè)領(lǐng)域[7,9-10]。手足口病的發(fā)病原因比較復(fù)雜,它與人的自身免疫力、病原、相關(guān)社會(huì)保健水平、人們的衛(wèi)生習(xí)慣及預(yù)防意識(shí)、環(huán)境條件等因素有關(guān)[11-12]。回歸分析預(yù)測(cè)模型就是通過分析影響手足口病疾病發(fā)生的各種因素,對(duì)數(shù)據(jù)進(jìn)行回歸擬合;由于自然和社會(huì)環(huán)境許多未知因素難以獲得,使其存在局限性。時(shí)間序列分析克服了因果回歸分析法中預(yù)測(cè)對(duì)象的影響因素難以掌握和數(shù)據(jù)資料不易得到的難題,利用任何事物的發(fā)展都具有一定慣性(即延續(xù)性)的原理,建立時(shí)間序列模型,以達(dá)到預(yù)測(cè)未來的目的[13]。
SARIMA的應(yīng)用前提是時(shí)間序列的平穩(wěn)性,實(shí)際工作中數(shù)據(jù)往往是非平穩(wěn)序列,需對(duì)序列進(jìn)行預(yù)處理,使之達(dá)到平穩(wěn)的要求;如果模型中含有季節(jié)因素,則至少應(yīng)有7或8個(gè)季節(jié)周期的數(shù)據(jù)對(duì)季節(jié)參數(shù)進(jìn)行估計(jì)。若序列太短,則可靠性較差;如果所研究對(duì)象的慣性趨勢(shì)發(fā)生了很大的改變(例如對(duì)主要傳染病采取了新的防治措施,或有新的傳染病傳入),則需要積累新的數(shù)據(jù)對(duì)模型進(jìn)行修正甚至重新擬合[7]。本研究中2011年預(yù)測(cè)值與真實(shí)值之間相對(duì)誤差較大,原因是考慮到應(yīng)用時(shí)間序列SARIMA模型需要數(shù)據(jù)個(gè)數(shù)的要求,但是2008年以前,手足口病未納入法定傳染病,導(dǎo)致發(fā)病數(shù)目上報(bào)數(shù)量與實(shí)際數(shù)量有太大出入。若是排除2005、2006、2007年的發(fā)病率,將無法應(yīng)用該模型。這在一定程度上影響了預(yù)測(cè)精度。但是隨著時(shí)間的進(jìn)行,逐步增加可靠、真實(shí)病例數(shù)收集,這可以將前期不太準(zhǔn)確的數(shù)據(jù)摒棄,進(jìn)而完善SARIMA模型,使預(yù)測(cè)值與真實(shí)值相貼近。
1.衛(wèi)生部.手足口病預(yù)防控制指南 (2009版).全科醫(yī)學(xué)臨床與教育,2010,8(2):125 -127.
2.王連森,畢振強(qiáng),房玉英,等.2008年山東省手足口病流行病學(xué)分析.山東醫(yī)藥,2009,49(019):45 -47.
3.衛(wèi)生部.手足口病預(yù)防控制指南(2008年版).中國(guó)鄉(xiāng)村醫(yī)藥,2009(S1).
4.徐國(guó)祥.統(tǒng)計(jì)預(yù)測(cè)和決策.上海:上海財(cái)經(jīng)大學(xué)出版社,1998:150-177.
5.潘浩,鄭揚(yáng),吳寰,等.ARIMA模型預(yù)測(cè)上海市手足口病發(fā)病趨勢(shì).預(yù)防醫(yī)學(xué)情報(bào)雜志,2011,27(6):408 -411.
6.張文彤.SPSS統(tǒng)計(jì)分析高級(jí)教程.高等教育出版社,2004:250-289.
7.吳家兵,葉臨湘,尤爾科.ARIMA模型在傳染病發(fā)病率預(yù)測(cè)中的應(yīng)用.?dāng)?shù)理醫(yī)藥學(xué)雜志,2007,20(1):90 -92.
8.溫亮,徐德忠,林明和,等.應(yīng)用時(shí)間序列模型預(yù)測(cè)瘧區(qū)瘧疾發(fā)病率.第四軍醫(yī)大學(xué)學(xué)報(bào),2004,25(6):507 -510.
9.李廷杰,陳秀山.應(yīng)用時(shí)間序列統(tǒng)計(jì)方法分析廣東省1984-1993年乙型腦炎季節(jié)性分布特性.中華流行病學(xué)雜志,1998,19(2):103-106.
10.丁亞興,張之倫,朱向軍.自回歸綜合移動(dòng)平均模型對(duì)天津市甲型肝炎發(fā)病預(yù)測(cè).疾病監(jiān)測(cè),2008,23(5):326 -328.
11.張曉云,張之倫.氣象要素對(duì)腸道傳染病的影響及預(yù)報(bào).氣象,2002,28(005):53-55.
12.周艷麗,徐文彩,馬海艷.北京市東城區(qū)細(xì)菌性痢疾與氣象因素的時(shí)間序列分析.疾病監(jiān)測(cè),2009,24(9):697 -700.
13.鐘朝暉,劉達(dá)偉,張燕.重慶市主城區(qū)人口死亡率的時(shí)間序列分析.中國(guó)公共衛(wèi)生,2003,19(7):796 -798.
Prediction of Hand-foot-mouth Disease Incidence Using SARI-MA Model in Shandong Province
Liu Tao,Wang Xianjun,Jiang Baofa,el al.Department of Epidemiology and Biostatistics,School of Public Health,Shandong University(250012),Jinan
ObjectiveTo establish a model to predict the incidence rate of hand-foot-mouth disease in Shandong Province.Methods
The SARIMA model for monthly hand-foot-mouth incidence rate from January 2005 to December 2011 in Shandong Province was established by SPSS 17.0.ResultsSARIMA(1,0,1)(0,1,0)12fitted very well with the incidence in the past period of time.The predicted incidence rates from January to December 2011 were accorded with the actual incidence trend of change in Shandong Province.ConclusionARIMA model could simulate a hand-foot-mouth disease incidence in time series change trend very well,and predict incidence and provide reference for the future as handfoot-mouth disease prevention and control work.
Hand-foot-mouth disease;SARIMA model;Time series analysis
(責(zé)任編輯:郭海強(qiáng))