劉琳玲,劉如春,陳田木,張本忠*,李亞曼,胡偉紅,謝 知,趙 錦
·論著·
·方法學研究·
長沙市流行性腮腺炎季節性自回歸移動平均模型預測研究
劉琳玲1,劉如春2,陳田木2,張本忠1*,李亞曼2,胡偉紅2,謝 知2,趙 錦2
目的 采用季節性自回歸移動平均(SARIMA)模型預測長沙市流行性腮腺炎發病數。方法 收集2005—2015年長沙市報告的流行性腮腺炎病例數據,將2005—2014年數據作為建模數據,將2015年數據作為驗證數據,開展SARIMA模型建立與驗證研究,并對2016年流行性腮腺炎發病數進行預測。結果 SARIMA(3,0,0)×(1,0,0)12模型可以很好地擬合實際數據,模型的展開式為:Yt=222.545+1.225Yt-1-0.713Yt-2+0.291Yt-3+0.366Yt-12-0.448Yt-13+0.261Yt-14-0.107Yt-15+at。將驗證數據與預測數據進行相關性分析,結果顯示呈顯著性相關(r=0.61,P<0.001)。SARIMA模型預測2016年長沙市全年發病數將達到3 032例,平均月病例數為253例。結論 SARIMA模型可以用于流行性腮腺炎發病數預測,長沙市2016年流行性腮腺炎疫情仍處于高發態勢。
流行性腮腺炎;時間序列;季節性自回歸移動平均模型;預測
劉琳玲,劉如春,陳田木,等.長沙市流行性腮腺炎季節性自回歸移動平均模型預測研究[J].中國全科醫學,2017,20(2):187-190.[www.chinagp.net]
LIU L L,LIU R C,CHEN T M,et al.Application of SARIMA model in the prediction of incident number of mumps in Changsha[J].Chinese General Practice,2017,20(2):187-190.
流行性腮腺炎是由腮腺炎病毒引起的急性呼吸道傳染病,該病毒主要侵犯腮腺,也可侵犯神經系統及肝、腎、心臟、關節等[1]。流行性腮腺炎發病常見于兒童和青少年人群,兒童約占46.27%,青少年約占33.16%[2]。小學和中學常出現暴發疫情,如西安市2006—2014年累計報告25起中小學腮腺炎暴發疫情[3]。據“中國疾病預防控制信息系統”統計的傳染病報告卡顯示:長沙市幾乎每年均有暴發疫情報告。流行性腮腺炎潛伏期長[4]、傳播能力強、發病后需要隔離的時間也較長,給防控帶來較大難度,也給正常教學秩序造成嚴重影響。流行性腮腺炎易伴發睪丸炎或卵巢炎,常見并發癥還有不同程度的腦炎,嚴重者可導致傷殘或死亡[5-6],對于青春期青少年身體健康有很大危害。為更好地采取防控策略提供參考,本研究以長沙市為例,根據流行性腮腺炎發病時間規律和季節性高發特點建立流行性腮腺炎季節性自回歸移動平均(seasonal autoregressive integrated moving average,SARIMA)模型,對長沙市2016年流行性腮腺炎疫情進行預測研究。
1.1 數據收集 通過將中國疾病預防控制信息系統的數據以“按照現住址瀏覽”+“長沙市”+“發病日期”+“2005-01-01至2015-12-31”+審核狀態:“已審核”+“流行性腮腺炎”為條件進行查詢,將查詢得到的流行性腮腺炎病例數據分年度以Excel表格導出,收集2005—2015年長沙市報告的流行性腮腺炎病例數據。病例診斷標準依據《流行性腮腺炎診斷標準及處理原則(GB 17016-1997)》和《流行性腮腺炎診斷標準(WS 270-2008)》[7-8]。將收集的數據分為建模數據集(2005—2014年報告病例數)和驗證數據集(2015年報告病例數)。
1.2 建立模型 由于流行性腮腺炎具有明顯的季節性高發特征,采用SARIMA模型進行研究,模型簡約表達式為SARIMA(p,d,q)×(P,D,Q)s模型。p、d、q、P、D、Q分別表示自回歸的階、差分的階、移動平均的階、季節性自回歸的階、季節性差分的階和季節性移動平均的階,s表示周期的長短,本研究以流行性腮腺炎月發病數為研究對象,12個月為1個周期,所以s=12。SARIMA模型的模型原理和建模過程與ARIMA類似,ARIMA詳見參考文獻[9-10]。
1.3 SARIMA模型識別、建模和評價 模型的識別為判斷p、d、q、P、D、Q的階,主要依靠自相關函數和偏自相關函數圖初步判斷和估計,ACF和PACF的識別原則詳見參考文獻[11]。本研究利用長沙市2005—2014年流行性腮腺炎發病數建模,生成ACF和PACF函數圖進行識別,獲得各參數的階后建立SARIMA模型,利用2015年流行性腮腺炎發病數進行模型驗證,計算絕對誤差和相對誤差,并對2016年長沙市流行性腮腺炎發病數進行預測。
1.4 統計學方法 采用Excel 2010整理數據和制作圖表,采用SPSS 13.0統計學軟件進行數據處理和建模,驗證數據與預測數據進行相關性分析,以P<0.05為差異有統計學意義。
2.1 長沙市疫情特征與模型識別 長沙市流行性腮腺炎疫情分別在2006年、2010—2011年、2013—2015年呈現高發態勢。從月發病數據看,季節性高峰較為明顯。利用2005—2014年的數據進行季節性處理后,進行1階(P=1,s=12)季節性自回歸模型識別,獲得自相關函數和偏自相關函數圖(見圖1),ACF呈拖尾衰減,PACF呈三步截尾,可判斷為平穩序列,可以識別為p=3、d=0、q=0的SARIMA(3,0,0)×(1,0,0)12模型。SARIMA(3,0,0)×(1,0,0)12模型參數估計結果具有統計學意義(見表1)。由此得到SARIMA模型的數學表達式為:(1-1.225B+0.713B2-0.291B3)(1-0.366B12)Yt=222.545+at,B與Y之間關系為:BkYt=Yt-k,其中B為后移算子,k為差分次數,t表示時間點,at為隨機誤差,因此進一步將數學表達式轉化為如下易于理解的方程:Yt=222.545+1.225Yt-1-0.713Yt-2+0.291Yt-3+0.366Yt-12-0.448Yt-13+0.261Yt-14-0.107Yt-15+at。

圖1 長沙市2005—2014年流行性腮腺炎時間序列的ACF和PACF圖
Figure 1 ACF and PACF diagrams of time series about mumps in Changsha from 2005 to 2014
表1 SARIMA(3,0,0)×(1,0,0)12模型參數估計結果
Table 1 SARIMA(3,0,0)×(1,0,0)12model parameter estimation results

模型指標參數標準誤t值P值非季節性時滯 AR11225009213314<0001 AR2-07130132-5409<0001 AR30291008932660001季節性時滯 R1036600953842<0001 常數222545498914461<0001
2.2 長沙市實際疫情與模型的擬合及預測 將2005—2014年數據作為建模數據,利用2015年數據作為驗證數據,并對2016年發病數進行預測,見圖2。由圖可知,建模區域與驗證區域的實際報告數與模型預測數非常吻合,實際報告數均在預測值的95%置信區間(CI)內,且驗證數據與預測數據呈正相關(r=0.61,P<0.001),驗證了該模型的合理性。根據2016年以來最新統計的1—5月實際報告數(174、161、138、182、354例)與該模型所預測的1—5月的預測數比較,即5個月預測值與95%CI分別為295(3,585)、254(-47,555)、241(-65,547)、250(-56,558)、273(-35,582)例,雖然數值上不完全一致,但各月的實際報告數均落入了預測數的95%CI內,進一步說明該模型的合理性,可以用該模型進行2016年預測。預測結果顯示,2016年全年發病數將達到3 032例,平均月病例數為253例。

圖2 長沙市流行性腮腺炎SARIMA模型擬合、驗證與預測圖
Figure 2 SARIMA model fitting,verification and prediction of mumps in Changsha
流行性腮腺炎的發病預測一直是公共衛生的重點關注對象,特別是在制定防治策略的規劃時顯得尤為重要。目前公認可采用數學建模方法進行預測研究。現有研究表明,目前常用的數學建模方法包括數理分析方法、微分方程模型[12-13]、隨機的基于個體的模型[13-14]、仿真平臺和復雜系統等。相對于其他方法而言,數理分析方法是最為簡便、易于應用的傳染病預測方法[15]。本研究采用的SARIMA模型屬于數理分析方法的范疇,該模型考慮了流行性腮腺炎發病的季節性規律,且實際報告數均在預測數的95%CI內,較好地擬合了長沙市流行性腮腺炎月發病數的變化規律,顯示出較高的預測精度,同時對驗證數據與預測數據進行相關性分析,結果顯示顯著性相關。利用建立的模型對流行性腮腺炎月發病數進行預測,均在95%CI內,且同實際報告數變動的趨勢一致,說明利用SARIMA模型預測流行性腮腺炎的流行趨勢是合理可用的。
本研究證實了建立的SARIMA模型能較好地用于流行性腮腺炎發病的預測,但受模型本身特點和資料可獲得性的限制,在應用中需要注意:首先,本研究建立的SARIMA模型是以流行性腮腺炎發病數隨時間的變化趨勢建立的模型,忽略了流行性腮腺炎的傳播過程。其次,單次分析時建立的SARIMA模型只能用于短期預測,不可作為長久性的預測[16]。傳染病發病預測既要考慮各級醫療機構傳染病的報告情況,也要考慮各項干預措施對發病率的影響[17]。所以,在實際工作中,對流行性腮腺炎要進行長期不間斷的監測,及時掌握其發病的變化趨勢,以便盡可能多地收集足夠的時間序列數據。不斷加入新的實際值,對模型進行修正或重新擬合,以提高模型預測的靈敏度,從而使數理分析方法中模型的構建和預測更好地服務于傳染病的防治工作。
作者貢獻:劉琳玲進行試驗設計與實施、資料收集整理、撰寫論文、成文并對文章負責;李亞曼、胡偉紅、謝知、趙錦進行試驗實施、評估、資料收集;劉如春、陳田木、張本忠進行質量控制及審校。
本文無利益沖突。
[1]楊小兵,汪鵬,孔德廣,等.武漢市2005—2011年流行性腮腺炎流行病學特征分析[J].公共衛生與預防醫學,2013,24(2):43-46. YANG X B,WANG P,KONG D G,et al.Epidemiological characteristics of mumps in Wuhan city(2005—2011)[J].Journal of Public Health and Preventive Medicine,2013,24(2):43-46.
[2]秦彥珉,程聰,謝旭,等.深圳市2008~2012年流行性腮腺炎疫情流行趨勢分析[J].中國熱帶醫學,2014,14(2):167-169. QIN Y M,CHENG C,XIE X,et al.Epidemiological analysis of mumps infections in Shenzhen city in 2008~2012[J].China Tropical Medicine,2014,14(2):167-169.
[3]張輝,劉繼鋒.西安市2006—2014年學校突發公共衛生事件流行情況分析[J].中華疾病控制雜志,2016,20(1):104-106. ZHANG H,LIU J F.Epidemiology of public health emergencies in school of Xi′an city,in 2006—2014[J].Chinese Journal of Disease Control & Prevention,2016,20(1):104-106.
[4]海蘭.認識流行性腮腺炎[J].家庭科技,2002(3):20. HAI L.Understanding of mumps[J].Jia Ting Ke Ji,2002(3):20.
[5]劉剛,王苑玲,梅樹江,等.深圳市2010—2013年流行性腮腺炎流行病學特征分析[J].公共衛生與預防醫學,2014,25(5):107-109. LIU G,WANG Y L,MEI S J,et al.Epidemiological characteristics of mumps in Shenzhen city(2010—2013)[J].Journal of Public Health and Preventive Medicine,2014,25(5):107-109.
[6]鐘貴良,林希建,劉姝.2008—2012年長沙市流行性腮腺炎流行病學特征分析[J].中華疾病控制雜志,2014,18(2):120-122. ZHONG G N,LIN X J,LIU S.Analysis on epidemiological characteristics of mumps in Changsha city from 2008 to 2012[J].Chinese Journal of Disease Control & Prevention,2014,18(2):120-122.
[7]中華人民共和國衛生部.GB 17016-1997 流行性腮腺炎診斷標準及處理原則[S].北京:中國標準出版社,1997. The Ministry of Health of the People′s Republic of China.GB 17016-1997 Diagnostic criteria and treatment principle of mumps[S].Beijing:China Standards Press,1997.
[8]中華人民共和國衛生部.WS 270-2008 流行性腮腺炎診斷標準[S].北京:中國標準出版社,2008. The Ministry of Health of the People′s Republic of China.WS 270-2008 Diagnostic criteria of mumps[S].Beijing:China Standards Press,2008.
[9]劉如春,陳田木,胡偉紅,等.ARIMA模型在腎綜合征出血熱發病率預測中的應用[J].實用預防醫學,2012,19(12):1782-1785. LIU R C,CHEN T M,HU W H,et al.Application of autoregressive integrated moving average model in forecasting the morbidity of haemorrhagic fever with renal syndrome[J].Practical Preventive Medicine,2012,19(12):1782-1785.
[10]陳發明,劉如春,陳田木,等.長沙市流感樣病例發病趨勢的時間序列分析和預測模型研究[J].實用預防醫學,2013,20(9):1052-1055. CHEN F M,LIU R C,CHEN T M,et al.Study on the time series analysis and prediction model of incidence trend of influenza-like illness in Changsha[J].Practical Preventive Medicine,2013,20(9):1052-1055.
[11]宇傳華.SPSS與統計分析[M].北京:電子工業出版社,2014. YU C H.SPSS and statistical analysis[M].Beijing:Electronic Industry Press,2014.
[12]CHEN T,LEUNG R K,ZHOU Z,et al.Investigation of key interventions for shigellosis outbreak control in China[J].PLoS One,2014,9(4):e95006.
[13]LIU R,LEUNG R K,CHEN T,et al.The effectiveness of age-specific isolation policies on epidemics of influenza A(H1N1)in a large city in central south China[J].PLoS One,2015,10(7):e0132588.
[14]LONGINI I M Jr,NIZAM A,XU S,et al.Containing pandemic influenza at the source[J].Science,2005,309(5737):1083-1087.
[15]LONGINI I M Jr,HALLORAN M E,NIZAM A,et al.Containing pandemic influenza with antiviral agents[J].Am J Epidemiol,2004,159(7):623-633.
[16]許陽婷.ARIMA模型在流行性腮腺炎發病率預測中的應用[J].華南預防醫學,2015,41(3):255-259. XU Y T.Application of ARIMA model in forecasting the incidence of mumps[J].South China Journal of Preventive Medicine,2015,41(3):255-259.
[17]楊小兵,汪鵬,江高峰.ARIMA乘積季節模型在流行性腮腺炎發病率預測中的應用[J].公共衛生與預防醫學,2013,24(6):39-42. YANG X B,WANG P,JIANG G F.The mumps incidence prediction by multiple seasonal ARIMA model[J].Journal of Public Health and Preventive Medicine,2013,24(6):39-42.
(本文編輯:賈萌萌)
Application of SARIMA Model in the Prediction of Incident Number of Mumps in Changsha
LIULin-ling1,LIURu-chun2,CHENTian-mu2,ZHANGBen-zhong1*,LIYa-man2,HUWei-hong2,XIEZhi2,ZHAOJin2
1.LanzhouUniversitySchoolofPublicHealth,Lanzhou730000,China2.ChangshaCenterforDiseaseControlandPrevention,Changsha410004,China
*Correspondingauthor:ZHANGBen-zhong,Professor;E-mail:Zhangbzh@lzu.edu.cn
Objective To predict the incident number of mumps in Changsha using seasonal autoregressive integrated moving average(SARIMA) model.Methods We collected the data of incident number of mumps reported in Changsha from 2005 to 2015,then,with the data between 2005 and 2014 as the modeling data,and that in 2015 as the validation data,we built and validated a SARIMA model and used it to predict the incident number of mumps in Changsha in 2016.Results SARIMA(3,0,0)×(1,0,0)12model could well fit the actual data,the expansion of the model was:Yt=222.545+1.225Yt-1-0.713Yt-2+0.291Yt-3+0.366Yt-12-0.448Yt-13+0.261Yt-14-0.107Yt-15+at.The validation data and model prediction data were analyzed,and the results demonstrated that there was significant correlation between them(r=0.61,P<0.001).SARIMA model predicted that the incident number of mumps occurred in Changsha in the whole year of 2016 would reach 3 032,the average monthly incident number was 253.Conclusion SARIMA model can be used to predict the incident number of mumps.It predicted that the mumps outbreak might still show a trend of high incidence in Changsha in 2016.
Mumps;Time series;SARIMA;Forecasting
R 512.1
A
10.3969/j.issn.1007-9572.2017.02.013
2016-05-30;
2016-09-16)
1.730000甘肅省蘭州市,蘭州大學公共衛生學院
2.410004湖南省長沙市疾病預防控制中心
*通信作者:張本忠,教授;E-mail:Zhangbzh@lzu.edu.cn