李 標 李雪梅 古麗斯
深圳市鹽田區疾病預防控制中心,深圳鹽田 518000
為增加手足口病防控工作的主動性和預見性,及時、科學地對手足口病的發病趨勢進行預測是很重要的。[1]時間序列分析法中的自回歸滑動平均混合模型是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的著名時間序列預測方法,近年來由于其在公共衛生領域良好的適用性而逐漸被廣大學者重視[2]。
數據源于中國法定傳染病報告系統—“中國疾病預防控制信息系統”,選取現住址為深圳市鹽田區,發病日期為2008年1月1 日—2014年4月30 日的所有臨床診斷和實驗室確診手足口病病例。人口數來源于每年深圳市鹽田區統計局公布的人口數。
AR IMA 模型的基本思想是:將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現在值來預測未來值。其中ARIMA(p,d,q)稱為差分自回歸移動平均模型,AR 是自回歸,p 為自回歸項;MA 為移動平均,q 為移動平均項數,d 為時間序列成為平穩序列所做的差分次數(階數)。
所有試驗數據均使用SPSS 19.0 軟件包處理,并確保準確無誤。組間的差異以P<0.05 表示具有統計學意義。
繪制2008年1月—2014年4月深圳市鹽田區手足口病發病率的時間序列圖,時間單位定義為年月型,起始點為2008年1月。結果顯示,總體線性趨勢不明顯,5~6月,9~10月出現明顯季節性高峰。提示原始序列非平穩序列,進行一階逐期差分和一階季節差分后,得到一個基本穩定的序列。

圖1 深圳市鹽田區2008年1月—2014年4月手足口病發病率的時序圖

圖2 原始序列1 階差分,1 階季節性差分后的自相關及偏相關圖
嘗試建立ARIMA (p,d,q) (P,D,Q)模型,經過前述對數據進行一階差分和一階季節差分的預處理,獲得較平穩數列,因此,d=D=1。自相關圖顯示(見圖2 左側),所有階以后函數值除周期點處外都落入區間內,所以q 取為0,而12 函數不為0,可以取Q 為1。
偏自相關圖(見圖2 右側),可取p 為0,而12 階函數不為0,P 可以取0 或1。綜合序列自相關系數和偏自相關系數的性質,初步選定ARIMA(0,1,0)(1,1,1)12 或ARIMA(0,1,0)(0,1,1)12。

圖3 殘差自相關函數分析
通過比較平穩的R2,BIC,LB 檢驗統計量,模型ARIMA(0,1,0)(0,1,1)12 的BIC=6.066,在擬合比較的模型中最小,故選定為最佳模型。模型的參數估計值有統計學意義。(見表1)殘差白噪聲檢驗,自相關系數均在95%可信區間,提示用該模型進行預測是合理的。(見圖3)4.擬合曲線與預測效果評價
用模型ARIMA (0,1,0)(0,1,1)12 對2013年9月—2014年4月各月發病率進行擬合,并用實際發病率進行比較,相對誤差的中位數為0.71,各月相對誤差以2013年11月最大,為6.09.提示模型雖可用于對深圳鹽田區手足口病發病趨勢進行預測,但是個別月份預測的精度仍存在較大誤差。

表1 2013年9月—2014年4月手足口病實際發病率與預測發病率比較
以2008年1月—2014年4月深圳鹽田區手足口病發病率數據為基礎,用模型ARIMA (0,1,0)(0,1,1)12 對2014年5~12月該地區手足口病發病率進行預測,結果顯示5~6月會出現高峰,分別為76.48/10 萬和61.25/10 萬。9~10月有個小高峰,分別為45.04/10 萬和44.93/10 萬。(見圖4),見表2。

表2 2014年12月手足口病發病率預測情況

圖4 深圳鹽田區2014年5月—2014年12月手足口病發病率預測情況
ARIMA 模型是目前應用較多的時間序列預測方法之一,它綜合考慮到了疾病的季節性、周期性、隨機性等可能影響序列平穩性的因素,提高了模型的擬合和預測效果,同時借助,模型的參數進行了量化表達,在傳染病預測中具有廣泛的適用性[2]。彭志行,陶 紅等將ARIMA 模型應用于麻疹疫情的預測預警,為防控提供了積極的指導作用[3]。陳莉.運用SPSS 軟件建立ARIMA 模型,很好的擬合了海南省細菌性痢疾的發病趨勢[4-5]。吳孟泉等應用ARIMA 模型對山東省2009年3月30 日—8月30 日手足口病發病時間序列進行擬合,結果證明該時間段手足口病發病率預測值符合實際發病率的變動趨勢[6]。手足口病具有傳染性強,傳播途徑多,病原學復雜,各病原體間無交互免,患者可多次重復感染等特點,容易在短時間造成大面積流行[1]。因此較準確的預測手足口病的發病趨勢,及時制定防控措施,對于減少聚集性及暴發疫情的發生是非常重要的。
本文利用2008年1月—2013年9月深圳市鹽田區手足口病發病資料,通過識別、估計、診斷等過程擬合建立了ARIMA(0,1,0)(0,1,1)12 預測模型。利用2013年10月—2014年4月實際發病數與預測發病數進行比較,實際值與預測值相對誤差的中位數為71%,實際值均落入95%可信區間,提示手足口病的發病無異常增高,且發病的趨勢與實際情況基本一致。表明利用ARIMA 模型預測深圳市鹽田區手足口病發病趨勢的可行性。另一方面也顯示了預測的實用性和應用價值,根據發病率既往的變化規律(線性趨勢、季節性、周期性等),如果實際發病率在預測值95%可信區間范圍內波動,表明當月疫情基本正常,如果超出預測值95%可信限范圍,應提示并警惕傳染病的暴發或流行的可能,可以為傳染病預警預報及干預提供依據[6-7]。根據預測結果,2014年5~12月深圳市鹽田區手足口病的發病率有2 個高峰,分別為5~6月,9~10月,提示在此期間,需重點做好手足口病的防控,尤其是加強與托幼機構、醫療機構的聯防聯控,較少聚集性或暴發疫情的發生。
本次研究所建立的模型只是對深圳市鹽田區2014年手足口病發病率的預測模型,而對今后幾年的預測,應該在不斷收集新的數據基礎上,再對其修訂或重新建模[8-10]。因為手足口病的發病率受到諸多未知隨機因素的影響,所建立的模型更適合進行短期的預測,
[1]蔡小虹,萬秋萍,吳益生,等ARIMA 模型預測上海市打閘北區手足口病發病趨勢[J].實用預防醫學,2012,19(3):381-384.
[2]彭志行,鮑昌俊,趙揚,等.ARIMA 乘積季節模型及其在傳染病發病預測中的應用[J].數理統計與管理,2008,27(2) :365-367.
[3]彭志行,陶紅,賈成梅,等.時間序列分析在麻疹疫情預測預警中的應用研究[J].中國衛生統計,2010,10(27):459-461.
[4]馮丹,韓曉娜,趙文娟,等.中國內地法定報告傳染病預測和監測的ARIMA.模型[J].疾病控制雜志,2007,11(2):140-143.
[5]陳莉.探討ARIMA 模型在細菌性痢疾發病預測中的應用[J].中國衛生統計,2011,8(28):417-419.