袁永旭,宋立群,吳文婧,李 黛,尚有為,于 琦
手足口病(hand-foot-mouth disease,HFMD)是一種兒童常見的傳染性疾病,是由人腸道病毒(human enterovirus,HEV)為主要病原體引起的傳染病,多發(fā)生于5 歲及以下兒童。HEV 類型眾多,同種型的病毒通常可以導致多種病癥或疾病,其中以柯薩奇病毒A 組16 型(CoxA16 型)和腸道病毒71 型(EV71 型)最為常見[1]。手足口病的主要臨床表現(xiàn)為經常性的口痛,手部、足部、口腔等小皰疹感染及潰瘍,絕大多數患者約1 周即可基本治愈。有報道個別重癥兒童病情的進展速度快,可致死亡[2]。我國于2008 年將手足口病納入丙類傳染病[3],2016 年中共中央、國務院印發(fā)了《“健康中國2030”規(guī)劃綱要》[4],要求加強重大傳染病的防控,改革并完善傳染病監(jiān)測預警機制,進一步擴大國家免疫規(guī)劃。我國的首個腸道病毒71 型(EV71 型)疫苗第1 期的臨床研究試驗疫苗已于2016 年春季上市,是我國唯一的可用于防治兒童手足口病的疫苗[5]。同時,為適應社會對聯(lián)合疫苗與多價疫苗研發(fā)的需求,中國食品藥品檢定研究院完成了柯薩奇病毒A 組16 型(CA16 型)疫苗國家抗原標準品的研制[5],但就目前情況來看仍然缺乏有效的臨床治療藥物,各地居民對腸道病毒71 型(EV71)疫苗的認識也仍然處于較低水平[6]。因此,手足口病防控形勢嚴峻,不容小覷[7]。
國內學者對各省市手足口病進行了不同方向的研究。有學者通過采集上海市寶山區(qū)2015-2016年手足口病標本進行實驗室檢測和數據聚類分析,對上海市手足口病的發(fā)病時間與特征進行了有依據的推斷預測[8];有學者根據沈陽市2008-2017年手足口病的流行特點及趨勢,采用描述流行病學的方法對沈陽市手足口病疫情流行發(fā)病率進行了分析[9]。近年來,山西省手足口病發(fā)病率呈平穩(wěn)略下降趨勢,但防控形勢仍然非常嚴峻,全省各縣市均出現(xiàn)了不同程度的流行情況。山西省衛(wèi)生和計劃生育委員會在防治手足口病新聞通氣會上表示,本省的手足口病病例主要分布在太原市、晉中市等地,其原因可能為城市人口密度過大、人群跨地區(qū)流動頻繁、國家三胎政策開放后新生兒數量增多,但針對兒童的醫(yī)療衛(wèi)生措施未有效實施,城市改造建設發(fā)展增快導致環(huán)境惡化,從而造成手足口病的持續(xù)高發(fā)[10]。因此,對手足口病發(fā)病率趨勢的預測就顯得尤為重要。本文基于山西省2007-2017年手足口病的月發(fā)病率數據,利用差分整合移動平均自回歸模型(autoregressive integrated moving average model,ARIMA)進行匯總分析,預測山西省2022-2023 年手足口病的月發(fā)病率和高發(fā)期,為山西省手足口病的早期預警與防控提供依據。
從公共衛(wèi)生科學數據中心(www.phsciencedata.cn)收集下載、整理山西省2007-2018 年手足口病的月發(fā)病率相關數據資料。使用Excel 2019 軟件建立樣本數據庫和整合預測數值表,利用R4.0.0 軟件進行數據處理及繪圖,并查閱山西省疾病預防控制中心相關資訊和統(tǒng)計信息,補充2019-2021 年未公示數據帶來的預測缺失部分,所獲得的數據一律保留4 位小數,數據真實、可靠。然后,利用山西省2007-2017 年手足口病的月發(fā)病率數據建立相關模型并進行擬合外推,以2018 年實際發(fā)病率數據檢驗所建立模型的預測效果,進一步佐證模型精度。
ARIMA 模型為差分集成移動(又稱“滑動”)平均自回歸模型,也叫“博克斯-詹金斯模型”[11]。其建模過程可分為4 步:序列平穩(wěn)性檢驗及平穩(wěn)化處理、模型識別、參數估計、模型檢驗及預測。該模型簡單靈活,被廣泛應用于傳染性疾病、呼吸系統(tǒng)疾病等的發(fā)病率預測研究[12]。
將用軟件推算出的模型與山西省2007-2018 年手足口病的月發(fā)病率實際數據進行對比,并進行擬合圖像分析,根據對比結果,采用平均絕對誤差評價模型精度,誤差數值越小表示模型預測能力越強。
采集2007 年1 月至2017 年12 月共132 個月的山西省手足口病月發(fā)病率數據(表1)。

表1 山西省2007-2017 年手足口病月發(fā)病率(1/10 萬)
根據表1 數據,利用R 軟件建立2007-2017年山西省手足口病月發(fā)病率時序圖(圖1)。圖1顯示,山西省手足口病月發(fā)病率有明顯的周期性和趨勢性,且月報告病例總數整體呈現(xiàn)上升趨勢,呈現(xiàn)周期性波動上升的特點,其中2009 年、2012 年、2014 年為高發(fā)年,但上升或下降幅度不大。

圖1 山西省2007-2017 年手足口病月發(fā)病率的時序圖
2.2.1 序列平穩(wěn)性檢驗及平穩(wěn)化處理
為觀察原始數據的趨勢,利用代碼df-ts-stl<-decompose(train)plot(df-ts-stl)將時間序列進行季節(jié)性分解。從時間序列的分解圖上看,山西省手足口病月發(fā)病率的趨勢性和周期性占比相當,并且周期性十分明顯(圖1、圖2)。

圖2 山西省2007-2017 年手足口病月發(fā)病率的時間序列季節(jié)性分解圖
如圖2 所示,山西省手足口病的月發(fā)病率數據存在較為明顯的規(guī)律性和周期性,但部分趨勢呈無序狀,無法認定其為平穩(wěn)序列,故判定其為非季節(jié)性ARIMA 模型,不能直接進行ARIMA 模型的模型識別與參數統(tǒng)計。所以下面要對原始時間序列進行一階差分,消除對其不平穩(wěn)規(guī)律性和周期性的影響,實現(xiàn)序列的平穩(wěn)化處理。
原始時間序列一階差分后的時間序列圖、自相關圖和偏自相關圖如圖3、圖4、圖5 所示。

圖3 一階差分后的時間序列圖

圖4 一階差分后的自相關圖

圖5 一階差分后的偏自相關圖
可以看出,差分后的序列整體平穩(wěn),自相關函數(autocorrelation function,ACF)和偏自相關函數(partial autocorrelation function,PACF)的數值非顯著為零,然后進行單位根檢驗得到假定值P為0.01,小于0.05,進一步判斷出此時的序列具有了平穩(wěn)性,說明接下來可以對一階差分后的序列進行ARIMA 的建模與分析。
2.2.2 模型識別與參數估計
根據以上的整理分析,開始進行ARIMA 建模。非季節(jié)性 ARIMA 模型的原始形態(tài)為 ARIMA(p,d,q)(P,D,Q)[12],p、d、q 分別代表自回歸、差分和移動平均的階次,這里的P、D、Q 分別代表季節(jié)性的自回歸、差分及移動平均的階次,以大寫與非季節(jié)性的p、d、q 進行區(qū)分[13]。首先在R 軟件中輸入代碼“fic<-auto.arima(train,ic=”aic”,trace=1)”來確定p、d、q、P、D、Q 等參數的值,R 軟件自動計算比較所建立模型中最優(yōu)的一個。
根據AIC 最小原則,函數自動識別模型為ARIMA(2,0,0)(2,1,0)[12]模型,根據此模型對R 軟件擬合模型的殘差進行隨機性白噪聲檢驗,求得假定值P為0.9725,明顯大于0.05,說明通過白噪聲檢驗;當P>0.05 時,擬合殘差項中不再蘊含任何相關信息,擬合模型顯著有效[14]。
2.2.3 模型精度評價
利用已建立的最優(yōu)ARIMA(2,0,0)(2,1,0)[12]模型“反向預測”2018 年1-12 月的手足口病月發(fā)病率,以實際值與預測值進行模型精度對比評價。山西省2018 年手足口病月發(fā)病率的預測值與實際值比較及預測精度見表2。

表2 山西省2018 年手足口病月發(fā)病率的預測值與實際值比較及預測精度
表2 顯示,2018 年5 月、6 月和8 月絕對誤差分別為4.5759、7.3613 和2.8540,明顯大于1,說明預測結果異常;雖然4 月、7 月、11 月的絕對誤差分別約為1.6、1.9 和1.7,也大于1,但相較于5月、6 月和8 月絕對誤差偏小,所以可認為除5 月、6 月和8 月外其余9 個月的絕對誤差均保持在1左右。山西省衛(wèi)生和計劃生育委員會2018 年發(fā)布的相關數據顯示[10],當年為手足口病高峰年,整體流行強度高于往年,因此2018 年5 月、6 月和8月的預測值與實際數值存在相對大的偏差。
利用代碼R2(pred$mean,test)計算出R2為0.751 1868,R是相關系數,R2指擬合優(yōu)度。當R2>0.75 時,說明模型擬合度很好,該預測模型精度較高。
再利用已建立的ARIMA(2,0,0)(2,1,0)[12]模型預測山西省2007 年1 月至2018 年12 月手足口病的月發(fā)病率,用2007 年1 月至2018 年12 月的實際月發(fā)病率數據與已預測的月發(fā)病率數據進行趨勢擬合分析,結果如圖6 所示。

圖6 山西省2007-2018 年手足口病月發(fā)病率實際值與模型預測值的趨勢擬合
圖6 顯示,本文建立的ARIMA 預測模型所預測的山西省2007 年1 月至2018 年12 月手足口病的月發(fā)病率趨勢與實際發(fā)病率趨勢走向整體上大致相同,進一步肯定了ARIMA(2,0,0)(2,1,0)[12]模型的可用性和準確性,因此可以使用該模型預測山西省2019-2023 年手足口病月發(fā)病率。
2.2.4 模型預測
ARIMA 模型的功能之一是預測未來連續(xù)年份的發(fā)病率,目前大量研究者均用該模型預測各種疾病未來5 年的發(fā)病率。同時,本文將2018 年實際數據與預測數據進行對比,驗證結果顯示模型預測值與實際值契合度較高,因此利用該模型進行5年趨勢外推具有可行性。
用選定的ARIMA(2,0,0)(2,1,0)[12]模型對山西省2019 年1 月至2023 年12 月份手足口病發(fā)病率進行預測,預測結果見表3。表3 顯示每年6-8月份手足口病的月發(fā)病率仍然高于其他月份,需要在這段時間內加大預防力度。為更加直觀地說明問題,將表格中的預測數據轉換成趨勢圖(圖7)。

表3 山西省2019-2023 年手足口病發(fā)病率預測值(1/10 萬)

圖7 山西省2019-2023 年手足口病月發(fā)病率預測趨勢
ARIMA(2,0,0)(2,1,0)[12]模型預測結果顯示,山西省未來5 年的手足口病月發(fā)病率仍呈現(xiàn)周期性波動,波動規(guī)律平穩(wěn),或將呈現(xiàn)略微上升趨勢。
本文通過建立ARIMA(2,0,0)(2,1,0)[12]模型預測了2019-2023 年山西省手足口病的月發(fā)病率,結果顯示手足口病發(fā)病率呈平穩(wěn)趨勢,且存在周期性,每年4-7 月為春夏季發(fā)病高峰期,10-11月為秋季發(fā)病高峰期。
登錄山西省疾病預防控制中心官方網站(http://www.sxcdc.cn/index.htm),查閱發(fā)布的傳染病疫情統(tǒng)計信息,比較實際數據和預測數據的差距。比較結果顯示,2019-2021 年的4、5、6 月份發(fā)布的丙類傳染病病例當中,包含手足口病在內的3 種傳染病占報告發(fā)病數的90%以上。雖然山西省疾病預防控制中心提示春季是呼吸道傳染病和手足口病等腸道傳染病的高發(fā)季節(jié)[15],與模型預測每年7 月是手足口病發(fā)病率最高的月份有所出入,但究其原因,主要是每年春季手足口病發(fā)病初期疾病防控部門都會進行干預,因而防止了手足口病月發(fā)病率到達模型預測出的最高點,側面驗證了模型精度。
針對山西省手足口病發(fā)病率常年波動且緩慢上升的趨勢,建議采取以下手足口病的綜合防治措施。
利用可獲得的數據對山西省手足口病月發(fā)病率進行預測預警,可以有效提醒山西省衛(wèi)生健康委員會、山西省疾病控制中心等有關部門提前加強流行病宣傳教育,尤其是對易發(fā)生手足口病的地區(qū)或單位開展重點人群宣傳教育。同時,醫(yī)院與社區(qū)等有關單位在做好日常宣傳的基礎上,定期舉辦手足口病知識普及活動,對手足口病的傳播途徑和病原寄生方式進行科普,使公眾充分了解相關癥狀、危害及預防方式,以及更好地了解手足口病的流行規(guī)律,為制定相關防治策略提供中肯意見及參考依據,以有效應對流感、手足口病等重點傳染病疫情,保證易感人群的健康。
實施流行病綜合防控戰(zhàn)略,加強省內的國家流行病綜合防控示范區(qū)建設,建立預防手足口病的專門機構,設立相關崗位,如手足口病宣傳員、防疫員等,吸納高素質前沿人才,建立強大的山西省醫(yī)療人才儲備軍,確保防疫工作順利開展;提高省內防治手足口病資金支持力度,加大對醫(yī)療設備、藥品、人才的投入,建立健全覆蓋全省的公共衛(wèi)生服務,防治手足口病等重大突發(fā)疫病。
在現(xiàn)有防控措施的基礎上,與相關機構緊密協(xié)作,規(guī)范病例監(jiān)測報告,開展手足口病咨詢服務,進行手足口病知識培訓,加大宣傳教育的力度,使公眾深入了解手足口病的傳染方式、防治措施等知識,規(guī)范做好疫苗預防接種。在自愿、自費原則的前提下,積極動員適齡兒童接種手足口病疫苗,并提供安全、規(guī)范的預防接種服務,保障人民群眾身體健康。
在傳染病發(fā)病率預測研究中,常用的模型預測方法有很多,ARIMA 模型因其便捷易行且模型精度較高而被廣泛使用。本文利用山西省2007-2017年手足口病的月發(fā)病率數據構建ARIMA 模型,經過序列平穩(wěn)化平穩(wěn)性檢驗處理、模型定階、參數估算及模型的檢驗等步驟計算得出最優(yōu)模型ARIMA(2,0,0)(2,1,0)[12],其預測值與實際月發(fā)病率基本在模型擬合的95%置信區(qū)間內,說明當月疫情無異常,該模型精度較高,可用來對山西省手足口病月發(fā)病率進行短期預測。
本研究還存在以下局限。一是ARIMA 模型依賴于數據本身且要求時序數據穩(wěn)定,用此模型對手足口病發(fā)病率進行預測分析時難以兼顧外部環(huán)境的變化,如人群的變化、空氣質量變化、氣溫異常變化等;二是所能查閱到的官方數據資料只更新到2018 年,而2019 年至今的數據沒有在正規(guī)的網站上公布,因此存在數據滯后的問題;三是判斷模型精度時只使用了平均絕對誤差這一種標準,沒有采用更多的標準進行比較,雖然結果可靠,但仍沒有達到最精確的水平。今后的研究將完善模型精確度,以獲得更嚴謹、更全面的山西省手足口病月發(fā)病率預測結果。