濰坊醫學院(261053)
孫 娜 許小珊 馮佳寧 馬 潔 黃 璐 田 野 杜澤玉 孟維靜 王素珍△ 石福艷△
s
國家掌握肺結核的發展情況,有利于及時制定方針政策,更好的做到“早發現、早隔離、早治療”,從而及時做好肺結核的防治工作[1]。本次研究利用2011年至2016年我國肺結核的發病人數,分別構建ARIMA乘積季節模型和GM(1,1)模型,采用平均絕對百分誤差(MAPE)來評價模型的擬合效果,并給出肺結核發病人數的預測值,為我國傳染病應急預案的制定提供依據。
研究中使用的2011年至2016年肺結核的發病人數資料來源于中國疾病預防控制中心發布的中華人民共和國國家衛生和計劃生育委員會公報。利用2011年至2016年肺結核的月發病人數擬合ARIMA乘積季節模型,利用2011年至2016年肺結核的年發病人數擬合GM(1,1)模型。
分別利用ARIMA乘積季節模型和GM(1,1)模型擬合我國肺結核的發病人數,用于我國肺結核發病人數的預測,并通過比較平均絕對百分誤差(MAPE)得到擬合效果較好的模型。
(1)ARIMA乘積季節模型
當序列既具有短期相關性還存在季節效應,同時短期相關性和季節效應通過加法模型無法充分、有效提取時,就可以使用乘積季節模型來進行擬合。
(2)ARIMA乘積季節模型的構造原理
當原始序列具有季節效應,季節相關性可以通過以周期步長為單位的ARMA(P,Q)模型提取;當原始序列具有短期相關性時,一般可通過低階ARMA(p,q)模型提取。當短期相關性和季節相關性之間具有乘積關系時,我們要擬合模型的模型則為ARMA(p,q)模型和ARMA(P,Q)模型的乘積。
(3)ARIMA乘積季節模型的建模流程
①平穩性檢驗:根據時序圖顯示的特征與ADF單位根檢驗結果判斷序列的平穩性。②白噪聲檢驗:對平穩序列進行白噪聲檢驗,若序列為白噪聲序列則分析結束,若序列不是白噪聲序列則進一步擬合ARMA模型。③擬合ARMA模型。
其中擬合ARMA模型的過程主要包括:①計算得到平穩后序列的樣本自相關系數(ACF)與樣本偏自相關系數(PACF)的值。②根據樣本ACF和PACF,選擇合適的ARMA(p,q)模型進行擬合。③運用極大似然估計法估計模型參數。④模型的檢驗。當擬合模型不能通過檢驗時,則重新進行步驟(2)。⑤模型的優化。當擬合模型檢驗通過了,仍然重新進行步驟(2),擬合新的模型,并且通過AIC和SBC最小原則選擇最優模型。⑥預測。利用所選的最優模型進行預測。
(4)GM(1,1)模型的建立
利用灰色預測法來擬合GM(1,1)模型[2]。設時間序列x(1)有n個觀察值,x(1)={X(0)(1),X(0)(2),…,X(0)(n)},通過一次累加生成以弱化其隨機性,強化其規律性的序列X(1)={X(1)(1),X(1)(2),…,X(1)(n)},則GM(1,1)模型相應的微分方程為:
式中,a稱為發展灰數,μ稱為內生控制灰數。利用最小二乘法求解a和μ,可以得到預測模型:
(5)GM(1,1)模型的檢驗

(6)外推預測
若所建模型的殘差檢驗、后驗差檢驗和關聯度檢驗均符合條件,我們就可以用該模型進行預測,預測公式為:
以2011-2016年我國肺結核發病人數為原始序列,利用SAS 9.4調用IML宏程序建立肺結核發病人數預測模型[4],然后對模型進行檢驗,檢驗通過后,運用該模型預測我國2017-2018年肺結核的發病人數。
(7)ARIMA與GM(1,1)模型效果評價
本次研究采用平均絕對百分誤差(MAPE),比較ARIMA乘積季節模型和GM(1,1)模型兩種模型在預測我國肺結核年發病人數中的效果。
MAPE=(∑|(xi-x)/x|*100%)/n
式中xi與x分別代表為預測值和實際值。
(1)判斷序列的平穩性

圖1 2011-2016年我國肺結核發病人數時序圖
時序圖顯示,該序列具有明顯的單調遞減的趨勢,同時也具有周期變化規律。我們嘗試進行1階差分,實現其趨勢平穩;進行12步差分,提取其中的周期信息。
時序圖顯示,差分后序列在0附近比較穩定地波動,可以初步認為差分運算后的序列平穩。ADF單位根檢驗結果如表1所示。
由于ADF單位根檢驗結果顯示檢驗統計量所對應的P值均小于0.05。因此,可以認為經過差分后的序列已經平穩。
(2)白噪聲檢驗

圖2 差分后序列時序圖

表1 增廣 Dickey-Fuller 單位根檢驗

表2 差分運算后序列白噪聲檢驗
在檢驗的顯著性水平取0.05的條件下,由于延遲6階的卡方統計量的值為23.16,P值為0.0007,小于0.05,所以該差分后的序列不能視為白噪聲序列,即差分后序列還蘊含著相關信息可供提取。
(3)ARIMA模型識別

圖3 差分后序列自相關圖
樣本自相關圖顯示延遲12階自相關系數顯著大于2倍標準差范圍,這說明差分后序列中仍蘊含著非常顯著的季節效應。而且延遲1階的自相關系數也大于2倍標準差,這說明差分后序列還具有短期相關性,考慮擬合乘積模型ARIMA(p,d,q)(P,D,Q)s。根據ACF圖和PACF圖所顯示的特征,認為12階以內的自相關圖1階截尾,偏自相關圖拖尾,嘗試ARMA(0,1)模型提取成分后序列的短期相關信息。一般P、Q階值比較難判斷,根據有關文獻[5]提示,P、Q階值通常不會超過2階,所以我們對P、Q分別取0、1、2,由低階到高階逐個實驗,根據AIC和SBC最小原則選擇最優模型[6]。最終得到的可以充分提取序列信息的模型有以下兩個:

圖4 差分后序列偏自相關圖

表3 ARIMA(p,d,q)(P,D,Q)s模型的組合與最優模型的選取準則檢驗
根據AIC和SBC最小原則確定最優模型為ARIMA(0,1,1)(0,1,1)12。
(4)ARIMA模型參數估計與模型檢驗
運用極大似然估計法估計模型參數。

表4 ARIMA(0,1,1)(0,1,1)12模型參數顯著性檢驗
模型參數檢驗的檢驗統計量的P值都小于0.05,因此,在顯著性水平為0.05條件下,可以認為模型參數值與0之間的差異具有統計學意義。

表5 ARIMA(0,1,1)(0,1,1)12模型殘差白噪聲檢驗
延遲各階的LB統計量的P值均大于0.05,所以擬合的ARIMA(0,1,1)(0,1,1)12模型成立。擬合模型的具體形式為▽▽12xt=(1-0.83148B)(1-0.73177B12)εt
根據擬合出的ARIMA(0,1,1)(0,1,1)12模型得到2017-2018年我國肺結核的月發病人數依次為82561、78303、109046、103622、99448、92873、93436、90499、86277、79478、82595、83082、78809、74552、105295、99871、95697、89122、89685、86748、82525、75726、78844、79330人。因此,2017-2018年我國肺結核的年發病人數依次為1081220、1036204人。
以我國2011-2016年肺結核發病人數為原始序列,運用SAS 9.4計算得出模型參數a=0.053161,μ=1469122.88,因此,應用GM(1,1)模型建立我國肺結核發病人數預測模型:
(1)殘差檢驗

表6 預測值與真實值之間的比較
結果顯示,所有的相對誤差均小于0.05,所以該模型可以通過殘差檢驗。
(2)后驗差檢驗
經檢驗,后驗差C值為0.17385,小概率P值為1.00,模型預測精度等級為好[3],可以將該模型用于外推預測。
(3)關聯度檢驗
運用SAS 9.4進行計算,結果顯示,關聯度r=0.63042>0.6,滿足檢驗準則。因此,模型通過了關聯度檢驗。
(4)肺結核發病人數的預測
根據擬合的GM(1,1)模型進行肺結核發病人數的預測。預測我國2017-2018年肺結核的年發病人數依次為1042909、988915人。
根據模型預測結果,計算2011-2016年兩模型的MAPE值。肺結核年發病人數ARIMA乘積季節模型和GM(1,1)模型MAPE分別為1.70%和1.45%。通過比較MAPE可以發現GM(1,1)模型擬合效果要好于ARIMA乘積季節模型。
目前在時間序列預測中應用比較多的模型就是ARIMA乘積季節模型和GM(1,1)模型。本研究中運用GM(1,1)模型和ARIMA乘積季節模型對我們肺結核發病人數進行擬合,用于比較ARIMA乘積季節模型和GM(1,1)模型在我們年肺結核發病人數預測中的準確性。兩種模型擬合均通過了模型檢驗,均可用于我國肺結核發病人數的外推預測,通過比較兩種模型的MAPE可以發現,GM(1,1)模型的MAPE小于ARIMA乘積季節模型的MAPE。因此GM(1,1)模型對我國肺結核年發病人數的擬合效果高于ARIMA乘積季節模型。可能是因為我們在進行年發病人數預測時,體現不出ARIMA乘積季節模型的預測優勢。但是,通過ARIMA乘積季節模型可以得到我國肺結核的月發病人數,也具有其獨特的優勢。
運用所得到的GM(1,1)灰色預測模型預測我國未來兩年肺結核的發病人數依次為1042909、988915人。預測結果顯示,我國2017-2018年肺結核的發病人數將呈現出下降的趨勢,但是其發病數仍然處于較高的水平。
肺結核是慢性傳染性病,其流行趨勢是有規律可循得,因此疾病預防控制中心應積極采取綜合措施,聚焦重點人群、強化業務知識培訓、全面深入推進全民肺結核預防策略與措施的宣傳,提高公眾對肺結核預防知識的知曉率[7],更好的做到“早發現、早隔離、早治療”,從而提高肺結核病人的發現率。疾病預防控制中心還應該采取措施強化聯防聯控,在宣傳肺結核預防策略與措施的同時宣傳現代肺結核治療策略與措施,讓公眾更好地了解到國家對肺結核病人所采用的政策與措施,使肺結核的病人可以得到規范的治療和管理,從而使肺結核病人的治愈率得到提高。對于確診為肺結核的患者,我們應該根據他們的實際病情,及時的采取有效的治療措施,對患者的病情進行控制,才能有效控制傳染源,從而降低肺結核病人的傳染率。對于肺結核的病人,我們還應該及時的掌握病人的病情資料以及藥物的使用情況,督促病人及時用藥,加強肺結核病人規律治療的意識,避免不規律服藥造成的治療失敗等后果。對肺結核病人進行長期的追蹤治療,還可以及時獲得他們的病情詳細資料,為將來對肺結核的觀察性研究提供資料。