劉紅楊,劉洪慶,李望晨,趙 晶
·論著·
·方法學(xué)研究·
差分自回歸移動平均與廣義回歸神經(jīng)網(wǎng)絡(luò)組合模型在丙型肝炎月發(fā)病率中的預(yù)測應(yīng)用
劉紅楊,劉洪慶*,李望晨,趙 晶
目的 探討差分自回歸移動平均(ARIMA)與廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)組合模型在丙型肝炎月發(fā)病率中預(yù)測建模效果及應(yīng)用前景,為疫情預(yù)測提供依據(jù)。方法 2015年5月—2016年5月,選取山東省疾病預(yù)防控制中心法定傳染病直報系統(tǒng)2004—2014年丙型肝炎月度發(fā)病率數(shù)據(jù)及山東省統(tǒng)計局發(fā)布的同期人口資料。對2004—2014年山東省丙型肝炎月發(fā)病率數(shù)據(jù)構(gòu)建ARIMA模型,驗證擬合精度并外推預(yù)測;將ARIMA模型擬合值作為GRNN模型的輸入,實際值作為GRNN模型的輸出,對樣本進(jìn)行訓(xùn)練和預(yù)測。比較單純ARIMA模型和ARIMA-GRNN組合模型在丙型肝炎月發(fā)病率中的預(yù)測效果。結(jié)果 2004—2014年山東省丙型肝炎年均發(fā)病率為17.28/10萬,并隨著時間的推移呈上升趨勢(Z=29.05,P<0.01)。ARIMA(1,2,1)模型預(yù)測2014年山東省丙型肝炎發(fā)病率與實際發(fā)病率基本一致,落在95%置信區(qū)間內(nèi),擬合效果較好。以ARIMA(1,2,1)模型擬合值作為GRNN模型的輸入,丙型肝炎月發(fā)病率實際值作為GRNN模型的輸出,取最優(yōu)光滑因子0.12訓(xùn)練模型,ARIMA-GRNN組合模型預(yù)測的擬合值與實際值基本吻合。ARIMA模型和ARIMA-GRNN組合模型的平均誤差率(MER)分別為16.87%、15.30%;決定系數(shù)(R2)分別為0.53、0.60;平均絕對誤差(MAE)分別為0.17、0.09;平均絕對百分誤差(MAPE)分別為1.18、0.35。結(jié)論 ARIMA-GRNN組合模型對山東省丙型肝炎月發(fā)病率擬合及預(yù)測效果優(yōu)于單純ARIMA模型,具有較高的擬合精度,有較為廣闊的應(yīng)用前景,對于疫情預(yù)測工作有一定的實用性意義。
丙型肝炎;發(fā)病率;預(yù)測;差分自回歸移動平均模型;廣義回歸神經(jīng)網(wǎng)絡(luò)
劉紅楊,劉洪慶,李望晨,等.差分自回歸移動平均與廣義回歸神經(jīng)網(wǎng)絡(luò)組合模型在丙型肝炎月發(fā)病率中的預(yù)測應(yīng)用[J].中國全科醫(yī)學(xué),2017,20(2):182-186.[www.chinagp.net]
LIU H Y,LIU H Q,LI W C,et al.Application of ARIMA-GRNN combination model in predicting monthly incidence of hepatitis C[J].Chinese General Practice,2017,20(2):182-186.
本研究創(chuàng)新性:
本研究通過對山東省丙型肝炎月發(fā)病率時序圖進(jìn)行分析發(fā)現(xiàn),既有線性趨勢又有非線性趨勢,時間序列分析能夠充分提取模型線性信息,廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)具有強(qiáng)大的非線性逼近能力、較快的學(xué)習(xí)速度和預(yù)測結(jié)果穩(wěn)定等優(yōu)點,將兩者結(jié)合起來,建立差分自回歸移動平均(ARIMA)-GRNN組合模型。該模型具有綜合利用各單一預(yù)測模型所提供信息的特點,預(yù)測更加敏銳,有效提高預(yù)測精度。ARIMA-GRNN組合模型對山東省丙型肝炎月發(fā)病率擬合及預(yù)測效果優(yōu)于單純ARIMA模型,具有較高的擬合精度,有較為廣闊的應(yīng)用前景,對于傳染病疫情預(yù)測具有一定的實用價值。
丙型肝炎是全球流行高發(fā)傳染病之一,主要經(jīng)血液或血液制品、母嬰和性途徑傳播。據(jù)WHO統(tǒng)計,全球丙型肝炎患者約1.85億人,每年因丙型肝炎死亡約35萬例。20%~30%的患者有發(fā)展為肝硬化、肝癌的風(fēng)險,發(fā)病率僅次于乙型肝炎[1-4]。在我國,人們對丙型肝炎的認(rèn)識、重視程度遠(yuǎn)不及乙型肝炎。但與乙型肝炎相比,其危害有過之而無不及。近年來,山東省丙型肝炎患者例數(shù)呈逐年升高趨勢,充分利用監(jiān)測信息資源,通過建立合適的數(shù)學(xué)模型對識別疾病發(fā)病規(guī)律,預(yù)測發(fā)病趨勢具有重要作用,是控制疫情發(fā)展的有效措施之一[5]。本研究應(yīng)用差分自回歸移動平均(ARIMA)模型及其與廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)組合模型對山東省2004—2014年丙型肝炎月發(fā)病率數(shù)據(jù)構(gòu)建預(yù)測模型并評價其預(yù)測效果,為丙型肝炎的預(yù)防控制和預(yù)測預(yù)警工作提供定量方法的依據(jù),提高工作時效性。
1.1 資料來源 2015年5月—2016年5月,選取山東省疾病預(yù)防控制中心法定傳染病直報系統(tǒng)2004—2014年丙型肝炎月度發(fā)病率數(shù)據(jù)及山東省統(tǒng)計局發(fā)布的同期人口資料,數(shù)據(jù)真實、可靠。
1.2 方法
1.2.1 ARIMA(p,d,q)模型 ARIMA模型是20世紀(jì)70年代初BOX等[6]提出的著名的時間序列預(yù)測方法。該模型較靈活,在預(yù)測過程中既考慮了序列依存性,又考慮了隨機(jī)波動的干擾性,對短期預(yù)測的精度較高,故廣泛應(yīng)用于各類對象的定量預(yù)測。建模過程分為4步:序列平穩(wěn)性檢驗及平穩(wěn)化處理、模型識別、參數(shù)估計和模型檢驗、預(yù)測應(yīng)用。本研究利用2004—2013年山東省丙型肝炎月發(fā)病率數(shù)據(jù)建立模型并擬合外推,以2014年實際數(shù)據(jù)檢驗?zāi)P皖A(yù)測效果。
1.2.2 ARIMA-GRNN組合模型 GRNN模型最早由美國學(xué)者SPECHT[7]在1991年提出,是徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN)的一個分支,適用于解決非線性問題,具有良好的全局逼近性和最佳逼近性質(zhì),是一種新穎有效的前饋式神經(jīng)網(wǎng)絡(luò)模型。該模型有輸入層、徑向基隱含層和線性輸出層3層組織構(gòu)成。GRNN中的調(diào)節(jié)參數(shù)僅有一個,即光滑因子。一般光滑因子越小,GRNN對樣本的逼近性能就越強(qiáng);光滑因子越大,GRNN對樣本的逼近過程就越平滑。由于GRNN模型的學(xué)習(xí)全部依賴數(shù)據(jù)樣本,所以其能盡量避免人為等主觀因素對預(yù)測結(jié)果產(chǎn)生的影響。GRNN模型在于逼近能力、分類能力和學(xué)習(xí)速度方面有較強(qiáng)的優(yōu)勢,可處理不穩(wěn)定的數(shù)據(jù),并且在樣本數(shù)據(jù)缺乏時,預(yù)測效果也較好[8-9]。
步驟建立:(1)學(xué)習(xí)樣本的選擇。最優(yōu)ARIMA模型擬合值作為GRNN模型的輸入,丙型肝炎月發(fā)病率實際值作為GRNN模型的輸出,建立一維輸入、一維輸出的GRNN模型訓(xùn)練樣本并進(jìn)行訓(xùn)練。(2)數(shù)據(jù)處理。由于樣本數(shù)據(jù)量綱存在較大差異,采用歸一化方法中的線性函數(shù)轉(zhuǎn)換方法,將所有的輸入、輸出訓(xùn)練數(shù)據(jù)控制在[0,1]范圍內(nèi)進(jìn)行處理,以消除數(shù)據(jù)自身的影響,有利于模型訓(xùn)練。(3)網(wǎng)絡(luò)的建立與訓(xùn)練。隨機(jī)選取一個或兩個樣本作為待估點,通過對光滑因子的不同取值進(jìn)行多次嘗試,確定最優(yōu)值,并分別對待估點進(jìn)行預(yù)測,計算待估點預(yù)測值與實際值誤差序列的誤差均方根(RMSE)值,作為模型性能的評價指標(biāo)。(4)模型應(yīng)用。當(dāng)光滑因子確定后,GRNN模型的訓(xùn)練也隨之結(jié)束。用訓(xùn)練好的GRNN模型擬合值與實際值比較,觀察其吻合程度并進(jìn)行預(yù)測及外推。
1.2.3 模型精度評價[10-11]采用平均誤差率(MER)及決定系數(shù)(R2)評價單純ARIMA模型與ARIMA-GRNN組合模型的擬合效果。R2越大,預(yù)測模型的擬合效果越好。采用平均絕對誤差(MAE)和平均絕對百分誤差(MAPE)評價預(yù)測模型的外推能力。MAPE可以衡量不同預(yù)測模型的優(yōu)劣,MAPE越小,預(yù)測模型的外推能力越強(qiáng),即預(yù)測性能越好。
1.3 統(tǒng)計學(xué)方法 采用Excel 2013建立數(shù)據(jù)庫,SAS 9.2構(gòu)建ARIMA模型,MATLAB構(gòu)建ARIMA-GRNN組合模型。各年間丙型肝炎發(fā)病率的比較采用趨勢χ2檢驗。以P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 一般情況 2004—2014年山東省共報告丙型肝炎18 095例,年均發(fā)病率為17.28/10萬,其中2012年和2014年發(fā)病率較高,分別為29.52/10萬、25.21/10萬。2004—2014年丙型肝炎發(fā)病率隨著時間的推移呈平緩波浪式上升趨勢(Z=29.05,P<0.01,見圖1)。
Figure 1 Variation trend of cases and the incidence of hepatitis C in Shandong province from 2004 to 2014
2.2 疫情預(yù)測
2.2.1 ARIMA模型預(yù)測 (1)序列平穩(wěn)性檢驗及平穩(wěn)化處理。根據(jù)2004—2013年山東省丙型肝炎月發(fā)病率數(shù)據(jù)繪制時序圖,該序列有曲線趨勢,序列非平穩(wěn)。對原序列進(jìn)行2階差分處理后,長期趨勢提取充分;同時白噪聲檢驗顯示,延遲6階P<0.01,各觀測值均在0值附近較為穩(wěn)定的波動,形成平穩(wěn)序列(見圖2~3)。(2)模型識別。根據(jù)殘差序列的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)性質(zhì),ACF圖和PACF圖均呈現(xiàn)出拖尾性,初步確定p=5,q=2。模型從低階開始依次反復(fù)調(diào)試驗證后,根據(jù)Akaike信息標(biāo)準(zhǔn)(AIC)和Bayesian信息標(biāo)準(zhǔn)(BIC)選取最優(yōu)模型ARIMA(1,2,1)。(3)參數(shù)估計和模型檢驗。擬合檢驗統(tǒng)計量P均>0.05,可以認(rèn)為該殘差序列為白噪聲序列,該模型擬合效果好;參數(shù)顯著性檢驗顯示參數(shù)均顯著(P<0.05),說明ARIMA(1,2,1)模型可用于預(yù)測。用模型繪制出的2014年山東省丙型肝炎預(yù)測值序列圖,預(yù)測值與實際發(fā)病率基本一致,落在95%置信區(qū)間內(nèi),擬合效果較好。(4)模型預(yù)測。利用原序列和已構(gòu)建最優(yōu)模型回代,預(yù)測2015年山東省丙型肝炎月發(fā)病率情況(見圖4)。
Figure 2 Sequence diagram of monthly incidence of hepatitis C in Shandong province from 2004 to 2013

圖3 2004—2013年山東省丙型肝炎月發(fā)病率2階差分后時序圖
Figure 3 Sequence diagram after two-order difference of monthly incidence rate of hepatitis C in Shandong province from 2004 to 2013

圖4 山東省丙型肝炎月發(fā)病率序列模型擬合效果圖
Figure 4 Fitting effect diagram of series model of monthly incidence rate of hepatitis C in Shandong province
2.2.2 ARIMA-GRNN組合模型預(yù)測 (1)學(xué)習(xí)樣本的選擇。以ARIMA(1,2,1)模型的擬合值作為GRNN的輸入,丙型肝炎月發(fā)病率實際值作為GRNN模型的輸出,建立一維輸入、一維輸出的GRNN模型并進(jìn)行樣本訓(xùn)練。(2)數(shù)據(jù)處理。2004—2014年丙型肝炎月發(fā)病率ARIMA(1,2,1)模型的擬合值與實際值已位于區(qū)間[0,1]中,無需再對輸入、輸出樣本進(jìn)行歸一化處理。(3)模型的建立與訓(xùn)練。在學(xué)習(xí)樣本中隨機(jī)選擇2006年7月與2011年11月丙型肝炎月發(fā)病率的擬合值與實際值作為訓(xùn)練的待估點,以確定光滑因子。光滑因子從0.10開始取值,每次增加一個單位量0.01直至0.20,并分別對待估點進(jìn)行預(yù)測,計算待估點預(yù)測值與實際值誤差序列的RMSE,將不同光滑因子與其對應(yīng)的RMSE繪圖(見圖5)。當(dāng)光滑因子為0.12時,待估點值RMSE值達(dá)到最小值0.03,所以確定光滑因子為0.12。(4)模型應(yīng)用。利用最優(yōu)光滑因子0.12訓(xùn)練模型,預(yù)測丙型肝炎發(fā)病率,擬合值與實際發(fā)病率基本吻合(見圖6)。

注:RMSE=誤差均方根
圖5 不同光滑因子對應(yīng)的RMSE
Figure 5 Corresponding RMSE values of different smoothing factors

圖6 山東省丙型肝炎月發(fā)病率序列模型擬合效果圖
Figure 6 Fitting effect diagram of series model of monthly incidence rate of hepatitis C in Shandong province
2.3 模型精度評價 ARIMA-GRNN組合模型的擬合和外推效果明顯優(yōu)于單純ARIMA模型,提示組合模型用于山東省丙型肝炎月發(fā)病率的擬合與預(yù)測精度明顯提高(見表1)。
表1 單純ARIMA模型與ARIMA-GRNN組合模型評價
Table 1 Evaluation of ARIMA model and ARIMA-GRNN combination model

模型擬合檢驗MER(%) R2 外推檢驗MAE MAPEARIMA(1,2,1)模型1687053017118ARIMA?GRNN組合模型1530060009035
注:ARIMA模型=差分自回歸移動平均模型,GRNN=廣義回歸神經(jīng)網(wǎng)絡(luò),MER=平均誤差率,R2=決定系數(shù),MAE=平均絕對誤差,MAPE=平均絕對百分誤差
自BATES等[12]首次提出組合預(yù)測模型的理論和方法以來,因其具有綜合利用各單一預(yù)測模型所提供信息的特點,有效提高預(yù)測精度,引起國內(nèi)外學(xué)者的廣泛關(guān)注。時間序列分析作為一種傳統(tǒng)的線性模型分析方法,對時間序列變量中的各種已知和未知因素進(jìn)行綜合統(tǒng)一的分析,進(jìn)而實現(xiàn)擬合預(yù)測,僅適用于平穩(wěn)時間序列的短期預(yù)測,但對具有非線性映射性能較弱,難以確定合適的模型結(jié)構(gòu),其預(yù)測精度也常不盡如人意[13]。因GRNN模型具有強(qiáng)大的非線性逼近能力、較快的學(xué)習(xí)速度、較好處理不穩(wěn)定數(shù)據(jù)的能力、網(wǎng)絡(luò)結(jié)構(gòu)較少受人為主觀因素影響和預(yù)測結(jié)果穩(wěn)定等優(yōu)點,因而廣泛用于多種非線性關(guān)系的擬合與預(yù)測[14]。將兩者結(jié)合起來,組合模型的擬合外推性能更好,使得預(yù)測更加敏銳,并且模型建立的過程簡單,被廣泛應(yīng)用于傳染病的預(yù)測[15]。
山東省2004—2014年丙型肝炎年均發(fā)病率為17.28/10萬,并隨著時間的推移呈平緩波浪式上升趨勢,丙型肝炎的防控工作依然嚴(yán)峻。本研究利用2004—2014年丙型肝炎疫情報告數(shù)據(jù)構(gòu)建ARIMA模型,經(jīng)過序列平穩(wěn)化、模型定階、參數(shù)估計及模型檢驗等步驟得出最優(yōu)模型ARIMA(1,2,1),其預(yù)測值與實際發(fā)病率基本在模型擬合95%置信區(qū)間內(nèi),能有效擬合丙型肝炎發(fā)病并進(jìn)行短期預(yù)測。但其擬合曲線在上升或下降方面與實際發(fā)病率存在差異,因此使用ARIMA-GRNN組合模型對原始數(shù)據(jù)進(jìn)一步擬合,除個別月份與實際發(fā)病率存在較小差異外,其余時間點與實際發(fā)病率基本重合。ARIMA模型和ARIMA-GRNN組合模型的MER分別為16.87%、15.30%,R2分別為0.53、0.60;MAE分別為0.17、0.09,MAPE分別為1.18、0.35。ARIMA-GRNN組合模型擬合效果優(yōu)于ARIMA模型,預(yù)測精度明顯提高,提示ARIMA-GRNN組合模型對山東省丙型肝炎發(fā)病率未來情況可以進(jìn)行良好的跟蹤預(yù)測,具有較為廣闊的應(yīng)用前景,為丙型肝炎的預(yù)防控制提供較為可靠的依據(jù)。
丙型肝炎素有人類健康“沉默的殺手”之稱,WHO將HCV慢性感染作為重要的公共衛(wèi)生問題[16]。由于丙型肝炎的潛伏期較長,癥狀不明顯,至少80%的患者發(fā)病前并未發(fā)現(xiàn)已感染HCV,增加了病毒傳播的危險性,喪失最佳治療時機(jī),引起并發(fā)癥的發(fā)生[17-18]。在臨床工作中,加強(qiáng)丙型肝炎的早期篩查工作及血液制品的管理,能夠明顯降低丙型肝炎發(fā)病率。實現(xiàn)早發(fā)現(xiàn)、早治療,丙型肝炎的治療效果可優(yōu)于乙型肝炎,多數(shù)患者有望實現(xiàn)治愈。2015年底,我國發(fā)布了丙型肝炎防治指南,隨著口服治療的直接抗病毒藥物(DAAs)的上市及臨床應(yīng)用,將明顯改善丙型肝炎患者預(yù)后[19]。
從方法上看,本文采用單純ARIMA模型和ARIMA-GRNN組合模型對山東省丙型肝炎發(fā)病率進(jìn)行預(yù)測,并進(jìn)行對比分析,結(jié)果更客觀。研究的不足之處主要在于樣本數(shù)據(jù)較少且僅局限于山東省,另外,由于隨機(jī)選取的待估點,在一定程度上限制了GRNN模型的學(xué)習(xí)和預(yù)測效果。同時,本研究未考慮影響丙型肝炎發(fā)病的因素,可能會影響到預(yù)測精度。在實際工作中,在有條件的情況下可以全面收集影響丙型肝炎的發(fā)病因素,建議建模時加入相關(guān)因素,擴(kuò)大樣本量等方法來提高預(yù)測精度[20]。本文只擬合了ARIMA-GRNN一種組合模型,也可擬合其他組合模型,或結(jié)合多個模型,從而獲得更優(yōu)的預(yù)測模型,并比較各種預(yù)測模型的優(yōu)劣[21]。
作者貢獻(xiàn):劉紅楊進(jìn)行文章的構(gòu)思與設(shè)計,統(tǒng)計學(xué)處理,撰寫論文,對文章整體負(fù)責(zé),并監(jiān)督管理;劉洪慶負(fù)責(zé)文章的質(zhì)量控制及審校;李望晨進(jìn)行論文的修訂;趙晶進(jìn)行數(shù)據(jù)收集、整理。
本文無利益沖突。
[1]MOHD HANAFIAH K,GROEGER J,FLAXMAN A D,et al.Global epidemiology of hepatitis C virus infection: new estimates of age-specific antibody to HCV seroprevalence [J].Hepatology,2013,57(4):1333-1342.
[2]LAVANCHY D.The global burden of hepatitis C[J].Liver Int,2009,29(Suppl 1):74-81.
[3]WHO.Guidelines for the screening,care and treatment of persons with hepatitis C infection[EB/OL].[2016-04-10].http://www.who.int/hepatitis/publications/hepatitis-c-guidenlines/en/.
[4]HAJARIZADEH B,GREBELY J,DORE G J.Epidemiology and natural history of HCV infection[J].Nat Rev Gastroenterol Hepatol,2013,10(9):553-562.
[5]韓琴,蘇虹,王忱誠,等.ARIMA模型與GRNN模型對性病發(fā)病率的預(yù)測研究[J].現(xiàn)代預(yù)防醫(yī)學(xué),2012,39 (6):1337-1340. HAN Q,SU H,WANG C C,et al.Prediction on the incidence of blood and sexually transmitted diseases with models of ARIMA and GRNN[J].Modern Preventive Medicine,2012,39(6):1337-1340.
[6]BOX G E P,JENKINS G M,REINSEL G C.Time series analysis: forecasting and control[M].San Francisco: Holden Day,1976:181-218.
[7]SPECHT D F.A general regression neural network[J].IEEE Trans Neural Netw,1991,2(6):568-576.
[8]朱玉.單純ARIMA模型和ARIMA-GRNN組合模型在丙肝月發(fā)病率中的預(yù)測效果比較[D].合肥:安徽醫(yī)科大學(xué),2011. ZHU Y.Comparison of the prediction effect between the single ARIMA model and the ARIMA-GRNN combination model in the monthly incidence of hepatitis C virus infection[D].Hefei:Anhui Medical University,2011.
[9]吳偉,郭軍巧,安淑一,等.應(yīng)用ARIMA-GRNN模型對腎綜合征出血熱發(fā)病率時間序列數(shù)據(jù)的預(yù)測研究[J].中國衛(wèi)生統(tǒng)計,2015,32(2):211-213. WU W,GUO J Q,AN S Y,et al.Application of ARIMA-GRNN model to predict the incidence of hemorrhagic fever with renal syndrome[J].Chinese Journal of Health Statistics,2015,32(2):211-213.
[10]王平.三種預(yù)測模型在主要傳染病發(fā)病率預(yù)測中的應(yīng)用[D].杭州:浙江大學(xué),2010. WANG P.Application of three model in forecasting incidence of the main communicable diseases[D].Hangzhou: Zhejiang University,2010.
[11]任茹香.基于GRNN的變權(quán)重組合預(yù)測模型在傳染病發(fā)病率預(yù)測中的應(yīng)用[D].杭州:浙江大學(xué),2011. REN R X.A forecasting model with variable weight combination based on GRNN for infectious diseases[D].Hangzhou:Zhejiang University,2011.
[12]BATES J M,GRANGER C W J.Combination of forecasts [J].Operations Research,1969,20(4):451-468.
[13]朱玉,夏結(jié)來,王靜.單純ARIMA模型和ARIMA-GRNN組合模型在猩紅熱發(fā)病率中的預(yù)測效果比較[J].中華流行病學(xué)雜志,2009,30(9):964-968. ZHU Y,XIA J L,WANG J.Comparison of predictive effect between the single auto regressive integrated moving average (ARIMA) model and the ARIMA-generalized regression neural network (GRNN) combination model on the incidence of scarlet fever[J].Chinese Journal of Epidemiology,2009,30(9):964-968.
[14]吳昊澄,王臻,何凡,等.基于GM(1,1)-GRNN組合模型的腎綜合征出血熱發(fā)病率預(yù)測[J].中國媒介生物學(xué)及控制雜志,2012,23(4):347-349. WU H C,WANG Z,HE F,et al.Prediction of the incidence of hemorrhagic fever with renal syndrome based on GM(1,1)-GRNN model[J].Chinese Journal of Vector Biology and Control,2012,23(4):347-349.
[15]嚴(yán)薇榮.傳染病預(yù)警指標(biāo)體系及三種預(yù)測模型的研究[D].武漢:華中科技大學(xué),2008. YAN W R.Study on the early warning indicators system and three types of forecasting models for infectious diseases[D].Wuhan: Huazhong University of Science and Technology,2008.
[16]World Health Organization.Global alert and response: hepatitis C[EB/OL].[2016-01-14].http://www.who.int/csr/disease/hepatitis/whocdscsrlyo2003/en/index1.html.
[17]LEMOINE M,NAVAGAM S,THURSZ M.Viral hepatitis in resource-limited countries and access to antiviral therapies:current and future challenges[J].Future Virol,2013,8(4):371-380.
[18]武海波,周紫霄,黃奕祥.2004—2011年中國丙型病毒性肝炎流行病學(xué)特征分析[J].現(xiàn)代預(yù)防醫(yī)學(xué),2015,42(7):1173-1175. WU H B,ZHOU Z X,HUANG Y X.Analysis of epidemiological characteristics of viral hepatitis C in China,2004—2011[J].Modern Preventive Medicine,2015,42(7):1173-1175.
[19]中華醫(yī)學(xué)會肝病學(xué)分會,中華醫(yī)學(xué)會感染病學(xué)分會.丙型肝炎防治指南(2015年更新版)[J].中國肝臟病雜志(電子版),2015,7(3):19-35. Chinese Society of Hepatology,Chinese Society of Infectious Diseases.The guideline of prevention and treatment for chronic hepatitis C: 2015 update[J].Chinese Journal of Liver Diseases(Electronic Version),2015,7(3):19-35.
[20]胡曉媛,吳娟,孫慶文,等.ARIMA模型與GRNN模型對肺結(jié)核發(fā)病率預(yù)測的對比研究[J].第二軍醫(yī)大學(xué)學(xué)報,2016,37(1):115-119. HU X Y,WU J,SUN Q W,et al.Comparative study on ARIMA model and GRNN model for predicting the incidence of tuberculosis[J].Academic Journal of Second Military Medical University,2016,37(1):115-119.
[21]姜超,劉文東,胡建利,等.丙肝疫情3種不同疾病預(yù)測預(yù)警方法比較[J].中國公共衛(wèi)生,2015,31(4):390-393. JIANG C,LIU W D,HU J L,et al.Prediction and early warning for HCV:comparison of three methods[J].Chinese Journal of Public Health,2015,31(4):390-393.
(本文編輯:吳立波)
Application of ARIMA-GRNN Combination Model in Predicting Monthly Incidence of Hepatitis C
LIUHong-yang,LIUHong-qing*,LIWang-chen,ZHAOJing
DepartmentofHealthStatistics,CollegeofPublicHealthandManagement,WeifangMedicalUniversity,Weifang261053,China
*Correspondingauthor:LIUHong-qing,Associateprofessor;E-mail:liuhq576@163.com
Objective To explore the predictive modeling effects and application prospects of ARIMA-GRNN combination model in the monthly incidence of hepatitis C,and to provide basis for the epidemic prediction.Methods From May 2015 to May 2016,the 2004—2014 monthly data on the incidence of hepatitis C were selected from direct reporting system of legal infectious diseases in Shandong Provincial Center for Disease Control and Prevention,and the population at the same period released by Shandong provincial Bureau of Statistics were also chosen in the study.ARIMA fitted model of the monthly incidence data of hepatitis C in Shandong province from 2004 to 2014 was constructed,and the fitting precision was verified and extrapolated;the fitted value of ARIMA model was taken as the input of GRNN model,and the actual value of monthly incidence of hepatitis C as the output,and the samples were trained and predicted.The effects of ARIMA model and ARIMA-GRNN combination model on predicting the monthly incidence of hepatitis C were compared.Results The annual average incidence of hepatitis C in Shandong province from 2004 to 2014 was 17.28/100 000,and showed an increasing trend as time went on (Z=29.05,P<0.01).By the use of ARIMA(1,2,1) model,the predictive incidence of hepatitis C in Shandong province in 2014 was basically the same as the actual incidence,which falls within the 95% confidence interval with good fitting effects.The fitted value of ARIMA(1,2,1) model was taken as the input of GRNN model,and the actual value of monthly incidence of hepatitis C as the output,the training model with an optimal smoothing factor of 0.12 was selected,and the fitted value of ARIMA-GRNN combination model basically agreed with the actual value.The mean error rate (MER) of ARIMA model and ARIMA-GRNN combination model were 16.87% and 15.30% respectively;their determination coefficients (R2) were 0.53 and 0.60 respectively;their mean absolute errors (MAE) were 0.17 and 0.09 respectively;and the mean absolute percent errors(MAPE) were 1.18 and 0.35 respectively.Conclusion The fitting and predictive effects of ARIMA-GRNN combination model on the monthly incidence of hepatitis C in Shandong province is better than those of simple ARIMA model,and has a high fitting precision and a promising application prospects.It is of certain practical significance in the epidemic prediction.
Hepatitis C;Incidence;Forecasting;ARIMA model;GRNN
“健康山東”重大社會風(fēng)險預(yù)測與治理協(xié)同創(chuàng)新中心資助課題(XT-1402001)
R 512.63
A
10.3969/j.issn.1007-9572.2017.02.012
2016-08-07;
2016-12-01)
261053山東省濰坊市,濰坊醫(yī)學(xué)院公共衛(wèi)生與管理學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室
*通信作者:劉洪慶,副教授;E-mail:liuhq576@163.com