999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ARIMA-ERNN組合模型預測我國甲肝發病率*

2016-12-09 01:14:08許春杰尹素鳳郭春月宋瑞瑞汪可可肖孟迎張秀峰劉曉宇范紅敏馮福民
鄭州大學學報(醫學版) 2016年6期
關鍵詞:模型

許春杰,尹素鳳,郭春月,宋瑞瑞,汪可可,肖孟迎,張秀峰,劉曉宇,范紅敏,馮福民,

胡 泊1)#

?

基于ARIMA-ERNN組合模型預測我國甲肝發病率*

許春杰1),尹素鳳1),郭春月1),宋瑞瑞1),汪可可1),肖孟迎1),張秀峰1),劉曉宇2),范紅敏1),馮福民1),

胡 泊1)#

1)華北理工大學公共衛生學院醫學統計與流行病學系 唐山 063000 2)華北理工大學附屬開灤醫院呼吸內科 唐山 063000

#通信作者,男,1976年5月生,博士,副教授,研究方向:流行病與衛生統計學,E-mail:lxy_hb007@126.com

ARIMA模型;BPNN模型;ERNN模型;組合模型;甲肝;發病率;預測

目的:比較ARIMA模型、BPNN模型和ARIMA-ERNN組合模型在我國甲肝發病率預測中的應用效果,探討預測甲肝發病率的優化模型。方法:收集2004年1月至2015年12月我國甲肝發病率資料,用SPSS 17.0和Eviews 8.0建立ARIMA模型,用Matlab 8.0建立BPNN模型和ARIMA-ERNN組合模型,并對模型的預測效果進行評價。結果:ARIMA-ERNN組合模型擬合及預測的MRE、MER、MSE、RMSE、MAE均小于ARIMA模型和BPNN模型,其MRE均小于5%。結論:ARIMA-ERNN組合模型對我國甲肝發病率的擬合及預測效果優于ARIMA模型和BPNN模型。

甲肝是一種容易造成大流行的傳染病,因此基于模型探討甲肝的流行趨勢及流行規律,對于探索甲肝的病因線索,制定相應的預防策略及措施具有非常重要的作用。目前用于預測傳染病發病的方法主要有季節性自回歸滑動平均混合模型(autoregressive integrated moving average model,ARIMA)、反向傳播網絡(back-propagation network,BPNN)、殘差自回歸模型和灰色模型等[1-6]。由于傳染病的發病受到很多因素的制約,其中包含許多不確定因素,故其變化趨勢呈現出復雜的非線性變化特征。單一的線性模型和非線性模型皆存在信息源不廣泛問題,因此在應用中常常受到限制或達不到高精度的要求[7]。組合預測就是將不同的單一預測模型按一定方式進行組合,綜合利用各種方法所能夠提供的信息,取長補短,優勢互補,從而達到提高預測精度和增加預測穩定性的效果[8]。Elman神經網絡(Elman neural network,ERNN)是一種非線性反饋型神經網絡模型,它在前饋網絡的隱含層中增加一個承接層,可以使系統具有適應時變特性的能力,且有非常強的非線性逼近和忽略外部噪聲影響的能力,特別適用于解決時間序列問題[9]。該研究利用我國2004至2014年甲肝發病率序列建立ARIMA-ERNN組合模型,并比較該組合模型、ARIMA模型和BPNN模型對2015年甲肝發病率預測的準確性,以探討預測甲肝發病率的優化模型。

1 資料與方法

1.1 資料 2004年1月至2015年12月甲肝發病資料來源于中國疾病預防控制中心傳染病直報系統,人口資料來源于中國衛生統計局。以2004至2014年數據建模。

1.2 ARIMA模型[1,9-10]通過單位根檢驗確定序列是否為平穩序列,對于非平穩序列通過對數轉換和差分的方式來消除季節和趨勢的影響,從而獲得平穩的時間序列;以赤池信息準則(AIC)和Schwarz貝葉斯準則(SBC)最小、對數似然函數值(Log likelihood)最大的模型為最優ARIMA模型;模型診斷時殘差序列應是白噪聲,其自相關系數(ACF)和偏自相關系數(PACF)不應與0有顯著的差異,Box-LjungQ統計量應無統計學意義,且模型各系數估計值均應有統計學意義。ARIMA模型公式如下:

Ф(B)Ф(Bs) ▽d▽SDXt= θ(B)Θ(Bs)εt;

E(εt)=0,var(εt)= σ2,E(εtεs)=0,

s≠t E(xtεt)=0,∨s

公式中,B為后移算子,εt為殘差,d和D分別為非季節和季節差分次數,p和q分別為自回歸和滑動平均階數,P和Q分別為季節自回歸和滑動平均階數;▽d=(1-B)d;▽SD=(1-B)SD;Ф(B)=1-Ф1B-…ФpBp;θ(B)=1-θ1B-…θqBq;Ф(Bs)=1-Ф1Bs-…ФPBPs;Θ(Bs)=1-Θ1Bs-…ΘQBQs。

1.3 BPNN模型[2,7]BPNN模型是多層感知器中的一種“逆推”學習算法,網絡結構由輸入層、隱含層及輸出層組成;其學習過程正向傳播時,輸入信息由輸入層經過隱含層處理傳向輸出層,若輸出層結果超過期望誤差,則轉入第二階段的反向傳播過程,即將誤差信號沿原來的連接通路逐層向輸入層反傳,通過修改各層節點間的連接權重值,反復調整網絡參數,將誤差分攤給各層所有單元,最終使得誤差信號最小。BPNN模型的建模過程分為三步:①采用newff函數實現網絡的生成及初始化。②采用train函數對網絡進行訓練。③利用sim函數對網絡進行仿真。

1.4 ARIMA-ERNN組合模型[11]ERNN模型是在BPNN模型的基礎上,通過承接層將隱含層的輸出自聯到隱含層的輸入。這種方式使得ERNN模型對歷史狀態的數據具有敏感性,內部反饋網絡的加入增加了網絡本身處理動態信息的能力,從而達到了動態建模的目的。通過甲肝發病率序列建立ARIMA模型,由于甲肝發病率序列的ARIMA模型擬合值與實際值存在高度的關聯性,可以將ARIMA模型擬合值作為ERNN模型的輸入,以甲肝發病率序列的實際值作為ERNN模型的輸出,通過newelm函數構建一個一維輸入、一維輸出的優化ERNN模型。

1.5 模型預測效果比較 用所建立的模型預測2015年甲肝發病率,并與實際值比較。模型評價指標包括相對誤差(RE),平均相對誤差(MRE),平均誤差率(MER),均方誤差(MSE),均方根誤差(RMSE)和平均絕對誤差(MAE)[7]。

1.6 統計學處理 使用SPSS 17.0和Eviews 8.0建立ARIMA模型,使用Matlab 8.0建立BPNN和ARIMA-BPNN組合模型。

2 結果

2.1 ARIMA模型結果 利用Eviews 8.0進行單位根檢驗,單位根ADF=-1.836 1,P=0.364 2,提示我國甲肝發病率序列為非平穩序列。所以首先對原始序列進行對數轉換和D=1的季節差分、d=1的非季節差分來消除季節和趨勢的影響,以獲得穩定的方差和均值,從而獲得平穩序列。再結合經過對數轉換和季節差分的ACF和PACF圖、殘差情況,以及系數之間的相關性選取最優模型。通過比較并結合模型簡潔的原則,得到的最優模型是ARIMA(1,1,0)×(0,1,1)12,具體方程為(1-B)(1-B12)Xt=(1-0.739B12)εt/(1+0.445B)。其殘差的ACF和PACF圖,見圖1,非季節性自回歸系數AR1=-0.445 (t=-4.384,P<0.001),季節性滑動平均系數SMA1=0.739(t=4.013,P<0.001),AIC=-0.211,SBC=8.415,Log likelihood=82.477。殘差序列Box-LjungQ=10.753,P=0.770,提示殘差序列是白噪聲。利用建立好的模型預測2015年甲肝發病率,預測值見表1第3列。

圖1 ARIMA(1,1,0)×(0,1,1)12模型殘差序列的ACF和PACF圖表1 2015年甲肝發病率(1/10萬)3種模型的預測值

月份實際值ARIMA模型預測值RE/%BPNN模型預測值RE/%ARIMA-ERNN組合模型預測值RE/%10.0180.15716.6670.0175.5560.0175.55620.0120.01716.6670.0120.0000.0118.33330.0150.0166.6670.0146.6670.0150.00040.0140.0140.0000.0157.1430.0137.14350.0130.0147.6920.0147.6920.0130.00060.0130.0127.6920.0130.0000.0130.00070.0150.0146.6670.0150.0000.0150.00080.0140.01614.2860.0137.1430.0137.14390.0150.0146.6670.01313.3330.0146.667100.0140.0140.0000.0137.1430.0137.143110.0140.0140.0000.0140.0000.0140.000120.0140.0140.0000.0137.1430.0140.000

2.2 BPNN模型結果 由于甲肝發病率變化的周期為年,因此BPNN模型輸入層和輸出層神經元個數分別為12和1,隱含層神經元個數根據經驗公式[11]取5~14。因此以5~14作為隱含層神經元個數分別對2004至2014年甲肝發病率進行訓練,訓練目標誤差為0.001,訓練步數為2 000。隱含層神經元的傳遞函數為tansig,輸出層為logsig,采用函數trainlm對網絡進行訓練。在經過2 000次訓練后,當隱含層神經元個數為5~14時,網絡的逼近誤差

(RES)分別為0.625 971、0.624 133、0.567 506、0.243 915、0.400 129、0.462 395、0.466 427、0.493 232、0.496 538、0.507 333。可見當隱含層神經元為8時網絡訓練誤差最小,神經網絡對函數的逼近效果最好,而且經過12次訓練即可達到目標誤差的要求(訓練的MSE=0.000 891)。因此選擇12-8-1作為最優BPNN模型,利用該模型預測2015年甲肝發病率,預測值見表1第5列。

2.3 ARIMA-ERNN組合模型結果 對甲肝原始序列進行D=1的季節差分和d=1的非季節差分導致13個數據損失,因此以2005年2月至2014年12月ARIMA模型的擬合值作為ERNN模型的輸入值,以對應月份的甲肝實際發病率作為ERNN模型的輸出值。網絡輸入層和輸出層神經元個數均為1。為防止過擬合,隱含層神經元個數采用試湊法在1~15之間尋找。網絡訓練函數及權值的修正函數分別采用traingdx和learngdm,其余參數設置同BPNN模型。隱含層神經元個數為1~15時網絡的RES和MSE見表2。表2提示,當隱含層神經元個數為11的時候,RES和MSE最小,而且經過98次訓練就達到了目標誤差的要求。因此選擇隱含層神經元個數為11。用確定好的網絡構建ARIMA-ERNN組合模型。以2015年ARIMA模型的預測值為輸入值,用組合模型對2015年甲肝的發病率進行預測,預測值見表1第7列。

表2 不同隱含層神經元個數對應的網絡訓練誤差

2.4 3種模型性能比較 3種模型對甲肝發病率的擬合及預測效果見表3。由表3可知,ARIMA-ERNN組合模型的擬合及預測性能均優于ARIMA模型和BPNN模型。圖2為3種模型對甲肝發病率的擬合及預測曲線,提示ARIMA-ERNN組合模型的擬合及預測曲線與原始值最接近。

表3 3種方法對甲肝發病率的擬合及預測效果比較

圖2 3種模型擬合及預測的甲肝發病率曲線

3 討論

我國甲肝的發病率數據序列中既有線性成分又有非線性成分,同時具有動態性的特點,因此該研究建立了具有ARIMA模型和ERNN模型優點的ARIMA-ERNN組合模型,并用其對我國甲肝發病率進行了預測。有文獻[4,12-13]報道模型擬合及預測的MRE小于10%時預測效果較好,小于5%時預測的準確度和精度最佳。該研究中ARIMA模型和BPNN模型擬合及預測的MRE均小于10%,說明其有較佳的預測效果,但其擬合及預測精度均低于ARIMA-ERNN組合模型, ARIMA-ERNN組合模型擬合和預測的MRE均小于5%,表明ARIMA-ERNN組合模型擬合及預測效果優于ARIMA模型和BPNN模型。ARIMA-ERNN組合模型擬合及預測值對我國甲肝發病原始序列進行了很好的跟蹤,提示ARIMA-ERNN組合模型能更好地反映我國甲肝發病率序列的內部規律和未來趨勢。

需注意的是BPNN模型和ARIMA-ERNN組合模型建模過程中對網絡結構的確定是關鍵:①隱含層神經元個數的確定尚無理論上的指導,如果隱含層神經元個數太少,網絡不能反映時間序列的內部規律;若隱含層神經元太多,會導致網絡訓練和學習時間過長,泛化能力降低等,因此需要通過對網絡進行多次反復訓練以尋找到最佳的隱含層神經元個數。該研究根據經驗,以網絡逼近誤差和MSE為評價指標,確定了最佳的隱含層神經元個數。②網絡初始化權重和閾值是隨機生成的,因此每一次網絡訓練結果都是不一樣的。該研究使用循環控制語句對網絡進行多次反復訓練,找出最佳的一次訓練結果,用命令save保存網絡,預測時使用命令load調用,這樣可使預測結果不會發生變化。③ARIMA-ERNN組合模型的訓練函數通常采用traingdx,這樣不但可以提高網絡的訓練效率,還可以有效地抑制局部極小值的出現,而trainlm函數的訓練速度太快,在ERNN模型中性能并不是很好[11]。

目前已有相關研究[8,14-16]將ARIMA-ARCHA、ARIMA-GRNN和ARIMA-NARNN組合模型應用于傳染病發病率的預測,研究結果表明它們的擬合及預測效果優于ARIMA模型,且ARIMA-NARNN組合模型擬合及預測性能優于ARIMA-GRNN組合模型。因此下一步可考慮將ARIMA-ERNN組合模型的擬合及預測效果與上述幾個組合模型進行比較,尋找預測我國甲肝發病的最佳組合模型。

綜上所述,ARIMA-ERNN組合模型在一定程度上具有較高的預測精度與準確度,因此可借助ARIMA-ERNN組合模型對我國甲肝發病率進行早期預警,為我國甲肝的防控工作提供參考依據,從而減少或者消除決策的盲目性[9]。但在實際工作中應用組合模型時需注意:①在滿足模型使用條件的情況下,根據數據序列的特征,選擇合適的單項模型進行組合預測,否則模型的效能不但得不到提高,反而會提供一些不正確的信息。②傳染病發病是多因素綜合作用的結果,在條件允許的情況下,盡可能多地收集影響傳染病發生的因素來構建組合模型。③單次分析構建的組合模型,只適用于短期預測。在實際應用過程中,應不斷收集新的數據序列對已建立的模型進行外回代驗證[13],以建立更能反映時間序列的內部規律和未來趨勢的組合模型。

[1]王永斌,鄭瑤,柴峰,等.基于周期分解的ARIMA模型在甲肝發病率預測中的應用[J].現代預防醫學,2015,42(23):4225

[2]GUAN P,HUANG DS,ZHOU BS.Forecasting model for the incidence of hepatitis A based on artificial neural network[J].World J Gastroenterol,2004,10(24):3579

[3]WEI J,HANSEN A,LIU Q,et al.The effect of meteorological variables on the transmission of hand, foot and mouth disease in four major cities of Shanxi province, China: a time series data analysis(2009-2013)[J].PLoS Negl Trop Dis,2015,9(3):e0003572

[4]GUO X,LIU S,WU L,et al.Application of a novel grey self-memory coupling model to forecast the incidence rates of two notifiable diseases in China: dysentery and gonorrhea[J].PLoS One,2014,9(12):e115664

[5]萬燕麗,楊永利,施念,等.ARIMA模型在河南省AIDS疫情預測中的應用[J].鄭州大學學報(醫學版),2015,50(2):160

[6]陳銀蘋,吳愛萍,余亮科.組合模型對乙肝發病趨勢的預測研究[J].解放軍醫學雜志,2014,39(1):52

[7]ZHANG X,LIU Y,YANG M,et al.Comparative study of four time series methods in forecasting typhoid fever incidence in China[J].PLoS One,2013,8(5):e63116

[8]YAN W,XU Y,YANG X,et al.A hybrid model for short-term bacillary dysentery prediction in Yichang City, China[J].Jpn J Infect Dis,2010,63(4):264

[9]LIU L,LUAN RS,YIN F,et al.Predicting the incidence of hand, foot and mouth disease in Sichuan province, China using the ARIMA model[J].Epidemiol Infect,2016,144(1):144

[10]朱玉,夏結來,王靜.單純ARIMA模型和ARIMA-GRNN組合模型在猩紅熱發病率中的預測效果比較[J].中華流行病學雜志,2009,30(9):964

[11]葛哲學.神經網絡理論與MATLABR2007實現[M].北京:電子工業出版社,2007:111

[12]ZHOU LL,YU LJ,WANG Y,et al.A hybrid model for predicting the prevalence of schistosomiasis in humans of Qianjiang City,China[J].PLoS One,2014,9(8):e104875

[13]王永斌,柴峰,李向文,等.ARIMA模型與殘差自回歸模型在手足口病發病率預測中的應用[J].中華疾病控制雜志,2016,20(3):303

[14]WU W,GUO J,AN S,et al.Comparison of two hybrid models for forecasting the incidence of hemorrhagic fever with renal syndrome in Jiangsu Province, China[J].PLoS One,2015,10(8):e0135492

[15]ZHANG G,HUANG S,DUAN Q,et al.Application of a hybrid model for predicting the incidence of tuberculosis in Hubei, China[J].PLoS One,2013,8(11):e80969

[16]ZHENG YL,ZHANG LP,ZHANG XL,et al.Forecast model analysis for the morbidity of tuberculosis in Xinjiang, China[J].PLoS One,2015,10(3):e0116832

(2016-01-22收稿 責任編輯王 曼)

Forecasting incidence of hepatitis A based on ARIMA-ERNN combination model in China

XUChunjie1),YINSufeng1),GUOChunyue1),SONGRuirui1),WANGKeke1),XIAOMengying1),ZHANGXiufeng1),LIUXiaoyu2),FANHongmin1),FENGFumin1),HUBo1)

1)DepartmentofEpidemiologyandBiostatistics,SchoolofPublicHealth,NorthChinaUniversityofScienceandTechnology,Tangshan063000 2)RespiratoryMedicine,KailuanHospital,NorthChinaUniversityofScienceandTechnology,Tangshan063000

ARIMA model;BPNN model;ERNN model;combination model;hepatitis A;incidence;forecasting

Aim: To compare the effect of ARIMA model, BPNN model and ARIMA-ERNN combination model in prediction on incidence of hepatitis A in China, and compare the predictive effect among them. Methods: The data of incidence of hepatitis A from January 2004 to December 2015 in China were collected and SPSS 17.0 and Eviews 8.0 were used to construct ARIMA model, Matlab 8.0 was used to establish BPNN model and ARIMA-ERNN combination model. At the same time, the data in 2015 was used to evaluate the effect of prediction. Results: The MRE, MER, MSE,RMSE,MAE fitted and forecasted by ARIMA-ERNN combination model were lower than those of ARIMA model and BPNN model,and the MRE was lower than 5%.Conclusion: The ARIMA-ERNN combination model for forecasting the incidence of hepatitis A is superior to the single ARIMA model and BPNN model.

10.13705/j.issn.1671-6825.2016.06.010

*河北省衛生廳醫學科學研究重點課題計劃 20130055;華北理工大學培育基金項目 SP:201505

R512.601

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产成人艳妇AA视频在线| 三上悠亚在线精品二区| 国产精品熟女亚洲AV麻豆| 欧美啪啪一区| 高潮爽到爆的喷水女主播视频| 精品一区二区三区无码视频无码| 亚洲三级电影在线播放| 国产麻豆91网在线看| 日本一区高清| 欧美综合中文字幕久久| 久久久久无码国产精品不卡| 香港一级毛片免费看| 波多野结衣一区二区三区88| 国产一区二区三区在线观看视频 | 日本草草视频在线观看| 国产亚洲高清视频| 国产亚洲男人的天堂在线观看| 麻豆国产精品| 久久久久88色偷偷| 国产综合网站| 伊人色婷婷| 高清色本在线www| 99ri国产在线| 国产在线观看人成激情视频| 一级香蕉人体视频| 精品久久香蕉国产线看观看gif| 亚洲视频免| a级毛片免费网站| 国产91丝袜| 99精品在线看| AV老司机AV天堂| 久无码久无码av无码| 国产伦片中文免费观看| 中文字幕亚洲精品2页| 午夜在线不卡| 无码日韩精品91超碰| 丁香六月激情综合| 中文毛片无遮挡播放免费| 日本福利视频网站| 久久精品日日躁夜夜躁欧美| 国产又色又爽又黄| 久久久久国产精品熟女影院| 色天天综合| 亚洲欧美在线综合图区| 91免费国产高清观看| 国产在线观看高清不卡| 日韩欧美色综合| 久久99蜜桃精品久久久久小说| 亚洲综合18p| 国产成人精品在线1区| 国产高清在线观看91精品| 亚洲精品第1页| 久久婷婷综合色一区二区| 天天综合网亚洲网站| 四虎国产在线观看| 国产激情无码一区二区三区免费| 无码国内精品人妻少妇蜜桃视频 | 激情五月婷婷综合网| Jizz国产色系免费| 国产天天射| 一级福利视频| 中文字幕永久在线观看| 日本不卡在线播放| 伊人大杳蕉中文无码| 久久国产V一级毛多内射| 性视频一区| 亚洲成A人V欧美综合天堂| 亚洲人成日本在线观看| 久久综合伊人77777| 免费大黄网站在线观看| 国产午夜福利亚洲第一| 伊人蕉久影院| 亚洲永久色| 4虎影视国产在线观看精品| 久久77777| 色婷婷亚洲综合五月| 久久77777| 日本欧美视频在线观看| 色偷偷综合网| 欧美在线天堂| 久久国产成人精品国产成人亚洲 | 中文无码日韩精品|