999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用遺傳算法優(yōu)化的ARIMA-BP組合模型預測手足口病發(fā)病趨勢

2014-01-08 01:54:17吳文博李虹艾萬鵬程袁秀琴南華大學公共衛(wèi)生學院湖南衡陽400南華大學經(jīng)濟管理學院
中南醫(yī)學科學雜志 2014年6期
關(guān)鍵詞:模型

吳文博,李虹艾,萬鵬程,袁秀琴(.南華大學公共衛(wèi)生學院,湖南 衡陽 400;.南華大學經(jīng)濟管理學院)

近年來,手足口病的發(fā)病數(shù)逐年增多,作為丙類傳染病中為我省重點監(jiān)測的疾病之一,因其發(fā)病率高、目前尚無疫苗進行免疫接種、并發(fā)癥危害大,故其防控形勢較為嚴峻。在傳染病的防控中,通過建立相對準確的統(tǒng)計預測模型,從而建立預警監(jiān)測機制,為制定防控政策和衛(wèi)生資源配置提供依據(jù),這是傳染病防控的重點及難點之一[1]。本文基于某市近年來手足口病的發(fā)病資料,先后建立差分自回歸移動平均模型(ARIMA)、遺傳算法(Gentic Algorithm,GA)優(yōu)化的ARIMA-BP神經(jīng)網(wǎng)絡(luò)模型,比較兩種模型的預測準確性,并探討組合模型在預測方面的優(yōu)越性。

1 材料與方法

1.1 資料來源

數(shù)據(jù)資料來源于中國疾病預防控制信息系統(tǒng)(傳染病報告信息管理系統(tǒng)),按發(fā)病日期檢索某市2009年1月1日~2013年12月31日的手足口病月發(fā)病數(shù)。

1.2 方法

將數(shù)據(jù)導入SPSS18.0中,檢查有無缺失數(shù)據(jù)。以2009年1月1日~2012年12月的發(fā)病數(shù)據(jù)作為模型擬合值,預測2013年手足口病月發(fā)病數(shù),將預測值與實際值進行比較,以相對偏差的大小衡量模型的精確性。在建模方法上,首先建立ARIMA模型,將ARIMA模型預測值作為BP神經(jīng)網(wǎng)絡(luò)的輸入值,真實值作為輸出值,同時應用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),不斷尋找預測值與真實值的關(guān)系,從而調(diào)整ARIMA模型的預測精度。比較這兩種模型的相對偏差,并對模型預測精度進行評價。

1.3 原理

1.3.1 ARIMA模型 ARIMA模型的基本思想是將預測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列,用一定的數(shù)學模型來近似描述這個序列[2]。該模型由美國數(shù)學家Box與英國統(tǒng)計學家Jenkins提出,在預測具有季節(jié)周期性的時間序列中,以乘積季節(jié)性模型最為常用,記ARIMA(p,d,q)(P,D,Q)n,其中p,q為非季節(jié)性模型的自回歸項及移動平均項數(shù),d為時間序列平穩(wěn)化時所做的差分次數(shù);P,Q為季節(jié)性模型的自回歸及移動平均項,D為季節(jié)差分的階數(shù)。其建模過程見圖1。

圖1 ARIMA的建模過程

1.3.2 BP神經(jīng)網(wǎng)絡(luò)及遺傳算法 BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)的主要特點是信號前向傳遞,誤差反向傳播。在前向傳遞中,輸入信號從輸入層經(jīng)隱含層逐層處理,直至輸出層。每一層的神經(jīng)元狀態(tài)只影響下一層神經(jīng)元狀態(tài)[3]。如果輸出層得不到期望輸出,則轉(zhuǎn)入反向傳播,根據(jù)預測誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而使BP神經(jīng)網(wǎng)絡(luò)預測輸出不斷逼近期望輸出。BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)如圖2所示。根據(jù)輸入向量X,輸入層和隱含層間連接權(quán)值ωij,以及隱含層閾值a,可以計算隱含層輸出向量H,即:

圖2 BP神經(jīng)網(wǎng)絡(luò)拓補結(jié)構(gòu)

但BP神經(jīng)網(wǎng)絡(luò)容易受數(shù)據(jù)極值的影響,從而導致預測精度的下降,同時由于各層權(quán)重的權(quán)值是主觀經(jīng)驗確定的,導致BP神經(jīng)網(wǎng)絡(luò)的主觀傾向性過大,為此引入GA算法。

遺傳算法(Genetic Algorithm,GA)是一種進化算法,其基本原理是仿效生物界中的“物競天擇、適者生存”的演化法則。遺傳算法的做法是把問題參數(shù)編碼為染色體,再利用迭代的方式進行選擇、交叉以及變異等運算來交換種群中染色體的信息,最終生成符合優(yōu)化目標的染色體[4]。遺傳算法所優(yōu)化的內(nèi)容是BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值一般是通過隨機初始化為[-0.5,0.5]區(qū)間的隨機數(shù),這個初始化參數(shù)對網(wǎng)絡(luò)訓練的影響很大,引入遺傳算法就是為了優(yōu)化出最佳的初始權(quán)值和閾值,以提高研究的預測精度。

1.4 軟件平臺

ARIMA模型構(gòu)建采用SPSS18.0,神經(jīng)網(wǎng)絡(luò)及遺傳算法編程采用MATLAB 7.0,操作系統(tǒng)為Windows XP。

2 結(jié) 果

2.1 ARIMA模型的建立

(1)模型的平穩(wěn)化識別

首先定義估計區(qū)間,依據(jù)2009年1月~2012年12月的發(fā)病數(shù)擬合模型,并繪制序列圖,見圖3。從序列圖中可見,手足口病發(fā)病數(shù)序列存在著明顯的季節(jié)性周期波動規(guī)律,在每一年5~8月份,出現(xiàn)發(fā)病高峰;報告數(shù)在2012年明顯增多。總的來看,手足口病發(fā)病數(shù)呈現(xiàn)逐年增多的趨勢,提示該序列是一個非平穩(wěn)的序列,需對其進行差分,和對數(shù)轉(zhuǎn)化,以達到序列平穩(wěn)化的目的。

(2)季節(jié)性ARIMA模型的建立:通過做出自相關(guān)函數(shù)(ACF)、偏自相關(guān)函數(shù)(PACF)圖,見圖4。依據(jù)“截尾性”估計季節(jié)性模型參數(shù);同時在殘差中識別非季節(jié)性模型,確定若干個備選模型后,利用Bayesian信息準則(BIC)最小原則,確定最后的模型,模型ARIMA(1,0,0)(1,1,0)12的BIC最小,為13.002。并對該模型進行診斷、對模型參數(shù)進行估計,相關(guān)統(tǒng)計量見表1,表2。同時利用Ljung-Box方法檢驗殘差白噪聲,得到L-B統(tǒng)計量為16.847,P﹥0.05,可以認為殘差為白噪聲序列。綜上,選用ARIMA(1,0,0)(1,1,0)12模型進行預測。

圖3 手足口病發(fā)病數(shù)序列圖

表1 預測模型的相關(guān)檢驗統(tǒng)計量

表2 模型的參數(shù)估計

圖4 手足口病序列的ACF、PACF圖

2.2 ARIMA-BP組合模型的建立與遺傳算法的優(yōu)化

(1)將ARIMA模型預測得到的預測值、2013年1月~12月的手足口病實際發(fā)病數(shù)數(shù)據(jù)進行歸一化處理,使其集中在[-0.5,0.5]之間;

(2)學習樣本的選擇

輸出變量:2013年1月~12月的實際觀測值yi。

(3)網(wǎng)絡(luò)初始化,利用遺傳算法進化50代尋找最佳初始權(quán)值和閾值。確定遺傳算法參數(shù)的程序代碼如下:

%%定義遺傳算法參數(shù)

NIND=5; %個體數(shù)目

MAXGEN=50; %最大遺傳代數(shù)

PRECI=10; %變量的二進制位數(shù)

GGAP=0.95; %代溝

px=0.7; %交叉概率

pm=0.01; %變異概率

trace=zeros(N+1,MAXGEN); %尋優(yōu)結(jié)果的初始值

FieldD=[repmat(PRECI,1,N);repmat([-0.5;0.5],1,N);repmat([1;0;1;1],1,N)]; %區(qū)域描述器

(4)依據(jù)遺傳算法尋找的最佳閾值與連接權(quán)值,計算隱含層與輸出層;

(5)計算誤差,不斷迭代更新閾值與權(quán)值,直至誤差保持在穩(wěn)定水平時輸出最后結(jié)果。迭代進化過程中誤差變化見圖5。

圖5 遺傳算法進化過程中誤差的變化

利用BP神經(jīng)網(wǎng)絡(luò)進行預測的程序如下:

net.iw{1,1}=reshape(w1,hiddennum,inputnum);

net.lw{2,1}=reshape(w2,outputnum,hiddennum);

net.b{1}=reshape(B1,hiddennum,1);

net.b{2}=reshape(B2,outputnum,1);

%%訓練網(wǎng)絡(luò)

net=train(net,inputn,outputn);

%BP網(wǎng)絡(luò)預測

%預測數(shù)據(jù)歸一化

inputn_test=P_test./80;

%網(wǎng)絡(luò)預測輸出

an=sim(net,inputn_test);

2.3 ARIMA模型與組合模型的預測精度比較

表3 ARIMA模型與組合模型預測2013年各月份發(fā)病數(shù)的結(jié)果比較

由表4可見,組合模型的平均預測精度高于ARIMA模型,且對于部分極端值(尤其是發(fā)病高峰5~8月)的預測較為準確。對模型整體的評價指標見表4。其中決定系數(shù)R2用來反映模型的擬合效果,即:

SSi表示預測值的離均差平方和,SSo表示實際值得離均差平方和。

表4 兩種模型的綜合評價

3 討 論

傳染病的發(fā)病預測是當前傳染病疾病預防與控制的難點[5]。用于發(fā)病預測的方法有很多,實際工作中通常的做法是定性預測法,即基于日常的疾病監(jiān)測數(shù)據(jù)、傳染病的發(fā)病特點,進行趨勢外推。這種做法主觀因素較大,沒有充分利用監(jiān)測數(shù)據(jù),難以保證預測的準確性。對于組合模型,國內(nèi)外相關(guān)的研究相對較少,如:Gamer分解定律、對不同模型給予一定的權(quán)重[6],但權(quán)重的設(shè)定僅能依靠經(jīng)驗的判斷,導致預測的主觀性增加,影響了預測的精度。有關(guān)基于ARIMA的組合模型預測,朱玉等[7]利用ARIMA-GRNN對猩紅熱的發(fā)病進行擬合;章勤等[8]則利用BP神經(jīng)網(wǎng)絡(luò)對矽肺的發(fā)病情況,進行了預測,取得了較好的效果。雖然上述采用神經(jīng)網(wǎng)絡(luò)的組合預測方法,避免了對各分模型權(quán)重大小選取的討論,但是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的閾值以及連接權(quán)值,均需要依靠經(jīng)驗反復設(shè)定,在實際利用中較為繁瑣。本次研究的創(chuàng)新點在于使用了遺傳算法,通過進化代數(shù)的迭代,優(yōu)化了神經(jīng)網(wǎng)絡(luò)參數(shù),使得預測結(jié)果更加科學可信。

從預測結(jié)果上看,利用遺傳算法優(yōu)化的ARIMA-BP組合模型實現(xiàn)了對手足口病的發(fā)病趨勢的預測,相比于ARIMA模型,該組合模型對極端值的預測效果較好,此外,從整體上看,手足口病的發(fā)病數(shù)年年攀升,需引起足夠重視,由于手足口病致病病原體種類繁多,難以進行免疫接種干預,故應在每年的疾病高發(fā)時期,建立統(tǒng)計預警,加大對托幼機構(gòu)、學校的消毒、衛(wèi)生檢查以及衛(wèi)生宣教;廣大醫(yī)療機構(gòu)應加強監(jiān)測篩檢機制,動員醫(yī)療資源做到早發(fā)現(xiàn)、早診斷、早治療。

由于納入本次建模的數(shù)據(jù)樣本量并不大,組合模型的效果變化并不是非常明顯,但當數(shù)據(jù)量增大時,采用本法的組合模型,將會依舊保持良好的預測精度。此外,介于本模型的非線性映射能力較強、不受極端數(shù)值的影響[9],基于ARIMA的組合模型尚可以用于金融、人口、水文以及環(huán)境保護領(lǐng)域,但仍需進一步的研究與討論。

[1]羅靜,楊舒,張強,等.時間序列ARIMA在艾滋病疫情預測中的應用[J].重慶醫(yī)學,2012,41(13):1255-1257.

[2]張晉昕,醫(yī)學時間序列分析及其預測應用相關(guān)問題的研究[D].西安:第四軍醫(yī)大學博士研究生畢業(yè)論文,2000:23-25.

[3]SimonHaykin.神經(jīng)網(wǎng)絡(luò)原理[M].北京:機械工程出版社,2004:154-167.

[4]史峰,王小川,郁磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)30個案例分析[M].北京:北京航天航空大學出版社,2010:21-25.

[5]牟瑾,謝旭,李媛,等.將ARIMA模型應用于深圳市1980~2007重點法定傳染病預測分析[J].預防醫(yī)學論壇,2009,15(11):1051-1055.

[6]Erxu Pi,Mantri,Sai Ming Ngai.BP-ANN for fitting the temperature-germination model and its application in predicting sowing time and region for bermudagrass[J].PLoS One 2013,11(8):e82413.

[7]朱玉,夏結(jié)來,王靜.單純ARIMA模型和GRNN-ARIMA組合模型在猩紅熱發(fā)病率中的研究[J].中華流行病學雜志,2009,30(9):964-966.

[8]章勤,田晶,孫傲冰,等.基于BP神經(jīng)網(wǎng)絡(luò)的矽肺病組合模型預測研究[J].計算機科學,2009,36(4):265-269.

[9]嚴薇榮,徐勇,楊小兵,等.基于ARIMA-GRNN組合模型的傳染病發(fā)病率預測[J].中國衛(wèi)生統(tǒng)計,2008,25(1):82-83.

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 伊伊人成亚洲综合人网7777| 精品久久久久久久久久久| 伊人91在线| 毛片a级毛片免费观看免下载| 国产成人精品午夜视频'| 在线观看欧美精品二区| 九月婷婷亚洲综合在线| 扒开粉嫩的小缝隙喷白浆视频| 91啦中文字幕| 免费国产一级 片内射老| 91久久偷偷做嫩草影院免费看| 99久久精品国产麻豆婷婷| 亚洲天堂免费在线视频| 无码日韩人妻精品久久蜜桃| 国产精品美乳| 在线五月婷婷| 色悠久久综合| 日韩精品专区免费无码aⅴ| 国产你懂得| 国产第八页| 国产精品永久久久久| 二级特黄绝大片免费视频大片| 日本亚洲欧美在线| 亚洲日本精品一区二区| 日韩av无码精品专区| 不卡午夜视频| 日韩欧美国产另类| 亚洲中字无码AV电影在线观看| 一区二区日韩国产精久久| 免费观看男人免费桶女人视频| 久久国产成人精品国产成人亚洲| 国产资源免费观看| 国产精品三级av及在线观看| 亚洲午夜国产精品无卡| 美女被狂躁www在线观看| 亚洲综合天堂网| 69视频国产| 四虎在线高清无码| 国产成人福利在线视老湿机| 国产主播福利在线观看| 白丝美女办公室高潮喷水视频| 又黄又爽视频好爽视频| 天堂亚洲网| 就去色综合| 婷婷亚洲最大| 1769国产精品视频免费观看| 在线不卡免费视频| 中文无码精品A∨在线观看不卡| 婷婷六月综合| 日韩欧美91| 国产精品吹潮在线观看中文| 日韩欧美91| 欧美三级视频在线播放| 日韩经典精品无码一区二区| 日韩人妻少妇一区二区| 国产丝袜丝视频在线观看| 久久99蜜桃精品久久久久小说| 性色一区| 亚洲成人动漫在线| 美美女高清毛片视频免费观看| 国产丝袜第一页| 永久天堂网Av| 国产精品yjizz视频网一二区| 亚洲无码视频一区二区三区| 国产老女人精品免费视频| 国产精品久久久久无码网站| 亚洲人精品亚洲人成在线| 国产性生大片免费观看性欧美| 国产成人综合日韩精品无码不卡| 狠狠操夜夜爽| 尤物视频一区| 777午夜精品电影免费看| 色视频国产| 欧美激情,国产精品| 国产v欧美v日韩v综合精品| 午夜毛片福利| 狠狠亚洲婷婷综合色香| 色妞www精品视频一级下载| 欧美国产日韩一区二区三区精品影视| 久久亚洲精少妇毛片午夜无码 | 强奷白丝美女在线观看| 欧美久久网|