999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

應用ARIMA-GRNN模型對腎綜合征出血熱發病率時間序列數據的預測研究*

2015-03-09 11:13:02偉郭軍巧安淑一關鵬周寶森
中國衛生統計 2015年2期
關鍵詞:模型

吳 偉郭軍巧安淑一關 鵬周寶森△

應用ARIMA-GRNN模型對腎綜合征出血熱發病率時間序列數據的預測研究*

吳 偉1郭軍巧2安淑一2關 鵬1周寶森1△

目的闡述ARIMA-GRNN模型預測腎綜合征出血熱發病率的方法和步驟,探討其在綜合征出血熱發病率預測中的應用。方法利用遼寧省1962-2008年的腎綜合征出血熱發病率時間序列數據作為訓練集,建立ARIMA模型和ARIMA-GRNN模型,選取2009-2011年的數據作為檢驗集,評價模型的擬合和預測效果。結果ARIMA(2,1,1)模型和ARIMA-GRNN模型擬合值的平均誤差絕對值分別為1.14和0.77;預測值的平均誤差絕對值分別為0.53和0.20。ARIMA-GRNN模型的擬合和預測效果均優于ARIMA模型。結論ARIMA-GRNN模型能有效模擬、預測腎綜合征出血熱的發病疫情,具有較強的推廣應用價值。

腎綜合征出血熱 時間序列 發病率 預測

腎綜合征出血熱(hemorrhagic fever with renal syndrome,HFRS)是由布尼亞病毒科的漢坦病毒屬引起,包括漢坦病毒、漢城病毒、obrava-Belgrade病毒和普馬拉病毒[1]。HFRS流行范圍廣、病死率高,已經嚴重危害人民的生命健康,屬于我國重點防治傳染病之一??刂艸FRS有效措施之一就是預測其發病情況,在此基礎上有針對性地采取滅鼠和疫苗接種措施,將會達到事半功倍的效果。對于HFRS發病率的預測,近年來普遍使用的有灰色預測模型[2-4]、時間序列模型[4-5]和神經網絡模型[6-9]等。灰色模型對于單調遞增或遞減短期時間序列預測的精度尚可,對于波動大、時間長的數據預測效果較差。時間序列模型中的ARIMA模型屬于傳統的線性預測方法,但是當疾病的發病變化比較復雜時,其預測精度往往較低。廣義回歸神經網絡(generalized regression neural network,GRNN)具有較強的逼近能力、較快的學習速度,并能夠收斂于樣本量聚集較多的優化回歸面[9]。本研究擬建立ARIMA-GRNN模型對HFRS發病率進行預測,探討其在傳染病預測中的應用前景。

材料與方法

1.資料收集HFRS發病資料來源于遼寧省疾病預防控制中心,收集1962-2011年HFRS年發病率資料,其序列圖見圖1。

圖1 遼寧省1962-2011年HFRS年發病率序列圖

2.方法

(1)ARIMA(p,d,q)模型建立[10]ARIMA時間序列預測的建模過程按4個階段進行:序列平穩性檢驗及平穩化處理、模型的識別、模型參數估計和模型診斷、預測應用。使用1962-2008年的數據建立模型,使用2009-2011年的數據檢驗模型的預測效果。

(2)ARIMA-GRNN模型建立[11]

根據建立的最優ARIMA預測模型,對HFRS發病率進行擬合分析,可以獲得每個實際觀察值的ARIMA模型擬合值;將ARIMA模型擬合值作為GRNN模型的輸入樣本A,將時間信息作為輸入樣本B,實際值作為輸出樣本,建立一個2維輸入、1維輸出的GRNN預測模型。使用1962-2008年的數據作為學習樣本,根據Donald F.Sprecht提出的光滑因子的確定方法[12],在其中隨機選取2個樣本(待估點)用來確定光滑因子;把2009-2011年的數據作為測試樣本。所有數據按進行歸一化后分析。最后利用訓練好的網絡進行外推預測,得到的輸出值經過反歸一化后即為最終預測值。

(3)數據處理使用Eviews8.0軟件進行序列平穩性檢驗;SPSS13.0軟件建立ARIMA模型;利用Matlab7.0軟件中的神經網絡工具箱編程構建ARIMAGRNN模型。

結 果

1.ARIMA(p,d,q)模型的建立過程及結果

(1)序列平穩性檢驗及平穩化處理 時間序列分析需要建立在序列平穩化的條件之上。一個平穩的隨機過程有以下要求:均數和方差不隨時間變化,自相關系數只與時間間隔有關,而與所處的時間無關[10]。觀察原始年發病率數據(圖1),可以發現該序列向右上方傾斜,并且波動幅度增加,說明原始序列存在異方差性和增長趨勢。使用Eviews 8.0軟件對原始序列進行ADF檢驗,結果顯示ADF=-1.387,P=0.152,原始發病率序列為非平穩序列。為了使序列平穩,我們對原始序列進行自然對數轉換,并進行一次差分。對處理后序列進行ADF檢驗,結果顯示ADF=-3.182,P=0.028,所以處理后序列可以認為是平穩序列。

(2)ARIMA(p,d,q)模型的識別 根據差分次數,可以選定模型的形式為ARIMA(p,1,q),其中p和q是待定的參數,表示模型中的自回歸階數和移動平均階數,其確定可以根據自相關圖和偏自相關圖進行估計。本研究中的自回歸系數和偏回歸系數均為2階拖尾,初步考慮ARIMA(1,1,1)、ARIMA(1,1,2)、ARIMA(2,1,1)和ARIMA(2,1,2)為備選模型。

(3)ARIMA(p,d,q)模型的參數估計及診斷 根據擬合優度、參數是否有統計學意義及殘差是否白噪聲決定優模型的模型階數。備選模型參數估計及擬合優度檢驗結果見表1、2。模型ARIMA(2,1,1)的AIC及BIC值均為最小,其擬合優度最好,并且參數AR1、AR2和MA1均有統計學意義(P<0.01)。對模型ARIMA(2,1,1)的殘差序列作自相關和偏自相關圖,結果顯示BOX-Ljung統計量均無統計學差異(P>0.05)。認為殘差序列是白噪聲,所選模型恰當。

表1 備選模型參數估計

表2 備選模型擬合優度統計量

2.ARIMA-GRNN模型的建立過程及結果

隨機選取了1980年和1999年HFRS發病率作為待估點,用來尋找最優光滑因子。通過不斷嘗試,我們從0.05開始選擇光滑因子每次增加一個單位量(0.01),分別得到待估點的預測值,將待估點預測值與樣本實測值之間平均平方誤差最小時的光滑因子作為最優值。取不同光滑因子時待估點的預測值與樣本實測值之間的平均平方誤差見圖2。根據圖示,最優光滑因子定為0.09。

圖2 最優光滑因子的確定

3.ARIMA模型和ARIMA-GRNN模型的比較

(1)兩種模型擬合效果的比較 ARIMA模型和ARIMA-GRNN模型對1962-2008年數據的擬合誤差曲線見圖3。計算擬合平均誤差絕對值,ARIMA模型為1.14,ARIMA-GRNN模型為0.77。顯然,和ARIMA模型相比,ARIMA-GRNN模型對原始數據的擬合逼近效果更好。

(2)兩種模型預測效果的比較 ARIMA模型和ARIMA-GRNN模型對2009-2011年數據的預測結果見表3。ARIMA模型和ARIMA-GRNN模型的預測平均誤差絕對值分別為0.53和0.20。和ARIMA模型相比,ARIMA-GRNN模型的預測效果更好。

圖3 ARIMA模型和ARIMA-GRNN模型的擬合誤差曲線

表3 兩種模型對遼寧省2009-2011年HFRS發病率預測結果比較

討 論

時間序列分析作為傳統的線性模型分析手段,克服了影響預測對象的因素錯綜復雜、不易分析和數據資料不易得到的難題,以時間序列變量綜合替代各種影響因素,模型的建立過程簡單、經濟、適用,短期預測精度較高[13]。但是,其缺點也比較明顯,如對于不規則數據序列難以確定合適的模型結構等[11]。因此,對于HFRS發病率這類影響因素多,因素間相互作用復雜,且有一定非線性特征的時間序列,單純使用傳統的分析方法進行預測,其預測的精度往往難以令人滿意。廣義回歸神經網絡具有較快的學習速度、較好的處理不穩定數據的能力、網絡結構較少受人為主觀因素影響和預測結果穩定等特點,因而可用于多種非線性關系的擬合與預測[9]。由于HFRS發病率數據中既包含線性趨勢又包含非線性趨勢。因此,可以先使用ARIMA模型預測HFRS發病率,使其線性規律包含在ARIMA模型的結果中。接著通過具有高度非線性逼近能力的GRNN模型反復學習歸納原始數據和ARIMA模型擬合值之間的關系,建立兼有ARIMA模型和GRNN模型優點的ARIMA-GRNN模型。

遼寧省1962年開始有完整的HFRS疫情資料記載。本研究對1962-2011年的疫情資料數據進行分析,分別建立ARIMA模型和ARIMA-GRNN模型。研究結果證實,ARIMA-GRNN模型對原始數據的擬合和預測效果要優于ARIMA模型。ARIMA-GRNN模型計算簡單,預測精度高,所需的資料較少且易于獲得,對于HFRS發病率資料是一種較好的預測模型,為HFRS的防控提供可靠的理論依據。在模型的實際使用過程中,確定ARIMA-GRNN模型的最優光滑因子是建模的關鍵,光滑因子越小,網絡對樣本的逼近性能就越強;光滑因子越大,網絡對樣本數據的逼近過程就越平滑。我們綜合考慮模型的擬合和外推能力,通過不斷嘗試,反復計算,把待估點預測值與樣本實測值之間平均平方誤差最小時的光滑因子作為最優值,使模型的逼近性能和泛化性能達到平衡。雖然ARIMAGRNN模型擬合和預測效果較好,但是和其他常用的數學模型一樣,主要從數據上反映疾病的發展變化趨勢,所得到的結論都只是建立在既往歷史疫情數據和單純數學統計分析的基礎上,一旦參數發生變化或無法獲得相應參數時,也就無法做出預測[14]。此外,影響HFRS發病的因素錯綜復雜,很多影響因素未被考慮到模型參數中,可能會影響到結果的準確性。因此,在實際工作中,在有條件的情況下可以全面收集影響HFRS的發病因素,建議建模時加入相關因素以進一步提高模型精度。再次,ARIMA-GRNN模型是建立在ARIMA模型基礎之上的,其結構更為復雜。但是考慮到其擬合和預測準確性提高的幅度較大以及目前計算機硬件水平對于這種規模的計算還可以承受,我們認為使用ARIMA-GRNN模型建立HFRS預測模型還是可以被接受的。

1.石健.我國腎綜合征出血熱流行病學研究進展.中國人獸共患病學報,2007,23(3):296-299.

2.劉潔,曲波,何欽成.應用GM(1,1)模型對全國1999-2009年腎綜合征出血熱疫情分析及預測.中國媒介生物學及控制雜志,2011,22(3):248-250.

3.葛洪福.灰色預測模型GM(1,1)模型在HFRS發病趨勢預測中的應用.現代預防醫學,2000,27(1):107.

4.吳偉,關鵬,郭軍巧,等.GM(1,1)灰色模型和ARIMA模型在HFRS發病率預測中的比較研究.中國醫科大學學報,2008,37(1):52-55.

5.郭海強,丁海龍,曲波,等.應用ARIMA模型對全國2004-2009年腎綜合征出血熱疫情分析及預測.中國人獸共患病學報,2010,26(2):1137-1140.

6.丁守鑾,王潔貞,袁曉紅.腎綜合征出血熱發病率的ANN預測模型.山東大學學報(醫學版),2002,40(2):100-102.

7.朱奕奕.人工神經網絡在上海市腎綜合征出血熱發病率預測中的應用.上海預防醫學,2012,24(5):229-232.

8.吳澤明,吳偉,王萍,等.應用BP人工神經網絡模型預測腎綜合征出血熱發病率.中國媒介生物學及控制雜志,2006,17(3):223-226.

9.吳偉,郭軍巧,王萍,等.廣義回歸神經網絡在腎綜合征出血熱發病率預測中的應用.中國媒介生物學及控制雜志,2007,18(6):483-487.

10.張文彤主編.SPSS11.0統計分析教程.北京:北京希望電子出版社,2002,250-287.

11.嚴薇榮,徐勇,楊小兵,等.基于ARIMA-GRNN組合模型的傳染病發病率預測.中國衛生統計,2008,25(1):82-83.

12.Sprecht DF.A general regression neural network.IEEE Trans Neural Networks,1991,2(6):568-576.

13.韓琴,蘇虹,王忱誠,等.ARIMA模型與GRNN模型對性病發病率的預測研究.現代預防醫學,2012,39(6):1337-1340.

14.劉剛,唐宋,孫文杰.時間序列分析法在香港結核病預測中的應用.中國衛生統計,2012,29(2):226-228.

(責任編輯:劉壯)

Application of ARIMA-GRNN Model to Predict the Incidence of Hemorrhagic Fever with Renal Syndrome

Wu Wei,Guo Junqiao,An Shuyi,et al.(Department of Epidemiology,School of Public Health,China Medical University(110122),Shenyang)

To describe the procedure of building ARIMA-GRNN model,and explore the value of potential application of the above model to predict the incidence of hemorrhagic fever with renal syndrome.ARIMA and ARIMA-GRNN models were established using the incidence of hemorrhagic fever with renal syndrome in Liaoning province from 1962 to 2008,and the fitting and predictive performances were evaluated using the data from 2009 to 2011.The mean absolute value of error for fitted value of the optimal ARIMA model and ARIMA-GRNN model were 1.14 and 0.77,respectively;and the mean absolute value of error for predicted value of the optimal ARIMA model and ARIMA-GRNN model were 1.14 and 0.77,respectively.This suggested that the fitting and predictive efficacies of ARIMA-GRNN model were better than ARIMA model.ARIMA-GRNN model could effectively fit and predict the incidence of hemorrhagic fever with renal syndrome,which was of great application value for the prevention and control of hemorrhagic fever with renal syndrome.

Hemorrhagic fever with renal syndrome;Time series;Incidence;Predict

*國家自然科學基金項目(No.81202254);國家自然科學基金項目(No.30771860)

1.中國醫科大學公共衛生學院(110122)

2.遼寧省疾病預防控制中心

△通信作者:周寶森,Email:bszhou@mail.cmu.edu.cn

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 人妻无码中文字幕一区二区三区| 亚洲一道AV无码午夜福利| 综1合AV在线播放| 91精品伊人久久大香线蕉| 五月婷婷精品| 亚洲欧美不卡视频| 久久精品国产一区二区小说| 国产精品久久久免费视频| 91精品国产麻豆国产自产在线| 青青操国产视频| 99在线视频免费| 欧美日韩在线国产| а∨天堂一区中文字幕| 日韩天堂视频| 亚洲色中色| 亚洲欧美日韩中文字幕在线| 国产午夜福利在线小视频| 欧美在线精品怡红院| 国模沟沟一区二区三区| 欧美国产日韩在线观看| 亚洲国产中文综合专区在| 亚洲日韩Av中文字幕无码| 无码高潮喷水专区久久| 久久视精品| 草草影院国产第一页| 免费国产不卡午夜福在线观看| 91福利免费视频| 在线一级毛片| 亚洲中文字幕23页在线| 免费在线不卡视频| 亚洲 成人国产| 亚洲欧洲综合| 亚洲一区免费看| 亚洲欧美成aⅴ人在线观看| 精品剧情v国产在线观看| 国产一区亚洲一区| 国产门事件在线| 亚洲国产日韩在线观看| 日韩精品一区二区三区免费| 亚洲人成影院午夜网站| 无码国产伊人| 欧美三级自拍| 欧美福利在线播放| 一级片免费网站| v天堂中文在线| av无码一区二区三区在线| 亚洲精品第一页不卡| a级毛片在线免费观看| 9999在线视频| 不卡色老大久久综合网| 毛片免费网址| 最新无码专区超级碰碰碰| 国产精品第一区| 国产91蝌蚪窝| 国产香蕉一区二区在线网站| 91麻豆精品国产91久久久久| 日本精品αv中文字幕| 欧美中文字幕无线码视频| 国产午夜福利亚洲第一| 91精品专区| 亚洲人成在线精品| 亚洲精品无码抽插日韩| 四虎影视库国产精品一区| 美美女高清毛片视频免费观看| 成人福利视频网| 色综合天天娱乐综合网| 天堂av高清一区二区三区| 国产精品对白刺激| 精品国产网站| 综合成人国产| 欧美怡红院视频一区二区三区| 狠狠亚洲五月天| 国产精品久久精品| 丰满人妻一区二区三区视频| 国产精品大白天新婚身材| 国产高清在线精品一区二区三区| 久久天天躁狠狠躁夜夜躁| 精品久久久久成人码免费动漫| 黄色污网站在线观看| 国内精品一区二区在线观看 | 国产成人综合网| 亚洲日本一本dvd高清|