西北民族大學計算機科學與信息工程學院(730030) 馬亮亮 田富鵬
基于ARCH族模型的海西州地區呼吸道感染發病情況研究*
西北民族大學計算機科學與信息工程學院(730030) 馬亮亮△田富鵬
*:國家自然科學基金資助項目(60673192)
△通訊作者:馬亮亮,E-mial:mll198684@126.com
呼吸道感染是危害人們健康的一種發病率較高的疾病,由于人們生活水平的提高、工作壓力的增大和不良的飲食習慣及其他原因,近年來呼吸道感染發病率有增加的趨勢。通過建立數學模型,研究呼吸道感染和平均氣溫之間的相互關系,可以幫助我們更好地認識和及時預防呼吸道感染,有效地降低呼吸道感染對人們的危害,從而保障人們的生活質量。
全部發病資料取自青海海西州第一人民醫院。經過核對、補漏,從而保證資料的準確和完整。
運用Excel 2003及EViews 3.1對2001年1月至2007年12月的海西州地區呼吸道感染發病資料進行整理分析,統計出了海西州地區的呼吸道感染月發病率和月平均氣溫,通過建立ARCH、ARCH-M、GARCH、GARCH-M、TARCH、TARCH-M、EGARCH、EGARCHM、CARCH和CARCH-M模型,并對所建模型中的殘差序列進行獨立性檢驗、利用所建模型對海西州地區的呼吸道感染實際發病率進行擬合,從中選出最優模型,對呼吸道感染的發病情況進行研究。
設序列xt和yt分別表示海西州地區2001年1月至2007年12月的呼吸道感染月平均氣溫和月發病率。以月平均氣溫為因變量,為了考察變量間的動態影響,故采用分布滯后模型(通過反復試驗,選取了一個相對較好的模型形式),其形式為:

其參數估計及相關檢驗結果如表1所示。
從表1可知,所有系數的統計學檢驗對于90%的置信度均通過,且該模型的擬合優度達0.9315,說明整體效果不錯。所建分布滯后模型對應的數學表達式為:

表1 分布滯后模型估計與檢驗結果

對模型(2)中的殘差序列做ARCH效應檢驗。當χ2檢驗階數即q值為8時,ARCH效應的檢驗結果顯示,F=1.970356,相伴概率為0.024564,LM 統計量=14.42686,相伴概率為0.03130。
因此,在q=7時相伴概率p=0.0313,小于α=0.05水平,故序列存在高階 ARCH效應,即存在ARCH-M、GARCH、GARCH-M、TARCH、TARCH-M、EGARCH、EGARCH-M、CARCH和CARCH-M 效應。
基于模型(2)中的殘差序列,分別建立ARCH、ARCH-M、GARCH、GARCH-M、TARCH 、TARCH-M、EGARCH、EGARCH-M、CARCH和 CARCH-M 模型。根據AIC和SC準則,并配合殘差獨立性檢驗比較發現,建立 ARCH(1)、ARCH(1,1)-M、GARCH(1,1)、GARCH(1,1)-M、TARCH(1,1)、TARCH(1,1)-M、EGARCH(1,1)、EGARCH(1,1)-M、CARCH(1,1)和CARCH(1,1)-M模型較為適宜。其條件方差的數學表達式分別為:

其中(7)和(8)式中dt是一個名義變量
上述模型中,模型(4)、(6)、(8)、(11)和(14)均是在回歸模型中加入標準差后得到的結果。
在上述所建的模型(3~15)中,模型ARCH(1)、ARCH(1,1)-M、GARCH(1,1)、GARCH(1,1)-M、TARCH(1,1)、EGARCH(1,1)、EGARCH(1,1)-M、CARCH(1,1)和 CARCH(1,1)所對應的參數 α1=0.1364 < 1、α1=0.0576 < 1、α1+ α2=-0.1115+1.0806=0.9691 < 1、α1+ α2=0.0702+0.2834=0.3536<1、α1+φ +θ1=2.2767-0.3262+0.0657=0.0162 <1、α1+ φ1+ θ1=0.2000+0.3839+0.2456=0.8295 <1、α1+ φ1+ θ1=0.2484+0.2026+0.0830=0.5340<1、α+θ+ρ+σ=0.1044-0.0873+0.9707-0.1410=0.8468<1、α+θ+ρ+σ=0.5717+0.1615-0.0919+0.6208=0.1187<1均滿足參數約束條件,即滿足平穩條件。而模型TARCH(1,1)-M 中,參數α1+φ +θ1=-0.2349+0.4195+0.8597=1.0443>1,不滿足平穩條件,所以排除該模型。下分別對模型(3)、(4)、(5)、(6)、(7)、(10)、(11)、(12)和(14)中的殘差序列進行獨立性檢驗〔5〕,以確定所建模型的合理性。檢驗結果如表2所示。

表2 各模型殘差獨立性檢驗結果
由表2 可知,模型(3)、(4)、(5)、(6)、(7)、(10)、(11)、(12)和(14)的SIC和SC值均較小,可認為模型較好地擬合了原始數據。從整體角度考慮,模型ARCH(1,1)-M 的AIC和SC值(4.4190和4.6555)最小。因此,與其他模型相比較而言,模型ARCH(1,1)-M 的擬合度更高、最合理,即模型ARCH(1,1)-M 最優。
利用模型(3)~(14)(除13外)分別對海西州地區2001年1月至2007年12月的呼吸道感染月發病率進行擬合。
模型(3)~(14)(除13外)的殘差序列擬合結果整體上均不錯,但殘差序列的擬合效果最好,因此基于原始數據建立的ARCH(1,1)-M模型是最優的。
由以上分析可知,由序列xt和xy(呼吸道感染月平均氣溫和月發病率)可建立分布滯后模型。通過對分布滯后模型中的殘差序列進行ARCH效應檢驗,發現殘差序列存在ARCH、ARCH-M、GARCH、GARCHM、TARCH 、TARCH-M、EGARCH、EGARCH-M、CARCH和CARCH-M效應。因此,基于分布滯后模型中的殘差項可分別建立ARCH、ARCH-M 、GARCH和GARCH-M模型。最后,通過模型殘差序列獨立性檢驗和預測,選出了最優模型ARCH(1,1)-M。
本文中的數據是近7年的海西州地區呼吸道感染發病資料,海西州既是我國西北高原地區,又是我國少數民族聚集的地區,做好該地區呼吸道感染發病率的預測對高原少數民族地區人民的健康有重要的意義。盡管國家經濟文化迅速發展,衛生條件得到改善,但是政府對這類疾病的預防不夠重視,所以近幾年來海西州地區呼吸道感染的發病率有逐年增高的趨勢,這就提醒醫療衛生部門應加強對此高原少數民族地區呼吸道感染預防和控制的宣傳工作。
1.劉曉冬,景睿,孟祥臻,等.ARIMA模型對中國人口死亡率預測的研究.中國衛生統計,2008,25(6):630-631.
2.李存行,張敏,陳偉.自回歸條件異方差模型在我國滬市的應用研究.數學的實踐與認識,2008,38(8):1-5.
3.張雪蓉,徐全智,楊晉浩.TARCH-M模型在上證指數波動率的實證分析.成都大學學報(自然科學版),2006,3(25):171-174.