劉德林
(河南理工大學 應急管理學院,河南 焦作 454000)
鄭州市年降水量的ARIMA模型預測
劉德林
(河南理工大學 應急管理學院,河南 焦作 454000)
鄭州市是我國嚴重缺水的城市之一。為掌握該市降水資源變化狀況,提供區域水資源合理開發利用的依據,運用差分自回歸滑動平均模型(ARIMA),在對鄭州市1951-2008年降水量數據進行預處理、模式識別、參數估計與模型檢驗的基礎上,建立了鄭州市年降水量的ARIMA(2,1,2)預測模型。結果表明:該模型預測相對誤差范圍為-6.36%~0.49%,預測精度較高,可以用于該區未來降水量的短期預測。
鄭州市;年降水量;ARIMA;預測
鄭州市是中國嚴重缺水的城市之一,全市人均水資源量僅為198m3,不足河南人均的1/2及全國人均的1/10[1]。而作為自然界水循環重要環節的大氣降水是該區水資源的主要補給來源,其大小決定著該區水資源的豐富程度[2]。因此,研究鄭州市年降水量的變化趨勢并對未來降水量進行合理預測,將有利于該區水資源的合理開發利用。然而,受下墊面性質與氣象條件復雜多樣及變異性的影響,降水過程存在著大量的隨機性與不確定性,目前還難以通過物理成因來準確預測未來某一時段的降水量,同時傳統的趨勢外推預測模型也不適合該類時間序列數據的預測[3]。統計學家G.E.P.Box與G.M.Jenkins于20世紀70年代提出的差分自回歸滑動平均模型(Auto-Regressive Integrated Moving Average Model,簡稱ARIMA)可用于非平穩時間數據序列的分析、預報與控制[4]。與平穩時間序列、周期時間序列模型相比,該建模方法在數學上更為完善,預測精度更高[5]。因此,本文以鄭州市1951-2008年逐年降水量為基礎,在對年降水序列進行平穩性和正態分布檢驗的基礎上,通過模式識別、參數估計和模型檢驗等步驟,采用數據處理軟件DPS 7.05經過多次擬合優選[6],建立鄭州市年降水量預測精度較高的ARIMA(2,1,2)預測模型。
ARIMA建模的基本思路是假設所研究的時間序列是由某個隨機過程產生的非平穩時間序列,對該非平穩時間序列數據進行若干次差分處理,使其變成平穩時間序列,然后用時間序列的觀測值去建立該隨機過程的自回歸滑動平均模型,用所建立的最優模型進行預測。該模型共有3個參數,分別是自回歸階數(p)、差分次數(d)和滑動平均階數(q),通常被記作ARIMA(p,d,q)。其通用表達式為:

式中:Xt——研究的時間序列數據;ψ1,ψ2,…,ψp——自回歸系數;p——自回歸階數;θ1,θ2,…,θq——滑動平均系數;q——滑動平均階數;εt——白噪聲序列。
該模型體現了對p階自回歸模型的誤差εt進行q階修正的預測思想。由于模型以多項和的形式出現,因此p,q伸縮自如,加之差分處理(d),使模型能適應于任何類型的時間數列[8]。運用ARIMA模型進行建模預測一般包括數據預處理、模式識別、參數估計和模型檢驗4個步驟。
(1)數據預處理。包括數據序列的正態性檢驗與差分平穩化處理,其主要目的是使時間序列數據滿足建立ARIMA模型的前提條件,提高預測的精度。當時間序列正態檢驗的卡方值和Daniel檢驗的秩相關系數的p值大于0.05時,表明數據正態分布且處于平穩狀態,反之亦然。
(2)模式識別。又稱模型定階,是ARIMA建模的關鍵。一般ARIMA(p,d,q)模型的定階方法主要是依據樣本自相關系數(ACF)與偏相關系數(PACF)的截尾性、拖尾性和周期性進行[5,7]。但因該模型結構復雜,AR部分的ACF和MA部分的ACF會相互影響,因此,本文采用從低階 ARIMA(1,1,1)模型進行嘗試,結合最小信息量AIC準則并考慮相關系數R及擬合度C的大小來確定模型的階次。如果AIC值較小且R值及擬合度C值較大,則說明模型的擬合效果越好。AIC準則可定義為:

式中:L——模型的極大似然函數;k——模型的獨立參數個數。
(3)參數估計。ARIMA模型的參數辨識采用麥夸特(Marquardt)非線性最小二乘法進行。
(4)模型檢驗。如果所建模型合適,根據定義,殘差序列εt應為白噪聲序列。因此,模型檢驗主要是殘差序列的白噪聲檢驗。由殘差εt的樣本自相關函數ρk(εt)構造box-pierce的修正統計量Q。

式中:ρk(εt)——殘差εt的樣本自相關函數;Q——統計量;n——樣本容量;D——差分后損失的數據個數;m一般取N/4,k,εt符號含義同前。在一定顯著性水平α(一般α取0.05或0.01)下,根據卡方分布表查得臨界值χ2α(m-p-q),若Q≤χ2α(m-p-q),則認為模型是合適的,否則需要對模型的殘差作進一步的識別或重新構造模型。
從中國地面氣候資料國際交換站鄭州氣象站和《河南統計年鑒》收集并計算鄭州市1951-2008年逐年降水資料,利用1951-2005年的數據作為建模數據序列,2006-2008年數據作為模型檢驗序列,在DPS平臺上進行ARIMA建模分析。
由正態性檢驗卡方值的顯著水平(p=0.01<0.05)和Daniel檢驗結果的顯著水平(p=0.035<α=0.05)可知,該時間序列呈非正態分布且處于非平穩狀態,因此,須對數據進行轉換或差分處理。對原始降水數據進行一階差分后發現,降水時間序列卡方值的顯著水平p=0.97>0.05且Daniel檢驗結果的顯著水平p=0.363>0.05,表明差分后的降水時間序列已呈正態分布且處于平穩狀態,達到ARIMA模型的建模要求。
本文采用麥夸特非線性最小二乘法進行模型的參數估計。采用從低階到高階依次嘗試的方法確定模型的階次,取d=1,即模型為 ARIMA(p,1,q)。通過從低階次到高階次對p和q的不同取值分別進行擬合和參數估計,得到時間序列不同的ARIMA模型(表1)。根據AIC值越小、相關系數R值及擬合度C值越大模型擬合效果越好的原則,可發現較為理想的模型是 ARIMA(2,1,2)


表1 ARIMA(p,1,q)模型判定指標
對殘差序列εt進行檢驗得Q=14.88。查自由度df=15,α=0.005時,χ2=32.8,可見殘差序列的Q值遠遠小于顯著水平0.005下的卡方值,說明殘差序列εt在極顯著水平下為白噪聲,模型有效。同時,通過對鄭州市2006-2008年降水量的預測值與實際值比較發現(表2),預測值與實際值差異較小,說明ARIMA(2,1,2)模型具有較高的預測精度,可用于鄭州市年降水量的預測。此外,從擬合值與實測值的曲線圖(圖1)來看,模型預測值與實測值擬合較好,除在個別年份差異稍大外(如1953年和1968年),其他年份誤差都很小,這也表明了模型擬合的結果是可靠的。

表2 鄭州市降水模型ARIMA(2,1,2)預測精度分析

圖1 鄭州市年降水量模擬值和實測值比較
通過對1951-2005年鄭州市年降水量進行時間序列分析,在對數據進行預處理、模式識別、參數估計和模型檢驗的基礎上,選擇了 ARIMA(2,1,2)模型對鄭州市年降水量進行模擬與預測。
(1)除在個別年份模擬值與實測值差異稍大外(如1953年和1968年),其他年份誤差都很小,這說明該模型擬合效果較好、結果可靠。
(2)利用該模型對2006-2008年鄭州市年降水量進行預測,預測值與實際值差異較小,相對誤差基本控制在10%以內,說明 ARIMA(2,1,2)模型具有較高的預測精度,可用于鄭州市年降水量的預測。
但考慮到降水是一個復雜多變的動態系統,受地區維度差異、氣溫變化、植被覆蓋、流域分布等多因素的綜合影響,該模型雖然對鄭州市年降水的預測較為精確,但是否適用于其他地區,還有待進一步驗證。
[1]李春曉.鄭州市水資源極度短缺,人均占有量不足全國1/10[N].東方今報,2011-03-03(A10).
[2]王友賀,谷秀杰,師麗魁,等.鄭州市降水特征分析與水資源問題初探[J].氣象與環境科學,2007,30(3):61-64.
[3]張杰,劉小明,賀玉龍,等.ARIMA模型在交通事故預測中的應用[J].北京工業大學學報,2007,33(12):1295-1298.
[4]Box G E P,Jenkins G M.Time series analysis:Forecasting and control[M].San Francisco:San Francisco Press,1978.
[5]劉賢趙,邵金花.煙臺地區降水量的ARIMA隨機模型研究[J].數學的實踐與認識,2006,6(8):8-12.
[6]唐啟義,馮光明.DPS數據處理系統[M].北京:科學出版社,2007.
[7]衛小英,霍麗驪.博克思-詹金斯預測方法簡介[J].預測,1984(Z1):35-39.
[8]趙亮,吳艷喬,雷海科,等.運用ARIMA模型對我國人均衛生費用的預測[J].現代預防醫學,2010,7(3):410-412.
Annual Precipitation Forecasting of Zhengzhou City Based on ARIMA Model
LIU De-lin
(Emergency Management School,He'nan Polytechnic University,Jiaozuo,He'nan454000,China)
Zhengzhou City is one of serious water shortage cities in China.In order to realize the change state of precipitation,and to provide the basis for the rational development and utilization of water resources,we applied ARIMA model to establish the ARIMA (2,1,2)model for the annual precipitation forecasting of Zhengzhou City.Some works including the data preprocessing,pattern recognition,parameter estimation and model checking have been done before the establishment of this model.The results showed that the forecast of ARIMA(2,1,2)model is exact,the relative error ranges from -6.36%to 0.49%.The model can be used for short-term forecast of annual precipitation.
Zhengzhou City;annual precipitation;ARIMA;forecasting
P333.6
A
1005-3409(2011)06-0249-03
2011-04-24
2011-05-12
河南省教育廳自然科學基金(2009A170003);河南理工大學博士基金(B2011-033);河南省政府決策研究招標課題(2011B231)
劉德林(1979-),男,山東濰坊人,博士,講師,主要從事水土資源高效利用與應急管理方面的研究與工作。E-mail:liudelina@163.com