程 敏,張耀文,姜紀沂*,任 杰,趙振宏
(1.防災科技學院,北京101601;2.中國地質調查局西安地質調查中心,西安710054)
降雨量的短期變化,往往會造成嚴重的干旱澇、洪災害,并對當地經濟發展等造成不同程度的影響。高精度的降雨量預測方法能及早地發現降雨量變化情況,提高應對此類災害的能力[1]。降雨量是衡量干旱程度的一個重要指標,直接反映了自然界的變化,降雨量的大小直接影響農業生產[2]。如能對降雨量做出科學準確預測,農業、水利等有關部門就可以及時采取防澇抗旱措施[3],降低不必要的損失,因此降雨量預測已成為當前預測中的重要研究課題[4]。對于水資源短缺的北方來說,地下水是北方的主要用水來源,高精度的預測降雨量,能最大限度的利用水資源,將多余的水儲存起來,以緩解水資源短缺問題,降低因水資源短缺或極度缺少而帶來的經濟損失。
基于這種情況,本文試圖運用時間序列中的ARIMA模型對該地區的降雨量進行預測,進而了解未來5年內濟南市的降雨量變化情況。
濟南市坐落于魯西北沖積平原和魯中低山丘陵的接觸地帶,北部為黃河下游平原,南部為泰山山系,地勢北部低、南部高,平原稍微傾向東北,黃河沿西南—東北方向穿過濟南市所在的區域,黃河河床高出地面形成地上河,在黃兩岸發育有諸多的呈條帶狀的洼地。最高峰為南部西營鎮梯子山,地面標高975.8m,如圖1。

圖1 濟南市水系分布
某種統計指標的數值按時間先后順序排列所形成的數列叫做時間序列[5]。時間序列模型主要分為兩類,一是ARMA(Auto Regression Moving Average)模型,即自回歸移動平均模型[6];二是ARIMA(Auto Regressive Integrated Moving Average Model)模型,即自回歸積分滑動平均模型[7]。其實兩類模型可以看做是兩類模型的組合再加上差分運算,一類模型是AR; 一類模型是MA,ARMA模型可以看做是AR+MA;而ARIMA可以看做是AR+差分處理+MA。
在ARIMA(p,d,q)模型進行預測時,所用序列必須是平穩的序列,如果是非平穩化的序列,就需將其轉化為平穩化的序列[8]。
以濟南市1959~2010年降雨量數據作為本次分析樣本,在SPSS的預測選項中創建ARIMA模型,并進行向前預測,使用2011~2015年降雨量數據檢驗ARIMA模型的預測準確度,如圖2。

圖2 1959~2010年降雨量序列
在SPSS軟件平臺進行降雨量的輸入與定義日期,然后進行數據序列圖的繪制[9],如圖3。
從圖3可看出,該時間序列在1967,1985,2003年具有較大波動,但總體具有一定的向下趨勢,并不平穩。需要對1959~2010年的降雨量數據進行平穩化處理。

圖3 降雨量平穩化序列
在SPSS軟件中繪制的降雨量一階差分的自相關圖和偏自相關圖如圖4。可以看出,一階差分后數據序列的自相關系數在顯著不為0后趨于0,而一階差分后的偏自相關系數較接近0。判定數據序列基本平穩。故ARIMA模型參數d取值為1。

圖4 自相關圖和偏自相關圖
根據自相關圖和偏自相關圖均表現為拖尾現象適用于ARMA模型,從偏自相關圖中可見在5%的顯著水平下,偏自相關系數顯著不為0的個數為3,之后趨于0,并呈現拖尾現象,故判斷p值取3或2(取2主要是因為最后一個顯著超過0的階數是由于偶然出現的,確定p值時需要剔出); 從自相關圖中可看出在5%的顯著水平下,自相關系數顯著為零的個數為6,故判斷q值取6或5(取5主要是最后一個顯著超過0的系數是由于偶然出現的,確定p值時需要剔出)。利用SPSS建立ARIMA模型,經過前期的預測對比分析,根據SPSS中輸出的模型統計量表格中的BlC值確定最佳模型。一般來講,選取BIC達到最小的模型為最佳模型。
經過前期數據處理與分析,模型可初定為ARIMA (3,1,6)、ARIMA (3,1,5)、ARIMA (2,1,6)ARIMA(2,1,5)。用SPSS軟件作擬合圖比較4種模型擬合(如圖5),檢驗選擇模型的準確性。根據BIC定階準則選出最優模型,如表1??芍P虯RIMA(2,1,5)BIC值最小,其值為11.654。

圖5 4種模型擬合

表1 4種模型BIC比較
由于預測準確度分析的年份為2011~2015年,ARIMA(2,1,5)的預測趨勢跟觀察值的走勢基本一致,而其他3個模型的預測趨勢都偏離了觀察值的走勢,所以ARIMA (2,1,5)的擬合效果最好。同時,ARIMA(2,1,5)模型的BIC值最小,可選取此模型作為最后的預測模型。
對殘差序列進行白噪聲檢驗,根據SPSS中輸出的模型統計量表來看,ARIMA(2,l,5)模型的Ljung-Box統計量Q=7.734。p值為0.737顯著大于0.05的檢驗水平,即接受Ljung-Box的原假設:所有數據之間相互獨立,可認為殘差序列為白噪聲序列[9]。
模型殘差序列的自相關系數與偏自相關系數的分布在以0為中心的范圍內,并且自相關系數與偏自相關系數的絕對值均小于0.3(如圖6),認為此殘差序列之間是相互獨立的,意味著殘差序列是白噪聲的。模型涵蓋了所有的信息,說明此模型效果較好。

圖6 殘差序列自相關和偏自相關
綜上,ARIMA(2,1,5)符合BIC準則,通過了擬合度檢驗與白噪聲檢驗,因此可以用ARIMA(2,1,5)對降雨量進行預測。表明濟南市2010~2015年降雨量預測同樣適用ARIMA(2,1,5)預測。
本次選擇了ARIMA(2,1,5),利用濟南市1959~2010年的降雨量數據,對該地區2011~2015年的降雨量進行預測,如表2、表3、表4。

表2 ARIMA預測值與實際值統計 單位:mm

表3 ARIMA預測值與實際值統計 單位:mm

表4 ARIMA的預測值與實際值統計 單位:mm
從表2、表3和表4看出,ARIMA模型預測年限為4年。表2中2011~2015年的平均相對誤差為5.74%,預測精度控制在10%以內;2014年以后,預測精度大于10%。表3中2010~2015年平均相對誤差4.9%,預測精度控制在10%以內;2015年預測精度大于10%。表4中2010~2013年平均相對誤差為2.2%,預測精度控制在10%以內,其中2010年和2013年的預測精度為1.0%,逼近實際觀測值,預報準確。由此推測,ARIMA模型對降雨量的預測在連續的4~5年內對降雨量的預測非常準確。
同樣方法,在SPSS軟件分析預測選項中對2016~2020年降雨量進行預測,如表5。

表5 2016~2020年降雨量預測值 單位:mm
2016~2020年濟南市的降雨量較平穩,波動較小,大多分布在濟南市的平均降雨量672.8mm周圍。預測結果看出,濟南市2016~2020年不會發生較大洪水,但ARIMA模型預測降雨量不一定準確,因降雨量受較多因素影響,僅憑時間序列是不能完全準確的預測降雨量。
通過模型確定,綜合1959~2015年的降雨量數據,時間序列,如圖7。從圖7可看出,1959~1991年30多年內,這段時期內降雨量波動較大,而1992~2015年,這段時期內降雨量波動較小;從大趨勢來看,濟南市降雨量逐漸減少。
2016~2020年降雨量進行預測,結果表明,這5年濟南市降雨量波動較小,大多在650mm上下波動,預計接未來5年沒有大的旱災和洪災。

圖7 1959~2015年降雨量序列
從原理來看,ARIMA模型具有一定的數理統計意義,即ARIMA模型具有偶然性,且這種偶然性會隨著預測時間長短變化而變化,可能會隨著時限增加而這種偶然性出現的頻率增加,同時也有可能隨著預測時限的縮短而增長(預測時限越短,其預測準確度會有一定提高)。
(1)用ARIMA模型對濟南市未來5年的年降雨量進行預測,其結果顯示未來5年的年平均降雨量為659.2mm,這 與1959~2015年的多年平均降雨量672.8mm較為接近,說明濟南市未來5年出現干旱及洪澇災害的可能性較小。
(2)濟南市降雨量的變化呈現出一個逐漸減小的趨勢,說明濟南市地下水的大氣降雨補給量將會出現下降趨勢,需要更加合理地利用和分配水資源。
(3)由于影響一個地區降雨量的因素很多,諸如地區緯度的差異,氣溫變化、所處地理位置、生態環境的因素(植被的覆蓋率,流域的分布狀況)[10],以及人為影響因素等,所以只用時間序列分析方法來預測降雨量的效果較差,需考慮多方面的因素,綜合現有的預測模型,建立適合當地的降雨量預測模型,從而使得降雨量預測更為可靠。