奚立平, 蔡文慶, 吳海鷹
(1.安徽水利水電職業技術學院,安徽 合肥 231603;2.無為縣氣象局,安徽 蕪湖 238300)
無為縣地處安徽省中南部,屬亞熱帶季風氣候區,旱澇頻發,嚴重影響農業生產、社會經濟發展等,因此利用時間序列分析法,建立降水量預測數學模型,服務于生活生產,尤其在防汛抗旱、農業生產等方面具有現實需求。
降水是隨時間變化的,對其觀測形成一組有序的數據,稱為時間序列,從“時域”角度對降水進行分析,稱為時間序列分析,其基本思想是認為降水在隨時間變化過程中任一時刻的變化和前期降水變化有關,利用這種關系建立適當的模型來描述它們變化的規律性,然后利用所建立的模型做出降水未來時刻的預報值估計。平穩時間序列模型主要有3種。
(1)自回歸模型AR(p)。
Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p+at
(1)
其中,p為模型的自回歸階數;Xt為平穩、正態、零均值的時間序列;φ為不為零的模型系數,表示時間序列中要素前后時刻間相關性大小;at為白噪聲序列。
(2)移動平均模型MA(q)。
Xt=at-θ1at-1-θ2at-2-…-θqat-q
(2)
其中,q為模型的移動平均階數;Xt為平穩、正態、零均值的時間序列;θ為不為零的模型系數,表示時間序列中要素與前期時刻白噪聲間相關性大小;at為白噪聲序列。
(3)自回歸移動平均模型ARMA(p,q)。
Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p+at-θ1at-1-θ2at-2-…-θqat-q
(3)
自回歸移動平均模型ARMA(p,q)可以看成是自回歸模型AR(p)的發展,即用p階自回歸模型AR(p)描述Xt所余下無法擬合的部分,用q階移動平均模型MA(q)來描述。

圖1 無為縣年降水量序列圖

圖2 無為縣年降水量自相關系數圖

圖3 無為縣年降水量偏自相關系數圖
利用spss 23統計軟件,輸入無為縣1957~2016年年降水量資料,其序列圖如圖1所示,顯然是平穩序列。
進一步對自相關性和偏自相關性進行檢驗,結果如圖2、圖3所示,由圖可知,無為縣年降水量序列接近于白噪聲序列,反映無為縣年降水量隨機性強。
對序列進行1階和2階差分處理,其相關性仍然較弱難以建模。
為了增強序列的相關性,對降水量進行5年疊加,1957~1961年的降水量疊加作為新序列的第1個值,1958~1962年的降水量疊加作為新序列的第2個值,以此類推,得到5年疊加后的新序列,對自相關性和偏自相關性進行檢驗,結果如圖4、圖5所示,由圖可知,新序列是平穩非白噪聲序列。
由圖4、圖5可見,自相關系數在K=2之后基本都落在2倍標準差范圍內,可判斷其為自相關系數2階截尾,偏自相關系數在K=1后基本上落入2倍標準差范圍以內,可以判斷其偏自相關系數1階截尾,而自相關系數、偏自相關系數開始逐漸變化,且后邊還有接近甚至稍大于2倍標準差的,故也可以判斷其拖尾,因此,可采用MA(2)、AR(1)以及ARMA(1,2)分別進行擬合。

圖5 無為縣5年疊加降水量偏自相關系數圖
嘗試建立MA(2)模型,從模型統計量表1可知,平穩的R2=0.493,楊-博克斯統計量為32.520,伴隨概率小于0.05,反映擬合模型的殘差存在相關性,不為純隨機序列,從自相關圖和偏自相關圖如圖6所示也能看出這一點,因此,采用MA(2)建模效果較差。

表1 MA(2)模型統計量
再嘗試建立AR(1)模型,從模型統計量表2、自相關圖和偏自相關圖(圖7)可得出與上述相似的結論,因此,采用AR(1)建模效果也較差。

表2 AR(1)模型統計量

圖6無為縣5年疊加降水量MA(2)自相關系數與偏自相關系數圖

圖7 無為縣五年疊加降水量AR(1)自相關系數與偏自相關系數圖
最后,嘗試建立ARMA(1,2)模型,模型參數如表3所列,經過t檢驗,自回歸系數的伴隨概率均小于0.05,顯著非零,有統計學意義。從模型統計量表4可知,平穩的R2=0.563,楊-博克斯統計量為22.375,伴隨概率大于0.05,再結合從自相關圖和偏自相關圖(圖8)來看,反映擬合模型的殘差項不存在相關性,殘差序列為白噪聲序列,另外,采用ARMA(1,2)擬合的模型不存在離群值,模型的擬合度較好。

表3 ARMA(1,2)模型參數

表4 ARMA(1,2)模型統計量

圖8無為縣5年疊加降水量ARMA(1,2)自相關系數與偏自相關系數圖
綜上可知,擬合的模型為:
Xt=-0.742Xt-1+at+1.608at-1+0.963at-2
(4)
利用上述模型對時間序列進行模擬,用擬合值與5年疊加的實測值進行對比,結果如圖9所示。

圖9 無為縣5年疊加降水量采用ARMA(1,2)模型擬合值與實測值對比圖
由圖9可見,擬合的最大相對誤差約為11.3%,最近2年(2015、2016)的擬合值與實測值對比如表5所列,其相對誤差分別為0.30%和-6.53%,說明模型精度較高,擬合效果良好。

表5 2015、2016年5年疊加降水量的擬合值與實測值比較

表6 5年疊加降水量預測
利用模型對未來的值進行預測,2017、2018、2019年的預測值如表6所列。2017年至2019年的疊加降水量呈下降趨勢。需要說明的是,由于分析的序列是5年降水的疊加值,所以擬合模型計算出的預測值不是某一年的降水量,而是5年累計的降水量。
由于無為縣降水量隨機性強,相關性弱,即使進行1階和2階差分處理,其相關性仍然較弱,因此采用五年疊加的方法增強序列的相關性,得到平穩的新序列。
根據自相關系數、偏自相關系數判斷,新序列可能存在MA(2)、AR(1)以及ARMA(1,2)3種模型。其中MA(2)和AR(1)模型的伴隨概率均小于0.05,從自相關圖和偏自相關圖,可以看出2種模型的殘差序列為非白噪聲序列,不采用。ARMA(1,2)模型的擬合度較好、符合要求,是選定的模型。
ARMA(1,2)模型的預測表明,無為縣5年疊加降水量自2017年至2019年處于下降通道。
[參考文獻]
[1] 孫明璽,吳俊卿,張志興,等.實用預測方法與案例分析[M].北京:科學技術文獻出版社,1993.
[2] 黃嘉佑.氣象統計分析與預報方法(第4版)[M].北京:氣象出版社,2016.
[3] 薛冬梅. ARIMA模型及其在時間序列分析中的應用[J].吉林化工學院學報,2010,(3):80-83.
[4] 何延治.基于時間序列分析的吉林省糧食產量預測模型[J].江蘇農業科學,2014,(10):478-479.