屈磊磊等
摘要通過對1978~2012年湞江歷年年徑流量數據分析,建立時間序列模型。在模型的建立過程中,使用SPSS軟件,對不同階數的ARIMA模型進行比較,按照最小信息量原則選擇最優模型ARIMA(4,1,0),并且使用該模型對2013~2016年徑流量進行預測。
關鍵詞時間序列分析;ARIMA;SPSS;年徑流量
中圖分類號S11文獻標識碼A文章編號0517-6611(2015)21-023-02
水文預報直接為防汛搶險、水資源的合理利用與保護、水利工程的建設和調度運行管理以及工農業生產提供服務。這是水文研究的重要內容。徑流量預測是水資源系統分析中一個很重要的內容,可以為水資源合理開發和優化利用、區域社會經濟規劃的制定提供必要的導向,尤其是對水庫合理調度的指導意義不容忽視。年徑流量的預報對于制定生產計劃、防洪、抗旱、發電、水資源的規劃管理和綜合利用有著十分重要的意義。
1時間序列模型
目前,對徑流量的預測方法有回歸分析模型[1]、人工神經網絡[2-4]、模糊數學模型[5-6]、灰色系統模型[7-8]以及時間序列模型[9-11]。但是,徑流形成固有的不確定性和復雜性使得人們對徑流過程演變認識、模擬、預測具有非唯一性,且徑流量本身存在很多不確定因素及很強的波動性,使得有些方法的預測精度往往不高。
時間序列分析屬于概率統計學科的一個重要分支,近些年得到迅速發展,其實際應用遍及自然科學、社會科學以及工程技術的諸多領域。時間序列分析的若干理論已經相當成熟,特別是對于線性平穩時間序列,其多種模型己被廣泛應用于各領域的控制和預測。
時間序列分析不通過其他變量對所觀測時間序列{Xt}的行為做結構性解釋分析,而是根據數據自身特點,為它建立一個能夠反映時間序列過去行為的模型,以幫助我們預測未來行為。
我們把具有如下結構的模型稱為自回歸移動平均模型,簡記為ARMA(p,q)。
xt=0+1xt-1+…+pxt-p+εt-θ1εt-1-…-θqεt-q
p≠0,θq≠0
E(εt)=0,Var(εt)=σ2ε,E(εtεs)=0,s≠t
Extεt=0,s<1
若0=0,則該模型被稱為中心化ARMA(p,q)模型。缺省默認條件,中心化ARMA(p,q)模型可以簡寫為xt=1xt-1+…+pxt-p+εt-θ1εt-1-…-θqεt-q。
其中,{xt}為平穩的時間序列;
{εt}為白噪聲序列;
1,2,…p,θ1,θ2,…θq為常數。
ARIMA(p,q)模型的實質就是差分運算與ARMA模型的組合。這說明任何非平穩序列只要通過適當階數的差分實現差分后平穩,就可以對差分后序列進行ARMA模型擬合。
2使用時間序列模型建模
韶關市地處粵北山區,水資源年際變化大,年內分配不均,受氣候、水文和地理條件的制約,在洪水期易產生山洪而枯水期又易出現旱災。自建國以來,韶關市旱情較嚴重的年份有1955、1963、1977、1986、2004、2009年,尤其是2001~2004年的多年連旱對韶關市經濟發展和人們的日常生活造成重大損失。
圖1為1978~2012年湞江年徑流量數據折線圖。由圖2可知,湞江歷年年徑流量稍有遞增趨勢,各階的自相關和偏自相關系數有一定的規律性,大都取負值,而非在零值附近波動。因此,對原始序列進行一階差分,對一階差分后數據做出自相關和偏自相關系數圖形。
圖3顯示一階差分后數據自相關系數拖尾,偏自相關系數可以近似看成四階截尾。因此,選擇ARIMA(2,1,0),ARIMA(3,1,0),ARIMA(4,1,0)以及ARIMA(5,1,0)模型。綜合比較模型參數,選擇較優模型。模型參數見表1。BIC準則適用于樣本數據較少的問題,目的是判斷預測目標的發展過程與哪一隨機過程最接近。具體的使用原則是在規定
范圍內選擇BIC值最小的模型。選擇ARIMA(4,1,0)建立
模型,模型參數如表2所示。
用對信息的提取是否充分來判斷模型的有效性,使用LjungBox檢驗統計量,判斷法則為當檢驗統計量的P值大于顯著性水平α時,認為殘差是白噪聲序列,否則說明殘差
序列中還殘留著相關信息,擬合模型不顯著。由表1可知,
當使用ARIMA(4,1,0)模型建模時,其LjungBox統計量的顯著性(α)為0.721,遠大于顯著性水平α(取α=0.05),可以認為殘差是白噪聲序列。進而,圖4給出建立ARIMA(4,1,0)模型之后殘差的自相關和偏自相關序列圖,基本在零值附近波動,則模型有效。
當使用ARIMA(4,1,0)模型建模時,其模型參數見表2。參數檢驗結果顯示,AR(1)、AR(2)、AR(3)、AR(4)系數均顯著。使用ARIMA(4,1,0)模型對湞江2013~2016年年徑流量進行預測,預測2013、2014、2015及2016年年徑流量分別為51.46億、58.88億、6012億以及63.09億m3。其置信上限、置信下限見表3。把歷年觀察值數據、擬合值以及預測值曲線繪制到同一個坐標軸中,如圖5所示。
3結論
通過對ARIMA模型理論的介紹和研究,對湞江年徑流量建立多個ARIMA模型。按照一定的原則,選擇較優的模型,并且對模型參數進行估計,對近4年的年徑流量做預報分析。
水文預報的方法很多,然而對于中長期預報,目前還沒有一種模型對所有的水文序列適用。預報模型的適用性至今仍是有待深入研究的問題。對于一個具體水文序列長期預報問題,往往通過對具體的數據進行分析、嘗試、檢驗等步驟,最終找到較適合的預報模型。
參考文獻
[1] 顧綺儀.長期水文統計預報方法在長江大通站徑流預報中的應用[J].應用技術,2005,3(1):42-43.
[2] 蔡煜東,許偉杰.自組織人工神經網絡在鄱陽湖年最高水位長期預報中的應用[J].水文科技情報,1993,10(2):27-29.
[3] 鐘登華,王仁超,皮鈞.水文預報時間序列神經網絡模型[J].水利學報,1995(2):69-75.
[4] 張利平,王德智,夏軍.白山水庫徑流中長期預報研究與應用[J].水電能源科學,2002(3):18-20.
[5] 陳守煜.中長期水文預報綜合分析理論模式與方法[J].水利學報,1997(8):15-32.
[6] 白子巖.模糊模式識別法在中長期預報中的應用[J].水利水電技術,1999,30(2):50-51.
[7] 謝科范.評灰色系統理論[J].系統工程,1991,9(4):49-52.
[8] 夏軍.灰色系統水文學理論方法及應用[M].武漢:華中理工大學出版社,1999:36-47.
[9] 洪時中.非線性時間序列分析的最新進展及其在地球科學中的應用前景[J].地球科學進展,1999,14(6):559.
[10] OOMS M,FRANSES P H.A seasonal periodic long memory model for monthly river flows[J].Environmental Modeling&Software,2001,16:559-569.
[11] 張小靜.函數系數自回歸模型在水文預報中的應用[D].西安:西安理工大學,2007.