陳家輝,李 敏
(廣西西江開發投資集團有限公司,廣西 南寧 530022)
西江發源于云南省曲靖市烏蒙山余脈馬雄山東麓,全長2 214 km,集水面積約35萬km2,是我國南方最大的河流,列全國七大江河的第四位。西江素有“黃金水道”之稱,歷史悠久,源遠流長,為流域經濟發展、社會進步和人類文明作出過重要貢獻。西江船閘運行調度中心已經在西江流域聯合調度上深耕多年,實現從單級船閘應用到現在的多級多線梯級船閘的調度,后續計劃實施的船舶航程精準預調度。要做到精準預調度船舶,需要有水情方面的信息,但是西江梧州下游段枯水期的水情不能得到有效的預測,無法對行業主管和裝載貨物的船舶形成有效的指導建議。因此,準確預測河流水位水量,對船舶航行的路線以及出港配載具有重要意義。
目前,國內外諸多水文專家關注水位變化趨勢的預測方法,提出以下幾個主要模型,如基于單變量的ARIMA模型、基于多變量的多元線性回歸模型、支持向量回歸機模型、人工神經網絡模型等。然而影響水位的因素較為復雜,包括地形、降雨、支流匯入、分流、水壩及電站儲水等,考慮這些因素對水位趨勢進行預測的多變量模型將會十分復雜。時間序列分析方法則是從時間序列數據的分析中尋找其所具有的時序性和規律性,其數據本身已經為建模提供了足夠的信息,因而能夠進行簡單有效的預測[1]。ARIMA模型作為時間序列分析方法的線性預測方法,在水位預測方面取得了進展。Sabzi H Z等人在2017年提出一種用于預測美國新墨西哥州海洛因水庫月水流量的改進型ARIMA模型,實現了決定系數R2為0.97的預測效果[2]。余珍在2018年采取ARIMA模型對漢口、監利、安慶歷史水位時間序列進行預測分析,實現了逐日平均水位的預測與觀測值擬合較高的擬合度,但是汛期水位頻繁劇烈的波動在一定程度上會降低預測精度[3]。
ARIMA是用于單變量時間序列數據預測的最廣泛使用方法之一,模型結構十分簡單,只需要內生變量而不需要借助其他外生變量,特別對取值平穩時間序列的預報精度高,廣泛應用于水文預測領域。西江梧州下游段通航水位歷史數據特別是枯水期數據較為平穩,適合采用ARIMA模型進行預測。
時間序列分析理論表明,ARIMA模型是將非平穩時間序列轉化為平穩時間序列。非白噪聲時間序列{xt}通常存在周期性、長期趨勢以及隨機波動等因素,我們需要對序列進行普通差分以消除長期趨勢,以及進行季節差分以消除周期特征,從而將非平穩時間序列轉化為平穩時間序列,進而對它的滯后值以及隨機誤差項的現值和滯后值建立線性回歸的模型,即乘積季節模型:ARIMA(p,d,q)×(P,D,Q)S,其結構如下:

(1)
式中:S——周期;
{εt}——白噪聲。
Φp(B)=1-φ1B-φ2B2-…-φpBp
Θq(B)=1-θ1B-θ2B2-…θqBq
HP(B)=1-m1BS-m2B2S-…-mPBPS
LQ(B)=1-n1BS-n2B2S-…-nQBQS
上述模型中:d——普通差分的階數;
p、q——自回歸和移動平均階數;
D——季節差分階數;
P、Q——季節性自回歸和移動平均階數;
s——{xt}的季節周期[4]。
為掌握西江梧州下游段枯水期的水情,我們對西江梧州下游段梧州水文站從2019-01-01至2021-01-01每天24 h的整點水位數據進行了時間時序特征分析,研究中所有數據由梧州水文站提供。梧州水文站整點水位數據屬于季節性時間序列,采用乘積季節模型,即ARIMA(p,d,q)×(P,D,Q)S。
利用SPSS 20統計軟件,本文將2019-01-01至2020-12-31每天24 h的整點西江梧州水文站水位時間序列(以下簡稱為西江水位)作為訓練集,建立ARIMA模型,預測2021-01-01 24 h的整點水位值,以計算預測值的相對誤差來評價模型預測能力。
1.3.1 時間序列的平穩性檢驗與平穩化
繪制2019-01-01至2020-12-31每天24 h的西江水位時間序列圖(見圖1)。

圖1 西江水位時間序列圖

圖2 西江水位自相關圖
由圖1可以看出,西江梧州水文站水位數據為非平穩序列,且有較強的自相關性。通過自相關圖(見圖2)可以看出,其自相關函數都是拖尾的,也說明序列是非平穩的,季節性不明顯,可通過差分處理使序列平穩。從時序圖(見圖3)可以看出,進行2階差分后序列變化較為平穩。由自相關圖(見圖4)看出,自相關函數迅速減少,由于差分序列的ACF和PACF圖(見圖5)都是拖尾的,因此可以對原始序列構建ARIMA模型。

圖3 西江水位2階差分時間序列圖

圖4 西江水位2階差分自相關圖

圖5 西江水位2階差分偏自相關圖
1.3.2 模型建立與預測
利用SPSS 20軟件和EVIEWS 10軟件,根據前面2階差分序列自相關與偏自相關函數特征,西江梧州下游段水位整點數據適合構建ARIMA(p,d,q)×(P,D,Q)S模型,其中d=2,D=0,S=24。由于ARIMA(p,d,q)×(P,D,Q)S模型中的參數不唯一,需要利用SPSS 20軟件和EVIEWS 10軟件,不斷調整自回歸和偏自回歸的系數p、q,以及季節自回歸和季節偏自回歸的系數P、Q,找出系數均顯著且殘差是白噪聲的模型,最終得出所有合適的模型及其主要的信息準則值如表1所示。

表1 所有合適的ARIMA模型的信息準則值表
根據優先選取信息準則,從AIC值最小的角度出發對模型進行優化,以及根據模型的簡潔性原則,從上面各模型的表現可以看出模型ARIMA(1,2,14)×(1,0,2)24和ARIMA(1,2,14)×(2,0,2)24的AIC值相對比較小且比較接近,然而后者模型的階數較高,因此確定選取ARIMA(1,2,14)×(1,0,2)24模型進行擬合原始時間序列。擬合結果如表2所示,其中R的平方達到0.988,擬合程度很好。ARIMA模型參數如表3所示,差分后AR(1)系數為0.718,MA(1)、MA(2)、MA(3)、MA(14)系數分別為1.497、-0.690、0.171、0.022,季節性序列的SAR(1)系數為0.997,SMA(1)、SMA(2)的系數分別為0.909、0.072,系數顯著性檢驗的概率P-值都近似為0,全部拒絕系數為零的原假設,因此系數都顯著不為0。此外,ARIMA(1,2,14)×(1,0,2)24殘差序列的白噪聲檢驗如圖6所示。

表2 ARIMA模型擬合結果表

表3 ARIMA(1,2,14)×(1,0,2)24模型參數表

圖6 ARIMA(1,2,14)×(1,0,2)24的殘差檢驗結果示例圖
綜上分析,得原始序列{Xt}的模型結構如下:
(1-0.718B)(1-0.997B24)(1-B)2Xt=(1+1.497B-0.690B2+0.171B3)·(1+0.909B24+0.072B48)εt
(2)
式中:εt——WN(0,σ2),且?s 1.3.3 模型預測 利用ARIMA(1,2,14)×(1,0,2)24進行擬合預測,對西江梧州段2020年12月每天每小時水位進行樣本內預測,可以看到擬合效果很好(見圖7)。 圖7 西江2020年12月每h水位預測值圖 對2021-01-01 24 h整點水位進行樣本外預測(見表4),預測值的絕對誤差值均較小,平均相對誤差為1.48%,擬合效果好。 表4 2021-01-01 24 h整點水位樣本外預測值表 本文根據西江梧州水文站水文數據2階差分序列變化內較為平穩的特征,利用傳統的單變量時間序列ARIMA模型進行短期水位預測。該模型從時間序列數值本身的相關性出發,不僅能夠充分利用時間序列數值變化信息,而且能夠將其他影響因素納入模型進行考慮,把相關因素的效應關聯到時間變量中,克服相關因素的影響。通過對西江水位從2019-01-01至2020-12-31每天24 h的整點水位作為時間序列,進行建模、預測及效果評估,建立了ARIMA(1,2,14)×(1,0,2)24最優模型,平均相對誤差為1.48%。本研究表明,ARIMA模型能夠在短期內、實際降雨趨勢無較大波動時,對西江梧州下游段通航水位進行了較好的擬合預測。梧州市長洲船閘聯合調度的瓶頸問題是每年的枯水期,在兩廣交界的航道處的水深不足,航行條件較差,正值枯水期的西江水位變化趨勢較為平穩,適合應用ARIMA模型即達到根據歷史水位值較好地預測未來水位,為船閘通航主管部門進行決策提供水情信息方面的數據參考依據,以及為裝載貨物的船舶確定航行路線、出港配載等提供依據,達到提升西江水運行業運力的目的。 對水位特征進行精準建模,從而精準預測水位的變化趨勢和數值,能夠充分發揮西江黃金水道的活力,對于釋放西江航運運力,落實2030年碳達峰、2060年碳中和具有非常積極的意義。

2 結語