丁紅翔
(云南省水文水資源局 普洱分局,云南 普洱 665000)
河流量的變化是一個(gè)水文過程,它直接影響一個(gè)地區(qū)的環(huán)境、生態(tài)、生物和氣候特征,并最終影響人類的生產(chǎn)和生活[1-2]。河流量的準(zhǔn)確預(yù)測是水資源規(guī)劃和優(yōu)化管理的重要內(nèi)容。隨著社會經(jīng)濟(jì)的發(fā)展,生產(chǎn)和生活用水量均逐年增加,水資源優(yōu)化管理的重要性和必要性也逐漸顯露。因此,可靠的河流量預(yù)測方法對于規(guī)劃合理利用水資源至關(guān)重要。
大多數(shù)預(yù)報(bào)技術(shù)是一種模擬河流系統(tǒng)自然和物理狀態(tài)的方法。近幾十年來,研究人員在預(yù)測河流流量時(shí),研究了多種類型的模型,這些模型通常可分為兩大類,即概念模型和數(shù)據(jù)驅(qū)動(dòng)模型[3-5]。概念模型需要對影響現(xiàn)象的物理過程有完整的數(shù)據(jù)和全面的認(rèn)識,這實(shí)際上是非常困難的,而且會給模擬帶來較大的誤差。因此,在實(shí)際工作中更傾向于使用數(shù)據(jù)驅(qū)動(dòng)模型。數(shù)據(jù)驅(qū)動(dòng)模型僅通過記錄水文氣象變量的數(shù)值數(shù)據(jù)進(jìn)行模擬,不需要調(diào)查和評估各階段控制河流量的物理過程[1, 6]。
研究表明,地表河流的流量往往受到降雨量和蒸發(fā)量的顯著影響[7-9]。因此,本文嘗試提出降雨量和蒸發(fā)量輔助ARIMA模型,對云南瀾滄江水系靛坑河的月平均流量進(jìn)行時(shí)間序列研究,提升對河流量的預(yù)測精度,為水資源的優(yōu)化管理和利用提供借鑒。
簡單指數(shù)平滑法(Simple exponential smoothing,SES)是一種簡單易用的時(shí)間序列預(yù)測方法,它對于短期內(nèi)的數(shù)據(jù)波動(dòng)有較好的捕捉能力,同時(shí)又保留了對長期趨勢的捕捉能力[10]。在簡單指數(shù)平滑法中,定義一個(gè)平滑因子α,來控制對過去數(shù)據(jù)的加權(quán)程度。對于每個(gè)時(shí)刻t,可用如下公式計(jì)算預(yù)測值:
Ft+1=αAt+(1-α)Ft-1
(1)
式中:Ft+1為預(yù)測值;α為平滑因子,參數(shù)值在0~1之間;At為實(shí)際數(shù)據(jù);Ft-1為前一個(gè)時(shí)間段的預(yù)測值。
由此可以看出,預(yù)測值是先驗(yàn)值或觀測值的加權(quán)平均值,其權(quán)重與收集數(shù)據(jù)的時(shí)間成反比。因此,越接近當(dāng)期時(shí)間的數(shù)據(jù),對該模型預(yù)測結(jié)果影響越為顯著。
差分整合移動(dòng)平均自回歸(Autoregressive integrated moving average,ARIMA)模型是時(shí)間序列預(yù)測分析的方法之一。ARIMA(p,d,q)是將自回歸模型、移動(dòng)平均模型和差分法結(jié)合,其公式定義為:
(2)
式中:Yi為當(dāng)前值;μ為常數(shù)項(xiàng);εi為誤差;p、q分別為自回歸模型與移動(dòng)平均模型的階數(shù);αi、βi分別為兩個(gè)模型的相關(guān)系數(shù)。
通過數(shù)據(jù)變換,可將一些外部信息作為所研究變量的參考變量。降雨和蒸發(fā)過程對地表水體具有顯著的影響,數(shù)據(jù)表現(xiàn)出一定的內(nèi)部相關(guān)性。因此,將歷年降雨量和蒸發(fā)量引入ARIMA模型,提出PEARIMA模型,以提高河流量分析和預(yù)測準(zhǔn)確性,是一種可預(yù)期的有效途徑。
簡單指數(shù)平滑模型和ARIMA模型計(jì)算均使用SPSS 26軟件實(shí)現(xiàn)。為了直觀顯示模型對數(shù)值的描述性,采用均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)等3種預(yù)測誤差度量進(jìn)行模型評估和比較。公式如下:

(3)
(4)
(5)
云南瀾滄江水系靛坑河2009年1月至2021年12月期間逐月河流量、周邊降雨量和蒸發(fā)量等歷史觀測數(shù)據(jù)見圖1。由圖1可知,河流量年際變化表現(xiàn)出一定的規(guī)律性,尤其呈現(xiàn)出具有周期性的季節(jié)變化。此外,河流量峰值通常滯后于降雨量和蒸發(fā)量,表明河流量與降雨量和蒸發(fā)量呈現(xiàn)出一定的內(nèi)在聯(lián)系。需要注意的是,2019-2020年間河流量的驟降,使數(shù)據(jù)表現(xiàn)出較為強(qiáng)烈的不確定性,這可能會增加時(shí)間序列預(yù)測的難度。

圖1 靛坑河歷年月平均流量、降雨量和蒸發(fā)量趨勢圖
為了驗(yàn)證PEARIMA在預(yù)測靛坑河歷年月平均流量的有效性,對比SES與傳統(tǒng)ARIMA方法的預(yù)測結(jié)果,見圖2和表1。

表1 擬合結(jié)果統(tǒng)計(jì)表

圖2 靛坑河歷年月平均流量分析
SES方法擬合結(jié)果顯示,RMSE、MAPE和MAE分別為4.9、32.2和3.1,對靛坑河歷年月平均流量的總體擬合程度較好,但對于2019-2020年期間發(fā)生的流量驟減現(xiàn)場擬合度欠佳,見圖2(a)。
傳統(tǒng)ARIMA的擬合結(jié)果顯示,RMSE、MAPE和MAE分別為5.2、27.5和3.0。其中,2019-2020年期間實(shí)測數(shù)據(jù)和ARIMA擬合數(shù)據(jù)對比顯示擬合精度有所提高,見圖2(b)。ARIMA模型具有一定跟蹤能力,不僅考慮到過去值對研究變量的影響,還考慮到隨機(jī)誤差項(xiàng)的影響,因此ARIMA模型總體預(yù)測結(jié)果優(yōu)于SES。但該模型對2016-2017年期間數(shù)據(jù)的擬合明顯欠佳,這可能是受到前期數(shù)年的河流量遞增趨勢的干擾。
PEARIMA模型擬合結(jié)果顯示,RMSE、MAPE和MAE均明顯降低,分別為3.7、24.4和2.4。2016-2017年期間數(shù)據(jù)擬合度相對ARIMA有所提升,擬合數(shù)據(jù)更為合理。此外,發(fā)生河流量驟減現(xiàn)象的2019-2020年數(shù)據(jù)的擬合度也顯著提升。因此,總體上PEARIMA表現(xiàn)出更好的預(yù)測性能。
本文提出結(jié)合歷年月平均降雨量和蒸發(fā)量數(shù)據(jù)輔助ARIMA模型,對靛坑河歷年月平均流量的時(shí)間序列進(jìn)行預(yù)測。結(jié)果顯示,傳統(tǒng)ARIMA模型對靛坑河歷年月平均流量的回歸擬合精度總體優(yōu)于SES,但容易受到前期數(shù)據(jù)趨勢性的影響,降低了部分預(yù)測精度。而各項(xiàng)評價(jià)指標(biāo)顯示,PEARIMA模型的回歸擬合精度均優(yōu)于SES與ARIMA模型,表現(xiàn)出令人滿意的擬合結(jié)果。因此,結(jié)合歷年月平均降雨量和蒸發(fā)量數(shù)據(jù)的PEARIMA模型,可用于河流量分析和預(yù)測工作。