章鑫 ZHANG Xin;李湘凌 LI Xiang-ling;馬征 MA Zheng
(①云南工商學院,昆明 651700;②云南城市建設職業學院,昆明 651700)
近年來天氣異常狀況頻發,根據2023 年中央氣象臺發布數據,入汛以來(截至10 月31 日),中央氣象臺共發布災害性天氣預警信號716 期,其中暴雨預警280 期,占天氣預警總數39.11%,入汛以來至10 月31 日,我國出現了35 次大范圍暴雨天氣過程,其中較強20 次、強13 次、特強2 次,今年的降雨還有著極端性強的特征。暴雨災害對我國農業生產和人民生活造成極大的損害,基于上述原因,對降水量進行精準預測尤為重要。
降雨量是對水資源有效管理、防洪減災和處理城市內出現的內澇問題預警的重要參數之一。城市降雨量的有效預測可以對因降雨量突變造成的不利問題進行有效預警,為相關部門進行決策,減小因自然因素造成的損失有著現實意義[1]。降雨量是一組時序數列,該數列具有非線性、不平穩的特點,常規預測手段對降雨量預測的難度較大,對降雨量的精準預測仍是亟待解決的問題。
降雨量是一組可挖掘的時序性數列,在不同地區的降雨具有不同的規律,這些規律分為共性規律和特性規律,只有充分挖掘降雨時序數據的內在信息才能對未來的時間段對任意地域的降雨量進行準確預測,這樣預測才會具有實際工程意義。對于搜集的降雨量數據首先分析共性特征,若降雨數據具有可預測的特點,研究才能進一步進行,根據不同的數據特點采用適應的預測模型,分別研究預測精度在全局和局部的預測體現,最終整合歸納分析模型的適用性。
降雨量數據預測的可行性分析是模型預測的基礎,根據已有數據的向外推算的關鍵步驟是確定數據是否具有時序性的判斷。若數據具有非趨勢的特點,那么對降雨的預測單一從概率的角度出發,那么預測手段的研究毫無意義。相反,若數據具有趨勢性特征,即具有時序性特點,那么數據具有可預測特點,通過進一步推斷數據的周期性和混沌性特征從而對降雨量數據進行精準預測。大量研究表明,降雨量數據具有可挖掘、可預測的特點。
現有研究情況表明,ARIMA 模型(整合自回歸移動平均法)[2]、ANN 模型(神經網絡模型)[3]、機器學習法等對小區域降雨量的預測研究有著獨特優勢。本文結合ARIMA模型和BPNN 模型對昆明市某地區降雨量進行預測,并將預測數據進行對比,分析了ARIMA 模型,BPNN 模型的優劣性。
降雨量關乎我國經濟發展,對農業、城市建設、工程實施有著重要的影響,對地區降雨量數據進行收集處理,并應用現代預測手段對未來的降雨趨勢和數據進行有效預測,可為我國生產和經濟活動做出良好的保障,為在建設和生產過程中提供決策性依據提供了重要保障,從古至今對降雨的研究從未中斷,其中產出了多種預測方法和手段,但降雨量受到諸多因素影響(地區性氣候、地區特點、歷史數據不全),建立一種切實可行且有效的模型較為困難,所以依靠挖掘降雨量內在信息并對未來降雨量數據進行準確預測是未來的研究趨勢。因為降雨量是一種具有時間序列特征的數據,其內在特征(隨機性、周期性、季節性等)可以通過較為先進的手段獲得。目前,國內外學者通過數據驅動模型對降雨系統的非線性和非平穩性已作出了較多研究,應用較為廣泛的模型有:灰色模型、神經網絡模型、支持向量機模型等。
ARIMA 模型在1976 年被提出后,廣泛的應用于降雨量的預測中,學者針對降雨量具有時序性這一特點,對降雨量數據進行多維度的分析,很多學者應用該模型對印度、蒙古地區的降雨趨勢進行了預測,該模型所得出的結果和降雨量實際數據在趨勢方面高度擬和。本模型具有計算快捷、建模簡單、可以實現同維度多重預測等優勢,但降雨量數據具有高維度、時序復雜等特點,本方法的預測結果在趨勢方面擬和較好但在節點處擬和精度不高。
根據研究,降雨量是一維具有時間序列性的數組,ARIMA 模型表達式為[4]:
式(1)中:
d-具有時間性的數據趨于平穩時所做的差分次數;
φ1,φ2,…,φp-自回歸系數;
θ1,θ2,…,θp-移動平均系數;
P-自回歸階次;
q-移動平均階次;
{εt}-白噪聲序列數。
①AR 模型。
②MA 模型。
③ARMA 模型。
④ARIMA。
當時序數列經過一定次的差分(d 次)后趨于平穩,這時可進行計算。
隨著計算機科學的飛速發展,學者們將更多的預測手段引入到降雨量預測中,其中神經網絡模型在非線性、非平穩的時序數列預測中展現了獨有的優勢,神經網絡模型是通過模擬神經元鏈接而成,模擬了大腦神經系統處理數據的特點,該模型具有良好的非線性數據的擬和逼近能力、大縱深計算能力和網絡互通能力的特點,被廣泛的應用于降雨量的模型預測中。BPNN 神經網絡模型對青海市、上海市等地區的降雨量進行了預測,預測結果表明本方法相較于其他傳統手段具有更高的預測精度,并凸顯了季節性預報的優勢。神經網絡模型具備良好的自我學習和非線性映射的特點可以進一步挖掘降雨量時序數列的內在特征,但是本方法的網絡結構特征難以確認,參數選擇較為困難,如何選擇正確的模型參數仍是亟待解決的問題。
BPNN 神經網絡模型是通過由不關聯的神經元組成的三維度神經結構[5],輸入端的數據通過三層之間的隱含層傳遞到輸出端。
BPNN 的結構和傳輸展開,如圖1 所示。

圖1 BP 網絡拓撲結構
根據圖1 所示,隱含層、輸出層的公式可表示為:
式中:
yi-隱含層的輸出;
Ok-輸出層的輸出端;
vij-權系數,輸入層到隱含層;
wjk-權系數,隱含層到輸出層。
本文采用昆明市某地區258 個月數據作為預測樣本,其中228 個月的數據作為訓練樣本,30 個月作為對比測試數據,分別驗證ARIMA 模型和BPNN 模型的數據平穩性和預測精度。
根據圖2 的平穩性檢驗結果表明,昆明地區時序趨于平穩。

圖2 平穩性檢驗結果(KPSS 檢驗)
結合了降雨量數值的容量,筆者在1~30 的區間內,考慮了p,q 不同組合的AIC 值,結果見圖3。由圖3 可知,向上尖點處的數據為最優解,當p=11,q=20 時為最優解,此時AIC=8.0013。

圖3 昆明某地區降雨量AIC 結果
基于確定參數的ARIMA(11,0,20)模型對昆明市月度降雨量值進行預測,降雨量預測值如圖4。預測結果表明,ARIMA 模型對月度降雨量過程中,對趨勢預測方面表現良好,但對局部變化點的預測結果不佳。

圖4 昆明某地區降雨量預測結果
應用BPNN 模型對昆明市某地區的時序性降雨量數據進行建模,模型參數選取如表1 所示。

表1 BPNN 模型參數選用表
應用BPNN 模型對昆明市某地區降雨量時序系列數據進行預測,將輸出后的數據平均值作為預測結果,以RMSE(均方根誤差)、MAE(均絕對誤差)作為衡量指標,預測的結果如圖5 所示。

圖5 昆明某地區月降雨量BPNN 模型預測結果
為了綜合對比這兩種模型的預測性能,將ARIMA 模型和BPNN 模型進行對比,對比結果如圖6 所示。

圖6 ARIMA 模型、BPNN 模型預測結果對比分析
對比ARIMA 模型和BPNN 模型對昆明市某地區降雨量預測得到以下結論:
①BPNN 模型在總體降雨量趨勢預測上擬和度較高;
②對比ARIMA 模型,BPNN 模型對訓練樣本的需求量較低,在樣本不足的情況下優勢較為突出;
③對比ARIMA 模型,BPNN 模型的預測精度更高,最高預測差值僅為1.02mm,可以為降雨量預測提供良好依據。