霍麗峰
(晉中市水文水資源勘測分局,山西 晉中 030600)
我國目前國內人均水資源僅為世界人均水平的不到30%,全國用水緊張是近幾年制約國內經濟發展的重要因素之一[1-2]。降雨是補給地表水資源的主要途徑之一,掌握降雨的一般規律,對國內水資源管理有著重要的意義[3]。在水文預報中,將預見期為3~15d的降雨預報稱為中期降雨預報,而預見期在15d以上的降雨預報為長期降雨預報,目前國內對中長期降雨預報的研究較滯后,成熟度不高[4]。由于中長期降雨預報過程中涉及到的因素較多,人文、地理等因素均可能影響降雨預報的最終結果,因此找出合理的方法進行降雨預報,對國內水資源評價及防災防洪措施制定有著突出的指導意義[5]。
目前神經網絡模型由于其計算速度快,精度高,已逐漸應用到了降雨預報領域中[6]。
梁國華等[7]基于BP神經網絡模型對旬降雨進行了預報,指出BP模型模擬精度較高,但對5d以上的降雨預報模擬精度較差;劉樂等[8]基于PCA法改進了BP神經網絡模型,改進后的模型測試預報率明顯提高,較原模型提高了50%以上;丁晶等[9]基于人工神經網絡模型預報月徑流量,結果表明,人工神經網絡模型用作過渡期徑流預報可行,且效果優于多元回歸方法。
RBF神經網絡模型與BP神經網絡模型是應用較廣泛的模型,但2種模型均存在一定的問題。BP網絡模型收斂速度慢,容易陷入局部極小值,造成計算結果的不準確,RBF神經網絡模型則需要較大的數據量進行訓練,否則其精度較低[10-11],同時目前對降雨中長期預報的模型研究較少。本文基于遺傳算法,分別對RBF神經網絡模型和BP神經網絡模型進行優化,用于預報中長期降雨,同時可比較4種模型的預報精度,得出最優模型。
將遺傳算法原理應用到BP神經網絡和RBF神經網絡模型中,可分為3步:
首先,確定神經網絡計算結構,確定模型計算長度。本次降雨預報模型中,神經網絡計算結構指的是模型降雨實測數據,確定的實測數據回歸變化趨勢,系統自動形成回歸模型結構。
其次,每個個體通過自適應函數計算個體適應度值,找出最優解。基于遺傳算法中的交叉、變異處理,優化2個神經網絡的權重賦值計算,通過模型計算權重,與輸入樣本的個體適應度相乘,得出輸出結果,通過公式(1)計算每個樣本的個體適應度:
(1)
式中,Y—表樣本的個體適應度值;a—系數;Ei、Fi—第i個節點的期望輸出和預測輸出,n—樣本數量。
通過交叉、變異等處理,選擇合適的個體適應度,其中每個個體的選擇概率Pi可用下式計算,最終得出輸出層結果[12]:
(2)
最后是神經網絡預測模型的建立,通過計算每個指標樣本的個體適應度,選出最優解,通過模型自動計算每個樣本與實測值的誤差,驗證預測值是否滿足要求,若滿足則輸出最終結果。通過上述步驟,對中長期降雨進行預報。本文用遺傳算法優化BP神經網絡(GA-BP)模型和RBF神經網絡模型(GA-RBF),比較不同模型的計算精度。
本文模型模擬結果評價指標體系采用相對均方根誤差(RMSE)、相對誤差(RE)、模型效率系數(Ens)和決定系數(R2)綜合分析精度,具體公式如下:
(3)

(4)
(5)
(6)

由于評價指標過多,單一的評價指標對許多具有不同統計指標的模型進行排序或比較是很困難的,因此引入全球績效指標(GPI)對模型模擬結果進行綜合評價。在計算時需對所有指標的值都進行了縮放,以防止任何特定統計指標出現顯著影響,具體過程見文獻[13]。
GPI指數的計算公式如下:

(7)
式中,αj—常數,RMSE和RE取1,Ens和R2取-1;gj—不同指標的縮放值的中位數;yij—不同指標的尺度值。
表1為不同模型計算的中期降雨的精度對比。由表1可以看出,BP模型的計算精度總體低于RBF模型,用遺傳算法改進后的GA-RBF模型計算精度同樣高于GA-BP模型。BP模型的RMSE為0.684mm/d,而相對誤差RE達到了35.78%,綜合GPI指數來看,GPI為-0.54,其值最小,表明BP模型的精度最低;RBF模型RMSE為0.501mm/d,RE為22.17%,GPI為-0.17,較BP模型精度明顯提高;改進后的BP模型和RBF模型GPI分別達到了0.16和0.47,表明在中期降雨預報中,RBF模型的計算精度高于BP模型,GA-RBF模型計算精度高于GA-BP模型,GA-RBF模型計算精度最高,可作為降雨中期預報的模型使用。

表1 中期降雨預報計算精度對比
圖1為不同模型長期降雨預報趨勢分析對比。由圖1可以看出,不同模型模擬值與實測值的變化趨勢基本一致,均呈現開口向下的拋物線型式,降雨主要集中在了每年的3—10月的主要作物生長期,占全年降雨的68.74%左右。改進后的GA-BP模型和GA-RBF模型更接近實測曲線,BP模型曲線在第20個月的時候誤差最高,達到了27.38%,RBF模型在第20個月和第30個月的誤差較高,分別達到了26.37%和21.74%。圖中可以清晰看出,GA-BP模型和GA-RBF模型的計算精度明顯較高。
表2為不同模型計算的長期降雨的精度對比。由表2可以看出,不同模型在長期降雨預報中的精度要明顯高于中期降雨預報,BP模型、RBF模型、GA-BP模型和GA-RBF模型GPI均有了明顯提高。在長期降雨預報中,GA-BP模型和GA-RBF模型的計算精度基本一致,GA-RBF模型的計算精度略高,GPI達到了0.63,而BP模型和RBF模型的計算精度較低,GPI分別為0.27和0.35。表明在長期降雨預報中,GA-RBF模型的計算精度最高,可作為降雨長期預報的模型使用。

圖1 長期降雨預報趨勢分析

計算模型RMSE/(mm/d)RE/%EnsR2GPI指數BP模型0.48517.480.7930.7870.27GA-BP模型0.2988.670.9710.9780.51RBF模型0.40115.730.8710.8380.35GA-RBF模型0.1975.770.9760.9690.63
本文研究了降雨中長期預報的標準模型,計算結果顯示通過遺傳算法優化后的RBF神經網絡模型在降雨中長期預報中表現出了較高的精度,其全球績效指標GPI指數最高,可作為中長期降雨預報中的標準模型使用。遺傳算法通過模擬達爾文生物進化論的自然選擇和生物進化過程的計算模型,更方便了神經網絡模型選取最優解,同時貝葉斯概率原理可通過后驗分布的計算結果迭代算出模型先驗分布的計算結果,在今后的研究中可將貝葉斯原理應用于神經網絡模型中,綜合比較降雨中長期降雨預報計算精度,進一步得出標準模型。