赫淑杰,陳燕朋
(1.山東省防汛抗旱物資儲備中心,山東 濟南 250014;2.山東省濟南生態環境監測中心,山東 濟南 250100)
洪水預報作為一項重要的防洪減災非工程措施,水文模型是開展流域洪水預報研究的重要工具之一。大量實踐表明,沒有哪個模型提供的預報結果總能優于其他模型,因此可以將不同模型的預報結果進行綜合,發揮各模型的優勢,從而得到更為可靠的預報結果。貝葉斯模型平均法通過綜合多個確定性模型的模擬預報結果,充分考慮模型結構的不確定性,給出傳統的均值預報結果的同時,提供預報變量的置信區間,實現概率預報,為防洪決策提供更準確的水文水情信息。
貝葉斯模型平均法(Bayesian Model Averaging,縮寫記為BMA)是利用貝葉斯理論在處理數據的過程中考慮模型本身不確定性的統計分析方法。BMA方法主要是以各模型的后驗概率為權重,組合各模型預報值的后驗分布,從而得到預報變量更可靠的概率分布。
BMA方法中組合預報變量的概率密度函數或分布函數,不僅可以提供如常規模型一樣的確定性預報,同時也可以提供概率預報或對定值預報結果的不確定性評價,獲得更豐富的預報信息。下面介紹BMA方法。
假設y為組合預報變量,D={y1,y2,…,yT}為實測的數據資料,M={M1,M2,…,MK}為所有可能的預報模型組成的模型空間。模型空間中的哪個預報模型為最優事先并不知道,這是模型本身不確定性的表現。根據全概率定律,BMA方法的組合預報量y的后驗概率密度函數的表達式:
(1)
式(1)中:p(y/Mi,D)為已知數據D與模型Mi的條件下預報量y的后驗分布;P(Mi/D)為模型Mi的后驗概率,即已知數據D的條件下Mi為最優模型的概率。
從(1)可知,組合預報量y的后驗分布是以模型Mi的后驗概率P(Mi/D)為權重,并對模型的后驗分布p(y/Mi,D)進行加權后所得的均值。其效果屬于變權估計,即權重將隨著模型預報精度的改變而發生變化,預報精度越高的模型將被賦予越大的權重,反之亦然,從而提高組合預報模型的預報精度。
組合預報量y后驗分布的均值和方差的計算公式分別為:
(2)
(3)
對水文模型的概率預報結果進行適當的分析與評估是必不可少的。目前,洪水概率預報的評估指標還未有統一的規范。采用覆蓋率、平均偏移幅度、平均相對偏移幅度、平均帶寬、平均相對帶寬、平均不對稱度以及平均離散度共7個指標對模擬及預報效果進行評價。
貝葉斯模型平均法的預報結果以概率密度函數或分布函數的形式表示,因此其不僅可以給出傳統的均值預報結果,而且還可以實現概率預報。
基于BP神經網絡的組合預報模型(其原理介紹詳見文獻)是水文學領域發展相當成熟的一種組合預報方法,限于篇幅這里不詳細論述。
以淮河流域內的息縣、潢川、班臺至王家壩區間集水區(簡稱區間)作為研究實例。息、潢、班至王家壩區間的集水面積為7 110 km2。研究區域的數字化地圖見圖1。從息縣、潢川、班臺至王家壩區間1980—2010年的水文資料中選取12場洪水進行多模型綜合預報。在用基于BMA的洪水概率預報模型與基于BP神經網絡的組合預報模型之前,先用新安江模型和降雨徑流經驗模型分別對率定期與驗證期內洪水進行了模擬計算。

圖1 息縣、潢川、班臺至王家壩區間數字化圖
采用BMA方法將新安江模型和降雨徑流經驗模型的模擬結果進行綜合,獲得預報變量的概率分布函數,提供期望預報及置信區間預報,并對預報結果進行評估。
率定期內8場洪水的模擬結果及精度統計見表1,驗證期內4場洪水的模擬結果及精度統計見表2。

表1 率定期內BMA的模擬結果及精度統計表

表2 驗證期內BMA的模擬結果及精度統計表
BMA方法是對各成員模型模擬結果的綜合,其模擬精度的改善很大程度上依賴于各成員模型本身預報精度的提升。例如,對于“20080721”場次洪水而言,雖然新安江模型提供場次洪水的模擬洪量高于實測值,但是降雨徑流經驗模型提供場次洪水的模擬洪量偏低于實測值,且其偏低的程度要高于新安江模型模擬洪量偏高的程度,故導致基于BMA方法時,模擬該場次洪水的洪量值低于實測值。
將新安江模型、降雨徑流經驗模型的洪水預報結果作為神經網絡輸入層的輸入,輸出層的輸出結果為基于BP神經網絡的組合預報模型的預報結果。由于BP神經網絡需要足夠的訓練樣本,因此在每場洪水進行組合預報之前,需要提前取10個時段的實測、預報數據,用于預熱BP網絡。訓練樣本在每場洪水開始之前,不參與模擬精度的統計。率定期內8場洪水模擬結果及精度統計見表3,驗證期內4場洪水模擬結果及精度統計見表4。

表3 率定期內場次洪水模擬結果及精度統計表

表4 驗證期內場次洪水模擬結果及精度統計表
驗證期內場次洪水的模擬洪量偏低于實測值的原因與前面所述的基于BMA的洪水概率預報模型所提供均值預報結果偏低的原因相似,這里不再重述。
率定期與驗證期內所有場次洪水BMA方法與BP神經網絡模擬結果分別見表5、表6,兩模型誤差特征統計見表7。

表5 率定期內場次洪水BMA均值與BP神經網絡模擬結果及精度統計表

表6 驗證期內場次洪水BMA均值與BP神經網絡模擬結果及精度統計表

表7 兩模型誤差特征統計表
從表5中可知,率定期內所有場次洪水,BMA方法模擬結果的確定性系數均大于等于BP神經網絡;從洪峰相對誤差來看,兩種方法模擬結果的洪峰相對誤差均在允許誤差之內,BMA方法模擬結果的洪峰相對誤差均小于BP神經網絡;從洪量相對誤差來看,兩種方法模擬結果的洪量相對誤差均在允許誤差之內,BMA方法模擬結果的洪量相對誤差均小于BP神經網絡。
從表6可知,驗證期內場次洪水,BMA方法計算結果的確定性系數均大于等于BP神經網絡;從洪峰相對誤差來看,兩種方法模擬結果的洪峰相對誤差均在允許誤差之內,BMA方法模擬結果的洪峰相對誤差均小于BP神經網絡;從洪量相對誤差來看,兩種方法模擬結果的洪量相對誤差均在允許誤差之內,BMA方法模擬結果的洪量相對誤差均小于BP神經網絡。
從表7可知,整體上,基于BMA的洪水概率預報模型比基于BP神經網絡的組合預報模型提供的確定性系數高,因此前者的預報結果優于后者。
采用貝葉斯理論考慮模型結構的不確定性時,為得到預報變量的解析解,利用模型對各序列進行正態化變換,對變換后的結果進行線性假設,同時對參數估計、后驗分布等作了簡化處理,這些都可能影響到預報的精度。因此,在滿足預報精度的情況下,如何利用貝葉斯模型平均方法減少求解預報變量過程中的簡化處理是未來研究的方向。