鐘逸軒,廖小龍,全栩劍,易 靈,陳 艷,李媛媛,薛 嬌
(中水珠江規劃勘測設計有限公司,廣東 廣州 510610)
月徑流模擬計算對于流域中長期水文預報、水資源優化配置、流域防汛抗旱、水電站發電計劃制定等工作具有重要作用。現有月徑流模型主要可分為統計模型、水量平衡模型、人工智能模型等。統計模型以季節性自回歸模型(Seasonal Auto-Regressive model,SAR)為代表,通過建立降水量、蒸散發量以及前期月徑流與當月徑流之間的統計關系開展模擬計算[1]。水量平衡模型[2]以水量平衡原理為理論基礎,將水文循環的各變量間的關系概化為經驗公式,以實現流域月徑流模擬計算,這類模型以熊立華等[3]提出的兩參數月水量平衡模型(Two-Parameter Monthly Water Balance model,TPMWB)為代表,取得了廣泛應用驗證。人工智能模型主要基于人工神經網絡 (Artificial Neural Network,ANN)[4-5]來模擬水文氣象變量與月徑流之間的關系,從而模擬月徑流過程,近年來隨著深度學習技術的推廣普及,人工智能模型也越來越多地應用在月徑流模擬計算問題上,獲得了良好的應用效果。同時,研究表明[6-7],由于水文預報過程中始終存在著各種不確定性來源,尚無任何單個模型能夠始終具有最佳計算精度,通過對多個模型結果進行集成,能夠對各預報方案揚長避短,有效提高預報精度。
北江發源于江西省信豐縣石溪灣[8],是珠江水系的第二大支流,流域面積46 710 km2。北江干流自北向南貫穿廣東省中北部地區,全長約468 km,平均坡降約為0.26‰。北江流域地處亞熱帶季風氣候,高溫多雨濕潤,多年平均降水量約為1 736 mm,水資源較為豐富,但流域降水的年內分配較不均勻,導致徑流年內變化較大,不利于水資源開發利用。流域內主要水利樞紐工程有飛來峽水利樞紐、孟洲壩水電站、蒙里水電站、白石窯水電站、西牛水利樞紐、南水水庫、錦江水庫等,且社會經濟較為活躍,因此準確可靠的月徑流模擬計算結果對于北江流域的社會經濟發展與保障社會安定具有積極意義。然而,現有文獻針對北江流域開展的月徑流模型研究較少,缺乏對不同月徑流模型在北江流域的應用效果的分析驗證,不利于充分發揮北江流域水利工程體系的興利除害功能,亟需開展相關研究為北江水資源開發利用工作提供有效決策支持,為實現數字孿生流域建設提供幫助。
為獲取準確可靠的北江流域月徑流預報結果,本文選取北江流域坪石站、犁市站、橫石站和石角站的月徑流過程為研究對象(圖1),綜合分析對比了不同的月徑流模型的應用效果,并基于BMA方法給出了多模型集成方案。采用數據包括北江流域降水量、潛在蒸發量以及相關站點月徑流數據,時間范圍為1970—2010年,研究成果可為北江流域的月徑流模擬計算及中長期水文預報工作提供參考。

圖1 研究區域示意
季節性自回歸模型在水文預報和隨機徑流模擬中有廣泛的應用,具有模型結構簡單,計算效果良好,廣泛適用于年均降水量、月徑流量、日均流量等具有周期變化特點的非平穩隨機變量的模擬計算問題。武蘭婷等[1]利用金沙江仁里水文站的實測月徑流序列,通過建立混合SAR模型,取得了良好的模擬預報精度。孟明星等[9]基于SAR模型開展了葛洲壩水庫入庫月徑流預報,并對模型應用問題展開了討論。ZHONG等[10]基于一階SAR模型獲取了三峽水庫入庫流量隨機序列,結果表明隨機序列具有與樣本數據基本一致的統計特性。用于月徑流模擬預報的SAR模型用公式表示如下:
Qt,η=φ0,η+φ1,ηQt,η-1+…+φp,ηQt,η-p+εt,η
(1)
式中φi,η——第η月的第i個自回歸參數;Qt,η——第t年中第η月的模擬月流量;εt,η——誤差項。
已有研究結果顯示,采用一階季節性自回歸模型通常可取得良好的月徑流模擬預報效果。
兩參數月水量平衡模型由熊立華等[3]提出,該模型的輸入為降水量和蒸發皿觀測值,輸出為實際蒸發量、徑流深等[11]。TPMWB模型具有參數少且容易優化、模擬精度高等優點[12],現已廣泛應用于不同流域,如樂通潮等[11]運用兩參數月水量平衡模型對漢江流域上游地區進行了模擬驗證,計算結果具有較高的納什效率系數;陳吉琴等[13]利用模型在西漢水流域上進行模擬,模擬結果相比實測值具有較小預報誤差。兩參數月水量平衡模型的計算流程如下。
a)推算實際蒸發量E。已知月降雨量P(t)、月蒸發皿觀測值Ep的條件下,則流域實際的蒸發量由式(2)計算:
E(t)=C·Ep(t)·tanh(P(t)/Ep(t))
(2)
式中E(t)——第t個月的實際蒸發量;Ep(t)——第t個月蒸發皿觀測值;P(t)——第t個月的降雨量;C——第一個模型參數。
b)扣除蒸散發以后的土壤含水量為:
W(t)=S(t-1)+P(t)-E(t)
(3)
式中S(t)——第t個月的土壤凈含水量。
模型計算開始時需要任意給定S初值,并給定合適的模型預熱期。
c)計算月徑流量Q(t):
Q(t)=S(t)·tanh(S(t)/SC)
(4)
式中 SC——第二個模型參數。
d)更新土壤凈含水量S(t):
S(t)=S(t-1)+P(t)-E(t)-Q(t)
(5)
本研究為提升參數優化效率,基于GPU技術運行遺傳算法開展了參數優化,獲取了北江流域各水文站對應的最優模型參數C和SC。
人工神經網絡,是一種模仿生物神經網絡的結構和功能的數學模型或計算模型,可有效應對各類具有高度非線性、模糊性和不確定性的問題,近年來被廣泛應用于中長期水文預報領域。李克飛等[14]針對三峽水庫采用ANN等模型開展了逐月入庫徑流預報,為三峽水庫中長期調度提供決策支持。趙鵬雁等[15]分析對比了不同月徑流模型在瀾滄江流域中長期預報的應用效果,結果表明人工神經網絡模型具有較好的預報表現。
ANN模型通常由輸入層、隱含層和輸出層3部分組成,對于水文預報問題,通常可采用m-1-1形式的ANN模型,即模型包含m個輸入變量,1個隱含層和1個輸出變量。模型結構見圖2。本研究中,選取北江流域各水文站的上月徑流量、多年平均月蒸發能力、月降水量作為預報輸入量,則ANN模型可表示為:
Q(t) =f(Q(t-1),P(t),ET(t))
(6)
式中P(t)——第t月降水量;ET(t)——第t月對應的多年平均月蒸發能力;f(·)——ANN函數,其中隱含層響應函數采用Sigmoid函數的形式。

圖2 月徑流預報ANN模型結構示意
水文預報過程中廣泛存在著各種不確定性,由此導致預報結果與實際值之間不可避免地存在誤差,為此學者們提出采用多模型集成的方法予以解決,現有研究常采用的多模型集成方法有貝葉斯模型平均法[16-17](BMA)、集合模型輸出統計法[18-19](Ensemble Model Output Statistics,EMOS)、深度學習算法[20-21](Deep Learning,DL)等。董磊華等[22]基于BMA方法開展了水文模型不確定性分析,結果表明BMA法能夠有效降低模型不確定性,獲取更為準確的預報結果。李宏亮[23]分別采用加權平均法、神經網絡和多元線性回歸模型對漓江桂林斷面的3組中長期預報結果進行了集成,相比原預報結果精度顯著提升。趙澤謙等[24]通過NSGA-II算法對6種模型計算的漢江黃金峽水庫中長期預報結果開展集成,有效提升了預報準確性。
考慮到BMA法不僅可獲取多模型集成預報,同時可為后期開展不確定性概率預報提供支撐,本研究最終選擇BMA法獲取了上述3種月徑流預報結果的優化權重值。BMA法的本質是對實測值與各集合預報成員的條件概率分布進行加權平均,以此推求實測值的后驗分布。本文僅對其簡要介紹,具體可參考文獻[25-26]。令Q(t)代表t時刻的實測值,Fi(t)代表第i個模型第t時刻的預報值,則基于集合預報Fi(t)(i=1,2,…,m)的實測值BMA后驗分布可表示為:
(7)

特別地,當Q和Fi的邊緣分布均為正態分布時,上述條件概率分布也為正態分布,此時式(8)可改為:
(8)

式(8)即為基于正態分布的BMA概率預報的分布函數形式,其參數可通過期望最大值算法(Expection-Maximization)獲取[26]。
對于邊緣分布不服從正態分布的Q和F序列,常采用Box-Cox變換將其轉換至正態空間再進行計算[27]:

(9)
式中X——原始不服從正態分布的序列;λ——Box-Cox變換系數,可通過極大似然法確定;XN——變換后的數據序列。
在獲取BMA優化權重值的基礎上,對各模型預報結果加權平均得到多模型集成預報:
Qens(t)=∑ωi·Qi(t)
(10)
式中Qens——多模型集成預報;Qi——第i個模型的預報結果;ωi——第i個模型的優化權重值。
采用水文情報預報規范[28]中推薦的確定性系數(DC)和水文預報廣泛采用的平均相對誤差絕對值[29](MAPE)作為評價各預報模型精度的指標。DC取值越接近1,MAPE取值越接近0,表示模型預報精度越好。
DC計算方法如下:
(11)

MAPE的計算方法如下:
(12)
式中各項同前。
對北江流域坪石站、犁市站、橫石站和石角站采用不同方法開展了月徑流預報,選取1970—1997共計28年作為模型率定期,1998—2010共計13年作為模型檢驗期。表1列出了3種模型的輸入數據結構,其中,TPMWB模型考慮了流域水文循環原理,其輸入量僅需當月降水量P和蒸發量E;SAR和ANN屬于數據驅動模型,為增加模型獲取的信息量,以提高計算精度,輸入額外引入了前一個月的徑流量Q。

表1 模型輸入數據及參數優化方法
表2給出了3種月徑流預報模型在北江不同水文站率定期和檢驗期的預報精度評價結果。結果表明,本次采用的3種月徑流預報模型在北江流域各站點均具有較好的表現,率定期DC值位于0.86~0.91之間,檢驗期DC值除橫石站TPMWB模型外,均位于0.81~0.90之間,且各站不同模型預報結果均具有較小的相對水量誤差。率定期內,SAR模型和ANN模型具有相較TPMWB模型更優的DC值,其可能原因是前面2種數據驅動型模型額外使用了上一個月徑流量作為輸入,增加了預報信息量,同時相比TPMWB模型具有更多模型參數,因此率定期取得了更好的預報效果。檢驗期結果則相反,TPMWB模型在大多數站點具有更優的DC值,表明具有物理機制的水量平衡模型具有更強的泛化能力,模型穩定性更好。同時由表2結果可看出,北江流域各水文站在不同評價指標或不同模型計算時期條件下,對應的最優模型也不完全相同,充分說明北江月徑流預報存在明顯的模型不確定性,有必要采用多模型集成方法削弱模型不確定性對預報結果的影響,提高預報精度。

表2 3種月徑流預報模型精度評價結果
采用BMA法通過計算實測流量的先驗概率,并基于前述3種模型的月徑流預報結果獲取了預報值的后驗分布,進而通過似然函數得到3種模型的優化權重值。表3給出了北江流域各水文站多模型集成預報各模型的權重值。表4給出了多模型集成預報精度評價指標與單模型預報指標最佳結果對比。

表3 北江各水文站月徑流預報模型優化權重值
由表3可知,SAR模型對于坪石站、橫石站和石角站有最大權重,ANN模型對于犁市站有最大權重。由于權重越大表明該模型在率定期具有越好的預報效果,表3中的結果與表2結果基本一致,即DC值較大且MAPE較小的模型能夠獲得較大權重值。同時,通過對比表4中多模型集成預報效果與單模型最優指標可知,基于BMA法獲取優化權重對原始預報結果進行加權平均后,北江各水文站的月徑流預報確定性系數和水量誤差均有所提升,以犁市站為例,多模型集成預報的DC值不僅優于任意單一模型結果,還有效降低了預報水量誤差,率定期和檢驗期的MAPE值分別下降2.65%和4.16%。對于中長期預報而言,水量誤差大幅降低能夠顯著提升預報應用效果,因此基于BMA法加權平均的多模型集成預報能更好地為北江流域興利除害提供決策支持。

表4 北江各水文站多模型集成預報與單模型最優結果對比
為直觀展示不同模型在率定期和檢驗期的預報精度,圖3、4分別給出了率定期和檢驗期各北江流域各水文站實測月徑流與預報結果的散點圖,同時計算了二者的相關系數,限于篇幅,圖中僅展示了橫石站計算結果。由圖3、4可知,橫石站月徑流預報結果散點圖基本接近1∶1線,預報值與實測值之間相關系數ρ均位于0.9以上,具有較好的預報效果。同時,多模型集成預報在率定期和檢驗期均具有最高的相關系數,表明該方法可獲取與實測值最接近的預報結果。綜上所述,推薦將多模型集成方法用于北江流域各站點的月徑流預報。

a)SAR

a)SAR
本文以北江流域坪石站、犁市站、石角站、橫石站為研究對象開展了月徑流預報研究,分析對比了3種常用月徑流預報模型在研究區域的應用效果,并構建了基于BMA法的多模型集成方案,下面是主要研究結論和展望。
a)3種月徑流模型在研究區域均具有較好的預報精度,率定期DC值位于0.86~0.91,檢驗期基本位于0.81~0.90,同時具有較小MAPE值,表明月徑流預報具有較好的擬合精度和較小的水量誤差。其中SAR模型和ANN模型具有更優DC值,表明增加輸入信息一定程度上能夠提升預報精度,而具有物理機制的水量平衡模型TPMWB則具有較小的水量誤差和更好的泛化能力。
b)采用各站3組月徑流預報率定期成果進行BMA權重優化,結果顯示坪石站、橫石站和石角站均為SAR模型權重值最大,而犁市站ANN模型具有最大權重,充分說明BMA法對于擬合精度較高的預報方案通常能夠給出更高的優化權重值,并兼顧了不同模型的優勢互補。
c)北江流域各站多模型集成后的月徑流預報具有相較任一單模型方案更優的DC值,還能有效降低預報水量誤差,顯著降低了MAPE值,能夠為北江流域興利除害提供更為準確的中長期預報信息;同時在實際應用中,應逐步積累經驗,分析多模型集成預報精度提升的效益相比其時間和經濟成本是否具有明顯優勢,探索如何令多模型集成更好服務實際。
d)后續研究工作中,可在本文考慮模型不確定性的基礎上,進一步探討輸入不確定性和參數不確定性對北江流域月徑流預報的影響,將多模型集成方案擴充為月徑流不確定性概率預報方案,并研究中長期水文預報信息對城市防洪排澇的作用[30],以期為流域管理部門制定調度決策方案提供更加準確和全面的中長期預報支撐。