王京晶,徐宗學,趙 剛,李 鵬,葉陳雷,宋蘇林
(1.北京師范大學水科學研究院,北京 100875;2.城市水循環與海綿城市技術北京市重點實驗室,北京 100875;3.布里斯托大學地理科學學院,英國 布里斯托 BS8 1TH;4.濟南市水文局,山東 濟南 250014)
隨著城市化的快速推進,由暴雨引起的城市洪澇災害問題日益突出[1-2]。城市化進程的不斷加快使得城市地表硬質化率越來越高、匯流時間縮短、洪水峰高量大;而隨著城市建筑群的擴張,暴雨云團在城市區域面臨的阻礙作用更加明顯,云團的移動更加滯后緩慢,短歷時強降雨現象愈加頻發,上述種種變化也使得城市區域在遭遇暴雨時更加脆弱[3-5]。因此,如何精確模擬城市雨洪過程并做出精準預警預報對政府相關部門防災減災決策至關重要。
水文過程是一個受多因素(氣象、下墊面特征、地形、人類活動)影響的復雜系統過程,而水文模型是人們通過一系列數理方程描述概化這一過程的工具,由于人為主觀構建模型及對水文過程機理客觀認識不足使得模型存在較強的不確定性,進而影響模擬精度[3,6-7]。城市雨洪模型是眾多水文模型中的一個重要分支,它能模擬城市雨洪過程并進行預警預報[7]。城市雨洪模型的發展經歷了經驗性模型、概念性模型、物理性模型等3個階段,比較著名的模型有SWMM(storm water management model)、InfoWorks、MIKE系列等模型,其中SWMM模型相較于其他模型具有開源免費、易操作等優點,成為應用最為廣泛的城市雨洪模型之一[7-8]。
參數優化是模型模擬中的一個重要環節,傳統參數優化方法基本思想是認為構建的模型只有一組最優參數組合。由于參數優化思想本身的缺陷,應用最優參數組合進行模擬預測很難保證模型應用效果與預測結果的可信度[9]。不確定性分析方法的發展提升了人們對參數優化體系的認知高度,其認為通過統計學手段優選提取的各參數組合的模擬結果均具有良好的可信度,避免了單一參數組合帶來的洪水預警預報風險[9-10]。GLUE(generalized likelihood uncertainty estimation)方法是應用較為廣泛的水文模型參數不確定性分析方法,可生成模型參數的后驗分布范圍,并通過設置一定的似然度進而輸出模型結果不確定性范圍[10-11]。目前不確定性分析的相關研究主要聚焦于對降水輸入、模型參數誤差等因素的分析,而從模型校驗數據的角度探究數據誤差對水文預報及模擬結果的不確定性分析的相關案例較少[12]。流量序列因其良好的長序列連續監測獲取等特點,成為現階段最常見的水文模型校驗數據依據[9,12]。流量序列是影響水文模型模擬效果的重要因素之一,選擇合適可靠的流量序列作為模型校驗數據至關重要。盡管目前在水文模擬中,大多數理論默認實測流量數據是真實有效的,可直接用于模型率定,但根據劉松等[12]的研究,流量數據因流域水文要素異質性及監測水平等因素限制,可能存在較大的誤差與不確定性。濟南市主城區流域由于其特殊的地形地貌和地質構造,降水引發的山洪極易由南向北宣泄至城區形成內澇,且流域內地下水極易出露地表形成泉水進入河道,成為河道基流的重要組分來源[13];流域出口斷面洪峰流量中基流占比一般可達10%以上,此時基流的存在可能對直接使用流量序列校驗模型的可靠性產生較大影響,不可忽視。因此,在模擬城市雨洪過程時,考慮校驗數據即實測流量序列誤差對模擬結果的影響尤為重要。
本文選擇典型高度城鎮化的濟南市主城區流域為研究對象構建SWMM模型,應用GLUE方法探討基流分割前后流量序列校驗模型對模擬結果不確定性的影響,以期為濟南市主城區流域洪水預報與制定防洪減災方案提供參考。
濟南市位于山東省中西部,主城區流域涵蓋濟南市大部分城區(36°33′N~36°45′N,116°47′E~117°7′E),流域面積約320 km2。流域雨熱同期,降水具有明顯的季節性特征,7—8月的降水可達到全年降水量的一半以上,多年平均降水量約為 650 mm[14-16];流域降水時空變化較大,且流域地形南高北低,整體坡度大,排澇主要依靠設計標準較低與排澇能力有限的城區老舊排水系統,在應對短歷時強降雨事件時極易形成“南洪北澇”“馬路行洪”等現象[13-14]。流域內設有5座雨量站,且唯一出口斷面設有黃臺橋水文站。流域水系成羽系狀,隸屬于小清河水系,小清河是流域唯一排水通道,肩負防洪排澇重任[13-14]。流域大部分區域位于濟南城市水系地下水排泄區,地表地下水交換復雜頻繁,南部山區的地下水下泄至北部的城區遇透水性弱的擋水隔板阻礙極易出露地表成為泉水,形成百泉爭涌的獨特景觀現象并最終排放至河道,因此濟南別稱“泉城”[13]。濟南主城區流域水系及站點見圖1。

圖1 濟南主城區流域概況
考慮到2010年以后城市下墊面變化劇烈,水文資料一致性較差,為便于分析,假設2005—2010年下墊面未發生變化,并選取其中7場暴雨洪水資料用于模型率定與驗證。選擇東紅廟、黃臺橋、興隆、燕子山、劉家莊等5座雨量站的降水數據通過泰森多邊形雨量分配計算后用作模型輸入數據,流域出口黃臺橋水文站的流量序列作為模型校驗數據;其中,20050730、20050915、20060803與20070809等4場洪水數據用于模型率定,20080717、20090616與20100819等3場洪水數據用于模型驗證。部分河道、管網資料由濟南市水文局提供。
SWMM模型是由美國環保署開發的城市雨洪模型,主要用于模擬城市雨洪過程[14,17-18],目前最新版本為2020年7月20日更新的SWMM 5.1.015版。模型可動態模擬城市雨洪過程中場次或長時間序列的水文/水質過程,其計算過程主要分為地表產流、地表匯流、河道/管網匯流3部分[17,19]。本文選用適用于城鎮化程度較高區域的Horton法計算地表產流;模型應用非線性水庫法,聯立曼寧方程和連續性方程來求解地表匯流;河道/管網匯流計算主要通過求解圣維南方程組實現,本文采用應用較為廣泛且穩定性較強的運動波法進行計算[17,19]。經概化后,模型由100個河道和排水管網控制的子匯水區構建而成,涵蓋1 800個排水節點。
SWMM模型參數眾多,依據現有資料直接確定部分參數取值,對于不能直接確定的參數值,通過參考相關文獻及SWMM模型用戶手冊確定其取值范圍,再通過模型參數優化進行調整[14-15,17,19]。
GLUE方法是一種應用較為廣泛的水文模型參數不確定性估計方法,其核心思想是認為不同參數組合在同一評價指標約束下可達到相同模擬效果,即不認為只有唯一一組模型參數能夠使模型模擬達到最優效果[9-11,20];并認為達到一定似然度的參數組合的模擬結果都是有效的,且精度評價指標越高或越低(高或低由似然函數而定),似然度越大,其置信度也就越高[12,20-21]。
GLUE方法計算的主要步驟如下:①確定模型參數范圍及先驗分布形式,通過隨機采樣方式抽取一定數量參數組合代入模型中運算得到模擬結果;②定義似然函數,計算模擬值與實測值的擬合程度,即似然度;③設置似然度閾值,篩選出有效參數組合,高于閾值的參數組合視為無效,似然值權重賦值為0,對低于閾值的參數組合似然值則進行歸一化處理,即可得到似然函數或參數空間分布概率密度;④依據似然值大小排序,估算一定置信區間的不確定性范圍,一般取累積概率密度分布圖的5%和95%置信區間作為洪水預報不確定性范圍的上下界限,得到參數后驗分布,并進行不確定性分析[10,22-23]。
相比于傳統水文預報不確定性分析的經典貝葉斯方法如SCEM-UA、MCMC方法,GLUE方法的表現則更加靈活,可主觀選擇似然函數與似然度閾值量化模型不確定性,具有較強的適用性[22,24]。
似然函數的選擇在不確定性分析中至關重要,它是用來篩選參數組合優劣集并評估模型模擬效果的重要參考[11,20]。本文選用均方根誤差(RMSE)作為模擬效果評價指標。
根據相關文獻[12,25-26],選取區間覆蓋率CR、區間平均寬度RB、平均偏移幅度D和平均對稱度S這4個指標來評價模擬結果不確定性區間的優良性,計算公式為
(1)
(2)
(3)
(4)
式中:m為落在置信區間內的實測流量數據點數;n為實測流量數據點總數;Qi0、Qi1、Qi2分別為第i個流量實測值和模擬流量置信區間上下邊界值,m3/s。
通常認為,在同樣置信水平下,實測值區間覆蓋率CR越高,越接近于100%,表明模擬值越接近實測值,模擬效果也就越好。區間平均寬度RB越小,預報區間的不確定性也就越小。平均偏移幅度D和平均對稱度S是衡量預報區間對稱度的指標,D和S越小,說明預測區間的偏移幅度越小,對稱性越好,模擬效果可靠性就越高。
基流一般是指河道中來源于地下水的延遲補給徑流,是枯水期河道徑流的主要組分[27-28]。泉水是濟南市區河道的“活水”之源,對整個濟南城市水系水生態功能保護具有十分重要的意義,在百泉爭涌的主城區流域,地下水是基流主要來源,同時也存在人類活動用水的排放(這部分徑流量雖較小,但實質并非基流,本文為計算便捷,統一將其劃歸為基流),基流占洪峰流量的比例較大(可能超過20%),對濟南市水文過程模擬和流域產匯流計算影響較大[13,27-28]。因此,本文嘗試從不確定性分析角度探索基流分割對城市雨洪模擬不確定性的影響。
根據研究區地表地下水交互頻繁、包氣帶較厚等水文地質特征選取傳統且適用性較強的水平分割法來進行基流分割,其分割方法如下:繪制洪水流量過程線,過程線中流量最低值為基流值,并藉此劃分水平基準線,基準線以下流量即為基流,以上流量為暴雨過程產生的徑流量[28-29]。因城市雨洪過程的復雜變異性,所以每次模擬洪水過程前需重新分割基流。
為獲取代表性更強的參數集,本文利用改進的蒙特卡羅法,即拉丁超立方采樣法獲取1萬組參數組合,并運行模型模擬各暴雨場次洪水流量過程[30]。將RMSE設為似然函數,將25 m3/s設為似然函數閾值,并根據有效參數組合的模擬結果,歸一化處理其似然值,計算累積概率分布函數(cumulative distribution function,CDF)。
7場洪水資料的基流分割結果見表1,基流占洪峰流量比例均超過10%,但變化不大,基本在10%~20%之間波動,均值為13.38%。圖2中灰色區域表示1萬組參數產生的流量過程模擬總不確定性區間,兩組流量序列在總不確定性區間的覆蓋率CR分別為61.23%和95.65%,基流分割后流量序列基本覆蓋在區間內,覆蓋效果良好,但原始流量序列的覆蓋率相對較小,圖2可清晰看出未覆蓋的點主要集中在峰后流量過程,表明無論如何調節參數,這部分流量過程的模擬效果始終較差,原始流量序列作為模型校驗數據的可靠性有待進一步考證。

圖2 洪水流量過程線

表1 7場洪水基流分割結果
出現上述現象的原因可能是,原始流量中基流占比較大,基流一般是河道中常年存在且較為穩定的流量,與暴雨并無直接關系。直接使用原始流量作為模型校驗數據,忽略了流量中并非來源于場次降水的基流組分,顯著增大了雨洪模擬的不確定性。從模型結構來看,城市雨洪模型較傳統水文模型有所不同,模擬時長較短,一般用于場次暴雨洪水模擬,且主要刻畫暴雨前后短時間水文過程,很難考慮基流在模擬中的影響[18-19]。主城區流域屬濟南市地下水系排泄區,泉水成為城市河道基流的主要水源,獨特的水文地質特征使得濟南市河道流量中基流占比相對較高,豐沛的泉水增強了基流對模擬效果的影響[13]。因此,當使用流量序列作為雨洪模型校驗數據時,基流的存在不可忽視,有必要對流量序列進行基流分割。
圖3是以基流分割前后兩組流量序列為模型校驗數據,所有參數集模擬流量過程的似然函數累積概率密度分布圖。從圖3可以明顯看出,基流分割后流量序列概率密度值始終位于原始流量序列上方,兩組流量序列計算的RMSE值低于閾值25 m3/s的有效參數組合數分別為284組和2 494組,最小值分別為19.15 m3/s與13.70 m3/s。基流分割后流量序列計算的RMSE主要集中在15~40 m3/s之間,原始流量序列的計算值主要集中在20~55 m3/s之間。不論是RMSE最小值,還是有效參數組合數,應用基流分割后流量序列作為校驗數據的模型模擬效果明顯優于原始流量序列,基流的存在對模型校驗的影響較為明顯。

圖3 似然函數累積概率密度分布
圖4為1萬組參數組模擬結果似然值散點圖,可以清晰地看出兩組流量序列的低似然值區,同時存在多組等效參數組合,表明GLUE方法能夠很好地解釋“異參同效”現象,即對同一評價指標而言,可存在多組參數組合的模擬效果一致。在預警預報中,同時使用多組有效參數組合模擬洪水過程并進行分析討論,能夠有效規避傳統思想認為的有且僅有一組“最優參數組合”帶來的預報風險,使模型具有更強的穩健性[26]。兩組流量序列計算的RMSE也存在明顯差異,原始流量序列計算的RMSE不確定性范圍更加離散,且RMSE總體大于基流分割后的流量序列。上述現象表明,當應用流量序列校驗模型時,基流分割能夠明顯收斂模擬結果的不確定性,并提高模擬精度。基流分割后流量序列具有較強的可靠性,可作為城市雨洪模擬的校驗數據。

圖4 1萬組參數組模擬結果似然值散點圖
似然函數RMSE高于閾值的參數組合不能有效反映流域水文特征,將其似然值統一設為0。低于閾值的參數組合,重新歸一化處理其似然值,并按照大小進行排序,求出一定置信度下的模擬預報不確定性區間。本文將置信度設為90%,模擬結果如圖5所示。
由圖5可知,原始流量序列趨勢與90%置信區間基本一致,基流分割后流量序列落入90%置信區間點數明顯高于原始流量序列,且大部分實測流量值落入置信區間內,表明本文構建的SWMM模型在主城區流域模擬城市雨洪過程效果較好。由圖5(a)可以明顯看出,大部分峰后流量過程依舊落在90%置信區間之外,而通過基流分割后(圖5(b)),峰后流量過程基本落在90%置信區間內,模擬效果明顯提升。表明基流的存在明顯增大了模擬結果的不確定性,且基流的存在對峰后流量過程模擬影響較大。

(a)原始流量序列
兩組流量序列置信區間估計評價結果如表2所示,可以看出,基流分割后流量序列實測值區間覆蓋率CR高達68.12%,較原始流量增大100%,但區間平均寬度RB明顯高于原始流量序列,增大了0.58,隨著CR增長RB也呈增長趨勢,這個結論與Xiong等[25-26]的結論一致。在對稱性方面,基流分割后流量序列不確定性區間計算的平均偏移幅度D和平均對稱度S明顯低于原始流量序列,平均偏移幅度和平均對稱度分別減小了42.60%和87.19%,不確定性區間對稱性明顯提高。綜合分析4項指標可知,在同等置信度下,基流分割后流量序列的預測不確定性區間覆蓋率與對稱性明顯優于原始流量序列,且不確定性區間的性能更加優良,可靠性更高。

表2 不確定性區間評價結果
a.在濟南市主城區流域,當使用流域出口流量序列校驗雨洪模型時,7場洪水基流占洪峰流量的比例較大,均超過10%。基流分割前后流量序列在模擬結果總不確定性區間覆蓋率分別為61.23%和95.65%,基流的存在對城市雨洪模擬影響較大,特別是對峰后流量過程模擬的影響最明顯,原始流量序列作為模型校驗數據的可靠性較差。
b.應用原始流量序列和基流分割后流量序列校驗模型時,1萬組參數組中滿足似然函數閾值的有效參數組合數分別為284組和2 494組,RMSE最小值分別為19.15 m3/s與13.70 m3/s。應用基流分割后流量序列作為校驗數據的模擬效果明顯優于原始流量序列,且似然值分布區間更加集中,即基流分割后流量序列作為模型校驗數據的可靠性更強。
c.相較于原始流量序列,使用基流分割后流量序列模擬的流量90%置信區間覆蓋率增大100%,平均偏移幅度和平均對稱度分別減小42.60%和87.19%,使用基流分割后的流量數據校驗模型,能夠有效降低流量序列導致的模擬結果不確定性,可提供更精確對稱的流量預報區間。