汗克孜·吐爾遜
(新疆維吾爾自治區(qū)水文局 水文實驗站,烏魯木齊 830049)
基于GLUE方法的TOPMODEL模型參數的不確定性分析水文過程是個隨機過程[1]。TOPMODEL 自提出以來,受到廣大學者的青睞,被廣泛應用于許多地區(qū),不僅適用于濕潤半濕潤地區(qū),同時也適用于干旱半干旱地區(qū)[2]。陳仁升等將 TOPMODEL 模型的DEM 分辨率拓展到 1 500 m*1 500 m,應用于中國西北干旱區(qū)內陸河黑河流域上模擬徑流,模擬過程也分別以日和月為步長,日徑流模擬結果在 DEM 分辨率較粗的情況下,模型有一個較長時間的土壤含水量調整期,之后模擬效果較好,尤其是枯水徑流[3-4]。倪用鑫等將TOPMODEL 應用于黃河中游干旱半干旱地區(qū)大尺度流域,獲得的3項模擬精度指標表明 TOPMODEL 模型在率定期和驗證期的模擬精度都比較高,確定性系數在 0.7~0.9 左右,說明該模型可以應用于干旱半干旱地區(qū)大尺度流域[5]。
GLUE是基于給定模型和給定參數集的條件下運行,所以GLUE認同在水文模型的參數率定過程中不同的參數組合(隨機選擇于特定的參數集分布中)的等效性或者近似等效性[6]。對預測值與觀測值進行比較,每一組參數組合計算出一個似然值,當所選擇的參數集不能反映系統(tǒng)的特性時,似然值應為零。“似然”這個詞不是嚴格意義上的最大似然估計,而是基于置信度、模糊論、概率等考慮了模型如何服從系統(tǒng)的觀測行為[7],是一種基于正態(tài)分布(均值為零)誤差下的特殊假定。
某河流為黃河二級、渭河一級支流,發(fā)源于陜西定邊縣白于山南麓的草梁山,全長680.3 km,流域面積2.69×104km2,在陜西省境內的流域面積達到2.45×104km2,流域面積平均寬度80 km,地形破碎,溝壑縱橫,屬黃土高原丘陵溝壑區(qū),呈明顯的條帶型。某流域地貌類型主要分為4類,丘陵溝壑區(qū)、丘陵林區(qū)、階地區(qū)及高原溝壑區(qū),分別占流域總面積的40%、31%、16%及13%。丘陵溝壑區(qū)內地形溝壑縱橫,水土流失現象嚴重,是該流域泥沙的主要來源區(qū)。丘陵林區(qū)植被茂密,水土流失較少。階地區(qū)水利化程度高,農業(yè)生產發(fā)達。高原溝壑區(qū)地勢平坦,由于水源缺乏補給,多為旱作農業(yè)[7]。
本文將GLUE算法應用到TOPMODEL模型中,可以對模型結果中5個子流域的1號子流域進行模型參數分析,子流域模型見圖1,模型參數見表1。應用GLUE算法和Morris篩選法分析參數后驗分布及參數敏感性情況,對由模型參數引起的模型輸出不確定性進行估計。

圖1 子流域編碼

表1 模型參數
似然函數值的作用是判斷實測數據與模擬結果的吻合程度。本文選取Nash效率系數作為似然函數,計算公式為:

TOPMODEL模型的參數分布區(qū)間見表2,各參數的先驗分布采用均勻分布。

表2 參數的取值范圍
模型參數的敏感性分析的目的在于分離出敏感性參數和非敏感性參數,減少機時,進而提高參數優(yōu)選效率及檢驗參數之間的相互作用。本文采用Morris參數篩選法分析TOPMODEL模型參數的敏感性。
Morris參數篩選法是一種定性的全局敏感性分析方法,通常對輸出結果的相應變化進行評估。其中,敏感度可分為4個等級,見表3。

表3 敏感性分類
采用Morris參數篩選法分析某流域TOPMODEL模型參數的敏感度如表4和5所示。

表4 TOPMODEL模型參數敏感度

表5 參數敏感度分類
利用GLUE方法對模型參數進行敏感性檢驗,見圖2。從圖2可以看出,Rv、SRmax、CHv在參數變化范圍中敏感,而其余3個參數的散點分布圖則顯示其在參數的允許范圍內變化的不明顯。這一結果與Morris參數篩選法分析相一致,所以參數Rv、SRmax和CHv為敏感參數。

圖2 各參數散點分布圖
對本文選定的Rv、SRmax、CHv參數進行不確定性分析,首先由GLUE方法結合MCMC方法隨機獲取10 000組參數,似然函數值的閾值設定為0.7,選擇高于此閾值的所有參數組(有效參數組)進行計算,按照似然值的大小進行排序,并設置信水平為90%(置信度上限95%,下限5%),計算徑流模擬值的不確定性區(qū)間。見表6。

表6 參數后驗證分布
表6中的最小值和最大值與表2的參數搜索范圍基本一致,說明參數空間得到了有效的搜索。
圖3為通過采用GLUE方法抽樣得到的某流域TOPMODEL模型Rv、SRmax和CHv參數的邊緣分布。

圖3 各參數邊緣后驗分布直方圖
由圖3可以看出,在每個時刻所對應的縱坐標表示參數值落在該刻度和前一刻度值之間的概率。而由圖2可以看出,其中Rv、SRmax和CHv都呈現不均勻分布,均有較大的不確定性。
由于模型存在很強的“異參同效”現象,雖然通過GLUE方法得到了模型參數Rv、SRmax和CHv的邊緣后驗分布,但在實際的水文預報過程中,真正有意義的不是單個參數,而是模型參數的組合。采用GLUE方法達到收斂以后抽取的420組有效參數組樣本分別對歷史數據進行模擬,對應可以分別生成420組模擬流量數據,再根據這些數據求出該時段的流量分布函數,并求得該分布5%和95%的分位數作為水文預報的90%置信度不確定性區(qū)間。見圖4。

圖4 某流域徑流不確定性范圍
圖4為模型模擬某流域1960-1977年數據的不確定性范圍,給出了1960-1977年某流域實測流量過程以及水文預報90%置信度下的不確定性區(qū)間。由圖4可以看出,大部分時段的實測流量都落在90%置信區(qū)間之內,有一部分通過實測的流量數據沒有落在90%的置信區(qū)間中,所以并不能完全模擬流域的流量過程。但不確定性范圍基本包含了實測流量過程的多數,模型結構本身的誤差所產生不確定性影響都是在可接受范圍之內,說明TOPMODEL模型在某流域的應用是可行的。因此,采用本文提出的GLUE方法對某流域TOPMODEL模型參數進行不確定性分析是可行的。
另外,某些時段的實測徑流位于置信區(qū)間之外,其原因有可能來自于以下幾點:①模型結構。雖然在TOPMODEL模型的產匯流計算中考慮了不同地形分布的影響,但產匯流模式是基于地形指數統(tǒng)計曲線來計算的;②面雨量。模型忽略了降雨分布不均帶來的影響,只是將點雨量數據換算成面雨量作為模型的輸入資料;③Monte Carlo參數的取樣。雖然Monte Carlo方法在一定程度上克服了尋優(yōu)方法的某些缺點,但對于多參數的水文模型,參數的不同組合需要數以萬計的采樣分析,所以消耗的機時較長;④參數的分布。由于無法預知TOPMODEL模型參數的先驗分布,只是采用均勻分布法來替代,因此將會帶來模擬結果的不確定性。
本文應用GLUE算法對TOPMODEL模型參數不確定性進行研究,結論如下:
1)GLUE方法原理簡單,易于操作,TOPMODEL模型模擬結果存在大量的“異參同效”現象,非常明顯,通過GLUE方法得到了420組有效參數組合。
2)利用GLUE方法對某流域進行研究,選取Nash效率系數為目標函數,設定閾值為0.7,在給定參數范圍內,計算90%置信區(qū)間的上下限流量值。計算結果表明,大多數實測流量包含在置信區(qū)間內,但還有一小部分實測流量出現在界限以外,說明預測的參數區(qū)間還不能完全覆蓋所有實測流量值。