鐘鳴,張鴻瑞,王一帆,耿浩
(1.中山大學地理科學與規劃學院,廣東 廣州 510275;2.云南電網有限責任公司電力科學研究院,云南 昆明 650217)
在全球氣候變暖與人類活動的影響下,降雨、徑流等水文循環過程都發生了變化,全球水資源危機和洪澇災害風險顯著增加[1]。徑流預測是流域防洪減災、水資源優化配置的重要依據,也是當前全球水文水資源領域的研究重點之一。
目前,徑流預測模型可分為物理機制模型和數據驅動模型兩類。物理機制模型主要從物理機制上對降水、蒸散發、入滲等關鍵水文過程進行解釋和描述,進而實現產匯流計算。在這個過程中,采用合適的經驗推導公式或者計算方程刻畫水文過程,因此物理機制模型對水文氣象數據和流域水文特性參數提出了較高要求[2]。隨著水文科學的發展,物理機制模型的發展呈現從集總式模型到分布式模型的趨勢,一定程度上提高了徑流預報的準確性[3]。數據驅動模型是從數據中學習物理現象的長期規律,建立輸入與輸出數據之間潛在的映射關系,弱化了徑流形成的物理過程,從而擁有了更快的運算效率和良好的模擬性能。傳統應用于徑流預測的數據驅動模型包括自適應模糊推理系統(Adaptive Network-based Fuzzy Inference System,ANFIS)、人工神經網絡(Artificial Neural Network,ANN)、反向傳播網絡(Back Propagation Network,BP)、支持向量機(Support Vector Machine, SVM)等算法,隨著大數據和機器學習的發展,深度學習作為一種基于概率論不斷遞歸進而尋求最優解的方法,能夠通過分層學習從大量數據集中挖掘復雜特征。因此,深度學習在時間序列預測和挖掘數據長期相關性上具有明顯優勢,特別是在徑流預測中,深度學習表現出了比其他模型明顯更強的預報性能[4]。例如,Bai 等[5]提出基于級聯框架的LSTM 模型,對日徑流進行預測,通過級聯建模,可以在一個框架內通過多個模型充分提取多個目標在不同階段的特征;Lin 等[6]將DIFF 和FFNN 模型引入LSTM 中,從模型結構、參數及輸入的角度分析模型在徑流模擬中的有效性;Xiang 等[7]提出了基于LSTM 的LSTM-seq2seq模型,并將其用于每小時的徑流預測,提高了短期洪水預報準確性。
為了提高徑流預測的準確性、高效性和可解釋性,研究物理驅動與數據驅動的耦合模型受到越來越多學者的關注[8]。通常采用兩種方式實現多模型耦合,一種方式是在提供觀測數據標簽時,加入由物理模型提取的控制方程、邊界條件等理論知識限制解集空間;另一種方式是基于物理模型模擬結果對深度神經網絡進行預訓練,從而建立物理指導的深度學習模型[9]。例如,Yang 等[10]將GHM-CaMa-Flood 模型的流量輸出與ERA 數據集的氣象數據整合作為LSTM 模型的輸入,改進了峰值流量的徑流預測精度;Liu 等[11]利用TIGGE-ECMWF 氣象預報數據,驅動CSSPV2 陸面水文模型預報徑流,并將其與氣象數據輸入至LSTM 中得到出口斷面流量,將徑流預報誤差降低了6%。上述研究表明,物理機制耦合深度學習的徑流預測方法能有效提升徑流預測精度和效率。因此,本研究在西江流域建立基于物理模型指導的深度學習模型,將基于物理驅動模型的水文水動力模型與深度學習方法相結合,建立優化的徑流預測模型,并進行模型計算結果驗證。
西江發源于云南,流經貴州、廣西和廣東,于珠海市注入南海,干流全長2214 km,流域總面積35.31 萬km2。西江流域屬亞熱帶季風氣候,多年平均氣溫為14~20 ℃,多年平均降水量為1200-2200 mm,受季風影響,70%以上降水量主要集中在4~10 月。梧州站以上流域集水面積32.7 萬 km2,占西江流域的92.88 %,跨越云南、貴州、廣西等省區,因此本文選取武宣站(WX)和梧州站(WZ)兩個水文站開展徑流預測研究,如圖1 所示。

圖1 研究區概況
VIC(Variable Infiltration Capacity) 模型是基于物理機制的大尺度分布式水文模型,廣泛應用于全球水文模擬工作。VIC 模型主要考慮了大氣-植被-土壤之間的相互作用過程,反映了土壤、大氣和植被之間的水熱變化狀況和水熱過程模擬,可同時進行陸-氣間能量平衡和水量平衡的模擬。本研究基于VIC-3L 模型,將西江流域劃分為4374 個空間分辨率為5 弧分的網格進行徑流預測。
CaMa-Flood(Catchment-based Macroscale Floodplain)是一個全球尺度的分布式河流模型,已被廣泛應用于不同時間尺度的大規模洪水研究中。水文模型模擬產生的徑流可以作為CaMa-Flood 模型的徑流強迫數據。本研究以VIC 模型產生的徑流(作為CaMa-Flood 模型的輸入數據,進而得到基于物理機制模型模擬的日徑流流量。
為了克服基于機器學習的徑流預測模型的局限性,本研究開發了一種耦合水文水動力模型和深度學習的徑流預測模型,即將基于物理機制的徑流模擬值和氣象觀測數據輸入到深度學習框架中,利用深度學習方法計算徑流模擬值。循環神經網絡(Recurrent Neural Networks,RNN)由輸入層、隱藏層和輸出層組成,是能夠處理時間序列的神經網絡模型。RNN 模型的計算公式如下:
其中,f與g為神經網絡激活函數;W和U為權重矩陣;xt,St,Ot為t時刻輸入層、隱藏層及輸出層數據。
長短時記憶網絡(Long Short-Term Memory,LSTM) 是針對RNN 模型在學習較長時間序列時存在的梯度消失問題而提出的改進模型。LSTM 可以有效處理長距離的依賴,與RNN 相比,LSTM 模型增加了三“門”結構,考慮了隱藏層中關聯不同時刻的輸入,常用來研究時間序列上的變化。具體如下:
式中:Wf,Wi,Wc,Wo和Uf,Ui,Uc,Uo為模型權重參數;bf,bi,bo為偏移系數;ht為t時刻的輸出;σ為激活函數;tanh為雙曲正切函數; 表示按元素乘。
在本研究中將特征輸入長度設定為15 天,輸出特征長度為1 天,選取2010 年1 月至2014年12 月數據為訓練期,2015 年1 月至2015 年12 月數據為驗證期,2016 年1 月至2016 年12 月數據為測試期。此外,本研究分別建立了物理機制模型(VIC-CamaFlood)、深度學習模型(RNN、LSTM) 和兩種混合模型(VICCamaFlood-RNN、VIC-CamaFlood-LSTM)進行徑流預測,從而進行徑流預測模型對比和優選。
選取三個指標來評估洪水特征值,分別是最大流量值(MAX)、95% 分位流量值(Q95) 和90%分位流量值(Q90)。同時,選取納什效率系數(NSE)、相對誤差(RE)和相關系數(R2)三個指標定量評估不同類型徑流預測模型的徑流模擬性能。具體如下:
其中,和分別指第i天的實測值和模擬值,N為樣本總數,和分別代表實測和模擬每日流量的平均值。
基于以上建立的VCR、VCL 兩種混合模型對梧州站和武宣站進行了日徑流預測,并進行對比分析。圖2 展示了VCR、VCL 兩種模型的日徑流預測結果,表1 展示了兩種耦合模型在訓練期(2010-2014 年)、驗證期(2015 年)、測試期(2016 年)的徑流預測結果的評價指標。在測試期內,VCR 模型NSE 值范圍為0.70~0.75,VCL 模型NSE 范圍為0.71~0.81;VCR 模型R范圍為0.85~0.88,VCL 模型R 范圍為0.85~0.9;VCR 模型RE 范圍為-5.8%~1.6%,VCL 模型RE 范圍為-8.6%~0.2%;從不同站點評價指標來看,在測試期中,VCL 的NSE 值在兩個站點的表現均比VCR 有一定程度的提高,均提高了1%~4% 左右;R值上,VCL 模型表現均比VCR 模型高。從既往研究中來看,當NSE 值大于0.5 且RE 小于25% 時,那么這模型模擬結果是可以接受的[12]。同時,VCL 和VCR 模型相關系數R均達到0.85 以上,這說明兩個站點的徑流模擬結果與實測徑流均有一定的相關性。

表1 基于混合模型的徑流預測結果評價

圖2 基于混合模型的徑流模擬結果
表2 展示了測試期內觀測值和模型模擬值的洪水指標,其中,VCR 模型MAX 的RE 值范圍為-34.1%~-33.3%,Q95 的RE 范圍為-5.5%~-4.2%,Q90 的RE 值范圍為-0.5%~1.8%;VCL模型MAX 的RE 值范圍為-22.8%~-19.7%,Q95 的RE 范圍為-8.5%~-4.5%,Q90 的RE 值范圍為-3.1%~-1.1%。從不同站點評價指標來看,在測試期中,VCL 的NSE 值在兩個站點的表現均比VCR 有一定程度的提高;R值上,VCL 模型均比VCR 模型高。在洪水預報指標中,根據MAX 指標評估,VCL 模型預報性能均比VCR模型表現好;根據Q95 和Q90 評估,VCL 模型比VCR 模型略高;從三個站點總體評價指標表現來看,武宣站(WX) 在測試期的表現最好,其次是梧州站(WZ)。

表2 基于混合模型的洪水評價指標性能
綜上所述,VCL 模型較VCR 模型能夠更好地模擬徑流和洪水,該結論將為今后徑流預測和洪水模擬提供科學參考。
為進一步研究不同類型徑流模擬模型的模擬效果,本文分別建立了物理機制模型(VICCamaFlood)、深度學習模型(RNN、LSTM)和兩種混合模型(VIC-CaMa-Flood-RNN、VICCaMa-Flood-LSTM),并進行徑流預測研究。圖3 展示了三種類型模型在徑流預測和洪水模擬方面的性能。
在基于VIC-CaMa-Flood 模型的徑流模擬中,所有站點的NSE 值均小于0.5,R值均大于0.7,同時,在VIC-CaMa-Flood 模型的洪水模擬中,RE 值在大部分情況均大于30%。因此,VIC-CaMa-Flood 模型不能很好地模擬徑流和洪水。將VIC-CaMa-Flood 模擬獲得的流量及其氣象驅動數據輸入到深度學習算法(即VCR、VCL)之后,徑流和洪水的指標都得到了顯著的提升,VCR 模型NSE 范圍為0.7 至0.75 之間,R值在0.85 至0.88 之間,除了在MAX 時RE 值達到33% 以上,其余均在7% 左右;而VCL 模型NSE 范圍為0.71 至0.81 之間,R值0.85 至0.9 之間,在MAX 時RE 值均在20%左右,而其他洪水指標均在5%左右。總體而言,VCR 和VCL 模型NSE 值均提升到了0.7 以上,R值均提升到了0.85 以上,三個洪水指標也有著不同程度的改善,且VCL 模型在徑流預測和洪水預測方面均優于VCR 模型。由此可知,混合模型有效地提高了物理驅動模型的預測模擬性能,這表明深度學習方法在徑流和洪水預測中起到了誤差校正和提高精度的作用。
在基于深度學習模型的徑流預測中,LSTM模型NSE 范圍為0.25 至0.6 之間,R值范圍為0.6 至0.8 之間,RNN 模型NSE 范圍為0.25 至0.65 之間,R值范圍為0.5 至0.8 之間;在3 個洪水指標上,LSTM 和RNN 模型均在15%左右,這表明深度學習模型相較于VIC-CaMa-Flood模型雖然能更好的模擬洪水,但是在徑流模擬上并沒有顯著的提升。而將VIC-CaMa-Flood模型模擬的徑流量輸入到深度學習模型中時,無論是徑流預測還是洪水模擬的性能都得到了顯著提升。由此可知,混合模型可以有效的提高數據驅動模型的仿真性能。
本文構建了基于物理機制模型(VICCaMa-Flood) 與深度學習方法(RNN、LSTM)耦合的徑流預測模型,選擇西江流域武宣站(WX) 和梧州站(WZ) 兩個水文站在2010-2016 年期間的徑流進行模擬實驗,評估了物理機制模型(VIC-CamaFlood)、深度學習模型(RNN、LSTM) 和兩種混合模型(VICCamaFlood-RNN、VIC-CamaFlood-LSTM) 在徑流和洪水預測中的性能。本文主要結論如下:
1)對于VCL 和VCR 模型,在測試期中,VCL 模型NSE 值大于0.71,最大值達到0.81、R值大于0.85、RE 值小于8%;VCR 模型NSE值大于0.7,最大值達到0.77、R值大于0.85、RE 值小于6%。結果表明,VCL 模型相比于VCR 模型能夠更好地模擬徑流和洪水,其模擬結果與實測徑流具有更高的相關性。
2)在三種類型徑流預測模型的對比中,深度學習方法在徑流和洪水預測中起到了誤差校正和提高精度的作用,物理機制模型與深度學習方法的耦合可提高徑流預測和洪水預測的準確性。