基于ForecastNet的徑流模擬及多步預測

2022-05-24 05:08:00閆寶偉劉金華

中國農村水利水電 2022年5期

關鍵詞：模型

劉昱，閆寶偉，劉金華，穆冉，王浩

（1.華中科技大學土木與水利工程學院，武漢 430074；2.中國電建集團華東勘測設計研究院有限公司，杭州 311122）

0 引言

高精度徑流預報對防洪減災、水庫群梯級聯合調度、水資源優化配置等具有重要指導意義［1］。一直以來，水文預報領域的學者們都在嘗試使用參數化方法描述流域降雨徑流過程的邊界條件、時空分布和物理過程，即傳統意義上的水文模型［2］。受氣象、自然地理條件、流域特性等眾多因素的綜合影響，徑流過程呈現出強非線性、非平穩性和隨機性等多種特性，使得傳統水文模型的預報精度受到制約［3，4］。

人工智能和機器學習的興起，逐漸改變著人類生產生活方式和思維方式，對經濟發展、社會進步等方面產生重大而深遠的影響?，F有水文預報方法眾多，基于機器學習的數據驅動徑流預報模型因不需要深入了解水文過程的物理機理而備受關注［5］。其中，循環神經網絡RNN 及其變體時間長短記憶模型LSTM 應用較為廣泛［6，7］。這類神經網絡模型都會生成一組具有固定體系的結構單元，這些單元隨著時間的推移而被不斷復制，為時不變模型。在多步預測中時間不變性會降低模型學習跨多個時間步長的能力，使得多步預測的精度逐漸降低。為此，引入時變的ForecastNet神經網絡模型［8］，分析其在徑流模擬和預報中的適用性，研究其多步預測效果，以期為徑流的實時預報提供依據。

1 ForecastNet模型結構

RNN 是深度學習中常見的神經網絡結構，主要用于處理和預測時間序列數據。與傳統前饋神經網絡不同的是，RNN 是有記憶功能的，如圖1所示，其網絡結構每層之間的節點是有連接的，其中隱藏層的輸入不僅包含輸入層的輸出，還包含上一時刻隱藏層的輸出。RNN的一般結構可表示為：

圖1 RNN一般結構示意圖Fig.1 General structure of RNN

式中：xt和yt分別為t時刻的輸入層和輸出層；ht和ht-1分別為t時刻和t- 1 時刻的隱藏層；gs和fo分別為隱藏層和輸出層的激活函數。

RNN 具有一組隨時間保持不變的鏈式結構單元，這種結構單元具有參數共享的優點［8］，但同時一方面會削弱其學習復雜時間依賴關系的能力，另一方面會存在梯度消失的難題。為了解決RNN中梯度消失的問題，LSTM 通過引入門控結構，一定程度緩解了RNN梯度消失的問題，但其結構單元仍是隨時間保持不變的。RNN和LSTM 結構單元的時不變性會減弱模型在多步學習中的能力，降低多步預測的精度［9］。為更好學習時間序列的多步動態變化過程，如圖2 所示，在RNN 基礎上發展而來的ForecastNet 通過建立交錯輸出的深度前饋架構，使其結構單元隨時間變化，從而有效降低梯度消失的問題。ForecastNet 的一般結構可表示為：

圖2 ForecastNet一般結構示意圖Fig.2 General structure of ForecastNet

式中：gt和ft分別為隱藏層和輸出層在t時刻的激活函數。

ForecastNet 是一種循環神經網絡，其隱藏單元可以是某種形式的前饋神經網絡，如多層感知器（Multi Pleperceptron，MLP）、卷積神經網絡（Conudutional Neural Netuerk，CNN）或自注意力機制。作為一個前饋網絡，即使每個隱藏單元的結構都是相同的，每個單元都有自己獨特的參數，因此，它是一個時變結構。ForecastNet 通過引入快捷鏈接結構［10］和輸出層結果，使得隱藏層之間交錯輸出，其網絡結構和參數隨時間而變，梯度反向傳播中的連乘形式也變為加法形式，而這種加法形式相比連乘形式更加穩定，從而可以減輕梯度消失問題，適用于模擬時間序列的長期動態過程。

2 應用研究

2.1 流域概況

雅礱江流域水量豐沛、落差大，干支流蘊藏了豐富的水力資源。根據雅礱江流域水能開發規劃，到2025年以前，全流域水電項目開發將全面完成。因此高精度的徑流模擬和預報可以為雅礱江流域梯級水庫開發和運行提供科學依據。本研究以雅礱江雅江站以上流域作為研究區域（簡稱雅江流域），流域總面積6.5萬km2，氣象、水文站點和水系分布如圖3所示。

圖3 雅江流域水系圖Fig.3 The drainage system of Yajiang river basin

2.2 數據及模型準備

2.2.1 數據準備

選取雅江站1984-1997年的歷史日徑流數據作為模型的數據集，其中，1984-1994年共11年的數據用于模型率定，1995-1997年共3年的數據用于模型驗證，數據分布如圖4所示。

圖4 雅江站徑流數據集Fig.4 The runoff dataset of Yajiang station

2.2.2 模型準備

為了驗證ForecastNet 模型在雅江流域的日徑流模擬效果，建立傳統分布式水文模型SWAT 與其進行比較。SWAT 模型是基于GIS 的分布式水文模型，可模擬流域中多種不同的水文物理化學過程，常用來模擬和預測下墊面及氣候變化下流域水文循環的響應。本研究以Cao等［11］建立的雅礱江SWAT模型為基礎，得出了雅江站率定期和驗證期的模擬徑流。其中，SWAT模型所需的氣象數據包括日降水量、最高、最低氣溫、太陽輻射、風速和相對濕度。為了保證兩類模型輸入的一致性，從上述氣象數據中選取與雅江站徑流相關性較高的預報因子作為ForecastNet 模型輸入，選取的預報因子包括圖5 中6 個雨量站（清水河、石渠、色達、甘孜、新龍、道孚）的降雨數據、面平均最高氣溫、面平均最低氣溫和月份，共9 項，輸出即為雅江站的模擬徑流。

為確保數據保持相同規模，ForecastNet 的輸入數據需要進行標準化處理。因此，采用最大最小歸一化將上述氣象和水文數據及其所對應的月份進行標準化，計算公式如下：

式中：z為標準化之后的數據；x為原始數據；xmin和xmax分別為原始數據系列的最小值和最大值。

神經網絡通常包含許多超參數，其值在ForecastNet 模型建立開始之前需設定，無需從模型訓練過程中獲得。超參數優化或調整是找到超參數元組的過程，使得給定數據的損失函數最小［12］。ForecastNet 模型的超參數及參數范圍如表1 所示，使用網格搜索方法［12，13］尋求最優參數，結果如表1所示。

表1 ForecastNet模型最優參數表Tab.1 Optimal parameters of ForecastNet

為了檢驗ForecastNet 模型在多步實時預測中的預測性能，本研究進一步考慮當前徑流，將其加入模型的輸入，分別建立雅江流域不同預見期（3、5、7 d）的ForecastNet 模型，并與RNN神經網絡，LSTM 神經網絡和RNN-LSTM 組合神經網絡［14］3 種時不變循環神經網絡模型進行對比分析。選取Nash-Suthcliffe系數（NSE）、均方根誤差（RMSE）和百分比偏差（PBIAS）3 個指標進行模型優劣的評價。

2.3 結果與分析

2.3.1 ForecastNet與SWAT模擬結果對比分析

表2 給出了SWAT 和ForecastNet 在率定期和驗證期的模擬精度評價結果。可以看出，SWAT 在率定期和驗證期的NSE均低于0.8，而ForecastNet 的模擬精度明顯高于SWAT，NSE 分別達到0.88 和0.82。圖5 和圖6 分別給出了雅江站在驗證期的徑流模擬過程和實測-模擬徑流相關圖，可以看出，SWAT 對于9月份汛期的洪水模擬明顯偏大，而ForecastNet 則能夠較好地模擬該部分洪水過程。圖6 也顯示出SWAT 的模擬結果更加發散，而ForecastNet 的模擬結果更加集中，與實測值更加接近。雅江流域位于雅礱江流域的上游，區域內降水站點稀少，且大部分分布于流域邊界處，模型輸入的雨量信息不能全面反映雅江流域降水空間分布的異質性，使得SWAT 水文模型徑流模擬結果偏差，而ForecastNet 神經網絡模型能夠較好地提取預報因子相關信息，進一步挖掘時間序列的組成特性，有效提高徑流模擬的精度。

圖5 驗證期徑流模擬結果Fig.5 Runoff simulation results in the validation period

圖6 實測-模擬徑流相關圖Fig.6 Correlation between observed and simulated runoff

表2 徑流模擬評價指標統計表Tab.2 The statistical table of runoff simulation evaluation index

2.3.2 ForecastNet多步預測結果分析

進一步將當前實測徑流作為輸入加入模型，分別建立RNN、LSTM、RNN-LSTM 和ForecastNet 在不同預見期下（3、5、7 d）的實時預測模型，預見期的預測結果如表3 所示。在預見期為3 d 時，RNN、LSTM、RNN-LSTM 的NSE還可以達到0.8 以上，隨著預見期的增加，這些模型的NSE下降較快，預見期為5 d時，NSE下降到0.75以下，預見期為7 d時，NSE下降到0.7以下。而ForecastNet 表現更優，在3 d 和5 d 預見期的NSE分別高達0.88 和0.82，預見期為7 d 時，NSE仍能保持在0.75 以上。圖7給出了4種模型在不同預見期的預測值和實測值的相關圖，同樣，與RNN、LSTM 和RNN-LSTM 等時不變模型相比，Forecast-Net的時變結構，使得其預測結果與實測值更為接近，且隨著預見期的增長，ForecastNet預測精度降低地也較慢。

表3 4種模型預測結果對比Tab.3 Comparison of forecasting results of four models

圖7 預見期為3、5和7 d時的預測徑流與實測值相關圖Fig.7 Correlation between observed and predicted runoff for 3，5 and 7 d-ahead forecasts

3 結論

針對傳統水文模型及神經網絡模型多步預測精度降低的問題，基于具有時變結構的ForecastNet 模型，建立了雅江流域不同預見期的日尺度預測模型。與傳統的水文模型SWAT 相比，ForecastNet模型能夠較好地提取預報因子相關信息，進一步挖掘時間序列的組成特性，有效提高徑流模擬的精度；與RNN、LSTM及其組合神經網絡模型相比，ForecastNet模型能夠利用其時變特性提高長預見期的預測精度和穩定性。ForecastNet模型的這些優異表現，使得其更適合于徑流的長預見期實時預測，為水庫的實時運行和流域水資源管理提供決策依據。