劉揚,王立虎,楊禮波,劉雪梅
(華北水利水電大學 信息工程學院,河南 鄭州 450046)
河川徑流作為水循環的關鍵節點,對其進行精確預報具有重要意義。變化環境下徑流的波動系數不斷加大,極端氣候背景下的徑流趨勢呈現更大的波動性,給徑流的準確預報提出了更高的要求。如何根據不同流域,提出更加穩定、高效的預報模型,具有重要的理論意義和應用價值。
目前,以物理認識為基礎的機理驅動模型和以統計科學為基礎的數據驅動模型在徑流預報領域取得了一定的進展。以氣象數據作為輸入,利用半分布式水文模型對徑流進行預測,并以異常相關系數作為評估指標,實驗結果表明,確定性預測精度較高[1]。將分布式水文模型和氣象遙相關分析相結合,采用水文模型提供初始條件,利用遙相關指數確定氣象輸入,開展流域水庫入庫徑流的長期預測[2]。然而,機理驅動模型往往存在可解釋性差,主觀干擾因素眾多等問題。數據驅動模型可以有效緩解機理模型帶來的不足[3-6]。例如,以支持向量回歸(support vector regression,SVR)模型預測集水區洪水發生概率,結果表明,SVR 模型對于提前1~3 h的預測具有令人滿意的預測性能[7]。利用自適應神經模糊推理系統(adaptive neuro-fuzzy inference system,ANFIS)對區域徑流進行預測。結果表明,ANFIS 模型的平均絕對誤差優于其他模型[8]。然而,以統計科學為基礎的數據模型往往存在預測精度低,可解釋性差等問題?;旌夏P涂捎行Ь徑鈹祿P偷牟蛔?。結合人工神經網絡(artificial neural network,ANN)模型和Muskingum-Cunge 方法,進而構建一種基于BR-ANN 的洪水預報模型。研究區的驗證對比結果表明,BR-ANN 模型具有優越的綜合預測能力[9]。將 SWAT 模型與ANN 模型結合并用于區域徑流預測,結果表明SWAT-ANN 的預測精度優于SWAT 模型[10]。結合經驗模式分解(empirical mode decompostion,EMD)算法與長短時記憶神經網絡(long short-term memory networks,LSTM),進而構建EMD-LSTM 模型。并使用均方根誤差(root mean square error,RMSE)、決定系數、Willmott 一致性指數(Willmott index,WI)和Legates-McCabe 指數(legates McCabe index,LMI)作為評估標準,結果表明該方法在特大洪水年預測可靠性較高[11]。然而,EMD 方法在分解過程中往往存在模態混疊和端點效應[12-14]。
針對以上問題,本文結合改進集合經驗模態分解(ensemble empirical mode decomposition,EEMD)與門控制循環單元神經網絡(goted recurrent unit,GRU)構建一種基于改進EEMD 的神經網絡模型(EEMD-GRU)。該模型將改進EEMD 方法和GRU 模型進行融合,同時引入并行計算思想,實現對徑流的精確、高效、穩定預測。經驗證,相比于結合了EMD 的SVR 模型,并行EEMD-GRU 模型表現出更加高效、可靠的性能。
GRU 基于循環神經網絡。同循環神經網絡相比,GRU 具有計算效率高,邏輯簡單等優勢[15]。其基本結構如圖1 所示。

圖1 GRU 神經元結構Fig.1 GRU neuron structure
GRU 的提出是為了克服RNN 無法很好地處理遠距離依賴的問題,在保持了LSTM 效果的同時使結構更加簡單。GRU 僅保留了重置門和更新門,即圖中r(t)和z(t),其中重置門輸出矩陣rt可定義為

式中:wr為重置門的權重矩陣;σ為sigmoid 函數;h(t?1)為t?1 時刻的隱含狀態;x(t)為t時刻輸入數據。更新門輸出矩陣zt可定義為

式中:wz為更新門的權重矩陣;則GRU 網絡的輸出可定義為

式中:Wo為輸出權重矩陣;c為輸出偏置[16-18]。
EEMD 在經驗模態分解的基礎上,通過引入白噪聲,有效消除了模態混疊現象,使得EEMD的分解結果更加具有物理意義[19-24],集合經驗模態分解的基本原理可以描述如下:
1)將正態分布的白噪聲信號ni(t)加到原始信號x(t)得到信號xi(t),定義為
xi(t)=x(t)+ni(t)
2)將加入白噪聲的信號作為一個整體,然后進行經驗模態分解(EMD),得到各IMF 分量,定義為

式中:cij(t)為第i次加入白噪聲后分解得到的第j個IMF 分量;ri(t)是分解后的剩余分量;n為IMF 分量的個數。
3)重復1)~2),對各階分量取平均,得到最終IMF 分量cj(t)為

式中w為添加白噪聲的次數,即總體平均數。
EEMD 的提出是解決EMD 分解過程中出現的模態混疊現象,使得在模態分解過程中可以很好地避免IMF 分量不精確等問題[25-26]。
解決集合經驗模態分解邊界效應的方法一般是對信號進行邊界拖延。本文利用極限學習算法作為模態分解端點效應的解決方案,具體步驟如下:
1)以右邊界為例,選取合適的拓延步長,作為原始信號的拓延信號序列長度;
2)將原始信號劃分為測試集、訓練集,進而構建極限學習預測模型;
3)將原始信號右端點利用預測模型進行預測,預測信號與原始信號合并;
4)利用相同的原理拓延原始信號的左邊界。
綜合實時采集技術,以黃河流域部分干流共32 個水文站的實際水文數據作為數據支撐,進行數據清洗、分解、預測、重構等一系列操作,最終獲得高精度徑流預測值,進而為水庫的安全運行和區域防洪減災提供決策支持。圖2 給出了并行EEMD-GRU 的數據流程圖,其基本實現如下。

圖2 并行EEMD-GRU 流程Fig.2 Parallel EEMD-GRU flow
1)以黃河流域部分干流為實驗對象,實時采集水文站徑流數據f(t),通過數據清洗技術,對空數據、非數值型數據等非法數據進行過濾,然后對其進行歸一化,其中歸一化方程可定義為

式中:max(x)為樣本數據的最大值;min(x)為樣本數據的最小值。
2)基于帶外誤差理論,以目標站點為基準,將目標預測站上下游水文站徑流數據作為特征x?,對目標預測站進行特征選擇。首先,將徑流樣本通過重復抽樣的方式構建樣本,訓練模型,然后利用剩余樣本對模型進行評估,并計算樣本誤差,記作E1,最后將剩余樣本加入噪聲,計算剩余樣本的誤差,記作E2,特征fi(x?)的重要性可定義為

fi(x?)值越大,表明特征x?的重要程度越高。
3)將歸一化并經過特征選擇的數據首先進行邊界拓延,然后進行EEMD 分解,分解為若干本征模態分量,并將各分量分別拆分為訓練集和測試集;
4)對訓練集與測試集進行數據劃分,將過去5 d(通過實驗分析,將預測集序列長度設置為5模型效果最優)設置為輸入變量,分別對未來1、4、6、16、21、31 d 進行預測;
5)對預測分量進行重組,由此得到輸出序列。
本文選取黃河流域2002—2019 年徑流觀測數據作為數據支撐,以EMD-SVR[27]和GRU[28]作為對比模型,以納什指數(Ens)、平均絕對誤差、相關誤差、運行時間(run time)作為評估標準,實現對算法的可信度、穩定度、精準度和執行效率的全面評估。其中Ens納什效率系數用于評估預測模型的可信度與穩定度。Ens取值為負無窮至1,Ens接近1,表示模式質量好,模型可信度高。相對誤差和平均絕對誤差分別評估實時誤差與整體誤差。
并行EEMD-GRU 方法及EMD-SVR 方法分別對未來1、4、6、16、21、31 d 徑流深度進行預測,結果如圖3 所示。

圖3 不同模型不同時間尺度下的預測曲線對比Fig.3 Comparison of prediction curves under different models and different time scales
根據圖3 可知,在低延時的未來預測中,EEMDGRU 與GRU 表現能力相似,但是隨著預測天數的增加,EEMD-GRU 相對于GRU 和EMD-SVR 具有較高的精確度。由于EEMD 可有效提高GRU模型的魯棒性。使得固定未來天數,調整預測序列的特征和序列長度,EEMD-GRU 相比GRU 模型穩定性高。
根據圖4 可以了解到,EEMD-GRU 相對于GRU 模型和EMD-SVR 模型,預測誤差更小,精度更高,且相對于其他模型更加穩定。由于EMD方法存在模態混疊和端點效應,EMD-SVR 模型預測精度最差。

圖4 不同模型不同時間尺度下的相對誤差對比Fig.4 Comparison of relative errors of different models and different time scales
綜合表1 與圖5,由于EEMD-GRU 引入了分解合成策略,有效提高了模型的非穩態信號處理能力,模型的預測精度提高,可信度增強。算法的運行時間可以作為算法運行效率的一個衡量標準,EEMD-GRU 模型相對于EMD-SVR 模型由于加入了并行計算的概念,使得模型的整體預測效率提高。

圖5 智能計算模型指標評估圖Fig.5 Intelligent calculation model index evaluation chart

表1 不同模型不同時間尺度下指標數值對比Table 1 Comparison of index values under different models and different time scales

續表 1
圖6 反應了各個算法在預測過程中的實時可信度表現。在中長期徑流預測中,預見期的增加,序列的非穩態性增強,對模型的魯棒性要求更高。預見期為未來16 d、31 d 時,EMD-SVR 和GRU 模型相對于EEMD-GRU 模型,可信度較差。


圖6 智能計算模型 Ens評估圖Fig.6 Intelligent calculation model Ens evaluation chart
本文在模態分解方法與深度學習方法的思想上,構造了并行EEMD-GRU 徑流預測方法,主要結論有:
1)本文所提出的并行EEMD-GRU 模型對于不同預測步長,預測時間均有有較高的精度、可信度和預測效率,預測模型具有一定的泛化性和魯棒性,通過與原生GRU 模型和EMD-SVR 模型的對比中發現,所構建的混合模型精準度、可信度和效率高于其他模型。
2)由于引入了EEMD 分解算法,使得混合模型整體計算性能有所下降,雖然所引入的并行計算思想可以有效解決模型計算消耗,但隨之而來的的確是內存消耗問題,希望在今后的研究中更加關注模型的高性能計算,使得模型綜合能力可以進一步提升。