VMD-LSTM模型對(duì)不同預(yù)見(jiàn)期月徑流的預(yù)測(cè)研究

2022-11-23 05:29:40祁繼霞粟曉玲張更喜

干旱地區(qū)農(nóng)業(yè)研究 2022年6期

祁繼霞，粟曉玲,，張更喜，張特

(1.西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院，陜西楊凌 712100；2.西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室，陜西楊凌 712100)

徑流預(yù)測(cè)是水資源管理、配置和有效利用的基礎(chǔ)，精確的徑流預(yù)測(cè)可為區(qū)域防洪抗旱、水庫(kù)優(yōu)化調(diào)度及水利工程規(guī)劃設(shè)計(jì)等提供有效的科學(xué)支持[1]。尤其在干旱地區(qū)，水資源短缺一直是限制農(nóng)業(yè)和經(jīng)濟(jì)發(fā)展的最大問(wèn)題，準(zhǔn)確可靠的徑流預(yù)測(cè)結(jié)果可為水資源高效利用提供重要參考，緩解旱區(qū)水資源短缺、供需矛盾等問(wèn)題。徑流的形成極易受氣候變化及人類(lèi)活動(dòng)等的影響，徑流序列常表現(xiàn)出高度的非線(xiàn)性、非穩(wěn)定性與復(fù)雜性[2]。因此，獲得高精度的徑流預(yù)測(cè)結(jié)果仍面臨挑戰(zhàn)，如何提高徑流預(yù)測(cè)精度仍需進(jìn)一步研究。

當(dāng)前用于徑流預(yù)測(cè)的模型主要分為過(guò)程驅(qū)動(dòng)模型和數(shù)據(jù)驅(qū)動(dòng)模型兩類(lèi)[3]。過(guò)程驅(qū)動(dòng)模型主要通過(guò)分析和模擬水文循環(huán)過(guò)程來(lái)實(shí)現(xiàn)[4-5]，雖然能較好地揭示徑流形成的物理機(jī)制，但建模需要大量準(zhǔn)確可靠的水文過(guò)程資料，普遍存在模型參數(shù)難以確定及模型通用性較差等缺陷[6]。數(shù)據(jù)驅(qū)動(dòng)模型無(wú)需考慮徑流形成的物理過(guò)程，所需數(shù)據(jù)量少且建模簡(jiǎn)單，因而被廣泛使用。數(shù)據(jù)驅(qū)動(dòng)模型通常分為時(shí)間序列統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)模型，時(shí)間序列統(tǒng)計(jì)模型一般適用于平穩(wěn)或線(xiàn)性的數(shù)據(jù)序列[7-8]，難以獲得隱藏在徑流時(shí)間序列中的非線(xiàn)性特征，因而預(yù)測(cè)效果普遍不理想；傳統(tǒng)的機(jī)器學(xué)習(xí)模型包括人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、自適應(yīng)模糊推理系統(tǒng)(ANFIS)及小波變換(WT)等[9-11]，這類(lèi)模型因具有較強(qiáng)的非線(xiàn)性映射能力[12]，可以捕獲徑流時(shí)間序列中的非線(xiàn)性及非平穩(wěn)特性，在徑流預(yù)測(cè)中取得了較好的效果[13]。

上述機(jī)器學(xué)習(xí)模型雖然具有較強(qiáng)的數(shù)據(jù)處理能力，但ANN易陷入局部最小值收斂及過(guò)擬合[14]，SVM需要謹(jǐn)慎選擇核函數(shù)，ANFIS難以處理噪聲等，導(dǎo)致模型的預(yù)測(cè)精度受到影響。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展，研究者提出了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)，以解決徑流的長(zhǎng)期依賴(lài)問(wèn)題[15-16]，從而獲得更高精度的徑流預(yù)測(cè)結(jié)果。LSTM的優(yōu)點(diǎn)在于能夠處理較長(zhǎng)時(shí)間信息的序列，實(shí)現(xiàn)時(shí)間序列的長(zhǎng)期傳遞和記憶[17-18]。已有研究表明LSTM模型是一種更有效的徑流預(yù)測(cè)模型，如胡慶芳等[19]采用LSTM模型對(duì)漢江安康站的日徑流進(jìn)行預(yù)測(cè)，發(fā)現(xiàn)LSTM模型可以有效避免過(guò)擬合問(wèn)題；Gao等[20]討論了LSTM、ANN、門(mén)控遞歸單元(GRU)模型在徑流預(yù)測(cè)中的效果，發(fā)現(xiàn)LSTM和GRU模型的性能優(yōu)于ANN模型。Yuan等[21]利用蟻獅優(yōu)化算法(ALO)對(duì)LSTM模型的參數(shù)進(jìn)行優(yōu)化，并與BP神經(jīng)網(wǎng)絡(luò)、最小支持向量機(jī)、徑向基神經(jīng)網(wǎng)絡(luò)進(jìn)行比較，結(jié)果證明所構(gòu)建的LSTM-ALO模型用于月徑流預(yù)測(cè)時(shí)顯著優(yōu)于其他三類(lèi)模型。

由于徑流是具有周期性、隨機(jī)性及趨勢(shì)性的非平穩(wěn)成分，直接使用上述模型預(yù)測(cè)的精度受限。信號(hào)分解技術(shù)可以將徑流序列分解為多個(gè)相對(duì)穩(wěn)定的分量，同時(shí)達(dá)到降噪的目的，使模型可以更好地捕捉徑流序列變化特征，提高預(yù)測(cè)精度。近年來(lái)基于分解技術(shù)與機(jī)器學(xué)習(xí)的混合模型廣泛應(yīng)用于徑流預(yù)測(cè)中，如梁浩等[22]在優(yōu)選多元線(xiàn)性回歸(MLR)、ANN、SVM模型的基礎(chǔ)上，構(gòu)建了基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)、集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)、小波分解(WD)的混合模型，結(jié)果發(fā)現(xiàn)混合模型的預(yù)測(cè)精度均高于單一模型。Wang等[23]、黃巧玲等[24]也將分解技術(shù)和機(jī)器學(xué)習(xí)模型相耦合用于月徑流的預(yù)測(cè)，表明耦合模型具有更高的預(yù)測(cè)精度。

基于分解技術(shù)的機(jī)器學(xué)習(xí)模型從挖掘數(shù)據(jù)序列自身的變化規(guī)律出發(fā)可用于徑流的模擬及預(yù)測(cè)，但這類(lèi)模型未考慮徑流形成的物理成因，因而預(yù)測(cè)精度受限。考慮到大氣環(huán)流是氣候和天氣變化的主導(dǎo)因子，同時(shí)也是水循環(huán)的主要驅(qū)動(dòng)要素，對(duì)徑流的變化有一定的影響，將大氣環(huán)流因子作為機(jī)器學(xué)習(xí)模型的輸入不僅考慮了徑流形成的物理因素，也可改善模型的預(yù)測(cè)效果。如梁浩等[22]、孟二浩等[25]在常規(guī)預(yù)報(bào)因子的基礎(chǔ)上增加了大氣環(huán)流因子后預(yù)測(cè)精度得到了進(jìn)一步的提高；李福興等[26]通過(guò)平均值法篩選大氣環(huán)流因子作為神經(jīng)網(wǎng)絡(luò)的輸入，發(fā)現(xiàn)預(yù)測(cè)誤差明顯減小。

然而，當(dāng)前基于LSTM模型的徑流預(yù)測(cè)研究大多只考慮了單一預(yù)見(jiàn)期及單一站點(diǎn)，分解技術(shù)能否提高LSTM模型在多預(yù)見(jiàn)期下的效用尚不明確，且大氣環(huán)流因子對(duì)較長(zhǎng)預(yù)見(jiàn)期徑流預(yù)測(cè)結(jié)果的影響尚無(wú)明確結(jié)論，故有待進(jìn)一步評(píng)估混合模型融合大氣環(huán)流因子后在多種預(yù)見(jiàn)期及多個(gè)站點(diǎn)上的適用性。基于此，本文選取了黃河流域上游5個(gè)水文站的月徑流數(shù)據(jù)，在對(duì)月徑流進(jìn)行變模態(tài)分解的基礎(chǔ)上，采用LSTM模型預(yù)測(cè)了各水文站未來(lái)1～3個(gè)月的徑流量，并融合了大氣環(huán)流信息，以期進(jìn)一步提高月徑流在多種預(yù)見(jiàn)期下的預(yù)測(cè)精度。

1 研究方法

1.1 變模態(tài)分解

變模態(tài)分解(Variational Mode Decomposition,VMD)是一種自適應(yīng)、完全非遞歸的模態(tài)變分和信號(hào)處理方法[27]，可根據(jù)實(shí)際情況確定序列的分解個(gè)數(shù)，在克服傳統(tǒng)經(jīng)驗(yàn)?zāi)B(tài)分解存在的端點(diǎn)效應(yīng)和模態(tài)混疊問(wèn)題的同時(shí)，實(shí)現(xiàn)固有模態(tài)分量的有效分離，分解獲得包含多個(gè)頻率尺度且相對(duì)平穩(wěn)的子序列。VMD的核心是構(gòu)建和求解變分問(wèn)題，假設(shè)原始信號(hào)f被分解為K個(gè)具有中心頻率的有限寬度的模態(tài)分量，同時(shí)各模態(tài)的估計(jì)寬帶之和最小，約束條件為所有模態(tài)之和與原始信號(hào)相等，則相應(yīng)約束變分表達(dá)式為：

(1)

(2)

式中，K為分解的模態(tài)個(gè)數(shù)，{uk},{ωk}分別對(duì)應(yīng)分解后的第k個(gè)模態(tài)分量和中心頻率，δ(t)為狄拉克函數(shù)，*為卷積運(yùn)算符，f為原始時(shí)間序列。詳細(xì)求解過(guò)程參見(jiàn)文獻(xiàn)[27-28]。

1.2 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)

長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)，其優(yōu)勢(shì)在于解決RNN的梯度消失和梯度爆炸問(wèn)題，廣泛應(yīng)用于序列處理與預(yù)測(cè)。與普通RNN不同，LSTM的核心概念在于細(xì)胞狀態(tài)及“門(mén)”結(jié)構(gòu)，細(xì)胞狀態(tài)保證了信息能在序列中傳遞下去，而“門(mén)”結(jié)構(gòu)則在訓(xùn)練過(guò)程中決定了該保存或遺忘哪些信息。特殊的網(wǎng)絡(luò)結(jié)構(gòu)使得LSTM在學(xué)習(xí)當(dāng)前信息的同時(shí)，還能捕獲時(shí)間序列中長(zhǎng)期的依賴(lài)關(guān)系，從而更適合處理和預(yù)測(cè)時(shí)間序列中間隔和延遲較長(zhǎng)的事件[18,29-30]。LSTM的結(jié)構(gòu)如圖1所示，單個(gè)LSTM主要由以下4個(gè)部分構(gòu)成：

圖1 LSTM結(jié)構(gòu)圖Fig.1 Structure of LSTM

(1)遺忘門(mén)：決定應(yīng)丟棄或保存哪些信息。

ft=σ(Wf.[ht-1,xt]+bf)

(3)

(2)輸入門(mén)：決定更新哪些細(xì)胞狀態(tài)。

it=σ(Wi.[ht-1,xt]+bi)

(4)

(5)

(3)更新細(xì)胞狀態(tài)：更新后的細(xì)胞狀態(tài)計(jì)算公式如下：

(6)

(4)輸出門(mén)：決定下一個(gè)隱藏狀態(tài)應(yīng)攜帶哪些信息。

Ot=σ(WO[ht-1,xt]+bO)

(7)

ht=Ot*tanh(Ct)

(8)

本文的LSTM模型通過(guò)Python3.9構(gòu)建，參數(shù)通過(guò)試錯(cuò)法確定，通過(guò)反復(fù)調(diào)整，最終確定LSTM模型的網(wǎng)絡(luò)結(jié)構(gòu)為雙隱層，每層的神經(jīng)元個(gè)數(shù)為50；為防止過(guò)擬合，加入舍棄層，并設(shè)定其隨機(jī)取舍率為50%；采用Adam優(yōu)化器并設(shè)置其學(xué)習(xí)率為0.05。

1.3 VMD-LSTM預(yù)測(cè)模型

本文所提出的VMD-LSTM組合模型的建立主要包含以下三個(gè)步驟：

(1)利用VMD方法對(duì)徑流序列進(jìn)行分解，得到多個(gè)平穩(wěn)的固有模態(tài)分量(IMFi(i=1～n))和一個(gè)趨勢(shì)分量(r)；

(2)將分解得到的多個(gè)分量進(jìn)行歸一化處理；

(3)確定LSTM模型的輸入與輸出；

采用前L個(gè)月的各固有模態(tài)分量(IMF1(t-L,t),IMF2(t-L,t)，…IMFn(t-L,t))和趨勢(shì)分量(r(t-L,t))作為預(yù)報(bào)因子，預(yù)測(cè)各水文站未來(lái)3個(gè)月的徑流(Rt+1,Rt+2,Rt+3)。其中L在LSTM模型中表示其滑動(dòng)窗口長(zhǎng)度，根據(jù)月徑流的周期變化規(guī)律，單一LSTM模型的L可直接設(shè)置為12個(gè)月，但序列經(jīng)VMD分解后其徑流年際變化規(guī)律已發(fā)生改變，故不能直接將VMD-LSTM混合模型的L值設(shè)為12，需要反復(fù)調(diào)試確定L的最優(yōu)值。

1.4 模型評(píng)價(jià)標(biāo)準(zhǔn)

采用均方根誤差(RMSE)和納什效率系數(shù)(NSE)對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行精度評(píng)價(jià)，其中RMSE用來(lái)衡量預(yù)測(cè)值與實(shí)測(cè)值之間的偏差，其值越小越好；NSE取值范圍為(-∞,1]，越接近1表示模型預(yù)測(cè)精度越高，RMSE和NSE的具體計(jì)算公式如下：

(9)

(10)

2 研究區(qū)概況

本文以黃河流域上游部分河流的月徑流為研究對(duì)象，收集了唐乃亥、民和、享堂、紅旗和折橋共5個(gè)水文站的月徑流資料。其中，唐乃亥站是黃河源區(qū)的門(mén)戶(hù)站，也是龍羊峽水庫(kù)的入庫(kù)站，距離省會(huì)西寧約300 km；民和站是黃河一級(jí)支流湟水的主要控制站，控制著湟水民和以上水量、沙量及水質(zhì)的變化；享堂站位于為黃河的二級(jí)支流、湟水的一級(jí)支流大通河的主要控制站，直接為八盤(pán)峽水庫(kù)的運(yùn)行調(diào)度、下游防汛、水源保護(hù)等提供水文依據(jù)及水情信息[23]；紅旗站位于黃河一級(jí)支流洮河，距離下游劉家峽水庫(kù)27 km；折橋站位于大夏河下游，是劉家峽水庫(kù)的入庫(kù)控制站，同時(shí)也是大夏河的重要水沙控制站。以上五個(gè)水文站分屬不同的子流域，水文情勢(shì)各異，具有較好的代表性，且徑流數(shù)據(jù)資料完整性良好，適用于水文數(shù)據(jù)的研究與預(yù)測(cè)，對(duì)其進(jìn)行月徑流模擬預(yù)測(cè)可為水庫(kù)的調(diào)度管理、水資源的管理配置等提供科學(xué)有效的依據(jù)。各水文站基本資料見(jiàn)表1，流域及水文站位置見(jiàn)圖2。

本文所采用的徑流數(shù)據(jù)來(lái)自黃河流域水文年鑒，88項(xiàng)大氣環(huán)流因子的月尺度數(shù)據(jù)來(lái)自國(guó)家氣候中心氣候系統(tǒng)診斷預(yù)測(cè)室(https://cmdp.ncc-cma.net/cn/download.htm)。模型的輸入項(xiàng)為前期的徑流數(shù)據(jù)，大氣環(huán)流因子為輸入項(xiàng)增加項(xiàng)。依據(jù)表1所示各站徑流資料，各序列前80%的數(shù)據(jù)用于模型訓(xùn)練，后20%的數(shù)據(jù)用于模型驗(yàn)證。

表1 各水文站徑流資料基本信息Table 1 Basic information of streamflow data for selected stations

圖2 各流域及水文站分布Fig.2 The locfation of selected stations in different river basins

3 數(shù)據(jù)預(yù)處理

3.1 月徑流VMD分解

VMD的分解效果在很大程度上受模態(tài)分解個(gè)數(shù)K影響，K值偏大或偏小均會(huì)影響后續(xù)預(yù)測(cè)效果。由于各模態(tài)的主要區(qū)別在于中心頻率的不同，所以可通過(guò)不同模態(tài)下中心頻率的分布情況選取合適的K值，具體求解方法參見(jiàn)文獻(xiàn)[31]，最終求得享堂站的K值為7，其他各站均為8。

以唐乃亥站為例，其月徑流經(jīng)VMD分解后的結(jié)果見(jiàn)圖3，原始的月徑流序列被分解成從高頻到低頻的7個(gè)平穩(wěn)分量(IMF)和表示趨勢(shì)的殘差項(xiàng)，在數(shù)據(jù)量增加的同時(shí)，不僅減少了噪聲，而且找出了徑流序列隱藏的周期性振蕩變化趨勢(shì)，有助于模型更好地識(shí)別數(shù)據(jù)序列的內(nèi)在變換規(guī)律，改善預(yù)測(cè)效果。

圖3 唐乃亥站月徑流VMD分解結(jié)果Fig.3 VMD decomposition of monthly runoff at Tangnaihai station

3.2 大氣環(huán)流因子篩選

目前，如何篩選機(jī)器學(xué)習(xí)模型的輸入要素尚無(wú)具體可供遵循的原則，以往研究多采用相關(guān)系數(shù)法且結(jié)果相對(duì)較優(yōu)。鑒于此，本文計(jì)算了所選5個(gè)站點(diǎn)的月徑流與88項(xiàng)大氣環(huán)流因子間的Person相關(guān)系數(shù)，考慮到機(jī)器學(xué)習(xí)模型的輸入因子過(guò)多會(huì)造成過(guò)擬合現(xiàn)象，且為了盡可能選擇與月徑流相關(guān)性較強(qiáng)的環(huán)流因子，故從通過(guò)0.01顯著性檢驗(yàn)的環(huán)流因子中選取相關(guān)系數(shù)(正相關(guān))最高的4項(xiàng)作為模型輸入因子的增加項(xiàng)。經(jīng)計(jì)算，與所選5個(gè)站的月徑流相關(guān)系數(shù)最高的4項(xiàng)大氣環(huán)流因子具有一致性，分別是北半球極渦中心強(qiáng)度指數(shù)(NHPVCII)、東亞槽強(qiáng)度指數(shù)(EATII)、西藏高原-1指數(shù)(TPR1)及西藏高原-2指數(shù)(TPR2)，這4項(xiàng)指數(shù)與各站月徑流的相關(guān)系數(shù)如表2所示。

4 結(jié)果與分析

4.1 VMD分解對(duì)LSTM模型預(yù)測(cè)結(jié)果的影響

為了探究VMD分解技術(shù)對(duì)LSTM模型預(yù)測(cè)結(jié)果的影響，使用單一預(yù)測(cè)模型LSTM和組合預(yù)測(cè)模型VMD-LSTM分別對(duì)5個(gè)水文站的月徑流進(jìn)行預(yù)測(cè)，各水文站不同預(yù)見(jiàn)期的預(yù)測(cè)結(jié)果見(jiàn)表3。因篇幅限制，本文僅展示唐乃亥站不同預(yù)見(jiàn)期的單一模型和組合模型的效果(圖4)。在相同預(yù)見(jiàn)期下，兩種模型均能有效預(yù)測(cè)低流量，但組合模型對(duì)高流量的預(yù)測(cè)效果顯著優(yōu)于單一模型，即VMD-LSTM組合模型能提高單一LSTM模型在峰值的預(yù)測(cè)精度。同時(shí)，相同預(yù)見(jiàn)期下組合模型的預(yù)測(cè)值與實(shí)測(cè)值的擬合程度要高于單一模型，且隨著預(yù)見(jiàn)期的增長(zhǎng)，組合模型的擬合程度沒(méi)有發(fā)生明顯的變化，預(yù)測(cè)效果較為穩(wěn)定。

表2 與月徑流顯著相關(guān)的大氣環(huán)流因子及相關(guān)系數(shù)Table 2 Atmospheric circulation factors significantly correlated with monthly runoff and the corresponding correlation coefficients

從表3看出，與單一LSTM模型相比，VMD分解技術(shù)能顯著提高LSTM模型的預(yù)測(cè)精度。如在1個(gè)月預(yù)見(jiàn)期時(shí)，唐乃亥、民和、享堂及折橋站的NSE從0.7左右提高到了0.91以上，尤其是紅旗站的NSE從0.598顯著提升至0.898，可見(jiàn)組合模型在各個(gè)站的預(yù)測(cè)精度都要高于單一模型。隨著預(yù)見(jiàn)期的增加，單一模型的預(yù)測(cè)精度逐漸降低，而組合模型的預(yù)測(cè)精度下降幅度較小；相較于單一預(yù)測(cè)模型，VMD-LSTM組合模型在較長(zhǎng)預(yù)見(jiàn)期情況下依然具有較高的預(yù)測(cè)精度，其中紅旗站尤為明顯，當(dāng)預(yù)見(jiàn)期由1個(gè)月增加到3個(gè)月時(shí)，采用單一模型時(shí)，NSE降幅為28.1%，而在組合模型下，NSE降幅僅為8.5%。此外，在唐乃亥站及享堂站，采用VMD-LSTM組合模型時(shí)，當(dāng)預(yù)見(jiàn)期由2個(gè)月增加到3個(gè)月時(shí)，其N(xiāo)SE分別保持在0.910和0.940，無(wú)明顯變化，而RMSE僅減小了2%左右。可見(jiàn)組合模型在較長(zhǎng)的預(yù)見(jiàn)期下其預(yù)測(cè)精度顯著高于單一模型，即VMD分解技術(shù)不僅提高了LSTM模型的預(yù)測(cè)精度，且延長(zhǎng)了預(yù)見(jiàn)期。

圖4 單一模型和組合模型驗(yàn)證期預(yù)測(cè)值與實(shí)測(cè)值對(duì)比(唐乃亥站)Fig.4 Comparison of measured and predicted monthly runoffs with LSTM and VMD-LSTM model during validation (Tangnaihai Station)

表3 單一模型和組合模型在各水文站驗(yàn)證期預(yù)測(cè)效果對(duì)比Table 3 Comparison of prediction performances between LSTM and VMD-LSTM model of each hydrological station during the validation period

4.2 融合大氣環(huán)流前后組合模型預(yù)測(cè)效果對(duì)比

上述研究表明，VMD-LSTM組合模型相較于單一LSTM模型能更準(zhǔn)確的預(yù)測(cè)未來(lái)1～3個(gè)月的徑流。為了進(jìn)一步提高模型預(yù)測(cè)精度，將所篩選的4項(xiàng)大氣環(huán)流因子作為VMD-LSTM模型輸入項(xiàng)的增加項(xiàng)，對(duì)5個(gè)水文站進(jìn)行1～3個(gè)月預(yù)見(jiàn)期的月徑流預(yù)測(cè)。鑒于BP神經(jīng)網(wǎng)絡(luò)和支持向量回歸(SVR)模型在徑流預(yù)測(cè)方面的優(yōu)勢(shì)[14-15,23-26]，分別構(gòu)建基于VMD分解的VMD-BP和VMD-SVR組合模型作為對(duì)比模型，以進(jìn)一步評(píng)價(jià)VMD-LSTM模型在融合大氣環(huán)流因子前后的預(yù)測(cè)性能。

3種組合模型融合大氣環(huán)流因子前后驗(yàn)證期的預(yù)測(cè)結(jié)果如表4所示。由表4可以看出：(1)融合大氣環(huán)流前，VMD-LSTM模型在各水文站的預(yù)測(cè)效果均明顯優(yōu)于VMD-BP和VMD-SVR模型，且VMD-SVR模型的預(yù)測(cè)效果略?xún)?yōu)于VMD-BP模型，并且隨著預(yù)見(jiàn)期的增加，VMD-LSTM模型預(yù)測(cè)精度呈緩慢下降趨勢(shì)，而VMD-BP和VMD-SVR模型預(yù)測(cè)精度迅速下降。這可能是因?yàn)锽P和SVR模型無(wú)法準(zhǔn)確獲取時(shí)間序列的波動(dòng)特性，因此前一刻的數(shù)據(jù)信息只能反映在當(dāng)前時(shí)刻，而LSTM模型既能獲得近期也能捕捉到早期的徑流特性，能較為準(zhǔn)確的獲取到徑流時(shí)間序列的波動(dòng)特性，可有效延長(zhǎng)模型的預(yù)見(jiàn)期。(2)3種模型融合大氣環(huán)流后預(yù)測(cè)精度均得到不同程度的提高，且相較于LSTM模型，BP和SVR模型在融合大氣環(huán)流后預(yù)測(cè)精度提升幅度更大，尤其是在增加預(yù)見(jiàn)期后，大氣環(huán)流對(duì)這兩種模型預(yù)測(cè)精度的提高尤為明顯。特別是在民和站，當(dāng)預(yù)見(jiàn)期為3個(gè)月時(shí)，VMD-SVR和VMD-BP模型在融合大氣環(huán)流前其N(xiāo)SE僅為-0.035和-0.014，融合大氣環(huán)流后兩模型的NSE均提高到0.7以上，且RMSE減少了近50%。這可能是因?yàn)榇髿猸h(huán)流對(duì)某一區(qū)域氣候的影響持續(xù)時(shí)間較長(zhǎng)，所以前一時(shí)期的大氣環(huán)流因子對(duì)今后很長(zhǎng)一段時(shí)間的氣候均有影響，進(jìn)而通過(guò)水循環(huán)過(guò)程對(duì)徑流產(chǎn)生影響。所以在預(yù)見(jiàn)期增加的情況下，前期歷史徑流對(duì)后面幾個(gè)月的徑流影響減小，模型預(yù)測(cè)精度逐漸降低，而大氣環(huán)流因子對(duì)后面幾個(gè)月的徑流仍然具有一定的影響，所以在融合大氣環(huán)流因子后，預(yù)見(jiàn)期越長(zhǎng)其預(yù)測(cè)精度提高越明顯。(3)融合大氣環(huán)流因子前后，3種模型在唐乃亥站和享堂站的預(yù)測(cè)效果均優(yōu)于其他水文站，且在唐乃亥站的預(yù)測(cè)效果要略?xún)?yōu)于享堂站，這可能與站點(diǎn)所處地理位置有關(guān)，唐乃亥站和享堂站分別位于黃河源區(qū)和大通河流域下游，所在地區(qū)無(wú)較大引用水設(shè)施，受人類(lèi)活動(dòng)擾動(dòng)小，所以模型能較好的識(shí)別出徑流序列的規(guī)律特性，進(jìn)而得到較高的預(yù)測(cè)精度。

盡管大氣環(huán)流因子能顯著提高VMD-BP和VMD-SVR模型的預(yù)測(cè)精度，而對(duì)VMD-LSTM模型預(yù)測(cè)效果的改善沒(méi)有其他兩種模型明顯，但最終的預(yù)測(cè)結(jié)果表明，融合大氣環(huán)流前后，VMD-LSTM模型在各水文站及各預(yù)見(jiàn)期情況下的預(yù)測(cè)精度均明顯高于其他兩類(lèi)模型。

表4 融合大氣環(huán)流前后驗(yàn)證期各模型預(yù)測(cè)結(jié)果Table 4 Predicted results of each model before and after integrating atmospheric circulation factors

為了更直觀地展示3種組合模型的預(yù)測(cè)效果，以唐乃亥站為例，融合大氣環(huán)流因子后各模型在驗(yàn)證期的預(yù)測(cè)結(jié)果如圖5所示。從圖5看出，當(dāng)預(yù)見(jiàn)期為1個(gè)月時(shí)，3種模型均能較好地預(yù)測(cè)出徑流的未來(lái)變化趨勢(shì)，其中VMD-LSTM模型的預(yù)測(cè)效果最佳，其他兩種模型在峰值和谷值的預(yù)測(cè)效果明顯不如VMD-LSTM模型。隨著預(yù)見(jiàn)期的增加，VMD-LSTM模型的預(yù)測(cè)值與實(shí)測(cè)值之間依然保持高度的吻合，而VMD-BP 和VMD-SVR模型在2、3個(gè)月預(yù)見(jiàn)期時(shí)模型的預(yù)測(cè)值明顯偏離了實(shí)測(cè)值，具體表現(xiàn)為圖像的平移錯(cuò)位，即存在延遲問(wèn)題。由此可見(jiàn)，VMD-LSTM模型相較于其他兩種模型不僅具有更高的預(yù)測(cè)精度而且能有效避免預(yù)測(cè)延遲問(wèn)題。

以上結(jié)果進(jìn)一步表明VMD-LSTM模型的預(yù)測(cè)性能優(yōu)于VMD-BP和VMD-SVR模型，且融合大氣環(huán)流因子后模型的預(yù)測(cè)效果有了進(jìn)一步的改善，可為該區(qū)月徑流預(yù)測(cè)提供準(zhǔn)確可靠的理論參考。

5 結(jié) 論

(1)VMD分解技術(shù)能顯著提高LSTM模型的預(yù)測(cè)精度，且相較于單一的LSTM模型，VMD-LSTM組合模型不僅能改善峰值的預(yù)測(cè)效果，同時(shí)能使模型在較長(zhǎng)預(yù)見(jiàn)期下仍能保持較高的預(yù)測(cè)精度。

(2)在基于VMD分解技術(shù)的混合模型中，3種混合模型的預(yù)測(cè)精度由高到低依次為VMD-LSTM>VMD-SVR>VMD-BP。

(3)在3種混合模型的預(yù)報(bào)因子中增加篩選后的大氣環(huán)流因子，各站點(diǎn)及各模型的預(yù)測(cè)精度均得到了不同程度的提高，尤其是VMD-BP和VMD-SVR模型提高的最為明顯，說(shuō)明有效的大氣環(huán)流因子可以顯著提高月徑流預(yù)測(cè)精度，且3種模型在受人類(lèi)活動(dòng)干擾較小的唐乃亥站及享堂站的預(yù)測(cè)效果更優(yōu)。

圖5 各模型驗(yàn)證期不同預(yù)見(jiàn)期預(yù)測(cè)值與實(shí)測(cè)值對(duì)比(唐乃亥站)Fig.5 Comparison of predicted and measured values in different forecast period for each model during the validation period (Tangnaihai Station)

(4)本研究提出的VMD-LSTM模型在融合大氣環(huán)流前后均優(yōu)于VMD-SVR和VMD-BP模型，其突出優(yōu)點(diǎn)表現(xiàn)在預(yù)見(jiàn)期增加的情況下模型的預(yù)測(cè)精度并沒(méi)有發(fā)生明顯的減小，避免了VMD-BP和VMD-SVR在預(yù)見(jiàn)期增加時(shí)存在的延遲問(wèn)題，在提高月徑流預(yù)測(cè)精度的同時(shí)延長(zhǎng)了預(yù)見(jiàn)期。

鑒于VMD-LSTM模型良好的徑流預(yù)測(cè)性能，也可將該模型應(yīng)用于填補(bǔ)數(shù)據(jù)缺失的徑流時(shí)間序列中，插補(bǔ)或延長(zhǎng)數(shù)據(jù)序列。為進(jìn)一步提高月徑流的預(yù)測(cè)精度，可在模型的輸入因子中加入其他氣象數(shù)據(jù)，同時(shí)采用優(yōu)化算法來(lái)尋求LSTM模型的最優(yōu)參數(shù)。