祁繼霞,粟曉玲,,張更喜,張 特
(1.西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院,陜西 楊凌 712100;2.西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室,陜西 楊凌 712100)
徑流預(yù)測(cè)是水資源管理、配置和有效利用的基礎(chǔ),精確的徑流預(yù)測(cè)可為區(qū)域防洪抗旱、水庫(kù)優(yōu)化調(diào)度及水利工程規(guī)劃設(shè)計(jì)等提供有效的科學(xué)支持[1]。尤其在干旱地區(qū),水資源短缺一直是限制農(nóng)業(yè)和經(jīng)濟(jì)發(fā)展的最大問(wèn)題,準(zhǔn)確可靠的徑流預(yù)測(cè)結(jié)果可為水資源高效利用提供重要參考,緩解旱區(qū)水資源短缺、供需矛盾等問(wèn)題。徑流的形成極易受氣候變化及人類(lèi)活動(dòng)等的影響,徑流序列常表現(xiàn)出高度的非線(xiàn)性、非穩(wěn)定性與復(fù)雜性[2]。因此,獲得高精度的徑流預(yù)測(cè)結(jié)果仍面臨挑戰(zhàn),如何提高徑流預(yù)測(cè)精度仍需進(jìn)一步研究。
當(dāng)前用于徑流預(yù)測(cè)的模型主要分為過(guò)程驅(qū)動(dòng)模型和數(shù)據(jù)驅(qū)動(dòng)模型兩類(lèi)[3]。過(guò)程驅(qū)動(dòng)模型主要通過(guò)分析和模擬水文循環(huán)過(guò)程來(lái)實(shí)現(xiàn)[4-5],雖然能較好地揭示徑流形成的物理機(jī)制,但建模需要大量準(zhǔn)確可靠的水文過(guò)程資料,普遍存在模型參數(shù)難以確定及模型通用性較差等缺陷[6]。數(shù)據(jù)驅(qū)動(dòng)模型無(wú)需考慮徑流形成的物理過(guò)程,所需數(shù)據(jù)量少且建模簡(jiǎn)單,因而被廣泛使用。數(shù)據(jù)驅(qū)動(dòng)模型通常分為時(shí)間序列統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)模型,時(shí)間序列統(tǒng)計(jì)模型一般適用于平穩(wěn)或線(xiàn)性的數(shù)據(jù)序列[7-8],難以獲得隱藏在徑流時(shí)間序列中的非線(xiàn)性特征,因而預(yù)測(cè)效果普遍不理想;傳統(tǒng)的機(jī)器學(xué)習(xí)模型包括人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、自適應(yīng)模糊推理系統(tǒng)(ANFIS)及小波變換(WT)等[9-11],這類(lèi)模型因具有較強(qiáng)的非線(xiàn)性映射能力[12],可以捕獲徑流時(shí)間序列中的非線(xiàn)性及非平穩(wěn)特性,在徑流預(yù)測(cè)中取得了較好的效果[13]。
上述機(jī)器學(xué)習(xí)模型雖然具有較強(qiáng)的數(shù)據(jù)處理能力,但ANN易陷入局部最小值收斂及過(guò)擬合[14],SVM需要謹(jǐn)慎選擇核函數(shù),ANFIS難以處理噪聲等,導(dǎo)致模型的預(yù)測(cè)精度受到影響。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,研究者提出了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM),以解決徑流的長(zhǎng)期依賴(lài)問(wèn)題[15-16],從而獲得更高精度的徑流預(yù)測(cè)結(jié)果。LSTM的優(yōu)點(diǎn)在于能夠處理較長(zhǎng)時(shí)間信息的序列,實(shí)現(xiàn)時(shí)間序列的長(zhǎng)期傳遞和記憶[17-18]。已有研究表明LSTM模型是一種更有效的徑流預(yù)測(cè)模型,如胡慶芳等[19]采用LSTM模型對(duì)漢江安康站的日徑流進(jìn)行預(yù)測(cè),發(fā)現(xiàn)LSTM模型可以有效避免過(guò)擬合問(wèn)題;Gao等[20]討論了LSTM、ANN、門(mén)控遞歸單元(GRU)模型在徑流預(yù)測(cè)中的效果,發(fā)現(xiàn)LSTM和GRU模型的性能優(yōu)于ANN模型。Yuan等[21]利用蟻獅優(yōu)化算法(ALO)對(duì)LSTM模型的參數(shù)進(jìn)行優(yōu)化,并與BP神經(jīng)網(wǎng)絡(luò)、最小支持向量機(jī)、徑向基神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,結(jié)果證明所構(gòu)建的LSTM-ALO模型用于月徑流預(yù)測(cè)時(shí)顯著優(yōu)于其他三類(lèi)模型。
由于徑流是具有周期性、隨機(jī)性及趨勢(shì)性的非平穩(wěn)成分,直接使用上述模型預(yù)測(cè)的精度受限。信號(hào)分解技術(shù)可以將徑流序列分解為多個(gè)相對(duì)穩(wěn)定的分量,同時(shí)達(dá)到降噪的目的,使模型可以更好地捕捉徑流序列變化特征,提高預(yù)測(cè)精度。近年來(lái)基于分解技術(shù)與機(jī)器學(xué)習(xí)的混合模型廣泛應(yīng)用于徑流預(yù)測(cè)中,如梁浩等[22]在優(yōu)選多元線(xiàn)性回歸(MLR)、ANN、SVM模型的基礎(chǔ)上,構(gòu)建了基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)、集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)、小波分解(WD)的混合模型,結(jié)果發(fā)現(xiàn)混合模型的預(yù)測(cè)精度均高于單一模型。Wang等[23]、黃巧玲等[24]也將分解技術(shù)和機(jī)器學(xué)習(xí)模型相耦合用于月徑流的預(yù)測(cè),表明耦合模型具有更高的預(yù)測(cè)精度。
基于分解技術(shù)的機(jī)器學(xué)習(xí)模型從挖掘數(shù)據(jù)序列自身的變化規(guī)律出發(fā)可用于徑流的模擬及預(yù)測(cè),但這類(lèi)模型未考慮徑流形成的物理成因,因而預(yù)測(cè)精度受限。考慮到大氣環(huán)流是氣候和天氣變化的主導(dǎo)因子,同時(shí)也是水循環(huán)的主要驅(qū)動(dòng)要素,對(duì)徑流的變化有一定的影響,將大氣環(huán)流因子作為機(jī)器學(xué)習(xí)模型的輸入不僅考慮了徑流形成的物理因素,也可改善模型的預(yù)測(cè)效果。如梁浩等[22]、孟二浩等[25]在常規(guī)預(yù)報(bào)因子的基礎(chǔ)上增加了大氣環(huán)流因子后預(yù)測(cè)精度得到了進(jìn)一步的提高;李福興等[26]通過(guò)平均值法篩選大氣環(huán)流因子作為神經(jīng)網(wǎng)絡(luò)的輸入,發(fā)現(xiàn)預(yù)測(cè)誤差明顯減小。
然而,當(dāng)前基于LSTM模型的徑流預(yù)測(cè)研究大多只考慮了單一預(yù)見(jiàn)期及單一站點(diǎn),分解技術(shù)能否提高LSTM模型在多預(yù)見(jiàn)期下的效用尚不明確,且大氣環(huán)流因子對(duì)較長(zhǎng)預(yù)見(jiàn)期徑流預(yù)測(cè)結(jié)果的影響尚無(wú)明確結(jié)論,故有待進(jìn)一步評(píng)估混合模型融合大氣環(huán)流因子后在多種預(yù)見(jiàn)期及多個(gè)站點(diǎn)上的適用性。基于此,本文選取了黃河流域上游5個(gè)水文站的月徑流數(shù)據(jù),在對(duì)月徑流進(jìn)行變模態(tài)分解的基礎(chǔ)上,采用LSTM模型預(yù)測(cè)了各水文站未來(lái)1~3個(gè)月的徑流量,并融合了大氣環(huán)流信息,以期進(jìn)一步提高月徑流在多種預(yù)見(jiàn)期下的預(yù)測(cè)精度。
變模態(tài)分解(Variational Mode Decomposition,VMD)是一種自適應(yīng)、完全非遞歸的模態(tài)變分和信號(hào)處理方法[27],可根據(jù)實(shí)際情況確定序列的分解個(gè)數(shù),在克服傳統(tǒng)經(jīng)驗(yàn)?zāi)B(tài)分解存在的端點(diǎn)效應(yīng)和模態(tài)混疊問(wèn)題的同時(shí),實(shí)現(xiàn)固有模態(tài)分量的有效分離,分解獲得包含多個(gè)頻率尺度且相對(duì)平穩(wěn)的子序列。VMD的核心是構(gòu)建和求解變分問(wèn)題,假設(shè)原始信號(hào)f被分解為K個(gè)具有中心頻率的有限寬度的模態(tài)分量,同時(shí)各模態(tài)的估計(jì)寬帶之和最小,約束條件為所有模態(tài)之和與原始信號(hào)相等,則相應(yīng)約束變分表達(dá)式為:
(1)
(2)
式中,K為分解的模態(tài)個(gè)數(shù),{uk},{ωk}分別對(duì)應(yīng)分解后的第k個(gè)模態(tài)分量和中心頻率,δ(t)為狄拉克函數(shù),*為卷積運(yùn)算符,f為原始時(shí)間序列。詳細(xì)求解過(guò)程參見(jiàn)文獻(xiàn)[27-28]。
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),其優(yōu)勢(shì)在于解決RNN的梯度消失和梯度爆炸問(wèn)題,廣泛應(yīng)用于序列處理與預(yù)測(cè)。與普通RNN不同,LSTM的核心概念在于細(xì)胞狀態(tài)及“門(mén)”結(jié)構(gòu),細(xì)胞狀態(tài)保證了信息能在序列中傳遞下去,而“門(mén)”結(jié)構(gòu)則在訓(xùn)練過(guò)程中決定了該保存或遺忘哪些信息。特殊的網(wǎng)絡(luò)結(jié)構(gòu)使得LSTM在學(xué)習(xí)當(dāng)前信息的同時(shí),還能捕獲時(shí)間序列中長(zhǎng)期的依賴(lài)關(guān)系,從而更適合處理和預(yù)測(cè)時(shí)間序列中間隔和延遲較長(zhǎng)的事件[18,29-30]。LSTM的結(jié)構(gòu)如圖1所示,單個(gè)LSTM主要由以下4個(gè)部分構(gòu)成:

圖1 LSTM結(jié)構(gòu)圖Fig.1 Structure of LSTM
(1)遺忘門(mén):決定應(yīng)丟棄或保存哪些信息。
ft=σ(Wf.[ht-1,xt]+bf)
(3)
(2)輸入門(mén):決定更新哪些細(xì)胞狀態(tài)。
it=σ(Wi.[ht-1,xt]+bi)
(4)
(5)
(3)更新細(xì)胞狀態(tài):更新后的細(xì)胞狀態(tài)計(jì)算公式如下:
(6)
(4)輸出門(mén):決定下一個(gè)隱藏狀態(tài)應(yīng)攜帶哪些信息。
Ot=σ(WO[ht-1,xt]+bO)
(7)
ht=Ot*tanh(Ct)
(8)

本文的LSTM模型通過(guò)Python3.9構(gòu)建,參數(shù)通過(guò)試錯(cuò)法確定,通過(guò)反復(fù)調(diào)整,最終確定LSTM模型的網(wǎng)絡(luò)結(jié)構(gòu)為雙隱層,每層的神經(jīng)元個(gè)數(shù)為50;為防止過(guò)擬合,加入舍棄層,并設(shè)定其隨機(jī)取舍率為50%;采用Adam優(yōu)化器并設(shè)置其學(xué)習(xí)率為0.05。
本文所提出的VMD-LSTM組合模型的建立主要包含以下三個(gè)步驟:
(1)利用VMD方法對(duì)徑流序列進(jìn)行分解,得到多個(gè)平穩(wěn)的固有模態(tài)分量(IMFi(i=1~n))和一個(gè)趨勢(shì)分量(r);
(2)將分解得到的多個(gè)分量進(jìn)行歸一化處理;
(3)確定LSTM模型的輸入與輸出;
采用前L個(gè)月的各固有模態(tài)分量(IMF1(t-L,t),IMF2(t-L,t),…IMFn(t-L,t))和趨勢(shì)分量(r(t-L,t))作為預(yù)報(bào)因子,預(yù)測(cè)各水文站未來(lái)3個(gè)月的徑流(Rt+1,Rt+2,Rt+3)。其中L在LSTM模型中表示其滑動(dòng)窗口長(zhǎng)度,根據(jù)月徑流的周期變化規(guī)律,單一LSTM模型的L可直接設(shè)置為12個(gè)月,但序列經(jīng)VMD分解后其徑流年際變化規(guī)律已發(fā)生改變,故不能直接將VMD-LSTM混合模型的L值設(shè)為12,需要反復(fù)調(diào)試確定L的最優(yōu)值。
采用均方根誤差(RMSE)和納什效率系數(shù)(NSE)對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行精度評(píng)價(jià),其中RMSE用來(lái)衡量預(yù)測(cè)值與實(shí)測(cè)值之間的偏差,其值越小越好;NSE取值范圍為(-∞,1],越接近1表示模型預(yù)測(cè)精度越高,RMSE和NSE的具體計(jì)算公式如下:
(9)
(10)

本文以黃河流域上游部分河流的月徑流為研究對(duì)象,收集了唐乃亥、民和、享堂、紅旗和折橋共5個(gè)水文站的月徑流資料。其中,唐乃亥站是黃河源區(qū)的門(mén)戶(hù)站,也是龍羊峽水庫(kù)的入庫(kù)站,距離省會(huì)西寧約300 km;民和站是黃河一級(jí)支流湟水的主要控制站,控制著湟水民和以上水量、沙量及水質(zhì)的變化;享堂站位于為黃河的二級(jí)支流、湟水的一級(jí)支流大通河的主要控制站,直接為八盤(pán)峽水庫(kù)的運(yùn)行調(diào)度、下游防汛、水源保護(hù)等提供水文依據(jù)及水情信息[23];紅旗站位于黃河一級(jí)支流洮河,距離下游劉家峽水庫(kù)27 km;折橋站位于大夏河下游,是劉家峽水庫(kù)的入庫(kù)控制站,同時(shí)也是大夏河的重要水沙控制站。以上五個(gè)水文站分屬不同的子流域,水文情勢(shì)各異,具有較好的代表性,且徑流數(shù)據(jù)資料完整性良好,適用于水文數(shù)據(jù)的研究與預(yù)測(cè),對(duì)其進(jìn)行月徑流模擬預(yù)測(cè)可為水庫(kù)的調(diào)度管理、水資源的管理配置等提供科學(xué)有效的依據(jù)。各水文站基本資料見(jiàn)表1,流域及水文站位置見(jiàn)圖2。
本文所采用的徑流數(shù)據(jù)來(lái)自黃河流域水文年鑒,88項(xiàng)大氣環(huán)流因子的月尺度數(shù)據(jù)來(lái)自國(guó)家氣候中心氣候系統(tǒng)診斷預(yù)測(cè)室(https://cmdp.ncc-cma.net/cn/download.htm)。模型的輸入項(xiàng)為前期的徑流數(shù)據(jù),大氣環(huán)流因子為輸入項(xiàng)增加項(xiàng)。依據(jù)表1所示各站徑流資料,各序列前80%的數(shù)據(jù)用于模型訓(xùn)練,后20%的數(shù)據(jù)用于模型驗(yàn)證。

表1 各水文站徑流資料基本信息Table 1 Basic information of streamflow data for selected stations

圖2 各流域及水文站分布Fig.2 The locfation of selected stations in different river basins
VMD的分解效果在很大程度上受模態(tài)分解個(gè)數(shù)K影響,K值偏大或偏小均會(huì)影響后續(xù)預(yù)測(cè)效果。由于各模態(tài)的主要區(qū)別在于中心頻率的不同,所以可通過(guò)不同模態(tài)下中心頻率的分布情況選取合適的K值,具體求解方法參見(jiàn)文獻(xiàn)[31],最終求得享堂站的K值為7,其他各站均為8。
以唐乃亥站為例,其月徑流經(jīng)VMD分解后的結(jié)果見(jiàn)圖3,原始的月徑流序列被分解成從高頻到低頻的7個(gè)平穩(wěn)分量(IMF)和表示趨勢(shì)的殘差項(xiàng),在數(shù)據(jù)量增加的同時(shí),不僅減少了噪聲,而且找出了徑流序列隱藏的周期性振蕩變化趨勢(shì),有助于模型更好地識(shí)別數(shù)據(jù)序列的內(nèi)在變換規(guī)律,改善預(yù)測(cè)效果。

圖3 唐乃亥站月徑流VMD分解結(jié)果Fig.3 VMD decomposition of monthly runoff at Tangnaihai station
目前,如何篩選機(jī)器學(xué)習(xí)模型的輸入要素尚無(wú)具體可供遵循的原則,以往研究多采用相關(guān)系數(shù)法且結(jié)果相對(duì)較優(yōu)。鑒于此,本文計(jì)算了所選5個(gè)站點(diǎn)的月徑流與88項(xiàng)大氣環(huán)流因子間的Person相關(guān)系數(shù),考慮到機(jī)器學(xué)習(xí)模型的輸入因子過(guò)多會(huì)造成過(guò)擬合現(xiàn)象,且為了盡可能選擇與月徑流相關(guān)性較強(qiáng)的環(huán)流因子,故從通過(guò)0.01顯著性檢驗(yàn)的環(huán)流因子中選取相關(guān)系數(shù)(正相關(guān))最高的4項(xiàng)作為模型輸入因子的增加項(xiàng)。經(jīng)計(jì)算,與所選5個(gè)站的月徑流相關(guān)系數(shù)最高的4項(xiàng)大氣環(huán)流因子具有一致性,分別是北半球極渦中心強(qiáng)度指數(shù)(NHPVCII)、東亞槽強(qiáng)度指數(shù)(EATII)、西藏高原-1指數(shù)(TPR1)及西藏高原-2指數(shù)(TPR2),這4項(xiàng)指數(shù)與各站月徑流的相關(guān)系數(shù)如表2所示。
為了探究VMD分解技術(shù)對(duì)LSTM模型預(yù)測(cè)結(jié)果的影響,使用單一預(yù)測(cè)模型LSTM和組合預(yù)測(cè)模型VMD-LSTM分別對(duì)5個(gè)水文站的月徑流進(jìn)行預(yù)測(cè),各水文站不同預(yù)見(jiàn)期的預(yù)測(cè)結(jié)果見(jiàn)表3。因篇幅限制,本文僅展示唐乃亥站不同預(yù)見(jiàn)期的單一模型和組合模型的效果(圖4)。在相同預(yù)見(jiàn)期下,兩種模型均能有效預(yù)測(cè)低流量,但組合模型對(duì)高流量的預(yù)測(cè)效果顯著優(yōu)于單一模型,即VMD-LSTM組合模型能提高單一LSTM模型在峰值的預(yù)測(cè)精度。同時(shí),相同預(yù)見(jiàn)期下組合模型的預(yù)測(cè)值與實(shí)測(cè)值的擬合程度要高于單一模型,且隨著預(yù)見(jiàn)期的增長(zhǎng),組合模型的擬合程度沒(méi)有發(fā)生明顯的變化,預(yù)測(cè)效果較為穩(wěn)定。

表2 與月徑流顯著相關(guān)的大氣環(huán)流因子及相關(guān)系數(shù)Table 2 Atmospheric circulation factors significantly correlated with monthly runoff and the corresponding correlation coefficients
從表3看出,與單一LSTM模型相比,VMD分解技術(shù)能顯著提高LSTM模型的預(yù)測(cè)精度。如在1個(gè)月預(yù)見(jiàn)期時(shí),唐乃亥、民和、享堂及折橋站的NSE從0.7左右提高到了0.91以上,尤其是紅旗站的NSE從0.598顯著提升至0.898,可見(jiàn)組合模型在各個(gè)站的預(yù)測(cè)精度都要高于單一模型。隨著預(yù)見(jiàn)期的增加,單一模型的預(yù)測(cè)精度逐漸降低,而組合模型的預(yù)測(cè)精度下降幅度較小;相較于單一預(yù)測(cè)模型,VMD-LSTM組合模型在較長(zhǎng)預(yù)見(jiàn)期情況下依然具有較高的預(yù)測(cè)精度,其中紅旗站尤為明顯,當(dāng)預(yù)見(jiàn)期由1個(gè)月增加到3個(gè)月時(shí),采用單一模型時(shí),NSE降幅為28.1%,而在組合模型下,NSE降幅僅為8.5%。此外,在唐乃亥站及享堂站,采用VMD-LSTM組合模型時(shí),當(dāng)預(yù)見(jiàn)期由2個(gè)月增加到3個(gè)月時(shí),其N(xiāo)SE分別保持在0.910和0.940,無(wú)明顯變化,而RMSE僅減小了2%左右。可見(jiàn)組合模型在較長(zhǎng)的預(yù)見(jiàn)期下其預(yù)測(cè)精度顯著高于單一模型,即VMD分解技術(shù)不僅提高了LSTM模型的預(yù)測(cè)精度,且延長(zhǎng)了預(yù)見(jiàn)期。

圖4 單一模型和組合模型驗(yàn)證期預(yù)測(cè)值與實(shí)測(cè)值對(duì)比(唐乃亥站)Fig.4 Comparison of measured and predicted monthly runoffs with LSTM and VMD-LSTM model during validation (Tangnaihai Station)

表3 單一模型和組合模型在各水文站驗(yàn)證期預(yù)測(cè)效果對(duì)比Table 3 Comparison of prediction performances between LSTM and VMD-LSTM model of each hydrological station during the validation period
上述研究表明,VMD-LSTM組合模型相較于單一LSTM模型能更準(zhǔn)確的預(yù)測(cè)未來(lái)1~3個(gè)月的徑流。為了進(jìn)一步提高模型預(yù)測(cè)精度,將所篩選的4項(xiàng)大氣環(huán)流因子作為VMD-LSTM模型輸入項(xiàng)的增加項(xiàng),對(duì)5個(gè)水文站進(jìn)行1~3個(gè)月預(yù)見(jiàn)期的月徑流預(yù)測(cè)。鑒于BP神經(jīng)網(wǎng)絡(luò)和支持向量回歸(SVR)模型在徑流預(yù)測(cè)方面的優(yōu)勢(shì)[14-15,23-26],分別構(gòu)建基于VMD分解的VMD-BP和VMD-SVR組合模型作為對(duì)比模型,以進(jìn)一步評(píng)價(jià)VMD-LSTM模型在融合大氣環(huán)流因子前后的預(yù)測(cè)性能。
3種組合模型融合大氣環(huán)流因子前后驗(yàn)證期的預(yù)測(cè)結(jié)果如表4所示。由表4可以看出:(1)融合大氣環(huán)流前,VMD-LSTM模型在各水文站的預(yù)測(cè)效果均明顯優(yōu)于VMD-BP和VMD-SVR模型,且VMD-SVR模型的預(yù)測(cè)效果略?xún)?yōu)于VMD-BP模型,并且隨著預(yù)見(jiàn)期的增加,VMD-LSTM模型預(yù)測(cè)精度呈緩慢下降趨勢(shì),而VMD-BP和VMD-SVR模型預(yù)測(cè)精度迅速下降。這可能是因?yàn)锽P和SVR模型無(wú)法準(zhǔn)確獲取時(shí)間序列的波動(dòng)特性,因此前一刻的數(shù)據(jù)信息只能反映在當(dāng)前時(shí)刻,而LSTM模型既能獲得近期也能捕捉到早期的徑流特性,能較為準(zhǔn)確的獲取到徑流時(shí)間序列的波動(dòng)特性,可有效延長(zhǎng)模型的預(yù)見(jiàn)期。(2)3種模型融合大氣環(huán)流后預(yù)測(cè)精度均得到不同程度的提高,且相較于LSTM模型,BP和SVR模型在融合大氣環(huán)流后預(yù)測(cè)精度提升幅度更大,尤其是在增加預(yù)見(jiàn)期后,大氣環(huán)流對(duì)這兩種模型預(yù)測(cè)精度的提高尤為明顯。特別是在民和站,當(dāng)預(yù)見(jiàn)期為3個(gè)月時(shí),VMD-SVR和VMD-BP模型在融合大氣環(huán)流前其N(xiāo)SE僅為-0.035和-0.014,融合大氣環(huán)流后兩模型的NSE均提高到0.7以上,且RMSE減少了近50%。這可能是因?yàn)榇髿猸h(huán)流對(duì)某一區(qū)域氣候的影響持續(xù)時(shí)間較長(zhǎng),所以前一時(shí)期的大氣環(huán)流因子對(duì)今后很長(zhǎng)一段時(shí)間的氣候均有影響,進(jìn)而通過(guò)水循環(huán)過(guò)程對(duì)徑流產(chǎn)生影響。所以在預(yù)見(jiàn)期增加的情況下,前期歷史徑流對(duì)后面幾個(gè)月的徑流影響減小,模型預(yù)測(cè)精度逐漸降低,而大氣環(huán)流因子對(duì)后面幾個(gè)月的徑流仍然具有一定的影響,所以在融合大氣環(huán)流因子后,預(yù)見(jiàn)期越長(zhǎng)其預(yù)測(cè)精度提高越明顯。(3)融合大氣環(huán)流因子前后,3種模型在唐乃亥站和享堂站的預(yù)測(cè)效果均優(yōu)于其他水文站,且在唐乃亥站的預(yù)測(cè)效果要略?xún)?yōu)于享堂站,這可能與站點(diǎn)所處地理位置有關(guān),唐乃亥站和享堂站分別位于黃河源區(qū)和大通河流域下游,所在地區(qū)無(wú)較大引用水設(shè)施,受人類(lèi)活動(dòng)擾動(dòng)小,所以模型能較好的識(shí)別出徑流序列的規(guī)律特性,進(jìn)而得到較高的預(yù)測(cè)精度。
盡管大氣環(huán)流因子能顯著提高VMD-BP和VMD-SVR模型的預(yù)測(cè)精度,而對(duì)VMD-LSTM模型預(yù)測(cè)效果的改善沒(méi)有其他兩種模型明顯,但最終的預(yù)測(cè)結(jié)果表明,融合大氣環(huán)流前后,VMD-LSTM模型在各水文站及各預(yù)見(jiàn)期情況下的預(yù)測(cè)精度均明顯高于其他兩類(lèi)模型。

表4 融合大氣環(huán)流前后驗(yàn)證期各模型預(yù)測(cè)結(jié)果Table 4 Predicted results of each model before and after integrating atmospheric circulation factors
為了更直觀地展示3種組合模型的預(yù)測(cè)效果,以唐乃亥站為例,融合大氣環(huán)流因子后各模型在驗(yàn)證期的預(yù)測(cè)結(jié)果如圖5所示。從圖5看出,當(dāng)預(yù)見(jiàn)期為1個(gè)月時(shí),3種模型均能較好地預(yù)測(cè)出徑流的未來(lái)變化趨勢(shì),其中VMD-LSTM模型的預(yù)測(cè)效果最佳,其他兩種模型在峰值和谷值的預(yù)測(cè)效果明顯不如VMD-LSTM模型。隨著預(yù)見(jiàn)期的增加,VMD-LSTM模型的預(yù)測(cè)值與實(shí)測(cè)值之間依然保持高度的吻合,而VMD-BP 和VMD-SVR模型在2、3個(gè)月預(yù)見(jiàn)期時(shí)模型的預(yù)測(cè)值明顯偏離了實(shí)測(cè)值,具體表現(xiàn)為圖像的平移錯(cuò)位,即存在延遲問(wèn)題。由此可見(jiàn),VMD-LSTM模型相較于其他兩種模型不僅具有更高的預(yù)測(cè)精度而且能有效避免預(yù)測(cè)延遲問(wèn)題。
以上結(jié)果進(jìn)一步表明VMD-LSTM模型的預(yù)測(cè)性能優(yōu)于VMD-BP和VMD-SVR模型,且融合大氣環(huán)流因子后模型的預(yù)測(cè)效果有了進(jìn)一步的改善,可為該區(qū)月徑流預(yù)測(cè)提供準(zhǔn)確可靠的理論參考。
(1)VMD分解技術(shù)能顯著提高LSTM模型的預(yù)測(cè)精度,且相較于單一的LSTM模型,VMD-LSTM組合模型不僅能改善峰值的預(yù)測(cè)效果,同時(shí)能使模型在較長(zhǎng)預(yù)見(jiàn)期下仍能保持較高的預(yù)測(cè)精度。
(2)在基于VMD分解技術(shù)的混合模型中,3種混合模型的預(yù)測(cè)精度由高到低依次為VMD-LSTM>VMD-SVR>VMD-BP。
(3)在3種混合模型的預(yù)報(bào)因子中增加篩選后的大氣環(huán)流因子,各站點(diǎn)及各模型的預(yù)測(cè)精度均得到了不同程度的提高,尤其是VMD-BP和VMD-SVR模型提高的最為明顯,說(shuō)明有效的大氣環(huán)流因子可以顯著提高月徑流預(yù)測(cè)精度,且3種模型在受人類(lèi)活動(dòng)干擾較小的唐乃亥站及享堂站的預(yù)測(cè)效果更優(yōu)。

圖5 各模型驗(yàn)證期不同預(yù)見(jiàn)期預(yù)測(cè)值與實(shí)測(cè)值對(duì)比(唐乃亥站)Fig.5 Comparison of predicted and measured values in different forecast period for each model during the validation period (Tangnaihai Station)
(4)本研究提出的VMD-LSTM模型在融合大氣環(huán)流前后均優(yōu)于VMD-SVR和VMD-BP模型,其突出優(yōu)點(diǎn)表現(xiàn)在預(yù)見(jiàn)期增加的情況下模型的預(yù)測(cè)精度并沒(méi)有發(fā)生明顯的減小,避免了VMD-BP和VMD-SVR在預(yù)見(jiàn)期增加時(shí)存在的延遲問(wèn)題,在提高月徑流預(yù)測(cè)精度的同時(shí)延長(zhǎng)了預(yù)見(jiàn)期。
鑒于VMD-LSTM模型良好的徑流預(yù)測(cè)性能,也可將該模型應(yīng)用于填補(bǔ)數(shù)據(jù)缺失的徑流時(shí)間序列中,插補(bǔ)或延長(zhǎng)數(shù)據(jù)序列。為進(jìn)一步提高月徑流的預(yù)測(cè)精度,可在模型的輸入因子中加入其他氣象數(shù)據(jù),同時(shí)采用優(yōu)化算法來(lái)尋求LSTM模型的最優(yōu)參數(shù)。