譚永杰,王現(xiàn)勛*,段茗續(xù),劉亞茹,姚華明,2,3
(1.長(zhǎng)江大學(xué)資源與環(huán)境學(xué)院 油氣地球化學(xué)與環(huán)境湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430100;2.中國(guó)長(zhǎng)江電力股份有限公司,湖北 宜昌 443000;3.智慧長(zhǎng)江與水電科學(xué)湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 宜昌 443000)
精準(zhǔn)可靠的徑流預(yù)報(bào)是防洪減災(zāi)、水資源的配置與管理、電力生產(chǎn)等流域管理和調(diào)度決策的關(guān)鍵依據(jù),也是全球水文水資源領(lǐng)域研究的熱點(diǎn)[1]。徑流過(guò)程通常受降水、蒸發(fā)、地形、土地利用及大尺度氣候異常因子等諸多因素的影響,本質(zhì)上是高度動(dòng)態(tài)的,甚至是混沌的,同時(shí)也是非線(xiàn)性和非平穩(wěn)的[2]。近年來(lái),受氣候變化和人類(lèi)活動(dòng)的影響,許多流域的水資源狀況發(fā)生了巨大的改變,徑流的一致性因此改變的愈加明顯,精準(zhǔn)捕捉日徑流時(shí)間序列的動(dòng)態(tài)過(guò)程變得更加困難[3]。為了準(zhǔn)確地預(yù)測(cè)未來(lái)時(shí)段的徑流,國(guó)內(nèi)外水文預(yù)報(bào)研究者提出了多種預(yù)報(bào)模型以及預(yù)報(bào)方法。在這些水文預(yù)報(bào)模型方法中大致可以分為3個(gè)類(lèi)型。第一種類(lèi)型是基于統(tǒng)計(jì)學(xué)原理的水文預(yù)報(bào)模型,該模型主要是通過(guò)對(duì)歷史水文數(shù)據(jù)進(jìn)行分析和擬合,來(lái)預(yù)測(cè)未來(lái)水文過(guò)程的變化趨勢(shì)。常用的統(tǒng)計(jì)學(xué)方法包括回歸分析[4]、時(shí)間序列分析[5]、聚類(lèi)分析[6]等。這種模型具有簡(jiǎn)單易用的優(yōu)點(diǎn),適用于數(shù)據(jù)量較少的情況,但存在著較大的誤差和不確定性。第二種類(lèi)型是基于物理學(xué)原理的水文預(yù)報(bào)模型,該模型主要是基于水文過(guò)程的物理規(guī)律,通過(guò)建立數(shù)學(xué)公式來(lái)描述水文的變化過(guò)程。常用的模型包括新安江模型[7-8]、水箱模型[9]、HBV模型[10]等。這種模型具有較高的準(zhǔn)確性和可靠性,但需要大量的數(shù)據(jù)和對(duì)水文過(guò)程的深入理解。第三種類(lèi)型是基于人工神經(jīng)網(wǎng)絡(luò)的水文預(yù)報(bào)模型,該模型主要是通過(guò)模擬人腦神經(jīng)元的工作原理,來(lái)建立水文過(guò)程的非線(xiàn)性模型。常用的神經(jīng)網(wǎng)絡(luò)模型包括(Back Propagation,BP)反向傳播神經(jīng)網(wǎng)絡(luò)[11]、(Extreme Learning Machines,ELM) 極限學(xué)習(xí)機(jī)[12]、(Support Vector Networks,SVM)支持向量機(jī)[13]、(Long Short Term Memory,LSTM)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)[14]等。由于深度學(xué)習(xí)算法能更好的模擬非線(xiàn)性、非平穩(wěn)的時(shí)間序列,可以更加準(zhǔn)確地進(jìn)行徑流預(yù)報(bào),逐漸成為近年來(lái)新的研究熱點(diǎn)。
隨著近幾年學(xué)者的深入研究,不少學(xué)者發(fā)現(xiàn)徑流時(shí)間序列是含有多種頻率和趨勢(shì)成分的非線(xiàn)性非平穩(wěn)時(shí)間序列,其非平穩(wěn)性和非線(xiàn)性增加了預(yù)報(bào)的預(yù)測(cè)難度[15-17]。不少研究表明將時(shí)域分析的數(shù)據(jù)預(yù)處理方法與神經(jīng)網(wǎng)絡(luò)模型組合可以提高徑流預(yù)報(bào)的精度。李福興等[18]采用經(jīng)驗(yàn)?zāi)B(tài)分解算法(Empirical Mode Decomposition,EMD)提取徑流序列中具有物理含義的信號(hào)并得到不同時(shí)間尺度的多個(gè)固有模態(tài)函數(shù)(Intrinsic Mode Functions,IMF),在利用(Autoregressive Integrated Moving Average,ARIMA)自回歸移動(dòng)平均模型與(Generalized Regression Neural Network,GRNN)廣義回歸神經(jīng)網(wǎng)絡(luò)分別對(duì)不同時(shí)間尺度的IMF進(jìn)行模擬,分析徑流未來(lái)變化趨勢(shì),預(yù)測(cè)結(jié)果表明,其提出結(jié)合EMD模態(tài)分解算法的組合預(yù)測(cè)模型能取得較好的預(yù)測(cè)效果;王秀杰等[19]利用時(shí)變?yōu)V波器的經(jīng)驗(yàn)?zāi)B(tài)分解(Time-Varying-Filter,Empirical Mode Decomposition,TVF-EMD)分解原始徑流序列,再利用(Grey Relation Analysis,Light Gradient Boosting Machine,GRA-LightGBM)組合模型進(jìn)行預(yù)測(cè),結(jié)果表明結(jié)合模態(tài)分解算法的組合預(yù)測(cè)模型較其他模型擁有更高的精度。劉揚(yáng)等[20]提出一種改進(jìn)的集合經(jīng)驗(yàn)?zāi)B(tài)分解算法(EEMD)將徑流信號(hào)分解為若干模態(tài)分量,在將各分量分別輸入門(mén)控循環(huán)單元(Gate Recurrent Unit,GRU)神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果表明,該組合模型擁有更高的預(yù)測(cè)精度,可進(jìn)一步減少防洪區(qū)的經(jīng)濟(jì)損失。但上述所描述的模態(tài)分解算法仍存在一定缺陷,EMD受獨(dú)特的分解原理限制,基于EMD的分解理論存在的模態(tài)混疊現(xiàn)象和端點(diǎn)效應(yīng)等問(wèn)題,且只能被削弱而難以根除;EEMD模型在添加噪音時(shí)使用了隨機(jī)數(shù),將導(dǎo)致每次分解結(jié)果都存在微弱偏差,結(jié)果難以完全復(fù)現(xiàn)。而基于自適應(yīng)噪聲的完整集合經(jīng)驗(yàn)?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)[21]方法是一種建立在EMD分解和EEMD分解基礎(chǔ)上的自適應(yīng)白噪聲分解方法,在分解過(guò)程中的每一階段都添加有限次的自適應(yīng)高斯白噪聲,不僅克服了EMD分解模態(tài)混疊問(wèn)題,還解決了EEMD方法在較少的實(shí)驗(yàn)平均次數(shù)下導(dǎo)致重構(gòu)誤差較大以及計(jì)算效率低的缺點(diǎn)。胡斯曼[22]將CEEMDAN模態(tài)分解算法運(yùn)用于月徑流、年徑流的預(yù)測(cè)中,且取得了不錯(cuò)的預(yù)測(cè)效果,但在更具非平穩(wěn)性、非線(xiàn)性的日徑流時(shí)間序列的運(yùn)用卻少有涉及,在應(yīng)對(duì)更加復(fù)雜的日徑流序列中,還有待進(jìn)一步探究。
針對(duì)上述問(wèn)題,結(jié)合不同的時(shí)域分解算法和LSTM模型,構(gòu)建基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)算法、集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)算法、完整經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)算法并利用(Grid Search,GS)網(wǎng)格搜索參數(shù)尋優(yōu)算法[23]對(duì)LSTM模型的超參數(shù)進(jìn)行尋優(yōu)的組合預(yù)測(cè)模型,對(duì)日徑流進(jìn)行預(yù)報(bào)。以宜昌水文站為研究區(qū)域,其日徑流時(shí)間序列為研究對(duì)象,比較不同模態(tài)分解算法構(gòu)成的組合預(yù)測(cè)模型的預(yù)測(cè)精度,結(jié)果表明結(jié)合CEEMDAN的GS-LSTM組合預(yù)測(cè)模型擁有更高的預(yù)測(cè)精度。
在處理非平穩(wěn)和非線(xiàn)性時(shí)間序列數(shù)據(jù)方面,HUANG等[24]于1998年提出的EMD在處理信號(hào)時(shí),將會(huì)產(chǎn)生一組固有模態(tài)函數(shù),消除了寄生諧波來(lái)表示非線(xiàn)性和非平穩(wěn)信號(hào)的需要。眾多文獻(xiàn)表明其在處理如徑流[25]、風(fēng)速[26]非線(xiàn)性時(shí)序數(shù)據(jù)時(shí)具有明顯的優(yōu)勢(shì)。EMD的技術(shù)步驟如下。
步驟一找到原始徑流時(shí)間序列S(t)的所有局部最大值和局部最小值,然后用三次樣條曲線(xiàn)擬合S(t)的上包絡(luò)線(xiàn)U(t)和下包絡(luò)線(xiàn)L(t),并求出上下包絡(luò)線(xiàn)的均值系列M(t),見(jiàn)式(1):
(1)
步驟二使用原始時(shí)間序列S(t)減去均值序列M(t)得到一個(gè)新的時(shí)間序列H(t),見(jiàn)式(2):
H(t)=S(t)-M(t)
(2)
步驟三如果M(t)和H(t)滿(mǎn)足終止標(biāo)準(zhǔn),可以得到第一個(gè)IMF為c1(t)=M(t)和第一個(gè)殘差R為r1(t)=H(t),其終止標(biāo)準(zhǔn)為①M(fèi)(t)接近于0;②H(t)中局部最小極值點(diǎn)和零交叉點(diǎn)的數(shù)量必須相同或最多相差一個(gè)。
步驟四如果不滿(mǎn)足終止標(biāo)準(zhǔn),對(duì)H(t)重復(fù)步驟一—三,直到得到c1(t)和r1(t)。
步驟五對(duì)r1(t)重復(fù)上述步驟一—四,直到得到所有的IMF和殘差。因此,原始時(shí)間序列S(t)將按照式(3)被分解。
(3)
式中ci(t)——第i個(gè)IMF;rk(t)——第k個(gè)殘差項(xiàng)。
盡管EMD技術(shù)在實(shí)際應(yīng)用中取得了不錯(cuò)的效果,但其分解得到的IMF存在模態(tài)混疊現(xiàn)象,給IMF的重構(gòu)帶來(lái)一定的困擾。Wu等[27]于2009年提出了一種名為EEMD的噪聲輔助數(shù)據(jù)分析方法,其最大優(yōu)點(diǎn)在于其能夠以自適應(yīng)方式提取信號(hào)的各分量及變化趨勢(shì),同時(shí)顯著地減少了經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)方法中存在的模態(tài)混疊現(xiàn)象,克服了小波變換容易造成很多虛假的沒(méi)有原有物理意義的諧波的缺點(diǎn)[28]。其通過(guò)在分解的過(guò)程中多次引入均勻分布的白噪聲,將信號(hào)本身的噪聲通過(guò)多次人為添加的噪聲掩蓋過(guò)去,從而得到更加精準(zhǔn)的上下包絡(luò)線(xiàn)。同時(shí)對(duì)分解結(jié)果進(jìn)行平均處理,平均處理次數(shù)越多,噪聲給分解帶來(lái)的影響就越小。EEMD的技術(shù)步驟如下:①在原時(shí)間序列中加入高斯白噪聲,然后得到一個(gè)新的時(shí)間序列;②分解新的時(shí)間序列以獲得每個(gè)IMF成分;③連續(xù)重復(fù)①和②,但每次都使用不同的高斯白噪聲;④以分解的相應(yīng)IMF的合計(jì)平均值作為最終結(jié)果。
基于自適應(yīng)噪聲的完整集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)方法是一種建立在EMD分解和EEMD分解基礎(chǔ)上的自適應(yīng)白噪聲分解方法,在分解過(guò)程中的每一階段都添加有限次的自適應(yīng)高斯白噪聲,不僅克服了EMD分解的模態(tài)混疊問(wèn)題,還克服了EEMD方法在較少的實(shí)驗(yàn)平均次數(shù)下導(dǎo)致重構(gòu)誤差較大以及計(jì)算效率低的缺點(diǎn)。

步驟一通過(guò)添加一個(gè)白噪聲wi(t)(i=1,2,……,n),信噪比為ε0到原始日徑流時(shí)間序列S(t),得到的S(t)被用來(lái)進(jìn)行一次分解,見(jiàn)式(4)。其中t代表不同的時(shí)間點(diǎn),i代表第i次加入的白噪聲,n代表加入白噪聲的總數(shù)。
Si(t)=S(t)+ε0ωi(t)
(4)

(5)
(6)
步驟三自適應(yīng)噪聲項(xiàng)是通過(guò)EMD獲得的第一個(gè)IMF,加上白噪聲ωi(t)且信噪比為ε1然后加入自適應(yīng)噪聲項(xiàng)得到第一個(gè)殘差R1(t),并得到一個(gè)新的時(shí)間序列。隨即利用式(7)分解得到CEEMDAN的第二個(gè)IMF,第二個(gè)殘差R2(t)根據(jù)式(8)計(jì)算得到。
(7)
(8)
步驟四重復(fù)步驟三,加入新的自適應(yīng)噪聲得到新的時(shí)間序列與殘差項(xiàng),然后分解得到CEEMDAN的第K個(gè)IMF,其中ωi(t),(i=1,2,…n),εk,(k=2,3,…K),計(jì)算步驟見(jiàn)式(9)、(10)。
EMDk-1(ωi(t)))
(9)
(10)
步驟五最后,CEEMDAN算法的殘差項(xiàng)不能繼續(xù)分解,因?yàn)椴粫?huì)超過(guò)2個(gè)極值點(diǎn),因此最終殘差項(xiàng)R(t)是一個(gè)獨(dú)特的趨勢(shì)項(xiàng)。獲得的完整IMF和R(t)與原始日徑流時(shí)間序列見(jiàn)式(11)。
(11)

LSTM[29]網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的一種改進(jìn)網(wǎng)絡(luò),在時(shí)間反饋機(jī)制基本不變的情況下,引入了記憶單元(memory cell)和門(mén)(gate)的機(jī)制,來(lái)實(shí)現(xiàn)對(duì)信息流的存儲(chǔ)和控制。該機(jī)制保障了信息在其特殊的神經(jīng)元結(jié)構(gòu)中實(shí)現(xiàn)長(zhǎng)期性的篩選與保留,從而有效避免橫向深度帶來(lái)的信息丟失問(wèn)題。此外,記憶單元的門(mén)控機(jī)制也使得梯度下降時(shí),梯度的衰減得到緩解,有效緩解了模型訓(xùn)練時(shí)的梯度消失與梯度爆炸的問(wèn)題。
圖1所示,LSTM單元中有3種類(lèi)型的門(mén)控,分別為輸入門(mén)、遺忘門(mén)和輸出門(mén)。圖中分別使用i、f和o來(lái)表示輸入、遺忘和輸出門(mén),⊙代表對(duì)應(yīng)元素相乘,W和b表示網(wǎng)絡(luò)的權(quán)重矩陣和偏置向量。
LSTM的計(jì)算過(guò)程大致可以用式(12)—(16)表示,在時(shí)間步為t時(shí),LSTM的隱藏層的輸入和輸出向量分別用xt和ht表示,記憶單元用ct表示。輸入門(mén)用于控制網(wǎng)絡(luò)當(dāng)前輸入數(shù)據(jù)xt流入記憶單元的多少,即ct可以保存多少有效信息,見(jiàn)式(12):
it=σ(Wxixt+Whiht-1+bi)
(12)
遺忘門(mén)是LSTM單元的核心組成部分,其可以保留部分信息并遺忘部分信息。遺忘門(mén)控制自連接單元,可以決定歷史信息中的哪些部分會(huì)被丟棄,即上一時(shí)刻記憶單元ct-1中的信息對(duì)當(dāng)前記憶單元ct的影響見(jiàn)式(13)、(14)。
ft=σ(Wxfxt+Whfht-1+bf)
(13)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc)
(14)
輸出門(mén)控制記憶單元ct對(duì)當(dāng)前輸出值ht的影響,即記憶單元中的部分信息會(huì)在時(shí)間步t輸出。輸出門(mén)的表達(dá)見(jiàn)式(15),LSTM單元在t時(shí)刻的輸出ht可以通過(guò)式(16)得到。
ot=σ(Wxoxt+Whoht-1+bo)
(15)
ht=ot⊙tanh(ct)
(16)
本文以長(zhǎng)江流域中的宜昌水文站為研究對(duì)象,宜昌水文站位于三峽工程下游距三峽水利工程約44 km處,地處長(zhǎng)江上游與中游的交界處,被視為干流上中游的咽喉。已知宜昌水文站控制流域面積占到整個(gè)流域面積的55%,該站所測(cè)徑流多年平均徑流量為4 131億m3,其中汛期平均流量為3 412億m3,占全年徑流量的79%左右[30],研究區(qū)域見(jiàn)圖2。

圖2 宜昌水文站地理位置示意
本文采用長(zhǎng)江流域宜昌水文站1952年1月1日至2020年12月31日實(shí)測(cè)(日)徑流資料進(jìn)行分析,其徑流數(shù)據(jù)見(jiàn)圖3。

圖3 徑流數(shù)據(jù)
在評(píng)估模型的性能時(shí),均方根誤差(Root Mean Square Error,RMSE)是預(yù)測(cè)值與實(shí)際值之間差異的平方的平均值的平方根;平均絕對(duì)誤差(Mean Absolute Error,MAE)是預(yù)測(cè)值與實(shí)際值之間差異的絕對(duì)值的平均值;平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)是預(yù)測(cè)值與實(shí)際值之間差異的絕對(duì)值與實(shí)際值之間的比率的平均值。本文采用RMSE、MAE和MAPE統(tǒng)計(jì)指標(biāo)來(lái)進(jìn)行評(píng)價(jià)[31],見(jiàn)式(17)—(19):
(17)
(18)
(19)

利用上述EMD、EEMD、CEEMDAN 3種模態(tài)分解算法對(duì)宜昌水文站1952年1月1日至2020年12月31日的日徑流時(shí)間序列進(jìn)行分解,使用EMD將原始序列自適應(yīng)的分解為若干個(gè)子模態(tài),結(jié)果見(jiàn)圖4;使用EEMD、CEEMDAN對(duì)徑流時(shí)間序列進(jìn)行分解,分解內(nèi)容見(jiàn)圖5、6。

圖4 EMD模態(tài)分解

圖5 EEMD模態(tài)分解

圖6 CEEMDAN模態(tài)分解
利用上述模態(tài)分解算法對(duì)宜昌水文站1952年1月1日至2020年12月31日的日徑流數(shù)據(jù)進(jìn)行分解,按照1952年1月1日至1999年10月22日為訓(xùn)練數(shù)據(jù),1999年10月23日至2020年12月31日為測(cè)試集,并將分解后的模態(tài)分別輸入LSTM模型進(jìn)行預(yù)測(cè),并將各模態(tài)的預(yù)測(cè)結(jié)果進(jìn)行加和得到最終的預(yù)測(cè)值,本算例直接選取10 d的歷史徑流數(shù)據(jù)預(yù)測(cè)下1 d的徑流,考慮到預(yù)見(jiàn)期過(guò)短,無(wú)法提供太多參考價(jià)值,因此采用滾動(dòng)預(yù)報(bào)的方式去增長(zhǎng)日徑流預(yù)見(jiàn)期,并利用網(wǎng)格搜索參數(shù)尋優(yōu)算法選擇的超參數(shù)設(shè)置見(jiàn)表1,其預(yù)測(cè)流程見(jiàn)圖7。

表1 LSTM超參數(shù)及取值

圖7 預(yù)測(cè)流程
為驗(yàn)證模型預(yù)測(cè)性能,對(duì)以下4種模型的結(jié)果分別進(jìn)行討論,以下4種模型均按照上述網(wǎng)格搜索算法尋優(yōu)的超參數(shù)進(jìn)行設(shè)置,4種模型的評(píng)價(jià)指標(biāo)結(jié)果見(jiàn)表2、圖8。

表2 4種模型評(píng)價(jià)指標(biāo)比較

圖8 預(yù)測(cè)結(jié)果對(duì)比
模型一(GS-LSTM):將原始日徑流時(shí)間序列直接輸入LSTM模型進(jìn)行預(yù)測(cè)。
模型二(EMD-GS-LSTM):運(yùn)用EMD模態(tài)分解算法先將原始日徑流時(shí)間序列進(jìn)行分解,然后分別輸入進(jìn)LSTM模型進(jìn)行預(yù)測(cè),最終將各個(gè)預(yù)測(cè)值進(jìn)行加和得到徑流預(yù)測(cè)值。
模型三(EEMD-GS-LSTM):使用EEMD模態(tài)分解算法先將原始日徑流時(shí)間序列進(jìn)行分解,然后分別輸入進(jìn)LSTM模型進(jìn)行預(yù)測(cè),最終將各個(gè)預(yù)測(cè)值進(jìn)行加和得到徑流預(yù)測(cè)值。
模型四(CEEMDAN-GS-LSTM):利用CEEMDAN模態(tài)分解算法先將原始日徑流時(shí)間序列進(jìn)行分解,然后分別輸入進(jìn)LSTM模型進(jìn)行預(yù)測(cè),最終將各個(gè)預(yù)測(cè)值進(jìn)行加和得到徑流預(yù)測(cè)值。
從表2、圖8可以看出,RMSE在463.46~1 325.23,MAE在327.58~786.47,MAPE在2.90%~5.78%,均處于較低水平,LSTM模型能較好地預(yù)測(cè)日徑流的總體趨勢(shì),此外可以看出模型四(CEEMDAN-LSTM)的預(yù)測(cè)精度優(yōu)于其他4個(gè)模型的精度,說(shuō)明其在日徑流預(yù)報(bào)中擁有更好的表現(xiàn)。
a)將模型一(GS-LSTM)的預(yù)測(cè)結(jié)果與其他模型預(yù)測(cè)結(jié)果對(duì)比,可以看出將模態(tài)分解算法加入到日徑流的預(yù)測(cè),可以提高模型的預(yù)測(cè)精度,與模型四相比,其RMSE、MAE和MAPE分別降低了65.02%、58.35%與2.88%,有效降低了徑流時(shí)間序列的非平穩(wěn)性與波動(dòng)性,使得徑流序列更易被LSTM模型捕捉,從而取得更好的預(yù)報(bào)效果。
b)將模型二(EMD-GS-LSTM)與模型三(EEMD-GS-LSTM)的預(yù)測(cè)結(jié)果進(jìn)行比較,模型二的預(yù)測(cè)結(jié)果略微優(yōu)于模型三,其RMSE、MAE和MAPE分別降低了20.91%、39.23%與1.57%。在使用EEMD算法對(duì)徑流時(shí)間序列進(jìn)行分解時(shí),由于隨機(jī)噪聲的加入,導(dǎo)致在模態(tài)分解時(shí)存在微弱的偏差,進(jìn)而影響到預(yù)測(cè)結(jié)果,這表明傳統(tǒng)的模態(tài)分解算法在進(jìn)行時(shí)域分解時(shí)仍存在一定的缺陷,若對(duì)模態(tài)分解算法進(jìn)行改進(jìn),可以提高模型的預(yù)測(cè)精度。
c)對(duì)比模型四(CEEMDNA-GS-LSTM)與其他3個(gè)模型的預(yù)測(cè)結(jié)果,克服模態(tài)混疊和重構(gòu)誤差問(wèn)題的CEEMDAN-GS-LSTM預(yù)測(cè)模型預(yù)測(cè)效果優(yōu)于EMD-GS-LSTM、EEMD-GS-LSTM預(yù)測(cè)模型。與模型二相比,其RMSE、MAE和MAPE分別降低了33.65%、27.57%與0.76%,對(duì)比模型三,其RMSE、MAE和MAPE分別降低了47.53%、55.99%與2.33%。采用CEEMDAN模態(tài)分解算法的預(yù)測(cè)模型均優(yōu)于EMD、EEMD,合適的模態(tài)分解算法可以更有效地追蹤徑流時(shí)間序列,進(jìn)而提高模型預(yù)測(cè)精度。
綜上所述,在面對(duì)更具波動(dòng)性的日徑流預(yù)報(bào)中,運(yùn)用模態(tài)分解算法去預(yù)測(cè)日徑流可以提高模型預(yù)報(bào)精度,且在本文4個(gè)模型中,模型四(CEEMDAN-GS-LSTM)模型預(yù)報(bào)效果優(yōu)于其他模態(tài)分解算法結(jié)合LSTM的組合預(yù)測(cè)模型,CEEMDAN模態(tài)分解算法在日徑流預(yù)報(bào)將時(shí)間序列自適應(yīng)地將其分解為一系列不同尺度的模態(tài)分量,與EEMD、EMD方法相比,其能實(shí)現(xiàn)對(duì)幅值較大數(shù)據(jù)分解的完整性,有利于進(jìn)一步提高預(yù)測(cè)精確度。
本文針對(duì)日徑流預(yù)報(bào)構(gòu)建了基于CEEMDAN與GS-LSTM的組合預(yù)報(bào)模型,并對(duì)比分析了不同模態(tài)分解算法在日徑流預(yù)報(bào)中的影響,通過(guò)算例分析得到以下結(jié)論。
a)本文首先利用傳統(tǒng)模態(tài)分解算法EMD和EEMD對(duì)徑流數(shù)據(jù)進(jìn)行分解,再分別對(duì)各個(gè)模態(tài)進(jìn)行預(yù)測(cè),最后對(duì)預(yù)測(cè)值進(jìn)行重構(gòu)得到最終的預(yù)測(cè)值,其預(yù)報(bào)結(jié)果明顯優(yōu)于單一預(yù)報(bào)模型,EMD-GS-LSTM組合預(yù)測(cè)模型其RMSE、MAE和MAPE分別降低了625.32%、334.21%與2.12%,EEMD-GS-LSTM組合預(yù)測(cè)模型其RMSE、MAE和MAPE分別降低了440.15%、42.22%與0.55%,表明將模態(tài)分解算法運(yùn)用日徑流預(yù)報(bào),可有效提高預(yù)報(bào)精度。
b)本文所使用的克服模態(tài)混疊和重構(gòu)誤差CEEMDAN模態(tài)分解算法對(duì)日徑流進(jìn)行分解,并使用網(wǎng)格搜索參數(shù)尋優(yōu)算法對(duì)LSTM模型的超參數(shù)進(jìn)行優(yōu)化,其預(yù)報(bào)結(jié)果優(yōu)于EMD、EEMD模態(tài)分解算法,其預(yù)報(bào)效果較EMD-GS-LSTM組合預(yù)測(cè)模型,其RMSE、MAE和MAPE分別降低了236.45%、124.68%與0.76%,表明該模型可以更準(zhǔn)確地對(duì)日徑流進(jìn)行預(yù)報(bào)。
以“分解-預(yù)測(cè)-重構(gòu)”這個(gè)徑流預(yù)報(bào)方法而言,模態(tài)分解算法的選取將會(huì)明顯影響到日徑流的預(yù)報(bào)精度,在未來(lái)的研究中,改進(jìn)模態(tài)分解算法,對(duì)徑流時(shí)間序列進(jìn)行更加有效且精準(zhǔn)的分解,這將獲得更加理想的預(yù)測(cè)效果。