基于邊界修正和二次分解的改進(jìn)月降水LSTM 預(yù)測(cè)方法

2023-09-22 01:07:06閆加寧

中國(guó)農(nóng)村水利水電 2023年9期

關(guān)鍵詞：模型

任碩，閆加寧，羅嘉，韓瑩，3

（1. 南京信息工程大學(xué)自動(dòng)化學(xué)院，江蘇南京 210044； 2. 湖北省公眾氣象服務(wù)中心，湖北武漢 430074；3. 南京信息工程大學(xué) 江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心，江蘇南京 210044）

0 引言

對(duì)于極端降水事件的處理、洪水災(zāi)害風(fēng)險(xiǎn)等級(jí)分析、區(qū)域水資源管理以及建立完備的防洪減災(zāi)預(yù)警系統(tǒng)而言，降水預(yù)測(cè)的研究具有重要意義［1］。目前，根據(jù)現(xiàn)有資料結(jié)合數(shù)理統(tǒng)計(jì)方法的統(tǒng)計(jì)模型是降水預(yù)測(cè)的一種主要途徑，黃鶴等人［2］將統(tǒng)計(jì)模型中的馬爾可夫模型運(yùn)用于原州區(qū)的降水預(yù)測(cè)，根據(jù)已有數(shù)據(jù)驗(yàn)證了預(yù)測(cè)結(jié)果的有效性。由于降水受地理位置，大氣環(huán)流和地形等因素的影響，降水序列呈現(xiàn)出高度的非線性和復(fù)雜的變化趨勢(shì)，統(tǒng)計(jì)模型對(duì)其進(jìn)行處理時(shí)存在一定的困難性，模型的預(yù)測(cè)精度也無(wú)法得到進(jìn)一步質(zhì)的提升［3］。

隨著人工智能領(lǐng)域的飛速發(fā)展，更多研究人員將人工智能技術(shù)與機(jī)器學(xué)習(xí)的方法應(yīng)用于對(duì)連續(xù)時(shí)間的降水預(yù)測(cè)，彌補(bǔ)統(tǒng)計(jì)模型難以處理非線性序列的不足之處［4］。基于機(jī)器學(xué)習(xí)的深度學(xué)習(xí)模型，采用多個(gè)不同類型的隱藏層作為訓(xùn)練模型的構(gòu)建［5］。長(zhǎng)短期記憶網(wǎng)絡(luò)（Long Short-Term Memory Networks，LSTM）是降水預(yù)測(cè)中常用的一種深度學(xué)習(xí)模型，由于其可以有效的學(xué)習(xí)時(shí)間序列中的長(zhǎng)期依賴關(guān)系，使得模型的預(yù)測(cè)效果得到顯著改善［6］。劉新等人［7］采用LSTM 模型對(duì)青藏高原地區(qū)的月降水量進(jìn)行預(yù)測(cè)，結(jié)果顯示在不同預(yù)測(cè)步長(zhǎng)下LSTM 模型的預(yù)測(cè)精度都優(yōu)于傳統(tǒng)模型。然而僅依靠單一預(yù)測(cè)模型容易忽略訓(xùn)練樣本中的隱藏規(guī)律，因此研究人員利用信號(hào)分解算法如變分模態(tài)分解（Variational Mode Decomposition， VMD）、極點(diǎn)對(duì)稱模態(tài) 分解（Extreme-point Symmetric Mode Decomposition，ESMD）與神經(jīng)網(wǎng)絡(luò)結(jié)合，采用分解-預(yù)測(cè)-重組的形式進(jìn)行模型構(gòu)建［8］。徐冬梅等人［2］在月降水預(yù)測(cè)的研究中，融入了具有處理非線性序列優(yōu)勢(shì)的VMD算法，取得了良好的預(yù)測(cè)效果。李繼清等人［9］考慮到ESMD 算法可以自適應(yīng)地提取時(shí)間序列的不同尺度信息，利用ESMD 算法將非平穩(wěn)的徑流序列分解為幾個(gè)相對(duì)平穩(wěn)的子序列后，對(duì)各個(gè)子序列分別建模預(yù)測(cè)，重構(gòu)結(jié)果后顯示該模型提高了徑流預(yù)測(cè)的準(zhǔn)確率，開(kāi)辟了一種優(yōu)于單一預(yù)測(cè)模型的新思路。由于“端點(diǎn)效應(yīng)”會(huì)干擾序列的分解效果［10］，影響信號(hào)分解算法提取時(shí)間序列的趨勢(shì)特性，熊濤證明了“端點(diǎn)效應(yīng)”對(duì)基于分解算法的混合建模框架的預(yù)測(cè)性能有較大的負(fù)面影響［11］。為此，XU 等人［12］創(chuàng)新性的在序列分解時(shí)考慮了邊界修正（Boundary Correction， BC）的方法，以此減少端點(diǎn)效應(yīng)問(wèn)題對(duì)整體預(yù)測(cè)模型的不利因素。

基于上述內(nèi)容，本文提出一種基于邊界修正模塊和二次分解模塊的LSTM 組合月降水預(yù)測(cè)模型。首先采用動(dòng)態(tài)時(shí)間彎曲算法（Dynamic Time Warping， DTW）匹配相似子波后擴(kuò)展原始月降水序列的左右邊界；之后選用ESMD 算法提取擴(kuò)展序列的不同尺度信息，產(chǎn)生頻率依次降低的幾個(gè)模態(tài)分量以及一個(gè)趨勢(shì)分量；切割各個(gè)分量中對(duì)內(nèi)部數(shù)據(jù)“污染”最嚴(yán)重的擴(kuò)展部分；接著運(yùn)用VMD 算法對(duì)高頻分量進(jìn)行平穩(wěn)化處理；最后基于分解的子序列分別建立LSTM 模型進(jìn)行預(yù)測(cè)，將所有分量的預(yù)測(cè)結(jié)果重構(gòu)后得到最終月降水預(yù)測(cè)結(jié)果；構(gòu)建一個(gè)考慮邊界修正的ESMD-VMD-LSTM（BC）組合月降水預(yù)測(cè)模型。本文將此模型應(yīng)用于湖北省巴東縣的月降水預(yù)測(cè)，采用4 種不同的誤差評(píng)價(jià)指標(biāo)來(lái)評(píng)估模型的優(yōu)劣。通過(guò)7 種模型對(duì)比分析，探究抑制“端點(diǎn)效應(yīng)”對(duì)采用ESMD 算法的組合模型預(yù)測(cè)性能的影響，以及分解算法對(duì)模型預(yù)測(cè)精度的提升效果。

1 方法及模型構(gòu)建

1.1 基于ESMD算法的邊界修正

ESMD 算法采用極值點(diǎn)對(duì)稱法來(lái)替換經(jīng)驗(yàn)?zāi)B(tài)分解（Empirical Mode Decomposition ，EMD）所采用的外部包絡(luò)線擬合對(duì)稱法［13］，有效緩解EMD 存在的模態(tài)混疊問(wèn)題［14］。分解中的關(guān)鍵步驟是確定最佳篩選次數(shù)K0的值，詳細(xì)計(jì)算步驟見(jiàn)文獻(xiàn)［14］。

ESMD 分解序列時(shí)， 3 次樣條插值法為端點(diǎn)處插值擬合失去約束從而產(chǎn)生端點(diǎn)處漂移，并逐漸污染內(nèi)部信號(hào)數(shù)據(jù)［15］。為了抑制“端點(diǎn)效應(yīng)”，采用波形特征匹配延拓法對(duì)原始序列進(jìn)行邊界擴(kuò)展，該方法依靠搜尋與邊界處子波擁有最高相似度的內(nèi)部子波完成擴(kuò)展。選定DTW 算法計(jì)算兩段不同長(zhǎng)度序列之間的相似度，如選取兩段長(zhǎng)度分別為m和n的序列A={α1，α2，α3，…，αm}和B={β1，β2，β3，…，βn}，構(gòu)建一個(gè)m×n的空間距離矩陣Z。Z(i，j)中的元素d(αi，βi)=(αi-βi)2表示兩點(diǎn)的歐氏距離，之后動(dòng)態(tài)規(guī)劃搜尋Z(1，1)到Z(m，n)的最短路徑，最短路徑越小，代表兩段序列的相似度越高。最短路徑S(m，n)的計(jì)算如式（1）示：

以右端邊界修正為例，步驟如下：

步驟1：PO 為原始序列，紫色子波N M O為選定的研究對(duì)象，包含極大值M和極小值N，見(jiàn)圖1。

圖1 邊界擴(kuò)展示意圖Fig.1 Boundary extension diagram

步驟2：從PO 的左側(cè)開(kāi)始，依次截取包含極大值和極小值的子波。通過(guò)DTW 算法將截取的子波分別與研究對(duì)象匹配計(jì)算相似度。選定出具有最高相似度的紫色子波N1M1O1。

步驟3：從O1點(diǎn)向右截取一定長(zhǎng)度的序列（紅色實(shí)線），將截取序列延長(zhǎng)至右邊界O點(diǎn)的右端（紅色虛線）。

步驟4：將邊界擴(kuò)展后的序列進(jìn)行ESMD 分解，根據(jù)PO 序列所占擴(kuò)展序列的位置以及自身長(zhǎng)度信息，將對(duì)應(yīng)的子序列進(jìn)行切割完成邊界修正。

1.2 VMD算法

VMD 算法實(shí)質(zhì)是通過(guò)將約束變分問(wèn)題轉(zhuǎn)化為非約束變分問(wèn)題并求解，使原始信號(hào)分解為中心頻率不同的K個(gè)子模態(tài)［16］。約束變分問(wèn)題如式（2）示：

式中：f為給定的原始信號(hào)；uk為第k個(gè)模態(tài)分量；K為序列分解數(shù)量；wk為uk的中心頻率；δ(t)為狄拉克分布；?t代表對(duì)時(shí)間變量t求偏導(dǎo)運(yùn)算；?為卷積運(yùn)算；j為虛數(shù)符號(hào)；為范數(shù)。

通過(guò)引入二次懲罰項(xiàng)和拉格朗日乘數(shù)轉(zhuǎn)化為非約束變分問(wèn)題，如式（3）示：

式中：α為懲罰系數(shù)；λ為拉格朗日乘數(shù)；為兩向量的內(nèi)積計(jì)算。

得到一個(gè)非約束模型，并采用交替方向乘子法搜尋迭代計(jì)算最優(yōu){wk}、{uk}和λ的結(jié)果。迭代計(jì)算如式（4）～（6）示：

1.3 LSTM 模型

LSTM內(nèi)部結(jié)構(gòu)主要包含4個(gè)部分：輸入門、遺忘門、記憶模塊和輸出門［17］，見(jiàn)圖2。輸入門限(it)決定了當(dāng)前細(xì)胞狀態(tài)的更新程度，并且控制選擇信息的存入；遺忘門限(ft)控制過(guò)去信息的丟棄或保留；候選細(xì)胞狀態(tài)存儲(chǔ)之前迭代訓(xùn)練中所學(xué)到的信息，并且對(duì)當(dāng)前輸出的細(xì)胞狀態(tài)(Ct)產(chǎn)生影響；輸出門限(ot)控制選擇Ct中的信息輸出［18］。LSTM 的數(shù)學(xué)計(jì)算如式（7）～（12）示：

圖2 LSTM 結(jié)構(gòu)示意圖Fig.2 Diagram of the LSTM structure

式中：Wi、Wf、Wo、Wc分別為輸入單元、遺忘單元、輸出單元、候選細(xì)胞狀態(tài)對(duì)應(yīng)的權(quán)重值矩陣；bi、bf、bo、bc分別為其對(duì)應(yīng)的偏差向量；?代表向量元素逐位相乘；σ代表sigmoid 激活函數(shù)；tanh 代表雙曲正切函數(shù)；xt代表輸入向量；ht-1代表上一時(shí)刻的輸出。

1.4 ESMD-VMD-LSTM（BC）模型構(gòu)建

本文提出一種基于邊界修正模塊和二次分解模塊的LSTM組合預(yù)測(cè)模型，整體模型由“修正、分解、預(yù)測(cè)和重構(gòu)”4 個(gè)重要部分構(gòu)建，見(jiàn)圖3。步驟如下。

圖3 ESMD-VMD-LSTM（BC）組合模型框架圖Fig.3 Framework diagram of ESMD-VMD-LSTM（BC） composite model

步驟1：邊界擴(kuò)展。采用波形特征匹配延拓法擴(kuò)展原始月降水序列的左右邊界。

步驟2：一次分解。ESMD算法對(duì)邊界擴(kuò)展后的月降水序列進(jìn)行分解。

步驟3：數(shù)據(jù)切割。根據(jù)原始月降水序列所占擴(kuò)展序列的位置以及自身長(zhǎng)度信息，將對(duì)應(yīng)子序列的擴(kuò)展數(shù)據(jù)切割后，得到有限個(gè)數(shù)模態(tài)分量(E1，E2，E3，…)及殘余分量(R)完成邊界修正。

步驟4：二次分解。VMD 算法對(duì)高頻分量E1進(jìn)行分解，得到有限個(gè)數(shù)模態(tài)(V0，V1，…，Vk)。

步驟5：數(shù)據(jù)處理。將除E1外的各分量(E2，E3，…，R，V0，V1，…，Vk)進(jìn)行歸一化處理后，分別劃分訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。

步驟6：訓(xùn)練預(yù)測(cè)。基于各分量(E2，E3，…，R，V0，V1，…，Vk)分別建立LSTM 預(yù)測(cè)模型，采用滑動(dòng)窗口作為模型的輸入方式，將各分量的預(yù)測(cè)結(jié)果反歸一化處理后輸出。

步驟7：重構(gòu)結(jié)果。將各分量的輸出結(jié)果重構(gòu)，得到原始月降水的預(yù)測(cè)結(jié)果。

1.5 模型評(píng)價(jià)方法

為了對(duì)模型的預(yù)測(cè)效果進(jìn)行全面評(píng)價(jià)，并與其余模型更好地進(jìn)行量化比較。本文選取4 種不同的評(píng)價(jià)指標(biāo)：均方根誤差（Root Mean Square Error，RMSE）、平均絕對(duì)誤差（Mean Absolute Error，MAE）、平均絕對(duì)百分比誤差（Mean Absolute Percentage Error，MAPE）和納什效率系數(shù)（Nash-Sutcliffe Efficiency coefficient，NSE）。計(jì)算如式（13）～（16）示：

式中：m為采樣點(diǎn)數(shù)量；S(t)為t時(shí)刻實(shí)測(cè)值；為t時(shí)刻預(yù)測(cè)值；為樣本平均值。

根據(jù)《水文情報(bào)預(yù)報(bào)規(guī)范》（GB/T 22482-2008）相關(guān)規(guī)定：當(dāng)0.90 ≤NSE時(shí)，預(yù)測(cè)精度等級(jí)為甲級(jí)；0.70 ≤NSE＜0.90 時(shí)，預(yù)測(cè)精度等級(jí)為乙級(jí)；0.50 ≤NSE＜0.70時(shí)，預(yù)測(cè)精度等級(jí)為丙級(jí)；NSE＜0.50時(shí)，預(yù)測(cè)結(jié)果不可信。

2 實(shí)例分析

2.1 研究數(shù)據(jù)選取

巴東縣位于中國(guó)湖北省的西南部，身處長(zhǎng)江三峽的中段地區(qū)，東經(jīng)110°04′～110°32′，北緯30°28′～31°28′之間，屬于亞熱帶季風(fēng)氣候，濕熱多雨。從表1 可以看出，巴東縣近45 年的年平均降水量在1 020～1 130 mm 之間，因此精準(zhǔn)的月降水預(yù)測(cè)對(duì)該地區(qū)的水資源管理以及經(jīng)濟(jì)可持續(xù)發(fā)展具有重要意義。選取巴東縣1975 年1 月-2020 年10 月的逐月實(shí)測(cè)降水量作為實(shí)驗(yàn)樣本點(diǎn)，共計(jì)550個(gè)，其逐月實(shí)測(cè)降水的連續(xù)變化曲線見(jiàn)圖4。

表1 巴東縣近45年的年代平均降水量 mmTab.1 Annual average precipitation in Badong County in the past 45 years

圖4 原始月降水序列Fig.4 Original monthly precipitation sequence

2.2 數(shù)據(jù)預(yù)處理

（1）邊界擴(kuò)展。為了遏制“端點(diǎn)效應(yīng)”對(duì)內(nèi)部數(shù)據(jù)的“污染”，提升ESMD 算法的特征提取效果，采用波形特征匹配延拓法擴(kuò)展原始月降水序列的左右邊界，擴(kuò)展后的月降水序列S(t)見(jiàn)圖5，紅色曲線為擴(kuò)展數(shù)據(jù)。

圖5 擴(kuò)展后的月降水序列Fig.5 Extended monthly precipitation sequence

（2）ESMD 算法提取不同尺度信息。原始月降水序列的最大值和最小值相差463.3 mm，序列的變化幅度大。采用ESMD算法對(duì)擴(kuò)展后的降水序列S(t)進(jìn)行分解，確定最佳篩選次數(shù)K0為8，得到頻率依次減少的7 個(gè)模態(tài)分量E1～E7和一個(gè)殘余分量R，見(jiàn)圖6。

（3）數(shù)據(jù)切割。根據(jù)原始月降水序列所占擴(kuò)展序列的位置以及自身長(zhǎng)度信息，截去“污染”程度較高的擴(kuò)展數(shù)據(jù)，見(jiàn)圖7。

圖7 數(shù)據(jù)切割結(jié)果Fig.7 Data cutting results

從圖7可知，R為最佳自適應(yīng)全局均線，代表S(t)的整體變化趨勢(shì)：呈現(xiàn)“較快下降-緩慢下降-較快上升”的變化規(guī)律［19］。ESMD 算法充分挖掘序列的趨勢(shì)特性，較好地提取S(t)的不同尺度信息，每個(gè)模態(tài)分量都對(duì)應(yīng)其獨(dú)自的主要波動(dòng)特征，為下一步的降水預(yù)測(cè)奠定基礎(chǔ)。

（4）VMD 算法處理高頻分量。VMD 模塊對(duì)高頻分量E1進(jìn)行平穩(wěn)化處理，根據(jù)經(jīng)驗(yàn)值將分解數(shù)量K設(shè)置成2～6，在K取不同值的情況下確保每個(gè)模態(tài)的中心頻率相差不能過(guò)小，為此本文采用中心頻率對(duì)比法［20］確定最佳分解數(shù)目為5，分解結(jié)果V0～V4見(jiàn)圖8。

由圖8 可知，V0～V3分量的數(shù)值近似對(duì)稱分布在零值線的上下區(qū)域，較E1擁有更強(qiáng)的穩(wěn)定性。即使V4分量依舊包含復(fù)雜的頻率信息，但是該分量的絕大部分?jǐn)?shù)據(jù)的波動(dòng)范圍較小，從而減少了此分量的預(yù)測(cè)結(jié)果對(duì)整體模型預(yù)測(cè)精度的影響［8］。VMD 分解模塊充分降低高頻分量的非平穩(wěn)性，便于之后的LSTM神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。

（5）模型設(shè)定。將分量E2～E7，R，V0～V4根據(jù)式（17）進(jìn)行歸一化處理，分別按照9∶1 劃分訓(xùn)練集和測(cè)試集。基于LSTM分別建立各分量的預(yù)測(cè)模型，其中LSTM 的優(yōu)化函數(shù)使用Adma函數(shù)，損失函數(shù)的目標(biāo)為均方誤差，激活函數(shù)使用tanh 函數(shù)，每個(gè)模型采用兩層LSTM，為了防止過(guò)擬合，將每層LSTM 后添加取值為0.2 的Dropout 層。根據(jù)多次實(shí)驗(yàn)確定LSTM 的超參數(shù)，其中時(shí)間步長(zhǎng)為6，批量大小為12，隱藏單元數(shù)為64，學(xué)習(xí)率為0.004，訓(xùn)練次數(shù)為100。采用滑動(dòng)窗口作為模型的輸入方式，本文選用固定大小窗口模式，當(dāng)窗口輸入的數(shù)據(jù)進(jìn)入LSTM 模型完成預(yù)測(cè)后，通過(guò)實(shí)測(cè)值的移入和窗口數(shù)據(jù)的移出完成滑動(dòng)窗口的更新。多次實(shí)驗(yàn)對(duì)比，最終設(shè)定滑動(dòng)窗口的大小為6，模型第一次訓(xùn)練時(shí)將訓(xùn)練集前6 個(gè)數(shù)據(jù)點(diǎn)xt-5，xt-4，xt-3，xt-2，xt-1，xt作為輸入，預(yù)測(cè)t+ 1時(shí)刻的數(shù)據(jù)點(diǎn)xt+1，通過(guò)滑動(dòng)窗口的更新完成對(duì)模型的多次訓(xùn)練。將預(yù)測(cè)結(jié)果反歸一化處理后重構(gòu)輸出，得到最終的月降水預(yù)測(cè)結(jié)果。

式中：x?為歸一化處理后的數(shù)值；x為原始數(shù)值；xmin和xmax為序列中最小數(shù)值和最大數(shù)值。

2.3 結(jié)果分析

選取單一SVM 和LSTM 模型、未進(jìn)行邊界修正的ESMDLSTM、VMD-LSTM 和ESMD-VMD-LSTM 模型、以及采用邊界修正的ESMD-LSTM（BC）模型與本文提出的ESMD-VMDLSTM（BC）模型對(duì)比。各模型預(yù)測(cè)結(jié)果見(jiàn)表2。

表2 各模型預(yù)測(cè)結(jié)果Tab.2 Predicted results of each model

由表2 信息可知：在7 種模型中，本文提出的ESMD-VMDLSTM（BC）模型的預(yù)測(cè)結(jié)果與實(shí)測(cè)數(shù)據(jù)相差最少，預(yù)測(cè)精度最優(yōu)，其中RMSE和MAE分別為15.515 6 和12.405 1，MAPE為23.987 5%，且NSE達(dá)到了0.960 0，可信度達(dá)到甲級(jí)；單一SVM和LSTM 模型的預(yù)測(cè)結(jié)果相近且較差，其中SVM 模型的RMSE和MAE分別為67.510 4 和56.253 6，MAPE為77.344 5%，NSE低至0.243 3，預(yù)測(cè)結(jié)果不可信，其原因是由于訓(xùn)練集的數(shù)據(jù)量較少，僅依靠單一模型無(wú)法處理非線性的月降水序列；融入信號(hào)分解算法的ESMD-LSTM、VMD-LSTM 和ESMD-LSTM（BC）模型，將非平穩(wěn)的降水序列趨于平穩(wěn)化，減少?gòu)?fù)雜變化趨勢(shì)的月降水序列直接饋送至模型造成的誤差影響，預(yù)測(cè)精度較單一SVM 和LSTM 模型得到一定的提升；對(duì)比ESMD-LSTM 和VMDLSTM 模型的預(yù)測(cè)結(jié)果可知，VMD 算法較ESMD 算法在月降水序列分解中具有更優(yōu)的分解性能；ESMD-LSTM（BC）和ESMDVMD-LSTM（BC）模型的預(yù)測(cè)精度均略微優(yōu)于其各自未考慮邊界修正的模型，表明“端點(diǎn)效應(yīng)”會(huì)影響月降水序列的預(yù)測(cè)結(jié)果；觀察發(fā)現(xiàn)ESMD-VMD-LSTM 和ESMD-VMD-LSTM（BC）模型的預(yù)測(cè)精度顯著優(yōu)于ESMD-LSTM 和ESMD-LSTM（BC）模型，證明VMD 分解模塊對(duì)模型的構(gòu)建具有重要性和有效性，進(jìn)一步將ESMD-LSTM 和ESMD-LSTM（BC）模型的高頻分量E1的測(cè)試集擬合結(jié)果可視化，見(jiàn)圖9，可知一次分解模型存在含有復(fù)雜頻率分量預(yù)測(cè)結(jié)果較差的情況。

圖9 E1的測(cè)試集結(jié)果散點(diǎn)圖Fig.9 Scatter plot of test set results for E1

從指標(biāo)變化的角度分析：由于二次分解算法VMD模塊的引入，較好的避免了高頻分量預(yù)測(cè)效果較差的情況，其中ESMDVMD-LSTM 較ESMD-LSTM 模型的RMSE和MAE降低了63.96% 和64.40%，MAPE的指標(biāo)變化較小，但NSE提升了0.302 8；ESMD-VMD-LSTM（BC）較ESMD-LSTM（BC）模型的RMSE、MAE和MAPE分別降低了62.60%、62.06%和29.20%，NSE提升了0.245 8。針對(duì)序列分解的“端點(diǎn)效應(yīng)”問(wèn)題，從而將邊界修正的方法融入到模型中，使得模型的預(yù)測(cè)效果得到改善，其中ESMD-LSTM（BC）較ESMD-LSTM 模型的RMSE、MAE和MAPE分別降低了9.37%、10.62%和14.48%，NSE增加了0.062 2；ESMD-VMD-LSTM（BC）模型的RMSE、MAE和MAPE較ESMD-VMD-LSTM 分別降低了5.95%、4.75%和39.07%，NSE僅提升了0.005 2，然而對(duì)于小樣本數(shù)據(jù)的月降水預(yù)測(cè)研究同樣具有意義。

為了清晰的觀察7種模型的預(yù)測(cè)結(jié)果與實(shí)測(cè)數(shù)據(jù)的擬合效果，將其可視化處理，見(jiàn)圖10。

圖10 各模型預(yù)測(cè)結(jié)果擬合圖Fig.10 Model fit plots for predicted results of each model

由圖10 可知，SVM 和LSTM 模型無(wú)法精準(zhǔn)預(yù)測(cè)實(shí)測(cè)逐月降水量，只能擬合基本的周期變化趨勢(shì)。ESMD-LSTM 與ESMDLSTM（BC）模型較SVM 和LSTM 模型預(yù)測(cè)結(jié)果更加逼近實(shí)測(cè)數(shù)據(jù)點(diǎn)，可以擬合基本周期變化趨勢(shì)的同時(shí)精準(zhǔn)預(yù)測(cè)少數(shù)實(shí)測(cè)值；VMD-LSTM 模型的擬合效果提升顯著，在非數(shù)據(jù)極值點(diǎn)上達(dá)到了較好的擬合，然而對(duì)于部分?jǐn)?shù)據(jù)極值點(diǎn)的擬合效果依舊不理想；見(jiàn)圖10 中的局部放大圖，本文提出的ESMD-VMDLSTM（BC）模型較其余6種模型擁有更強(qiáng)的極值擬合能力，進(jìn)一步提升模型預(yù)測(cè)性能的同時(shí)增強(qiáng)了模型在實(shí)際應(yīng)用中的適用性。

3 結(jié) 論

針對(duì)月降水?dāng)?shù)據(jù)的小樣本特點(diǎn)和特征變量之間的復(fù)雜性和高冗余性，以及分解算法存在的“端點(diǎn)效應(yīng)”問(wèn)題，本文結(jié)合ESMD 算法可以自適應(yīng)提取時(shí)間序列不同尺度信息的優(yōu)點(diǎn)，VMD 算法處理非線性序列的優(yōu)勢(shì)，提出一個(gè)考慮邊界修正的ESMD-VMD-LSTM（BC）組合月降水預(yù)測(cè)模型。將該模型應(yīng)用于湖北省巴東縣的月降水預(yù)測(cè)，通過(guò)7種模型對(duì)比分析，得出如下結(jié)論。

（1）本文模型的預(yù)測(cè)精度和擬合效果在7種模型中最佳，在巴東縣的月降水預(yù)測(cè)中取得良好表現(xiàn)。未來(lái)可將本文提出的預(yù)測(cè)方法應(yīng)用于其他地區(qū)的月降水預(yù)測(cè)，嘗試性的應(yīng)用于日降水的預(yù)測(cè)研究，探究模型是否具有較強(qiáng)的泛化能力。

（2）VMD-LSTM 模型的擬合效果良好，然而其對(duì)數(shù)據(jù)極值點(diǎn)的擬合效果較差，本文模型擁有更強(qiáng)的極值擬合能力，在實(shí)際應(yīng)用中更具適用性。

（3）缺少VMD 模塊的一次分解模型，存在高頻分量預(yù)測(cè)精度較差的情況，從而影響整體模型預(yù)測(cè)的準(zhǔn)確性。

（4）“端點(diǎn)效應(yīng)”會(huì)對(duì)采用ESMD 算法的組合模型的預(yù)測(cè)性能產(chǎn)生一定的負(fù)面影響，降低模型的預(yù)測(cè)精度以及影響模型的擬合效果。

（5）由于高頻分量的預(yù)測(cè)效果是決定模型預(yù)測(cè)精度高低的關(guān)鍵因素，因此通過(guò)加入優(yōu)化算法，對(duì)高頻分量建立更優(yōu)的參數(shù)模型，使得ESMD-VMD-LSTM（BC）模型的預(yù)測(cè)精度仍然可以進(jìn)一步提升，這也是后續(xù)需要進(jìn)一步研究的工作之一。