張先起,宋 超,胡登奎
(1.華北水利水電大學水利學院,鄭州 450046;2. 水資源高效利用與保障工程河南省協同創新中心,鄭州 450046)
灌區地下水埋深變化是一個復雜的、模糊的和不確定性的系統,影響地下水埋深變化的因素有很多,地下水開采、土壤地質條件、地表蒸發與植物蒸騰[1]等都會引起其變化。準確的預測地下水埋深變化可為灌區地下水保護、種植結構與模式調整、水土資源的合理利用與生態環境保護等提供理論依據。國內外關于地下水埋深預測模型的研究比較重視,且已取得了較豐碩的成果。Zhang等[2]運用GSM、RBF和ANFIS模型對吉林市的非承壓含水層地下水埋深進行了預測;Adhikary等[3]采用交叉驗證方法比較IDW、RBF、OK、UK插值方法在地下水位預測中的效果;Al-Mahallawi等[4]利用神經網絡預測農村農業地區的地下水硝酸鹽污染的變化;Maiti等[5]運用三種神經網絡模型對地下水位進行預測;楊忠平[6]等運用時間序列模型預測吉林省地下水的動態變化;沈冰等[7]利用灰色記憶模型對新疆和田地下水埋深進行了預測;李榮峰等[8]采用自記憶模型對山西晉中地下水埋深進行了預測。由上可知,國內外研究人員對地下水埋深預測模型的研究主要集中在對地下水埋深時間序列回歸分析與利用模糊理論、灰色理論與神經網絡等方面。影響灌區地下水埋深變化的因素有很多,且具有隨機性、不確定性與模糊性等。Elman神經網絡具有較強的自主學習適應能力及泛化能力,在非線性時間序列預測中被廣泛應用[9]。集合經驗模態分解法[10](Ensemble Empirical Mode Decomposition,簡稱EEMD)是從原信號中提取固有模態函數(IMF),從而分離信號的低頻與高頻部分,來實現對非平穩化序列的平穩化處理。雖然EMD分解和神經網絡在地下水埋深中均有應用[11-13],但是利用EEMD和Elman網絡結合起來構建灌區地下水埋深預測耦合模型較為少見。論文結合EEMD和Elman神經網絡的優勢,建立了基于EEMD和Elman網絡的地下水埋深預測耦合模型,并將其應用于人民勝利渠灌區的地下水埋深預測中。
經驗模態分解[14](Empirical Mode Decomposition,簡稱EMD)是依據數據自身的時間尺度特征來進行信號分解,且無須預先設定任何基函數,該方法在處理非平穩及非線性數據上,具有非常明顯的優勢。集合經驗模態分解是經驗模態分解的改進算法,相比于EMD,EEMD在信號中加入了高斯白噪聲,以其均勻分布的特性補償IMF分量丟失的尺度[15],從而改變極值點的特性,使信號在不同尺度上具有連續性,有效避免了EMD的混頻現象。EEMD最大特點在于其能夠以自適應方式提取信號的各分量及變化趨勢[16],從而降低序列的非平穩性,將非平穩的時間序列轉化為平穩且相互影響甚微的序列。
地下水埋深受多種影響因素的影響,其變化具有隨機性、不確定性與波動性。研究選取EEMD就在于它可以將信號的波動性、趨勢性提取出來,將非平穩的時間序列轉化為平穩且相互影響甚微的序列,進而可以將復雜的地下水埋深演變轉化成對多個簡單的單一變量的預測相加,以達到減小預測誤差的目的。
EEMD分解的實現步驟如下所示:
(1) 在原始的地下水埋深序列(f(t))中添加一個隨機白噪聲序列(ξ(t)),從而得到一整體序列F(t)。
F(t)=f(t)+ξ(t)
(1)
(2)對F(t)進行EMD分解,得到IMF分量和趨勢項。
(2)
(3)每次加入方均根相等的不同白噪聲序列,重復步驟(1)、(2),得到k組不同的IMF分量和剩余分量。
(4)將相應的IMF取均值作為最終IMF組。
(3)
式中:k為添加白噪聲序列的數目。
Elman神經網絡由Jeffrey L. Elman[17]于1990年提出,Elman是一種反饋式神經網絡,該網絡由4層組成,分別是輸入層、隱含層、承接層、以及輸出層組成。Elman神經網絡相對于BP網絡,是在BP網絡的隱含層中多增加了一個承接層,作為延時算子來實現對系統的記憶,從而使系統具有適應時變特性的能力,由于Elman網絡具有良好的記憶功能和穩定性特點,該網絡在時間序列的預測效果上要優于BP網絡,因此,Elman網絡被廣泛的應用于各個領域[18,19]。Elman網絡結構如圖1所示。

圖1 Elman網絡結構Fig.1 Elman network structure
圖1中輸入向量u為r維向量,輸出向量y為n維向量,xc為n維反饋狀態向量,w3為隱含層到輸出層的連接權值,w2為輸入層到隱含層的連接權值,w1為隱含層到承接層的連接權值,Elman網絡模型的表達式如下,
y(k)=g(w2x(k))
(4)
x(k)=f(w2xc(k)+w2(u(k-1)))
(5)
xc(k)=x(k-1)+axc(k-1)
(6)
式中:g()為輸出神經元的激活函數,為隱含層輸出的線性組合;f()為隱含層神經元的激活函數,常采用S函數;a為自連接反饋增益因子,0≤a≤1。a=0時,網絡為標準的Elman網絡,a≠1,網絡為修改的Elman網絡。
Elman網絡采用BP算法進行權值修正,學習指標函數采用誤差平方和函數,表達式為:
(7)

從EEMD分解角度來說,各IMF分量和殘差對地下水埋深序列的貢獻率不盡相同,可近似將IMF分量和殘差看作地下水埋深的驅動因素。則地下水埋深預測就相當于IMF分量和殘差的預測。
EEMD-Elman耦合模型具體步驟如下:
(1)利用MATLAB對1993-2013年的人民勝利渠灌區月地下水埋深序列進行EEMD分解,得到地下水埋深序列的IMF分量和殘差。
(2)對地下水埋深序列的IMF分量和殘差進行標準化處理。
如果網絡的輸入或輸出數據的范圍相差較大,網絡的預測模型將會存在較大誤差,因此我們必須對數據進行標準化處理,使數據范圍在[0,1]內。
(3)將1993-2011年的地下水埋深的IMF分量和殘差作為Elman網絡的訓練數據,2012-2013年的IMF分量和殘差作為Elman網絡的預測數據。
(4)利用Elman網絡對2012-2013年地下水埋深的IMF分量和殘差進行預測。
(5)最后將預測的地下水埋深IMF分量和殘差依據公式(2)進行累加還原,并與原始的地下水埋深數據比較。
人民勝利渠灌區地處河南省北部,是我國建國以來在黃河下游興建的首個引用黃河水灌溉的大型自流灌區。灌區屬暖溫帶大陸性季風型氣候,年平均氣溫14 ℃,無霜期220 d,年平均水面蒸發量1 300 mm,年平均降水量620 mm,灌區內總土地面積為1 486.84 km2。本文數據來源于1993-2013年灌區觀測井的監測數據。

圖2 人民勝利渠灌區1993-2013年地下水埋深曲線Fig.2 Groundwater depth curve of the people's victory canal irrigation district from 1993-2013
從圖2中可以看出,1993-2013年間,人民勝利渠灌區的地下水埋深大致呈現出上升的趨勢,上升過程中伴隨著一定的波動性,且波動幅度不一致,這也驗證了地下水埋深具有不確定性、非平穩性,這也從側面反映選用EEMD方法是合理的。
按照前面EEMD分解的步驟,對人民勝利渠灌區1993-2013年的地下水埋深數據進行EEMD分解,噪聲方差取0.2,噪聲次數取100。分解結果如圖3所示。

圖3 人民勝利渠灌區1993-2013年地下水埋深EEMD分解Fig.3 EEMD decomposition of groundwater depth in the people's victory canal irrigation district from 1993-2013
從圖3可以看出,地下水埋深序列被分解為6個IMF分量和一個對應的殘差。其中,第一個IMF分量波動性最大,頻率高、波長最短;其他IMF分量振幅逐漸減小,頻率逐漸降低,波長逐漸變大。人民勝利渠灌區地下水埋深序列經過EEMD處理后,序列的波動性、非平穩性大大降低。
在利用Elman網絡對人民勝利渠灌區地下水埋深進行預測時,必須進行訓練、測試樣本的劃分。將1993-2011年的IMF和殘差數據作為訓練樣本,2012-2013年的IMF和殘差數據作為測試樣本。采用滾動預測的方式,用連續19年第i個月的數據預測第20年的第i個月的數據。
通過大量反復試驗,得出網絡模型最優對應的隱含層節點數為10,隱藏層神經元傳遞函數為tansig,輸出層神經元傳遞函數為purelin,網絡訓練函數定為traingdx,訓練次數為1 000次,訓練目標誤差為10-4。
依據前面的步驟,利用Elman網絡對人民勝利渠灌區2012-2013年地下水埋深的6個IMF分量和一個殘差進行預測,預測結果如圖4所示。

圖4 IMF1~IMF6、殘差預測結果Fig.4 The prediction results of IMF1~IMF6 and Residual
由圖4可以看出,IMF1分量的預測效果略差,這說明IMF1分量非平穩性要高一些;IMF2~IMF6的預測效果較好,這說明IMF2~IMF6分量非平穩性要低一些,地下水埋深序列經過EEMD分解后,序列的波動性、非平穩性大大降低。

表1 IMF1~殘差的相對誤差指標 %
由表1可以看出,IMF1相對誤差的最大值、最小值、平均值均較大,分別為2 714.10、0.81、245.83,這說明IMF1分量非平穩性要高一些,對預測誤差影響較大;殘差相對誤差的最大值、最小值、平均值均較小小,分別為0.82、0.16、0.44,這說明低頻信號相對平穩,對預測誤差影響較小。由表1可以看出,地下水埋深序列經過EEMD分解后,IMF分量愈趨于平穩,IMF1殘差的相對誤差的各項指標整體呈現出逐漸減小的趨勢。
由表2可以看出,EEMD-Elman耦合預測模型相對誤差的最大值、最小值、平均值分別為2.91%、0.04%、1.09%,模型預測相對誤差較小,合格率較高。
圖5是人民勝利渠灌區2012-2013年地下水埋深的預測曲線,由圖5可看出,人民勝利渠灌區2012-2013年地下水埋深的預測值與真實值基本一致,EEMD-Elman耦合模型的擬合度較高。
表3為EEMD-Elman模型與其他模型的預測誤差對比結果。
從表3可以看出,EEMD-Elman耦合模型對地下水埋深預測的合格率為100%,且相對誤差較低,模型要明顯優于單一的Elman網絡模型和BP模型,模型較好的克服了Elman網絡和BP網絡對一些高頻數據不能很好的學習的缺點,從而使預測精度提高。

圖5 人民勝利渠灌區2012-2013年地下水埋深預測曲線Fig. 5 The groundwater depth prediction curve of people’s victory canal irrigation district from 2012-2013
(1)地下水埋深序列經過EEMD分解,其隨機性、波動性降低,這為耦合模型預測提供了良好的條件。EEMD-Elman耦合模型預測相對誤差小于2.91%,模型合格率為100%,精度較高,并優于單一Elman和BP神經網絡。這表明EEMD-Elman耦合模型用于灌區地下水埋深預測是可行的。

表3 EEMD-Elman模型與其他模型的對比 %
(2)在地下水埋深序列進行EEMD分解的基礎上,利用Elman 網絡對IMF1~殘差進行預測,解決了直接用Elman網絡對一些高頻突變數據不能很好的學習問題。通過對EEMD分解后的各成分進行預測—重構,能夠較好的擬合真實值。相比于傳統的Elman網絡和BP網絡,模型在細節上能合理的反映序列的真實變化。
(3)地下水埋深時間序列經過EEMD分解,信號被分解為若干個IMF分量和殘差,其預測值等于若干個IMF分量和殘差的預測值相加。盡管有些IMF分量預測誤差相對偏大,但這部分IMF分量在整個信號中所占成分較少,將IMF分量和殘差的預測值轉換成整體預測值時,整體誤差將會減弱。
(4)盡管建立的EEMD-Elman耦合模型預測精度較高,但也有不足之處,比如網絡參數需要人為設定和調整,研究僅僅對地下水埋深做了短期預測,沒有進行長期預測,預測模型沒有考慮地下水埋深變化的物理機制,這些都是需進一步研究的方向和重點。