席東潔,趙雪花,張永波,鄭秀清,祝雪萍,王 燕
(太原理工大學水利學院,太原 030024)
徑流過程高度復雜。徑流演變過程受多種因素影響,降雨、氣溫、太陽活動、恩索循環、人類活動、下墊面因素的改變都直接或間接地引起徑流發生改變。影響徑流的因素眾多,各種因素錯綜復雜、相互影響從而導致徑流波動的不確定性,給徑流預報帶來了困難。但研究徑流變化規律以及預測徑流變化趨勢對各種水利工程規模、水工建筑物尺寸的選擇有著重要意義;對水土保持規劃有一定影響;為水資源合理開發、規劃利用提供依據;在防洪、抗旱、旅游、發電、航運、國防建設等領域有廣泛的應用。研究徑流預報十分必要[1]。
徑流預測法分為過程驅動法和數據驅動法,過程驅動分析法是基于徑流形成過程,產匯流機制而建立的模型,是徑流預測的一個發展方向。但由于徑流形成過程的復雜性和影響徑流量因素的多樣性,使用該方法進行水文預報十分困難[1]。數據驅動法包括傳統方法和人工智能方法。傳統方法包括周期分析方法、平穩時間序列法、主成分分析法等。人工智能法分為模糊數學方法,人工神經網絡方法,灰色系統理論法,混沌動力學及分形理論法,小波分析法,粗糙集理論法,支持向量機法,組合預測法[2]。其中神經網絡是揭示水文現象變化規律的一種有效手段,它包括BP,Elman,RBF,GRNN等[3],常用BP等方法進行水文預報。但BP學習收斂速度慢,易陷入局部極值不足,對徑流預測的精度有很大影響[5]。而Elman神經網絡[4]是動態網絡,可以很好地和非穩定的徑流數據匹配[7]。隨著徑流預測多元化發展,組合預測越來越多地被用到徑流預報中。
將經驗模態分解(empirical mode decomposition,EMD)與Elman神經網絡進行組合分析,已經應用于經濟、化學、礦業安全等領域,但很少應用于徑流預測中[6-8]。本文將其應用于水文徑流預報中。
黃河歷史悠久,覆蓋著中國西北以及華北的大部分地區。黃河源區以唐乃亥水文站斷面為界,研究唐乃亥水文站的水文特性,為黃河水資源統籌規劃、優化調度、防汛抗旱提供基本水文依據[9]。
經驗模態分解是由HUANG[10]等提出的一種數據分析方法,它的特征是對信號進行平穩化作用,提取出不同頻率的波動。分解出來的數據序列就稱為固有模態函數(intrinsic mode function,IMF)。
經驗模態分解的步驟如下:
步驟1:求原序列的上包絡線值xmax(t),下包絡線值xmin(t)。
步驟2:求平均包絡線m(t):
(1)
步驟3:求原序列x(t)與平均包絡線m(t)之差h(t):
h(t)=x(t)-m(t)
(2)
h(t)如果滿足極值點和過零點的數目相等或者最多差一個,并且各個瞬時平均值為零,則h(t)為IMF分量。否則把h(t)當作原序列,重復以上步驟,直到滿足前兩個條件,得到IMF。
步驟4:當求出第一個固有模態函數I1(t)后,用原序列減去I1(t),得余序列r1(t):
r1(t)=x(t)-I1(t)
(3)
然后把r1(t)看作一個新的原序列,按照以上步驟,依次分解。直到rn(t)變成一個單調趨勢序列。
步驟5:原始序列等于分解出所有分量與趨勢項之和[11]。
(4)
Elman神經網絡是Elman在1990年提出的,該神經網絡Elman神經網絡分為輸入層,隱含層,輸出層和承接層四層。一般情況下,輸入層單元傳輸信號,輸出層單元線性加權,隱含層單元的傳遞函數可以采用線性或非線性函數,承接層用來記憶隱含層前一時刻的輸出值[12]。
Elman神經網絡的非線性空間表達式為:
y(k)=g(w3x(k))
x(k)=f(w1xc(k-1)+w2u(k-1))
xc(k)=x(k-1)
(5)
式中:y、x、u、xc分別表示m維輸出的節點向量、n維隱含層節點單元向量、r維輸入向量和n維反饋狀態向量;w3、w2、w1分別代表隱含層到輸出層、輸入層到隱含層、承接層到隱含層的連接權值;g(·)為輸出神經元的傳遞函數,是隱含層輸出的線性組合;f(·)為隱含層神經元的傳遞函數,常用S函數[13]。
唐乃亥水文站,其經緯度為100°09′E,35°30′N,黃河源區地處青藏高原東部邊緣,以唐乃亥水文站斷面為界,源區流域面積占黃河流域面積的16.2%,多年平均來水量占黃河多年平均來水量的34.5%。唐乃亥水文站是黃河源區的門戶。唐乃亥水文站位于青海省興海縣唐乃亥鄉,是黃河上游的重要控制站,控制流域面積121 972 km2,控制斷面以上河長1 553 km,占全河的28.4%,是龍羊峽的入庫站,至河口距離3 911 km。其徑流變化過程如圖1所示。
選取1979-2009年的唐乃亥水文站月徑流資料。實測資料的序列越長,其代表性越好。唐乃亥水文站共31年的徑流資料,即372個月徑流數據,該序列包括足夠的豐、平、枯水年及其組合,資料精度較高,該資料的代表性能夠得到保證。其中斷面最大流量為3 550 m3/s,斷面最小流量為89 m3/s,斷面平均流量為634 m3/s,標準差可以很好地刻畫徑流序列對均值的偏離情況,其標準差為528 m3/s。離勢系數為0.83,大于北方的平均離勢系數,表明其徑流數據變化劇烈。偏度可以用來描述分布不對稱的程度,其偏度為1.66,分布為正偏,峰度刻畫了分布密度曲線的峰形闊狹特征,其峰度為3.62。
徑流的中長期預測大多數都在時間序列平穩的假定下完成的。EMD分解的本質是對信號的平穩化處理,本文利用EMD方法對徑流序列進行平穩化處理,分解之后重構的序列進行Elman建模,這樣可以減小預測誤差,提高模擬精度。唐乃亥水文站月徑流資料EMD的處理結果如圖2所示,原序列分解獲得5個IMF和1個趨勢項,IMF分量相對于原始序列,既包含了原始序列的所有信息,又分別突出了原始序列的不同特征,使對原始序列影響較弱的序列特征顯現出來,體現了原始序列的多尺度性。隨著階數的增加,IMF的頻率由高到低,周期由短到長;時間尺度由小到大;IMF分量的幅值不斷減少,對原始序列的影響程度也減少。從趨勢線可以看出,該水文站月徑流變化趨勢是先減少后緩慢增大。使用經驗模態方法把月徑流資料不同頻率,不同峰值的序列分解出來,根據不同序列情況建立不同模型,提高精度。

圖2 EMD分解結果Fig.2 EMD decomposition results
本文提出的基于EMD-Elman神經網絡的思路(具體流程如圖3所示)是:首先利用EMD處理月徑流數據,該方法可以將徑流序列按其內部特征分解為頻率不同的多個IMF和趨勢項Res,若逐個進行建模預測,則會帶來較大的工作量和誤差,因此本文將波動頻率和波動振幅相近的EMD分解項進行重構,將這重構后的分量作為Elman神經網絡的訓練和測試數據,進行多次訓練,然后將各個Elman模型預測結果進行疊加,結果為最終預測值,最后進行誤差分析。由于水文時間序列變化是動態、隨機的過程,表現出復雜的非線性特征。而Elman神經網絡具有較強的動態信息處理能力。EMD-Elman神經網絡組合預測法適用于數據資料長,弱相關,隨機的徑流過程。具體建模及其計算步驟如下:
步驟1 :通過對徑流序列的經驗模態分解,得到若干個IMF分量和趨勢項。
唐乃亥水文站1979-2009年月徑流資料EMD分解為5個固有模態函數和1個殘余項。
步驟2 : 將波動頻率相近的序列進行重組,得到高頻、低頻、趨勢項。
IMF1,IMF2,IMF3組合得到高頻項,將IMF4,IMF5相加得到低頻項,剩下的為趨勢項。
步驟3 :將處理后的各分量分別進行Elman神經網絡訓練,得到最優Elman模型。
選擇1979-2007年的月徑流資料和2008年上半年的月徑流數據模擬和訓練模型,選取剩下18個月的月徑流數據來預測建模情況。通過對各個分量輸入層和隱含層權值的調整,直到很好地擬合徑流變化過程,誤差達到最小,得到最優模型。
步驟4:比較誤差大小,預測結果評價。
通過使用3個誤差指標,計算月徑流實測值和EMD-Elman神經網絡預測值之間的誤差,并與單獨使用Elman神經網絡預測模型進行對比分析。

圖3 EMD-Elman神經網絡預測模型Fig.3 Forecasting model based on EMD-Elman neural network
本文共372個月徑流數據,選擇其中354個月徑流數據來建立Elman模型訓練,選取剩下18個月的月徑流數據來檢驗模型。
為了更加準確地觀察數據處理情況,本文選用以下3個經常使用的誤差評價指標,即平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)以及均方根誤差(RMSE)。
(8)

本文為了獲取合適的模型參數值,分別對高頻項,低頻項,趨勢項進行Elman神經網絡多次分析,各個子序列的Elman模型參數和誤差如表1所示。經過多次訓練,高頻分量輸入層個數為18,隱含層個數為24;低頻分量輸入層個數為18,隱含層個數為25;趨勢項輸入層個數為24,隱含層個數為24。分別對高頻分量、低頻分量、趨勢項進行Elman模型訓練,其誤差都小于單獨使用Elman模型的誤差。高頻分量的平均絕對誤差減少了52%,平均絕對百分比誤差減少了89%,均方根誤差減少了59%;低頻分量的平均絕對誤差減少了96%,平均絕對百分比誤差減少了82%,均方根誤差減少了97%;趨勢項的平均絕對誤差減少了81%,平均絕對百分比誤差減少了70%,均方根誤差減少了87%。通過對比發現,低頻分量Elman模型的3個誤差都比較小,說明Elman模型更加適合分析低頻分量。低頻分量和趨勢項的Elman模擬誤差比較小,使得該方法總的模擬誤差減小。

表1 各分量預測模型參數及誤差Tab.1 The component prediction model parameters and errors
為了更加直觀地觀察組合模型的模擬情況,作出直接使用Elman法的模擬圖和EMD-Elman法模擬圖,建模情況如圖4所示。由圖4可以看出,組合預測模型的預測徑流序列和實測徑流序列比較擬合。

圖4 Elman預測結果與EMD-Elman預測結果Fig.4 The predicting results of Elman neural network and EMD-Elman neural network
表2對比了Elman模型和EMD-Elman模型的誤差,發現EMD-Elman神經網絡預測模型的3個誤差指標都比較小,EMD-Elman模型的平均絕對誤差減少了55%,平均絕對百分比誤差減少了28%,均方根誤差減少了61%。說明該組合模型預測是行之有效的,預測結果比較可靠。EMD分解之后徑流序列變為平穩過程,使分解之后重構的序列與Elman 神經網絡耦合情況良好,因此EMD-Elman神經網絡的誤差比Elman神經網絡誤差要小。

表2 模型性能指標Tab.2 Model performance index
本文為了得到更加滿意的預測結果,先用EMD法對徑流數據進行平穩化處理,分量重構建立Elman模型,將EMD與Elman神經網絡進行組合預測,得到結論如下:
(1)EMD-Elman神經網絡模型,相對于Elman模型,平均絕對誤差減少了55%,平均絕對百分比誤差減少了28%,均方根誤差減少了61%。該方法減少了非平穩性對誤差的影響,提高了模擬精度。
(2)與Elman單獨處理徑流序列的相比,將EMD和Elman結合的模型應用到徑流預報中取得了良好效果,在誤差降低方面有明顯優勢,將這兩種方法組合預測,在徑流的中長期預測中是可行的,具有應用前景。
(3)單一方法預測精度低,不適合變化復雜,隨機的水文預測,將多種方法進行組合預測可以分別利用各種方法的優勢,這將是水文預報的一個趨勢。
□
[1] 黃 強,趙雪花.河川徑流時間序列分析預測[M].鄭州:黃河水利出版社,2008.
[2] 朱永英. 水庫中長期徑流預報及興利調度方式研究[D]. 遼寧大連:大連理工大學, 2008.
[3] 崔東文. 多重組合神經網絡模型在年徑流預測中的應用[J]. 水利水電科技進展,2014,34(2):59-63.
[4] ELMAN J L.Finding structure in time[J].Cognitive Science,1990,14(2):179-211.
[5] 李 佳,王 黎,馬光文,等.LS-SVM在徑流預測中的應用[J].中國農村水利水電,2008,(5):8-14.
[6] 宋菁華,楊春節,周 哲,等.改進型EMD-Elman神經網絡在鐵水硅含量預測中的應用[J].化工學報,2016,67(3):729-735.
[7] 李潤求,施式亮,伍愛友,等.采煤工作面瓦斯涌出預測的EMD-Elman方法及應用[J].中國安全科學學報,2016,24(6):51-56.
[8] 謝 赤,鄭林林,孫 柏,等.基于EMD和Elman網絡的人名幣匯率時間序列預測[J].湖南大學學報,2009,36(6):89-92.
[9] 丁小謹,高曉清,湯懋蒼,等. 唐乃亥水文站徑流量與黃河源區拍渦的關系[J]. 高原氣象, 2014,33(3): 861-867.
[10] Huang N E.et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis [J]. Proceedings of Royal Society London.1998,454:903-995.
[11] 趙雪花,陳 旭,袁旭琦. 基于EMD的數據驅動模型在徑流預測中的應用[J]. 系統工程,2014,32(9):150-154.
[12] 崔東文.改進Elman神經網絡在徑流預測中的應用[J].水利水運工程學報,2013,(2):71-77.
[13] 張秋余,朱學明. 基于GA-Elman神經網絡的交通流短時預測方法[J]. 蘭州理工大學學報, 2013,39(3): 94-98.
[14] 胡海鵬,方兆本. 股市波動性預測模型改進研究[J]. 數理統計與管理,2004,23(5):40-47.