郭兵托,孫素艷,張金萍,李佳藝
(1.黃河勘測規劃設計研究院有限公司 河南 鄭州450003;2.水利部 水利水電規劃設計總院,北京100120;3.鄭州大學水利與環境學院,河南鄭州450001;4.山西省太原市水利科學研究所,山西 太原030002)
灌溉用水對灌區作物生長尤為重要,準確預測灌區的灌溉水量是實現節水、安全生產和糧食增產的重要途徑。在灌區水資源系統中,水文要素具有明顯的不確定性和隨機性,很難用線性關系來合理反映不同要素間所蘊含的內在聯系。在水文分析和水文預測中,具有自適應、自學習、聯想存儲、高速尋找優化解的能力和適用于解決非線性問題的人工神經網絡(ANN),應用越來越廣泛并取得了較好效果。胡鐵松等[1]對水文學及水資源領域應用神經網絡的情況作了總結;龐博等[2]將總徑流線性響應模型和神經網絡模型結合,利用流量資料進行預測,取得了較好的效果。自1992年Zhang Qinhua和Benveniste提出小波神經網絡(WNN)的概念和算法[3]后,小波神經網絡開始被應用于水文領域。馮艷等[4]用小波神經網絡對水稻的需水量進行了預測;Kisi[5]利用廣義回歸神經網絡與小波分析耦合建模進行月徑流量預測,并與前饋式神經網絡進行了比較,反映出此模型的優越性;Adamowski等[6]將神經網絡與離散小波變換結合,闡明其在季節性河流徑流預測中的適用性;郭其一等[7]利用小波-模糊神經網絡對水文時間序列進行預測,取得了良好的預測效果;朱躍龍等[8]為了提高水文時間序列的預測精度,提出了一種多因子小波預測模型。
上述研究利用單純分析宏觀時間序列變化對水文變量進行解釋、預測,模型預測能力有限。筆者對水文變量時間序列利用小波變換進行分解,得到的小波系數作為神經網絡的輸入條件,參與到水文時間序列的預測模型中,讓小波神經網絡學習多個時間序列的小波系數的時變特征和預測目標時間序列之間的映射關系,以陸渾灌區為研究對象,選取灌區水資源系統中影響較大的3個因素(降雨量、作物需水量和灌溉水量)構建多尺度小波變換神經網絡(WNN)模型,并與原始序列的單隱層BP神經網絡、多隱層BP神經網絡和小波神經網絡模型對比分析,期望可以改善模型的預測能力。
多尺度小波變換WNN是一種將離散小波變換得到小波系數,以此作為小波神經網絡輸入的模型。它結合小波分解后體現的多尺度信息,并利用小波基函數作為激勵函數的神經網絡進行訓練。
小波變換是一種將時間信號變換到時間頻率域的時頻分析方法,將水資源系統中的時間序列進行多尺度分析,可以更好地觀察信號的時間和頻率信息。
設子小波函數 ψ(t) ∈ L2(R)[L2(R) 表示平方可積的實數空間,即能量有限的空間信號[9]],將母小波經平移和伸縮得小波序列,又稱子小波:

式中:a為伸縮因子或尺度因子;b為平移因子;t為時間。
對于能量有限信號f(t)∈L2(R),其連續小波變換定義為

式中: Wf(a,b) 為小波實部系數; ψ() 為 ψ() 的復共軛函數。
實際工作中,時間序列常常是離散的[10],如f(kΔt)(k = 1,2…,N) ,離散小波公式為

式中:Δt為取樣時間間隔;N為樣本容量。
實際水文序列是離散的,因此利用離散小波變換對水文序列進行分解,得到不同時間尺度的小波系數[11]。這些小波系數是水文序列在不同時間尺度和不同空間位置上的投影,能用來描述水文序列的內在結構、性質和變化特性。
小波神經網絡的思想是用小波函數作為神經元的基函數,經過仿射變換建立起小波變換和神經網絡權重系數之間的聯系,并將小波神經網絡應用于函數逼近問題的求解[12]。同使用sigmoid型基函數的前饋神經網絡一樣,小波神經網絡具有任意逼近非線性函數的能力,同時,由于小波變換具有較好的時頻特性,因此可以對尺度參數和平移參數進行訓練,更快、更精確地逼近非線性函數。另外,小波神經網絡還可以避免神經網絡訓練過程中的局部最優問題。圖1為小波神經網絡結構。

圖1 小波神經網絡結構
通常所說的WNN是緊致型的,即用小波函數代替S函數作為隱含層的激活函數[4]。本文采用Morlet小波函數(該小波為有限支撐、對稱、余弦調制的高斯波)作為網絡隱含層的激勵函數。其中:輸入樣本的個數、輸入層節點個數、隱含層節點個數、輸出層節點個數分別為m、p、n、q;輸入層樣本元素為xkm;輸入樣本對應的輸出值為yim;連接輸入層和隱含層的權重為wij;連接隱含層和輸出層的權重為wjk;小波函數表示為 Jj(aj,bj) ,第 j個隱含層節點的伸縮系數和平移系數分別為aj和bj;作用于輸出層的純線性函數用f表示,則WNN的模型為

陸渾灌區位于河南省西部,北溫帶南緣,屬于大陸性季風氣候區。灌區處于伏牛山北麓、嵩山和熊耳山圍成的谷地,范圍涉及洛陽、平頂山、鄭州三市[13]。灌區縱跨黃淮流域,主要供水水源為伊河上游的陸渾水庫,設計灌溉面積89 493 hm2,主要種植作物為小麥、玉米和棉花[14]。灌區多年平均降水量為600 mm,多年平均蒸發能力為1034.32 mm,容易發生氣象干旱。研究采用的基礎數據為陸渾灌區1970—2013年的年灌溉用水量系列數據(來自陸渾灌區灌溉管理局),以及選取1970年1月1日—2013年12月31日的主要來源于中國氣象科學數據共享服務網的逐日氣象數據(平均相對濕度、最高氣溫、最低氣溫、日照時數、降雨量、平均風速等),同時選取灌區所覆蓋的鄭州、洛陽、平頂山三市的氣象觀測站1970—2013年的逐日資料,經過篩選并將逐日的數據匯總,得到1970—2013年逐年降雨量數據[15]。陸渾灌區作物需水量計算采用作物系數法,基本公式為

式中:KC為作物系數,根據陸渾灌區實際,KC取值為0.77;ET0為參考作物騰發量,利用1998年 FAO推薦的Penman-Monteith公式計算得到。
圖2為1970—2013年陸渾灌區的年降雨量(P)、作物需水量(ETC)和灌溉水量(Irri)數據序列。

圖2 陸渾灌區1970—2013年降雨量、作物需水量和灌溉水量數據序列
在灌溉水量預測中構建多尺度小波變換WNN,建模過程如下。
(1)基于水文序列是離散的這一性質,取Daubechies(db6)小波系對陸渾灌區1970—2013年降水及作物需水量時間序列進行5尺度水平分解,得到不同尺度下的低頻部分和高頻部分,從而得出灌區供需序列高頻部分d1~d5及趨勢項a5的序列系數,反映出時間序列的周期性和趨勢性。
(2)確定輸入、輸出樣本對。考慮到要將小波變換WNN模型預測的數值與實測值進行比較,于是選取1970—2003年年降雨量和年作物需水量的低頻趨勢項 a5和高頻部分 d1、d2、d3、d4、d5共 12 組數據序列作為樣本輸入,灌溉水量作為期望輸出。由于灌溉水量供需預測中,降雨量和ETC的單位是mm,而灌溉水量的單位是億m3,具有不同的物理意義,因此需要對數據進行歸一化處理,本文采用 MATLAB里的mapminmax函數進行歸一化。
(3)確定網絡結構。輸入層節點個數p、輸出層節點個數q均由樣本的模式特征決定,隱含層的節點個數 n 由 min(p,q)<n≤2p+1 確定;初始權值、小波函數的伸縮系數、平移系數在網絡參數初始化時隨機得到。
(4)網絡參數的反復調整。小波神經網絡權值參數修正算法采用梯度修正法修正網絡權值和小波基函數參數,從而使小波神經網絡預測輸出不斷逼近期望輸出。網絡參數修正過程如下。
①計算網絡預測誤差e:

式中:yn(k)為期望輸出;y(k)為小波神經網絡預測輸出。

式中:η為學習速率。
輸入層、隱含層和輸出層分別含有12、6和1個節點,最終確定小波神經網絡的結構為12-6-1。采用梯度學習算法用訓練數據訓練小波神經網絡,網絡反復訓練100次。用訓練好的小波神經網絡預測灌溉水量,并對預測進行分析。
為檢驗多尺度小波變換WNN的預測能力,與未分解數據(原始數據)輸入的單隱層BP神經網絡、雙隱層BP神經網絡和小波神經網絡的預測相對誤差進行對比,見圖3。4種神經網絡預測的平均相對誤差見表1。

圖3 4種神經網絡預測相對誤差對比

表1 4種神經網絡預測的平均相對誤差
由圖3和表1可以看出,在進行網絡學習訓練逼近實際灌溉水量時,多尺度小波變換WNN在預測精度和穩定性方面有較大提高。2006年雙隱層BP神經網絡的相對誤差最大,2008年單隱層BP神經網絡的相對誤差最大,而小波神經網絡和多尺度小波神經網絡的相對誤差比較穩定。小波神經網絡除了2006年的相對誤差較高外,其他預測年份的相對誤差均在20%左右;多尺度小波變換WNN的預測相對誤差均在20%以下,且整體波動比較平緩,相對誤差平均值最小,為12.60%,說明小波函數的非線性程度明顯比Sigmoid函數要高,因此在逼近非線性函數時,小波函數的逼近能力更強,也說明將原始數據通過小波變換分解后得到的多尺度小波數據,因內在結構、性質和變化特性被分解出來,使得小波神經網絡逼近非線性函數的能力變強。
定量預測方法包括時間序列預測法和因果關系預測法[17]。因果關系預測法包括回歸分析法、Markov預測、灰色系統模型和神經網絡預測法等。時間序列法需要的數據資料較少,短期預測時可使用;較長時間預測采用因果關系預測法較準。因果關系預測法所需數據較多,通常要求占有的數據時間應為預測時間的3倍以上;按預測時間長短又分為長期預測(5~10 a及以上)、中期預測(2~5 a),短期預測(1 a 內)[18]。 本文采用神經網路預測法(屬于因果關系預測法)進行長期預測,考慮到建模數據是預測數據的3倍以上和預測時間為5~10 a,于是將建模和預測數據劃分為4種情況(見表2),分別預測10組、9組、8組和7組數據,目的在于除了掌握總體的相對誤差趨勢和平均相對誤差外,還需要對模型在異變值上的預測能力進行對比分析[19],結果見圖4~圖7和表3。

表2 建模數據和預測數據分組情況 a

圖4 預測9 a幾種神經網絡預測相對誤差對比

圖5 預測8 a幾種神經網絡預測相對誤差對比

圖6 預測7 a幾種神經網絡預測相對誤差對比

圖7 4種神經網絡4種數據組合下的平均相對誤差折線
從圖4、圖5和圖6看出,預測年份2006年和2008年的相對誤差都較大,在2006年和2008年,實際的灌溉水量形成了兩個明顯的拐點,偏離平均變化趨勢較大,但多尺度小波變換WNN的相對誤差仍然較小,而另外3種神經網絡的相對誤差都明顯增大。當預測數據為9 a時,在2006年單隱層BP神經網絡相對誤差最大,為50%左右;當預測數據為8 a時,在2006年、2008年單隱層BP神經網絡相對誤差再次最大,分別約為35%、38%;當預測數據為7 a時,在2008年小波神經網絡相對誤差最大,為30%左右。
實際上2006年和2008年的降雨量和作物需水量均屬于正常水平,但是實際的灌溉水量卻較正常水平偏差較大,分別為 1.24 億 m3(偏低)和 2.55 億 m3(偏高),這可能是受到上游來水和水庫調度影響所致。

表3 4種神經網絡4種數據組合下的平均相對誤差 %
通過表3、圖7看出,單隱層BP神經網絡、雙隱層BP神經網絡和小波神經網絡當預測年數逐漸減少,即隨著訓練數據逐漸增多,平均相對誤差均在減小,說明構建的模型隨著訓練數據的增多而變得更加穩定,平均相對誤差變化范圍分別是 10.89%~20.14%、9.63%~18.21%和 8.77%~16.78%,最大值是最小值的2倍左右。而多尺度小波變換WNN并沒有隨著預測年份的減少(即訓練數據的增多),平均相對誤差有較大變化,波動范圍是12.60%~14.79%,說明當訓練數據足夠多時,增加或者減少一組數據并不會對模型的穩定性及預測精度有明顯的影響。
以陸渾灌區1970—2013年的實測數據為實證構建多尺度小波變換WNN,并將數據分別分成預測10、9、8、7 a四種情況,利用單隱層BP神經網絡、雙隱層BP神經網絡和小波神經網絡分別進行了預測,并基于4種模型的4種數據分組情況,進行了綜合對比分析,得到以下結論。
(1)多尺度小波變換WNN在預測結果的總體平均值、穩定性及波動性和突變值上都比別的神經網絡模型預測誤差更小,精度更高,表現出了明顯的預測優勢。但對個別點的擬合存在一定的偏差,說明多尺度小波變換WNN還有需要改進的地方,例如網絡權值與小波參數的調整尋求更加優越的方法,訓練誤差方式的選取也有很大的發展空間等。
(2)本研究僅是灌區供需水量預測技術方法層面的一種簡單嘗試,雖然多尺度小波神經網絡在陸渾灌區供需水量預測中獲得了較滿意的應用效果,但這僅是以陸渾灌區為例進行的分析,研究結果是否具有普適性還有待進一步研究。