李志新,賴志琴,龍云墨
(貴州理工學院 土木工程學院,貴陽 550003)
作物需水量是流域規劃、地域水利規劃、灌溉工程規劃規劃、設計、管理以及實施的基礎和依據。在灌區動態用水計劃制定實施中,實時灌溉預報起到關鍵作用,而實時灌溉預報必須做到準確可靠,灌區動態用水計劃才能與實際相符,從而實現灌區節水、高產及高效,因此,實時灌溉預報的核心在于作物需水量的估算,在此過程中,參考作物需水量的預測作為基礎性工作,具有重要的理論實際價值[1,2]。
參考作物需水量的主要計算方法是Penman公式法,它基于能量平衡原理,可分為直接和間接計算方法兩種。直接法是依據實測數據,分析若干主要因素,如:水面蒸發、輻射、氣溫、日照、濕度等與作物需水量的關系,歸納為經驗公式。首先算出作物全生育期需水量,再利用生育期階段蓄水模系數對各階段作物需水量進行分配,如基于產量的需水系數法、水面蒸發量法、日照時數法、積溫法等。應用上述方法對階段需水模系數準確度要求較高,但需水模系數受作物品種、氣象因素、水土條件以及階段劃分等多種因素影響,其值變化范圍較大且不穩定[3,4];間接計算參考作物需水量較為常用的是Penman綜合法。聯合國糧農組織FAO在1977年推薦經修改的Penman公式計算參考作物需水量;在1979年又提出了Penman修正公式;為規范作物騰發量的計算方法,1993年FAO和ICD依據Penman-Monteith公式,對參考作物蒸發蒸騰重新定義,使該法利用一般氣象資料就能計算參考作物需水量,具有較高的實用價值以及計算精度。其不足之處是需要較多氣象資料,當資料不全則不能使用,另外,其中一部分氣象因素難以預報,因此應用該法時可計算參考作物需水量,但不適于對未來的參考作物需水量進行預測[5,6]。人工神經網絡模型具有自組織、自適應、自學習特性,適于高度非線性且具有動態性的時間系列的預測[7,8]。Elman神經網絡因其回饋結構,其映射呈動態性,從而有聯想記憶功能,對于時間序列預測方面問題其處理效果較好,但其傳統訓練算法仍采用梯度下降法,容易陷入局部極值,而遺傳算法在處理優化問題方面能夠全局尋優,且有較強魯棒性,應用較為廣泛[9,10]。
因此,本文將用遺傳算法對Elman傳統訓練算法進行優化,構建了基于GA-Elman神經網絡的參考作物需水量預測模型,并采用通東灌區2008~2017年的逐日氣象資料及參考作物需水量數據,對模型進行了訓練及預測性能測試。
本研究采用通東灌區2008-2017年逐日氣象資料為基礎資料,因灌區無參考作物需水量實測數據,故采用Penman-Monteith方法計算得到參考作物需水量,可近似為灌區參考作物需水量實際值。本文選取2008-2017年作物生育期共1 347 d的逐日數據作為網絡訓練和測試的數據集。對氣象數據進一步進行相關性分析表明,日序數、日照時數、日平均氣溫等因子與參考作物需水量相關性較強,而且上述因子也便于預報[11,12]。參考作物需水量隨著日序數在年內呈周期性變化規律;日照時數則一定程度上反映溫度、濕度、飽和差及輻射能,同時對作物的光合作用、生長發育及葉氣孔開度有重要影響,是一個綜合性較強的氣象因子;基于溫度對作物需水量的預報研究較多,取得較好效果,其預測也很便利[13,14]。因此本文神經網絡模型選取日序數、日照時數、日平均氣溫作為網絡輸入向量,以逐日參考作物需水量為輸出向量。
1.2.1 Elman神經網絡
如圖1所示,Elman網絡結構由4層組成。其中輸入層的功能為信號傳輸;隱含層的單元用激活函數來表示;承接層的功能是從隱含層接受其反饋的信號,該信號可記憶隱含層神經元在前一時刻產生的輸出值,然后承接層神經元的輸出再經過延遲、存儲,再一次輸入到隱含層,這樣網絡對歷史輸入數據有一定程度記憶和聯想能力,較適于動態信息處理;而輸出層的功能則是線性加權輸出。

圖1 Elman網絡拓撲結構
該網絡的狀態空間可用如下公式表達:
y(k)=g[w3x(k)]
(1)
x(k)=f{w1xe(k)+w2[u(k-1)]}
(2)
xe(k)=x(k-1)
(3)
式中:x為隱含層單元的狀態矢量;y為輸出節點的矢量;u則為輸入矢量;xe為反饋狀態矢量;w3、w2、w1為各層的權值;g和f分別為輸出層及隱含層節點的激活函數,一般為Sigmoid函數。
1.2.2 GA-Elman參考作物需水量預測模型構建
遺傳算法計算基本操作包括:選擇、交叉和變異。首先用染色體表示問題的解,算法中是采用二進制編碼的串,通過一群染色體來表示假設的可行解,再根據特定問題環境,選取適應度函數,可對染色體進行選擇、復制、交叉以及變異等一系列算子操作,形成新種群,通過進化,其適應性有所提高;經過若干代進化過程,最后染色體個體實現收斂,其相應的適應度函數值最大,即可作為為當前問題的最優解[15,16]。GA-Elman網絡的優化主要包括:選取Elman網絡的拓撲結構、全局性優化網絡權值及偏置值、對Elman網絡進行訓練及測試。


圖2 遺傳算法優化的Elman神經網絡
1.2.3 模型輸入因子及結構分析
分析表明,日序數、日照時數、日平均氣溫等因子與參考作物需水量相關性較強,而且上述因子也便于預報。故本網絡模型選取日序數、日照時數、日平均氣溫作為網絡輸入向量,以逐日參考作物需水量為輸出向量。網絡結構主要取決于隱含層層數及節點數。Kolmogorov定理表明,三層的網絡即可表達任一連續函數,對于本文關于參考作物需水量預測問題,可選取含有一個隱層的Elman網絡。另外,隱含層節點數目如過少或過多,容易導致訓練不收斂,或發生過擬合,反而引起泛化能力下降。本研究采用Kolmogorov經驗公式初擬隱含層節點數目,并結合多方案試湊方法最后確定,即設計多個網絡結構實驗方案,并反復對比,以確定合理的隱含層節點數。輸入及輸出層的節點數分別取決于輸入、輸出因子數量[17]。

采用的通東灌區2008-2017年的逐日氣象資料及相應的參考作物需水量等數據,作物生育期共1 347 d,采用隨機方法選取2015年的逐日氣象資料及相應的參考作物需水量數據作為用以模型驗證的測試集,其他所有資料及數據則作為用以模型學習的為訓練集。神經網絡模型隱含層及輸出層傳遞函數分別為TANSIG以及PURELIN,訓練函數為泛化性能較好的TRAINBR;訓練次數設定為不超過2 500次。
采用用隨機選擇的2015年逐日的氣象資料及參考作物需水量數據作為測試集,進行模型的預測檢驗,模型預測值與期望目標值擬合情況見圖3,圖3可以看出,GA-Elman神經網絡模型預測參考作物需水量精度較高,且預測性能穩定。

圖3 GA-Elman神經網絡模型預測值ETGA-Elamn與期望目標值ET的擬合
為檢驗模型預測值與期望目標值之間的相關一致性,對二者進行了回歸分析及t檢驗,結果見圖4,網絡模型預測值與期望目標值之間是正相關關系,復相關系數0.939 6,表明預測值與期望目標值之間一致性較強。由上述分析可知,基于GA-Elman神經網絡模型預測參考作物需水量具有較高的精度性能。

圖4 GA-Elman神經網絡模型預測值ETGA-Elamn與期望目標值ET的相關性
神經網絡模型預測值與期望目標值之間存在一定程度的誤差,但相對誤差絕對值基本都在0%~25%范圍內,相對誤差絕對值0%~10%內占總數百分比為81.8%,超出25%的占總數百分比為0.7%,相對誤差絕對值平均值為7.24%。上述結果表明:模型預測整體誤差較小(見表1)。

表1 GA-Elman模型預測結果相對誤差絕對值統計分析
為進一步測試GA-Elman模型預測性能,采用有效性指數EF指標,對預測值與期望目標值的一致度進行計算,其值為94.1%,表明該模型預測性能較好。
本文以日序數、日照時數、日平均氣溫為輸入向量,以逐日參考作物需水量為輸出向量,構建了拓撲結構為3-11-1、基于GA-Elman神經網絡的參考作物需水量預測模型;GA-Elman神經網絡模型在對逐日參考作物需水量預測時有良好的精度性能及穩定性,經測試,其相對誤差絕對值均值為7.24%,絕大多數處于0%~25%范圍內,其中處于0%~10%范圍內的占總數81.8%;GA-Elman模型方法不需要任何假設及參數修正,所需資料信息易于獲取及預報,故為一種行之有效且便捷的參照作物需水量預測手段。本文構建的模型是基于一定地域氣象條件下的數據資料,故模型的應用也存在地域的局限性。