楊會娟,粟曉玲,郭 靜(西北農林科技大學水利與建筑工程學院,陜西 楊凌 712100)
潛在蒸散發量是衡量大氣蒸散發能力的重要指標,也是估算作物需水量、生產潛力和制定灌溉制度的重要依據。此外,由于其對地表能量平衡和水量平衡的影響,也是建立流域水文模型及水量平衡模型時必須考慮的水文變量[1,2]。對一些氣候模式和大氣環流模式的研究發現,潛在蒸散發極易受到氣候因素變動的影響[3]。目前計算潛在蒸散發應用最多的且較精確的是聯合國糧農組織推薦的基于氣象數據的Penman-Montieth公式[4](簡稱PM公式),但該公式需要濕度、風速、溫度、日照時數等多個氣象因子,而在一些氣象站,風速數據或者缺失或者精度存在問題[5],一些ET0自動估測系統,難以用低成本測量傳感器測量日照時數,限制了其在缺少風速和日照時數兩氣象因子的站點的應用。
潛在蒸散發是各氣象因子的非線性復雜函數[6],采用人工智能方法模擬非線性關系已得到廣泛應用。很多學者應用人工神經網絡(ANN)方法模擬潛在蒸散發,如鄒磊等[7]在河南省選擇了5個典型區域,建立了基于溫度及輻射資料的RBF神經網絡模擬模型,取得了較高的模擬精度;Kuo等[8]以嘉南灌溉協會實驗站的氣象觀測數據作為輸入變量,利用ANN對Penman-Monteith方法和蒸發皿蒸發量的方法研究比較,結果表明,基于Penman-Monteith公式的BP-ANN模型可以精確的預測蒸散發;Jahanbani等[9]根據伊朗北部的拉什特市的1975-1985年的最高和最低的日氣溫資料,使用基于貝葉斯正則化的FFBP模型預測了該地區當前月份和下一個月的蒸散發,取得了較高的預測精度,發現ANN模型的預測精度優于HGS模型;El-Shafie等[10]提出了預測日蒸散量的集成神經網絡模型(ENN),依據伊朗北部的拉什特市和馬來西亞柔佛的新山市的最低和最高的日氣溫進行模擬預測,結果表明,ENN模型預測日ET0的效果優于經典的MLP-ANN方法。也有一些學者嘗試采用支持向量機(SVM)模擬潛在蒸散發[11,12]或實際蒸散發[13],取得了較好的模擬效果。SVM作為一種簡單實用的方法,與ANN相比,SVM能夠很好地克服前者訓練時間長,訓練結果存在隨機性和過學習等不足[14]。當觀測的氣象因子缺乏風速和日照時數時,SVM模擬潛在蒸散發的精度能否滿足要求尚未知。茲采用支持向量機回歸方法,以我國西北干旱區石羊河流域為例,分別建立輸入6個氣象因子和4個氣象因子的潛在蒸散發模擬模型,并比較模擬精度,評價模型的適用性。
Penman-Monteith方程考慮了影響ET0的各種氣象因素,物理基礎可靠,不需要專門的地區率定和風函數等,使用一般氣象資料(濕度、風速、溫度和日照時數)即可計算潛在蒸散發量。Penman-Monteith公式[15]如下:
(1)
式中:ET0為潛在蒸散發量,mm/d;Rn為輸入冠層凈輻射量,MJ/(m2·d);G為土壤熱通量,MJ/(m2·d);T為空氣平均溫度,℃;u2為2 m高處風速,m/s;es為飽和水汽壓,kPa;e0為實際水汽壓,kPa;Δ為飽和水汽壓與溫度關系曲線在某處的斜率,kPa/℃;γ為干濕溫度計常數,kPa/℃。
SVR最初主要用于解決模式分類識別問題[16,17]。 但分類問題和回歸問題在原理上是一樣的,對于一個輸入都有相應的輸出,也相當于一個函數映射關系,其基本原理為:
假定樣本的訓練集為{(x1,y1),(x2,y2),…,(xn,yn)},其中i=1,2,…,n,xi∈Rd是n個d維向量,yi∈R。xi為樣本的輸入值,yi為輸出值。通過訓練學習找到一個非線性回歸函數f,使得對于訓練樣本集和預測數據集均滿足yi=f(xi)。利用非線性映射ψ將輸入的訓練數據映射到高維特征空間,然后在該空間進行線性回歸。設需要求解的SVR函數為:
f(x)=ω·ψ(x)+b
(2)
式中:ψ(x)為映射函數;ω為權值向量,其維數為高維空間的維數;b∈R,為偏置。
可通過最小化下面的風險函數來求函數估計問題:
(3)
式中:‖w‖2為描述函數;c為懲罰系數,為對超出誤差ε的樣本的懲罰度,c越大表示對訓練誤差超出ε的樣本的懲罰越大,用于逼近誤差的折中和控制模型復雜度;ξ,ξ*為考慮允許擬合誤差而引入的松弛變量;ε為回歸函數的輸出誤差要求,ε越小,回歸函數的輸出誤差越小,擬合精度越高。
這是一個凸二次規劃優化問題,采用Lagrange乘子法和核函數技術,引入α和α*,將上述問題轉換為其對偶形式進行求解:


(4)


再利用KKT條件求得偏置b為 :
(5)
最后代入原方程得支持向量機回歸方程為:
(6)
若αi-α*i不為零,則該值所對應的樣本即為支持向量。這里K(xi,x)為核函數,在最優分類面中采用適當的內積函數K(xi,x)就可以實現某一非線性變換后的線性回歸,但核函數一定要滿足Mercer條件,其值等于向量Xi在特征空間ψ(xi)和ψ(x)的內積。核函數的引入,使得函數求解繞過特征空間,直接在輸入空間上求和。本文選用的核函數為RBF核函數,其形式為:
K(x,xi)=e(-g‖x-xi‖2)g>0
(7)
研究所用到的氣象資料有河西走廊東段石羊河流域烏鞘嶺、民勤、永昌、武威、古浪共5個氣象站的1959―2009年的長系列逐日的平均氣溫、最低氣溫、最高氣溫、平均風速、日照時數、相對濕度。其中古浪站的資料來源于甘肅省氣象局,其余氣象站資料來自于中國氣象科學數據共享服務網。各氣象站的地理位置見表1。

表1 石羊河流域各氣象站地理位置Tab.1 Location of all meteorological stations in Shiyang River Basin
選擇平均絕對誤差MAE(mm)、均方根誤差RMSE(mm)、相關系數R以及確定性系數DC作為模型模擬精度的評價標準。

(8)

(9)

(10)

(11)

以平均氣溫、最低氣溫、最高氣溫、平均風速、日照時數、相對濕度6個氣象因子作為SVR模型和ANN模型的輸入,模擬石羊河流域5個氣象站月潛在蒸散發量,以1999―2008年共10年(120個月)的序列為訓練期,2009年(12個月)為驗證期。
圖1為SVR模型模擬的月潛在蒸散發量與Penman-Monteith方程計算值的對比,可以看出,各站SVR模型模擬值與PM公式計算值擬合較好,除烏鞘嶺站外,其余4站在高值(>120 mm/月)區模型模擬值較計算值偏低,月潛在蒸散發高值主要分布在夏季5―8月。表2和表3分別為SVR模型和ANN模型模擬月潛在蒸散發量時訓練期和驗證期的性能指標值,可以看出,SVR模型和ANN模擬精度都較高,在訓練期和驗證期有較小的RMSE、MAE和較高的R和DC值,各站的相關系數R和確定性系數DC均在0.9以上。故在模擬該流域的月潛在蒸散發量時兩個模型都可以應用。

圖1 訓練期六因子輸入SVR模型月潛在蒸散發量模擬值與PM公式計算值的對比Fig.1 The comparison of monthly potential evapotranspiration between SVR model and calculation value

表2 六因子輸入SVR模型的RMSE、MAE、DC以及R值Tab.2 The RMSE、MAE、DC and R values of SVR model
為了探索資料較少地區潛在蒸散發量計算的新方法,進行了基于平均溫度、平均最高氣溫、平均最低氣溫、平均相對濕度4個因子的月潛在蒸散發量的模擬。

表3 六因子輸入ANN模型的RMSE、MAE、DC以及R值Tab.3 The RMSE、MAE、DC and R values of ANN model
圖2為四因子SVR模型模擬的月潛在蒸散發量與Penman-Monteith方程計算值的對比,可以看出,各站SVR模型模擬值與PM公式計算值擬合較好,除烏鞘嶺站外,其余4站在高值點(>140 mm/月)模型模擬值較計算值偏低。表4為四因子SVR模型模擬月潛在蒸散發量時訓練階段和驗證階段的性能指標值,可以發現,以四因子為輸入模擬月潛在蒸散發量時,不論在訓練期還是驗證期,各站的模擬性能指標盡管略低于六因子輸入條件下的性能指標,但相關系數R和確定性系數DC依然在0.9以上,模擬精度較高。故在缺少風速和日照資料的情況下,可用支持向量機回歸模型進行月潛在蒸散發量的模擬。

圖2 訓練期四因子輸入SVR模型月潛在蒸散發量模擬值與PM公式計算值的對比Fig.2 The comparison of monthly potential evapotranspiration between SVR model and calculation value

表4 四因子輸入SVR模型的RMSE、MAE、DC以及R值Tab.4 The RMSE、MAE、DC and R values of SVR model
采用Penman-Monteith方程計算了石羊河流域5個氣象站的潛在蒸散發,建立了六因子和四因子輸入的支持向量機回歸模擬模型。通過比較發現,四因子輸入的SVM模型模擬月潛在蒸散發的精度盡管略低于六因子輸入的模型精度,但相關系數和確定性系數依然高于0.9,說明SVM模型可以應用于干旱區缺乏風速和日照時數的觀測站的潛在蒸散發的模擬。這與侯志強、郭淑海[11,13]等人的研究成果相一致,即隨著輸入氣象因子的減少,模型的模擬精度會降低,但仍具有一定的適用性。此外,本研究還建立了六因子和四因子輸入的年支持向量機回歸模擬模型,由于篇幅所限,在此未能一一列舉。這兩個模擬模型的精度也較高,但同上述研究結果一樣,六輸入因子模型的模擬精度要高于四輸入因子模型。
研究也發現SVM模擬月潛在蒸散發時,在5-7月份潛在蒸散發較高時,模擬值相比PM公式計算值偏低,這與模型的參數選擇有關,并不影響模型的使用。用支持向量機做回歸模擬時,懲罰參數c和核函數g的選擇十分重要,可進一步研究基于粒子群、遺傳算法、蟻群算法等智能方法實現SVM參數優化,提高SVM的模擬效果。另外本文僅探索了月潛在蒸散發量的模擬效果,在以后的研究中,可進一步探討支持向量機回歸模型模擬日潛在蒸散發量的有效性。
□
[1] 張 東,張萬昌,徐全芝.漢江上游流域蒸散量計算方法的比較及改進[J].資源科學,2005,27(1):97-103.
[2] 侯蘭功,肖洪浪,鄒松兵,等.額濟納綠洲生長季參考作物蒸散發敏感性分析[J].中國沙漠,2011,31(5):1 255-1 259.
[3] 張 勃,張調風.1961-2010年黃土高原地區參考作物蒸散量對氣候變化的響應及未來趨勢預估[J].生態學雜志,2013,32(3):733-740.
[4] 李 祿,遲道才,張政利,等.太子河流域參考作物騰發量演變特征及氣候影響因素分析[J].農業工程學報,2007,23(9):34-38.
[5] Laaboudi A & Mouhouche B & Draoui B.Neural network approach to reference evapotranspiration modeling from limited climatic data in arid regions[J].International Journal of Biometeorology.2012,56:831-841.
[6] 粟曉玲,宋 悅,牛紀萍,等.涇惠渠灌區潛在蒸散發量的敏感性及變化成因[J].自然資源學報,2015,30(1):115-123.
[7] 鄒 磊,夏 軍,馬細霞,等.潛在蒸散發量估算方法在河南省的適用性分析[J].水文,2014,34(3):17-23.
[8] Kuo SF,Chen FW,Liao PY,Liu CW.A comparative study on the estimation of evapotranspiration using backpropagation neural network:Penman-Monteith method versus pan evaporation method[J].Paddy and Water Environment,2011,9(4):413-424.
[9] Jahanbani H,El-Shafie A.Application of artificial neural network in estimating monthly time series reference evapotranspiration with minimum and maximum temperatures[J].Paddy and Water Environment,2011,9(2):207-220.
[10] El-Shafie A,Najah A,Alsulami HM,et al.Optimized Neural Network Prediction Model for Potential Evapotranspiration Utilizing Ensemble Procedure[J].Water Resources Management,2014,28:947-967.
[11] 侯志強,楊培嶺,蘇艷平,等.基于最小二乘支持向量機的ET0模擬計算[J].水利學報,2011,42(6):743-749.
[12] 陳大春,曹 偉,雷曉云.基于最小二乘支持向量機的參考作物潛在蒸散量估計[J].新疆農業大學學報,2012,34(5) :431-436.
[13] 郭淑海,楊國靖,李清峰,等.新疆阿克蘇河上游高寒草甸蒸散發觀測與估算[J].冰川凍土,2015,37(1):241-248.
[14] 顧燕萍,趙文杰,吳占松.最小二乘支持向量機的算法研究[J].清華大學學報(自然科學版),2010,50(7):1063-1066.
[15] Allen,RG,Pereira,LS,Raes D, et al.Crop evapotranspiration guidelines for computing crop water requirements[R].FAO Irrigation and Drainage Paper 56,Rome,1998.
[16] 王小川,史 峰,郁 磊,等.MATLAB神經網絡43個案例分析[M].北京:北京航空航天大學出版社,2013.
[17] 黃巧玲,粟曉玲.基于小波支持向量機耦合的月徑流預測方法[J].水力發電學報,2015,34(3):1-8.