周 瑞,魏正英,張育斌,張 帥
(西安交通大學機械制造系統工程國家重點實驗室,西安 710049)
參考作物蒸散量(Reference Crop Evapotranspiration,ET0)是計算作物需水量的重要參數之一,準確預測參考作物蒸散量對作物需水量的預測至關重要。目前關于參考作物蒸散量的計算,聯合國糧農組織提出以FAO-56 Penman-Monteith(P-M)模型作為標準的ET0計算公式[1],P-M模型基于空氣動力學和能量平衡原理建立,綜合考慮了ET0的各種影響因素,對于ET0的計算有較好的結果,其精度也經過全球各地氣象站數據的實際檢驗。但P-M模型計算涉及氣象數據參數較多,且計算中間過程復雜,因此需要研究針對ET0的簡化計算模型。
隨著智能算法的發展,基于機器學習算法的ET0預測模型的研究也取得了進展。侯志強[2]等利用最小二乘支持向量機進行ET0的模擬計算,并利用河套地區數據驗證了模型效果,其模擬精度受輸入氣象因子數量的影響。Tabari[3]等研究利用自適應模糊推理系統和支持向量機能夠建立ET0與氣象因子之間的非線性關系,模擬精度與Hargreaves、Priestley-Taylor和Blaney-Criddle等模型進行對比,效果較好。Shiri[4]等研究了了基于基因表達式編程的ET0計算模型,在西班牙巴斯克地區進行的驗證,發現GEP模擬性能高于ANFIS、Priestley-Taylor和Hargreaves-Samani模型。張育斌[5]等利用耦合模擬退火算法對最小二乘支持向量機的ET0計算模型進行優化,解決了一般最小二乘支持向量機模型訓練速度慢、參數選擇困難等缺陷問題。馮禹[6]等建立了基于極限學習機的ET0預測模型,模型在四川地區預測精度較高。
本文提出了基于粒子群算法(Particle Swarm Optimization, PSO)和廣義回歸神經網絡(Generalized Regression Neural Network, GRNN)的ET0計算模型,并利用西安、延安、榆林等氣象站數據結合P-M公式計算結果進行驗證,實驗結果表明PSO-GRNN模型具有較高的預測精度,且穩定性相對現有研究有了一定提高。
廣義回歸神經網絡(GRNN)具有較強的非線性映射能力,在樣本數不大的情況下同樣能取得不錯的預測效果見圖1。賈義鵬等曾應用GRNN在巖爆預測領域取得了較好的應用[8]。

圖1 廣義回歸神經網絡結構Fig.1 GRNN block diagram
GRNN基于非線性回歸分析理論,設隨機變量x和隨機變量y的聯合概率密度函數為f(x,y),已知x的觀測值為X,則y相對于X的回歸,也即條件均值為:
(1)


(2)
式中:Xi,Yi為隨機變量x和y的樣本觀測值;n為樣本容量;p為隨機變量x的維數;σ為高斯函數的寬度系數,在此稱為光滑因子。


(3)

(4)

為得到最優的GRNN模型,需要確定最合適的光滑因子σ,因此引入粒子群優化算法進行尋優。
粒子群優化算法(Particle Swarm Optimization,PSO)用于求解優化問題,算法中每個粒子都代表問題的一個潛在解,構建一個適應度函數來表征每個粒子的當前狀態。每個粒子具有各自的速度,保證其可以向不同的方向和距離進行運動,速度根據粒子本身及周圍粒子的歷史運動過程動態調整,從而實現尋優過程[12,13]。
對GRNN模型進行優化,將原始氣象數據和通過P-M模型計算得到的標準ET0作為輸入,將GRNN模型的光滑因子σ的值作為粒子位置坐標,訓練GRNN模型并計算結果與標準值的均方根誤差,算法的適應度函數選擇為預測結果的均方根誤差,經過粒子群算法的迭代優化得到使預測結果均方根誤差最小的σ值,即GRNN模型的最優參數(見圖2)。

圖2 PSO-GRNN模型流程Fig.2 Flow chart of PSO-GRNN model
本文選取中國氣象數據網上共享的西安、榆林、延安等氣象臺站1970-2015年逐日氣象數據作為原始數據,選用日最高氣溫、日平均氣溫、日最低氣溫、平均相對濕度、平均風速、日照時長和臺站的海拔和緯度8個參數作為特征值,選擇P-M公式計算得到的ET0作為標準值。將數據集分為訓練集、測試集和驗證集3部分,1970-2000年數據為訓練集,用于模型訓練;2001-2010年數據為測試集,用于測試模型精度;2011-2015年為驗證集,用來驗證模型的誤差和性能[7]。
為驗證模型計算效果,以P-M模型計算得到的結果作為標準值,測試集數據進行預測的結果越接近標準值視為計算效果更好。另外選擇Hargreaves、Priestley-Taylor、Makkink、和Irmark-Allen等4種常用的ET0經驗模型進行對比分析,各模型公式及參數見表1。

表1 常用ET0計算模型Tab.1 Calculation models of ET0
注:ET0為參考作物蒸散量,mm/d;Rn為凈輻射,MJ/(m2·d);T為平均氣溫,℃;es為飽和水氣壓,kPa;ea為實際水氣壓,kPa;Δ為飽和水氣壓-溫度曲線斜率,kPa/℃;u2為距地面2 m高處的風速,m/s;TD為最高與最低氣溫之差,℃;Ra為大氣頂層輻射,MJ/(m2·d);α為經驗系數,取值為1.26;Rs為太陽輻射,MJ/(m2·d);n為日照時數,h/d;RH為相對濕度,%。
對比選用均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)模型有效性系數(EF)和自相關系數(R2)4個指標來評價各模型計算結果的準確性與一致性[14,15],計算公式如下:

(5)

(6)

(7)

(8)
以FAO-56 PM模型計算的ET0作為標準,將PSO-GRNN模型計算結果與經典ET0計算模型進行對比,對比的結果如表2所示。

表2 模型誤差對比Tab.2 Accuracy of models in modeling ET0
從表2可以看出采用西安地區氣象數據,使用PSO-GRNN模型進行預測得到的結果RMSE為0.408,MAE為0.305;Hargreaves模型得到的RMSE為0.725,MAE為0.548; Priestley-Taylor模型得到的RMSE為0.617,MAE為0.459;Makkink模型得到的RMSE為0.923,MAE為0.656;Irmark-Allen模型得到的RMSE為0.680,MAE為0.567。對比可知PSO-GRNN模型的預測結果比其他傳統經驗模型的均方根誤差小,模型有效性系數高。榆林和延安地區的結果同樣符合這一結論。
以FAO-56 PM公式的預測結果作為標準,將其他模型的預測結果與標準值進行對比,以標準值為x,對比模型的預測值為y繪制散點圖,對散點線性擬合后觀察預測值相對標準值的線性相關性(y=ax+b),a值與1的差值越小,b值與0的差值越小,模型的擬合效果越好。由圖3可知,延安地區PSO-GRNN模型擬合曲線為y=1.028 9x-0.061 582,自相關系數為97.7%,由圖4可知,Hargreaves模型擬合曲線為y=1.190 2x-0.018 282,自相關系數為88.154%;由圖5可知,Priestley-Taylor模型擬合曲線為y=1.037 1x-0.166 92,自相關系數為89.083%;由圖6可知,Makkink模型擬合曲線為y=0.868 8x+0.249 13,自相關系數為88.516%;由圖7可知,Irmark-Allen模型擬合曲線為y=0.900 25x+0.719 94,自相關系數為89.367%。對比可知PSO-GRNN模型預測結果的擬合曲線相對于其他4個經驗模型更接近y=x,自相關系數更接近1,結果與P-M模型計算結果更吻合。

圖3 延安地區PSO-GRNN模型與P-M模型ET0對比Fig.3 Comparison of ET0 calculated by PSO-GRNN and P-M in Yan'an

圖4 延安地區Hargreaves模型與P-M模型ET0對比Fig.4 Comparison of ET0 calculated by Hargreaves and P-M in Yan'an

圖5 延安地區Priestley-Taylor模型與P-M模型ET0對比Fig.5 Comparison of ET0 calculated by Priestley-Taylor and P-M in Yan'an

圖7 延安地區Irmark-Allen模型與P-M模型ET0對比Fig.7 Comparison of ET0 calculated by Irmark-Allen and P-M in Yan'an
由圖8可知,榆林地區PSO-GRNN模型擬合曲線為y=1.028 4x-0.074 979,自相關系數為98.6%,由圖9可知,Hargreaves模型擬合曲線為y=0.959 98x-0.063 673,自相關系數為85.406%;由圖10可知,Priestley-Taylor模型擬合曲線為y=0.863 72x-0.045 771,自相關系數為84.048%;由圖11可知,Makkink模型擬合曲線為y=0.662 64x+0.338 13,自相關系數為85.247%;由圖12可知,Irmark-Allen模型擬合曲線為y=0.747 98x+0.944 24,自相關系數為83.74%。對比可知PSO-GRNN模型預測結果在榆林地區的擬合曲線更接近y=x,自相關系數更接近1,模型預測效果更好。

圖8 榆林地區PSO-GRNN模型與P-M模型ET0對比Fig.8 Comparison of ET0 calculated by PSO-GRNN and P-M in Yulin

圖9 榆林地區Hargreaves模型與P-M模型ET0對比Fig.9 Comparison of ET0 calculated by Hargreaves and P-M in Yulin

圖10 榆林地區Priestley-Taylor模型與P-M模型ET0對比Fig.10 Comparison of ET0 calculated by Priestley-Taylor and P-M in Yulin

圖11 榆林地區Makkink模型與P-M模型ET0對比Fig.11 Comparison of ET0 calculated by Makkink and P-M in Yulin

圖12 榆林地區Irmark-Allen模型與P-M模型ET0對比Fig.12 Comparison of ET0 calculated by Irmark-Allen and P-M in Yulin

圖13 西安地區PSO-GRNN模型與P-M模型ET0對比Fig.13 Comparison of ET0 calculated by PSO-GRNN and P-M in Xi'an
由圖13可知,西安地區PSO-GRNN模型擬合曲線為y=1.003 7x-0.007 435,自相關系數為99.5%,由圖14可知,Hargreaves模型擬合曲線為y=1.007 9x-0.182 23,自相關系數為86.057%;由圖15可知,Priestley-Taylor模型擬合曲線為y=0.939 33x-0.074 953,自相關系數為89.337%;由圖16可知,Makkink模型擬合曲線為y=0.682 29x+0.347 8,自相關系數為84.515%;由圖17可知,Irmark-Allen模型擬合曲線為y=0.772 26x+0.903 32,自相關系數為87.785%。對比可知PSO-GRNN模型在西安地區也比其他經驗模型有更好的預測精度。

圖14 西安地區Hargreaves模型與P-M模型ET0對比Fig.14 Comparison of ET0 calculated by Hargreaves and P-M in Xi'an

圖15 西安地區Priestley-Taylor模型與P-M模型ET0對比Fig.15 Comparison of ET0 calculated by Priestley-Taylor and P-M in Xi'an

圖16 西安地區Makkink模型與P-M模型ET0對比Fig.16 Comparison of ET0 calculated by Makkink and P-M in Xi'an

圖17 西安地區Irmark-Allen模型與P-M模型ET0對比Fig.17 Comparison of ET0 calculated by Irmark-Allen and P-M in Xi'an
為了研究氣象數據不完整的情況下PSO-GRNN模型的計算效果,將不同氣象因子進行組合,分組對模型進行訓練,建立相應的PSO-GRNN模型,分析不同氣象數據資料缺少對PSO-GRNN模型精度的影響。
從表3可以看出總體來說輸入的氣象數據參數越少,模擬計算結果精度越差。輸入全部8個氣象參數所得結果與輸入6個氣象參數所得結果相通,說明φ,Z兩個氣象參數對于模型的預測精度影響可以忽略。當缺少U2這項參數時,模型的均方根誤差RMSE從0.233增大到0.322,模型自相關系數R2從97.709%降低到95.585%,模型有效性系數EF從0.974降低到0.949。當再缺少n,這項氣象參數時,模型的均方根誤差RMSE從0.322增大到0.438,模型自相關系數R2從95.585%降低到91.685%,模型有效性系數EF從0.949降低到0.899。說明n、U2兩項氣象數據的缺失對模型精度有一定影響,但模型的均方根誤差仍小于0.5模型自相關系數大于90%,模型預測效果較好。當缺少溫度資料(Tmax,Tm,Tmin)作為輸入的情況下,模型的誤差較大,自相關系數較低,說明溫度資料對模型精度影響較大,缺失溫度資料將很難得到較好的預測模型。

表3 不同氣象參數組合下的PSO-GRNN模擬ET0精度Tab.3 Accuracy of PSO-GRNN with different input combination
為驗證PSO-GRNN模型計算結果的總體精度,選取2011-2015年數據作為輸入,以P-M模型計算得到的總參考作物蒸散量作為參照,將PSO-GRNN模型模擬計算的ET0與標準值進行對比計算出相對誤差,并對比PSO-GRNN與其他經驗模型。
從表4可以看出,PSO-GRNN模型模擬計算預測的2011-2015年總參考作物蒸散量相對誤差優于其他經驗模型,延安、榆林、西安等地區總體相對誤差均在1.5%以內,其他經驗模型總參考作物蒸散量在不同地區的計算結果不夠穩定,因此可知PSO-GRNN模型相對于傳統經驗模型預測效果有一定提升。

表4 總參考作物蒸散量對比Tab.4 Comparison of total ET0 by different models
建立了基于粒子群算法(Particle Swarm Optimization, PSO)和廣義回歸神經網絡(Generalized Regression Neural Network, GRNN)的參考作物蒸散量預測模型,利用延安、榆林、西安等地的氣象數據進行了模型的模擬計算,實驗結果顯示,PSO-GRNN模型能夠較好的反應氣象數據與蒸散量之間的非線性映射關系,能取得較好的預測精度,效果優于Hargreaves、Priestly-Taylor、 Makkink 、Irmark-Allen等經驗模型。
(1)建立了基于廣義回歸神經網絡的ET0計算模型,并利用粒子群優化算法解決了GRNN模型參數選擇困難的問題,減少了人為因素對模型的干擾,提高了模型的穩定性。
(2)對比了不同氣象數據組合情況下PSO-GRNN模型的均方根誤差、自相關系數和模型有效性系數,結果表明溫度數據對模型的模擬精度影響最大,缺失溫度數據模型精度下降嚴重。缺失緯度和海拔資料對于某一地區ET0的預測影響可以忽略,缺失風速和日照時數資料對模型精度有一定影響,但缺失風速和日照時數PSO-GRNN模型均方根誤差小于0.5,自相關系數大于90%,因此在風速和日照資料缺失的條件下利用PSO-GRNN模型進行ET0預測計算仍能取得較好結果。
(3)將PSO-GRNN模型與Hargreaves Priestly-Taylor、 Makkink、Irmark-Allen等經驗模型進行對比,PSO-GRNN模型測試結果與標準值擬合結果更好,驗證歷年ET0總和的計算誤差也較其他模型更小,結果表明PSO-GRNN模型的預測精度高于4種經驗模型,能夠為作物需水量的決策提供依據。
□
[1] Allen R G, Pereiral L S, Raes D, et al. Crop Evapotranspiration: Guidelines for Computing Crop Water Requirements[M]. Rome: FAO Irrigation and Drainage 56, 1998.
[2] 侯志強,楊培嶺,蘇艷平. 基于最小二乘支持向量機的ET0模擬計算[J]. 水利學報,2011,42(6):743-749.
[3] Tabari H. Evaluation of reference crop evapotranspiration equations in various climates[J]. Water Resources Management, 2010,24(10):2 311-2 337.
[4] Shiri J, Kisi O, Landeras G, et al. Daily reference evapotranspiration modeling by using genetic programming approach in the Basque Country (Northern Spain)[J]. Journal of Hydrology, 2012,414/415:302-316.
[5] 張育斌, 魏正英, 張 磊, 等. 耦合模擬退火優化最小二乘支持向量機的日參照蒸散量模擬計算[J]. 節水灌溉, 2016,(9):133-138.
[6] 馮 禹,崔寧博,龔道枝,等. 基于極限學習機的參考作物蒸散量預測模型[J]. 農業工程學報,2015,31(S1):153-160.
[7] 李 航. 統計學習方法[J]. 北京:清華大學出版社, 2012.
[8] 賈義鵬, 呂 慶, 尚岳全. 基于粒子群算法和廣義回歸神經網絡的巖爆預測[J]. 巖石力學與工程學報, 2013,32(2):343-348.
[9] 王小川,史 峰,郁 磊,等. MATLAB 神經網絡43個案例分析[M]. 北京: 北京航空航天大學出版社,2013:243-255.
[10] Lu J, Bai Y. Applications of GRNN based on particle swarm algorithm forecasting stock prices[C]∥ Proceedings of the International Conference on Information, Business and Education Technology (ICIBET'13),2013:14-15.
[11] CUI J, QIE Z, LIU L. Short-term prediction of urban water consumption based on PSO-GRNN method[J]. Yangtze River, 2011,21:21.
[12] Zhou J, Yang K. General regression neural network forecasting model based on PSO algorithm in water demand[C]∥Knowledge Acquisition and Modeling (KAM), 2010 3rd International Symposium on IEEE, 2010:51-54.
[13] 謝習華, 徐 雷, 譚 耀, 等. 基于 PSO-GRNN 的直升機旋翼不平衡故障診斷[J]. 噪聲與振動控制, 2015,35(2):175-179.
[14] 馮 禹, 崔寧博, 龔道枝, 等. 利用溫度資料和廣義回歸神經網絡模擬參考作物蒸散量[J]. 農業工程學報, 2016,32(10):81-89.
[15] 張育斌,魏正英,馬勝利,等. 極端天氣下作物參照蒸散量計算方法研究[J]. 中國農村水利水電,2014,(12):64-68.