999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習算法的ET0預測研究

2022-11-30 07:27:28徐解剛柏玥辰李昕彤徐俊增
節水灌溉 2022年11期

韋 琦,衛 琦,徐解剛,柏玥辰,李昕彤,賀 敏,徐俊增

(1.河海大學農業科學與工程學院,南京 210098;2.河海大學水文水資源與水利工程科學國家重點實驗室,南京 210098;3.宜興市水利局,江蘇 宜興 214200)

0 引 言

參考作物騰發量(ET0)是估算作物需水量的關鍵參數,準確預測ET0對于灌溉制度制定、水資源合理配置和發展節水型農業具有重要指導意義[1,2]。目前,常用的ET0預測方法主要包括以FAO-56 Penman-Monteith(PM)為代表的綜合法、以Hargreaves-Samani (HS) 為代表的溫度法和以Kimberley-Penman 為代表的輻射法[3-5]。其中,FAO-56PM 綜合法由于具有計算精度高、物理學基礎嚴密等優點[6],已經在世界各地、不同氣候條件下進行了驗證和應用。然而,由于其對氣象數據資料的要求較高,因此在氣象資料短缺地區受到了一定的限制。HS 溫度法由于對氣象資料要求較低(僅需最高和最低溫度),且具有溫度容易獲取、觀測精度高等優勢,因此在氣象數據缺失地區受到了廣泛的關注[7]。

隨著計算機和人工智能技術的迅速發展,機器學習算法為ET0預測提供了新的理論與方法[8]。目前,已有部分學者針對機器學習算法在ET0預測方面的表現進行了研究。例如,馮禹等[9]以四川盆地遂寧氣象站2001~2010年氣象資料為基礎,以PM 公式計算的ET0為標準,對比分析了廣義回歸神經網絡(GRNN)和小波神經網絡(WNN)在預測ET0方面的適用性,結果發現GRNN 與WNN 算法可以在氣象資料缺失條件下較好的預測四川盆地ET0,且GRNN 預測精度高于WNN。江顯群等[10]針對廣州地區,以PM 公式計算結果為標準,研究了回歸型支持向量機(SVR)與BP神經網絡模型的ET0預測精度,結果表明SVR 與BP 神經網絡對ET0均具有較好的預測效果,且SVR預測精度優于BP神經網絡。趙文剛等[11]基于PM計算結果探討了BP 神經網絡、極限學習機和小波神經網絡算法在廣東典型站點ET0預測方面的表現,結果表明,在全氣候因子輸入條件下,機器學習算法預測ET0的精度表現為BP 神經網絡>極限學習機>小波神經網絡。然而,上述文獻主要基于單一地區且以PM 計算結果為標準開展了相關研究,考慮到不同氣候區溫度和降雨的時空分布極不均勻、以及不同ET0計算方法所需參數的差異,因此,針對不同氣候區,探究分別以PM 和HS 公式計算的ET0結果為標準值時不同機器學習算法的預測精度及適用性顯得尤為重要,但相關方面的研究還鮮有報道。

為此,本研究擬以中國干旱區和濕潤區各10 個典型氣象站點逐日氣象資料(1960~2019年)為依據,分別以PM 和HS公式計算的ET0為標準,對比分析多元逐步回歸(SL)、支持向量機(SVM)和高斯過程回歸(GPR)3 種常用機器學習算法的預測精度及其適用性,旨在了解機器學習算法在不同氣候區、以及以不同ET0公式計算結果為標準情況下的表現,研究結果對于ET0預測方法的選擇以及不同氣候區ET0的準確評估具有重要指導意義。

1 材料與方法

1.1 數據來源

本研究所使用的氣象資料由國家氣象信息中心(http://www.nmic.cn/)提供。基于站點空間分布均勻、氣象資料連續且具有較強代表性為原則,收集了中國干旱區和濕潤區兩種不同氣候特征區域各10 個常規氣象站點近60年(1960-2019)的逐日氣象數據,主要指標包括最低氣溫(Tmin,℃)、最高氣溫(Tmax,℃)、平均氣溫(Tmean,℃)、相對濕度(RH,%)、平均本站氣壓(P,kPa)、日照時數(N,h)、風速(U2,m/s)共7項指標。各氣象站點基本信息如表1所示。

表1 各氣象站點的基本信息Tab.1 Basic information of each meteorological station

1.2 參考作物騰發量(ET0)計算方法

1.2.1 FAO-56 Penman-Monteith模型

由于FAO-56 PM 公式計算精度較高,能夠較為準確反映參考作物騰發量的真實情況,因此近年來被廣泛應用,其具體計算公式如下:

式中:Rn為到達地表的凈輻射,MJ/(m2·d);Tmean為日平均氣溫,℃;G為土壤熱通量,MJ/(m2·d);γ為干濕計常數,kPa/℃;es和ea分別為飽和水汽壓與實際水汽壓,kPa;Δ為飽和水汽壓與溫度曲線的斜率;U2為距離地面2 m處的日平均風速,m/s。

1.2.2 Hargreaves-Samani模型

HS公式是一種基于溫度估算ET0的方法[12],由于需要的氣象數據較少,常用于氣象設備缺乏地區的ET0預測,其表達式為:

式中:Ra為大氣輻射,MJ/(m2·d);C、E、T為Hargreaves 公式的3個參數,建議值分別為0.002 3、0.5和17.8。

1.3 機器學習算法

1.3.1 支持向量機(SVM)

支持向量機(Support Vector Machines,SVM)是一種基于統計學習理論的機器學習方法,它不僅可以解決分類問題,也可以解決非線性回歸問題,為解決非線性回歸問題,模型通常用轉換函數φ將變量x映射到高維特征空間,再對其進行計算,并引入核函數可以將原來線性算法非線性化[13]。

1.3.2 高斯過程回歸(GPR)

高斯過程回歸(GPR)數學模型是依賴于非參數核的概率模型,它在機器學習編程領域具有重要意義。GPR 模型是將統計學習理論和貝葉斯理論相結合的一種機器學習方法,對于處理小樣本、高維度和非線性復雜關系的回歸和分類問題都有較好的效果[14]。

1.3.3 多元逐步回歸(SL)

多元逐步回歸分析是指有兩個或兩個以上的自變量或者至少有一個線性解釋變量的回歸分析。它是回歸分析中一種篩選變量的過程,可以使用逐步回歸從一組候選變量中構建回歸模型,讓系統自動識別出有影響的變量[15]。

1.3.4 評價方法

為了評價模型的ET0預測精度,本研究采用平均絕對誤差(MAE)、均方根誤差(RMSE)和決定系數(R2)3 個指標對模型模擬結果進行評價[11]。通常情況下,MAE和RMSE越小,表明模型偏差越小,精度越高;R2越接近1,表明模型的擬合程度越高。各指標具體計算公式如下:

式中:為ET0,PM或ET0,HS值,mm/d;yi分別為ET0,GPR、ET0,SVM、ET0,SL值,mm/d;為ET0,PM或ET0,HS的平均值,mm/d;分別為ET0,GPR、ET0,SVM、ET0,SL的平均值,mm/d。

1.4 統計與分析

采用Microsoft Excel 2011 對各站點氣象數據進行整理,采用Matlab 2019b 進行機器學習算法對ET0的訓練與預測,并采用Origin 2021對3種機器學習算法預測精度進行圖表繪制。此外,為了比較3 種機器算法在預測ET0方面的精度,首先通過PM 和HS 公式計算出各站點逐日參考作物騰發量ET0,PM和ET0,HS,再分別以前50年(1960-2009年) 逐日氣象資料(Tmin、Tmax、Tmean、RH、P、N和U2)和ET0值(ET0,PM和ET0,HS)為機器學習算法的輸入變量和輸出訓練集,并通過輸入后10年(2010-2019年)逐日氣象因子模擬該時間序列上的ET0值。

2 結果與分析

2.1 3種機器學習算法預測精度比較

由圖1可以看出,當以HS 公式計算的ET0為標準值時,GPR 模擬結果的R2、MAE和RMSE分別維持在0.950~0.984、0.429~0.809 和0.574~1.228 mm/d 范圍內;SVM 模擬結果的R2、MAE和RMSE分別維持在0.945~0.981、0.472~0.904 和0.606~1.239 mm/d范圍內;SL模擬結果的R2、MAE和RMSE分別維持在0.935~0.975、0.622~0.985 和0.756~1.386 mm/d 范圍內。而當以PM 公式計算的ET0值為參考時,3 種機器學習算法的R2均較以HS 公式計算結果為參考的模擬精度有所提升,而RMSE和MAE則正好相反。其具體表現為:GPR模擬結果的R2均值提高了0.017,MAE均值降低了0.445 mm/d,RMSE均值降低了0.619 mm/d,SVM 模擬結果的R2均值提高了0.019,MAE均值降低了0.483 mm/d,RMSE均值降低了0.648 mm/d,SL 模擬結果的R2均值提高了0.021,MAE均值降低了0.544 mm/d,RMSE均值降低了0.704 mm/d。整體上,當分別以HS和PM公式計算結果為標準時,3種機器學習算法在預測ET0效果方面均表現為:GPR>SVM>SL。

圖1 3種機器學習算法在不同參考公式下的評價指標對比Fig.1 Comparison of evaluation indexes of three machine learning algorithms under different reference formulas

進一步分析同一機器學習算法下分別以不同ET0公式計算結果為標準值的預測精度(圖2),可以發現,當采用SL 算法時,其以HS 公式計算值為標準值的計算結果的R2的變化范圍為0.935~0.975,MAE的變化范圍為0.622~0.985 mm/d,RMSE的變化范圍為0.756~1.386 mm/d;而當以PM 公式計算值為標準值時,其計算結果的R2的變化范圍為0.965~0.987,MAE的變化范圍為0.150~0.243 mm/d,RMSE的變化范圍為0.192~0.331 mm/d。當采用SVM 算法時,其以HS 公式計算值為標準值的計算結果的R2較SL 算法提高了0.007 9,MAE降低了0.092 mm/d,RMSE降低了0.091 mm/d,其以PM 公式計算值為標準值的計算結果的R2較SL 算法提高了0.005 7,MAE降低了0.032 mm/d,RMSE降低了0.036 mm/d。而對于GPR算法來說,其以HS 公式計算值為標準值的計算結果的R2的變化范圍為0.950~0.984,MAE的變化范圍為0.429~0.809 mm/d,RMSE的變化范圍為0.574~1.228 mm/d;而當以PM 公式計算值為標準值時,其計算結果的R2較以HS 公式計算值為標準值時提高了0.017,MAE降低了0.445 mm/d,RMSE降低了0.619 mm/d。整體上可以得出:當采用同一種機器學習算法進行模擬時,以PM 公式計算值作為標準值進行機器學習的模擬精度要顯著高于以HS公式計算值作為標準值進行機器學習的模擬精度。

圖2 不同參考公式在同一機器學習算法下評價指標對比Fig.2 Comparison of evaluation indexes of different reference formulas under the same machine learning algorithm

此外,通過對比不同氣候區情況下3種機器學習算法的預測精度(圖3),可以看出,無論是以PM 公式還是以HS 公式計算的ET0數值為標準,3 種不同機器學習算法在干旱區模擬ET0結果的R2均較濕潤區有所增大,其增幅主要維持在0.005~0.016 范圍內。且在干旱區,以PM 公式計算結果為標準值時,GPR算法的模擬效果最好,其R2均值高達0.988。

圖3 不同氣候區3種機器學習算法預測精度對比Fig.3 Comparison of prediction accuracy of three machine learning algorithms under different climatic regions

2.2 3種機器學習算法的穩健性比較

3 種機器學習算法在訓練和測試階段的R2、RMSE和MAE如圖4所示。可以發現,不同機器學習算法在訓練階段的計算精度均優于預測階段的計算精度。其中當以PM 公式計算的ET0為標準值時,SL 算法的穩健性最高,其R2、RMSE和MAE在訓練和預測階段變化幅度分別為0.16%、6.4%和6.2%;GPR算法的穩健性最低,其R2、RMSE和MAE的變化幅度分別為0.27%、13.6%和12.8%。而當以HS 公式計算的ET0值為標準值時,SVM 算法的穩健性最高,其R2、RMSE和MAE變化幅度分別為0.11%、8.4%和8.4%;GPR 算法的穩健性最低,其R2、RMSE和MAE變化幅度為0.56%、9.1%和8.9%。整體上,SL 和SVM 算法在分別以PM 和HS 公式計算的ET0值為標準值時其穩健性最高,而GPR 算法在所有情況下的穩健性均最低。

圖4 機器學習算法訓練和預測階段各評價指標情況Fig.4 Evaluation indexes of machine learning algorithm in training and prediction stages

2.3 3種機器學習算法的計算成本比較

機器學習的計算成本反應了模型訓練過程中消耗時間的長短,對評價機器學習模型的優劣具有重要參考意義[16]。通過分析3 種機器學習算法的計算成本(表2),可以看出,與SL算法相比,SVM 和GPR 算法的平均消耗時間顯著增加。具體來說,當以PM 公式計算的ET0為標準值時,SVM 算法在干旱區、濕潤區以及全區域的計算成本分別是SL 算法的12.1、14.7 和13.3 倍,GPR 算法的計算成本是SL 算法的13.2、18.4和15.6 倍;當以HS 公式計算的ET0為標準值時,SVM 和GPR算法的總計算成本是SL 算法的7.9~11.4 倍。結合表2情況來看,總體上,SVM 和GPR 算法計算時間成本顯著高于SL 算法,但計算精度也有明顯的提升。

表2 3種機器學習算法的計算成本sTab.2 Calculation cost of three machine learning algorithms

3 討論

3.1 3種機器學習算法適用性對比

不同機器學習算法對ET0預測結果有著顯著的影響[17]。劉小強等[17]基于江西省2001-2015年15 個站點的氣象數據,研究了3 種機器學習算法(GPR、XGBoost 和CatBoost)在預測ET0方面的表現,結果表明GPR 算法的預測精度最高且穩定性最好。褚江東等[18]基于石羊河流域5 個站點2013-2017年的氣象數據,對比分析了人工神經網絡(ANN)和支持向量機(SVM)對ET0的預測精度,結果發現SVM 算法預測的ET0與PM 公式計算結果之間的相關系數R2高達0.957 以上,模擬效果較好。本研究中,3 種機器學習算法預測的ET0數值與PM、HS 公式計算結果之間的相關系數R2分別高達0.965 和0.935 以上,且其ET0模擬精度整體表現為GPR>SVM>SL(圖1),與上述研究結果較為相似。進一步分析發現,由于SL 算法主要通過將顯著相關的變量選入回歸方程,而將影響不大的部分氣象因子進行了剔除,以得到最優方程[19],因此導致其預測效果相對較差;而與SL 算法相比,高斯過程回歸(GPR)與支持向量機(SVM)算法主要通過對原始數據集的數據特征進行學習,并通過反復交叉驗證與迭代的方法,對數據集進行“學習-驗證-預測”的方式得到最佳學習效果,因此,其預測精度相對較高,這可能是導致3 種算法預測精度差異的主要原因。

3.2 不同ET0參考公式下機器學習算法預測精度比較

與PM 公式相比,HS 公式僅需考慮溫度和太陽輻射的影響,因此,在不做任何修正的情況下,使用HS 公式容易出現估計值偏大的情況[20]。以往文獻大多以PM 公式計算結果作為參考值來探求其他ET0計算公式(如Hargreaves-Samani、Irmak-Allen 公式等)的計算精度[12,21-23],也有部分文獻以PM公式計算結果為參考值,將其他ET0公式的計算結果與機器學習算法模擬結果進行對比[2,24,25],分析其預測精度及其適用性。本研究中,分別以PM 和HS 公式計算出的ET0計算結果為參考,評價了3 種不同機器學習算法的適用性,研究結果表明,在采用同一種機器學習算法進行模擬時,以PM 公式計算值作為標準值進行機器學習的模擬精度要顯著高于以HS 公式計算值作為標準值進行機器學習的模擬精度(圖2)。產生上述現象的原因可能是機器學習算法在“訓練--預測”過程中受參考公式計算的ET0準確性影響較大,PM 公式作為目前最為推薦計算ET0的參考公式,公式本身復雜性較高,物理學基礎嚴謹,相較于其他參考公式來說更貼近真實情況,因此相較于HS 公式而言,以PM 公式為參考公式情況下,機器學習算法預測精度更高。此外,由于HS 公式在不同地區不同時間尺度上表現效果的不同,部分學者也對HS 公式的經驗系數進行了修正[26,27],因此未來研究中,還需結合不同經驗系數下的HS公式開展相關研究。

3.3 3種機器學習算法的穩健性和計算成本

穩健性是評估機器學習算法在ET0預測方面的一個關鍵因素[28]。本研究中,3 種機器學習算法在預測階段的精度較訓練階段有所降低,即R2降低,RMSE和MAE增加(圖4),這與Fan 等人的研究結果較為一致[28-30]。這一現象也表明了機器學習算法在使用新的氣象數據時,其預測精度會顯著降低。此外,對比3種機器學習算法,GPR算法的表現最不穩定,其在訓練和預測過程中精度變化最大,R2分別降低了0.003(PMGPR)和0.006(HS-GPR),這可能與訓練過程中的核函數、交叉驗證倍數和相關重要參數的選擇有關[31]。此外,機器學習的計算成本反應了模型訓練過程中消耗時間的長短,對評價機器學習模型的優劣有著重要的參考意義[16]。本研究結果表明,SVM 和GPR 算法的平均計算時間遠遠高于SL 算法(表2)。具體來說當以PM 公式計算的ET0為標準值時,SVM 和GPR 算法的計算成本是SL 算法的13 和15.6 倍。而當以HS 公式計算的ET0為標準值時,SVM 和GPR 算法的計算成本是SL算法的11.4 和8.7 倍,較PM 公式為基準情況時有所降低。產生這一現象的原因主要是由于多數機器學習算法的計算時間成本會隨著所采用算法參數的復雜程度和數量的增多而增加[29]。且對于SL 算法來說,由于其模型形式簡單、采用的參數較少,因此不需要花費太長的時間進行迭代運算;而對于SVM 和GPR 算法來說,由于核函數、交叉驗證倍數與相關重要參數的選擇有所不同,因此也導致了計算時間成本的增加。

3.4 氣象因子變化對機器學習算法模擬精度的影響

氣象因子作為影響參考作物騰發量的重要因素,其趨勢變化也顯著影響著ET0的估算結果。張亞東等[32]研究了杭嘉湖地區6個氣象站點的氣象因子和參考作物騰發量變化,結果表明ET0隨著時間的推移表現出了顯著上升趨勢,且氣溫和相對濕度與ET0具有顯著的相關性,其相關系數的絕對值均高達0.5以上。馬亞麗等[33]基于石羊河流域8個氣象站點1984-2019年的逐日氣象資料為依據,研究了ET0時空變化特征及其與氣象因素的響應關系,結果發現溫度對ET0增大的貢獻率為13.61%,升高的溫度可能是導致石羊河流域ET0增大的主要原因。然而,針對氣象因子變化對機器學習算法模擬精度影響的研究還鮮有報道,因此本研究嘗試從氣候變化影響機器學習模擬ET0精度的角度出發,對機器學習模擬精度與氣象因子的變化趨勢進行了定量分析(圖5)。

圖5 機器學習模擬精度與各因子變化趨勢相關性分析Fig.5 Correlation analysis between machine learning simulation accuracy and variation trend of various factors

結果表明,各氣象因子的變化速率與機器學習算法預測ET0的精度之間具有較強的相關性,其中當以HS 公式計算的ET0值為標準時,平均大氣壓(P)和日照時數(N)與3 種機器學習算法模擬精度的相關性較高,其具體表現為:P與HSSL、HS-SVM 和HS-GPR 的斯皮爾曼相關系數(ρ)范圍為0.46~0.57;N與HS-SL、HS-SVM 和HS-GPR 的斯皮爾曼相關系數(ρ)范圍為0.54~0.66。當以PM公式計算的ET0值為標準時,N與3 種機器學習算法預測精度的相關性最高,即N與PM-SL、PM-SVM 和PM-GPR 的相關系數分別為0.40、0.49 和0.51。上述結果表明,在以HS 公式計算的ET0為標準值情況下,P與N的變化可能是影響3 種機器學習算法預測精度的主要因子,且N的變化對其預測精度的影響更為明顯。而在以PM 公式計算的ET0為標準值情況下,N的變化在影響3種機器學習算法預測精度方面占據主導地位。

4 結 論

本研究以中國干旱區和濕潤區20 個氣象站點1960-2019年的日氣象數據為依據,以PM 和HS公式計算的ET0結果為參考值,評價了3 種機器學習算法在預測ET0方面的表現,得出如下結論:

(1)對于不同機器學習算法來說,其預測精度不受氣候分區(干旱區、濕潤區)和ET0參考值計算方法(PM 和HS 公式)的影響。總體上,3 種機器學習算法的ET0預測精度大小關系表現為:GPR>SVM>SL。

(2)對于同一機器學習算法來說,其預測精度與ET0參考值計算方法密切相關,且以PM 公式為參考值的模擬結果優于以HS公式為參考值的模擬結果。

(3)對于不同氣候分區來說,其預測精度不受參考值計算方法的影響,即3種機器學習算法在干旱區的預測精度均高于濕潤區,且預測精度與日照時數(N)、平均大氣壓(P)的變化等成顯著正相關關系。

(4)對于3種機器學習算法的穩健性和計算成本來說,SL和SVM算法在分別以PM和HS公式計算的ET0為標準值時穩健性最高,而GPR 算法在所有情況下穩健性均最低;SVM 與GPR 模型相較于SL 模型的計算成本較高,但計算精度也有明顯的提高。

主站蜘蛛池模板: 久久99国产乱子伦精品免| 精品国产免费人成在线观看| 亚洲第一成年网| 人与鲁专区| 色妞永久免费视频| 欧美一道本| 国产丝袜一区二区三区视频免下载| 99视频有精品视频免费观看| 在线精品视频成人网| 国产免费a级片| 久久动漫精品| 中文字幕在线一区二区在线| 欧美国产三级| 老司机精品一区在线视频| 国产成人精品午夜视频'| 精品福利一区二区免费视频| 亚洲免费成人网| 成人福利在线视频免费观看| 亚洲欧美一区在线| 精品小视频在线观看| 国产亚洲一区二区三区在线| 国产亚洲欧美日本一二三本道| 91免费观看视频| 在线观看视频99| 女人一级毛片| 99手机在线视频| 波多野结衣的av一区二区三区| 亚洲国内精品自在自线官| 国产美女一级毛片| 男女男免费视频网站国产| 国产成人AV男人的天堂| 久草视频中文| 91精品国产自产在线老师啪l| 青青青视频免费一区二区| 欧美a级完整在线观看| 久久香蕉欧美精品| 99久久国产综合精品2023 | 国产女人18水真多毛片18精品 | 久久久久九九精品影院 | 91精品专区国产盗摄| 欧美激情综合| 欧美一区二区三区欧美日韩亚洲| 久久精品国产电影| 欧美亚洲另类在线观看| A级毛片高清免费视频就| 黄色网站在线观看无码| 日韩视频免费| 亚洲精品视频网| 91精品国产自产在线观看| 成人午夜福利视频| 国产成人在线无码免费视频| 国产精品亚洲αv天堂无码| 国产综合日韩另类一区二区| 国产成人毛片| 亚洲丝袜第一页| 中文字幕无码电影| 欧美成人手机在线观看网址| 久久综合色88| 亚洲精品男人天堂| 久久久亚洲国产美女国产盗摄| 国产一区二区免费播放| a天堂视频| 国产毛片基地| 国产午夜小视频| 久久a级片| 亚洲免费成人网| 国产成人亚洲精品蜜芽影院| 国产国模一区二区三区四区| 亚洲最黄视频| 亚洲综合专区| 亚洲精品欧美重口| 丝袜亚洲综合| 97se综合| www精品久久| 欧美亚洲一区二区三区导航| 免费无码在线观看| 国产精品亚洲欧美日韩久久| www精品久久| 欧美爱爱网| 真实国产精品vr专区| 国产麻豆精品久久一二三| 国产精品三级专区|