999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習與氣象災害指標的蘋果相對氣象產量預測

2023-09-23 03:48:18茹曉雅何建強
農業機械學報 2023年9期
關鍵詞:產量特征模型

羅 琦 茹曉雅 姜 元 馮 浩 于 強 何建強

(1.西北農林科技大學旱區農業水土工程教育部重點實驗室,陜西楊凌 712100;2.西北農林科技大學中國旱區節水農業研究院,陜西楊凌 712100;3.中國科學院水利部水土保持研究所黃土高原土壤侵蝕與旱地農業國家重點實驗室,陜西楊凌 712100;4.陜西省氣象局秦嶺和黃土高原生態環境氣象重點實驗室,西安 710016)

0 引言

目前,我國黃土高原是全世界最大的蘋果(MaluspumilaMill.)種植區之一,其蘋果種植面積和產量分別占全球的25.2%和26.3%[1-2]。由于蘋果種植業的經濟效益較高,黃土高原大部分傳統農田都已改建為蘋果園,蘋果產業已成為當地農村經濟的支柱產業之一,是當地農民的主要收入來源。因此,及時準確地預測蘋果產量對當地蘋果產業的發展具有重要意義。

黃土高原大部分地區光熱資源豐富、晝夜溫差大,對蘋果樹的生長發育和結果極為有利[3]。降水、氣溫和太陽輻射是影響蘋果生長發育的重要氣象要素,但氣象災害也會對蘋果產量形成過程造成極大的影響。黃土高原地區干旱少雨,屬于典型生態脆弱區,容易發生各種氣象災害。已有相關研究分析了各類氣象災害對蘋果產量的影響。例如,RODRIGO[4]發現春季花期凍害很少導致果樹死亡,但會嚴重損害蘋果花芽,是限制蘋果產量的關鍵因素;韓文靜等[5]采用連陰雨指標分析發現蘋果著色成熟期和采收期受到連陰雨危害的程度高于其他生育期;戴安然等[6]研究結果表明,旱災是限制中國蘋果生產發展的主要因素之一,會使果樹正常生長受到抑制,導致葉片萎蔫、落果、枝條抽干等。此外,干旱指標中標準化降水蒸散發指數(Standardized precipitation evapotranspiration index,SPEI)對降水和潛在蒸散發同樣敏感,1—6個月尺度的SPEI可用于評估農業干旱,且該指標還被廣泛應用于不同作物的產量預測模型中[7]。

為了量化氣象因子和氣象災害因子對蘋果產量的影響,有必要建立上述因子和蘋果產量之間的數學映射關系。但是不同氣象因子和氣象災害因子之間存在較強的共線性,并且這些因子與蘋果產量之間通常為非線性關系,將傳統的線性模型應用于作物產量預測往往不能獲得理想的預測結果。近年來,機器學習算法由于其眾多優勢而逐漸被廣泛應用于作物產量預測研究[8]。這類方法從訓練數據集中提取信息建立統計模型,隨后根據測試數據集評估模型模擬精度,從而在自變量和非自變量之間建立非線性關系[9-10]。相關研究表明機器學習算法可在蘋果產量預測中取得較好的效果。例如,LI等[11]利用氣象數據和支持向量機(Support vector machine,SVM)算法對陜西省28個基地縣的蘋果進行了估產,但研究區域只限制于陜西省;KHAN等[12]基于農業生產總值建立了基于列文伯格馬夸爾特(Levenberg-Marquardt optimization,LM)、尺度共軛梯度(Scale conjugate gradient back propagation,SCG)、貝葉斯正則化反向傳播神經網絡(Bayesian regularization back propagation,BRBP)算法的蘋果產量預報模型,但其選擇的模型輸入變量并不包括影響蘋果產量形成的環境因素;景輝等[13]采用氣象數據和多元線性回歸(Multiple linear regression,MLR)、反向傳播神經網絡(Back propagation neural network,BPNN)算法建立了蘋果產量早期預測模型,但并未考慮氣象災害因子對蘋果產量的影響,且只考慮了各生育期內氣象因子對蘋果產量的影響??傮w而言,上述研究的不足在于研究區域往往較小,所選擇的蘋果產量預測模型輸入特征變量較少考慮蘋果生長季內不同月份氣象因子的影響,以及氣象災害因子對蘋果產量的影響。

本文以我國黃土高原蘋果產區為研究區域,基于氣象、空間和氣象災害3類特征變量與產區蘋果單產統計數據,選擇梯度提升樹(Gradient boosting decision tree,GBDT)、SVM和BRBP神經網絡3種機器學習算法和MLR算法,構建黃土高原蘋果相對氣象產量預測模型。首先,采用斯皮爾曼相關性分析確定影響黃土高原蘋果相對氣象產量的最重要氣象特征變量,然后以最重要氣象特征變量、氣象災害特征變量和空間特征變量為輸入變量,選擇蘋果相對氣象產量預測模型的最佳模型輸入特征變量組合,最后基于不同生育期和生長季內各月份的最佳模型輸入特征變量組合,分析不同模型預測蘋果產量的提前期,以期為黃土高原蘋果產量早期預測提供科學依據和技術參考。

1 材料與方法

1.1 研究區域

研究區域為我國黃土高原蘋果產區,主要包括河南、山西、陜西和甘肅4省在內的共86個蘋果基地縣(34°22′~37°42′N,104°53′~112°46′E,海拔84~4 216 m,圖1)。黃土高原屬于半干旱大陸性季風氣候,是我國最大的蘋果優生區,其多項氣象因素能滿足優質蘋果生長需求。研究區內年均溫為6~16℃,年降水量為201~1 010 mm,年日照時數為1 294~2 900 h。

圖1 黃土高原86個蘋果生產基地縣和氣象站點分布圖

1.2 數據來源與處理

1981—2017年共37年的逐日氣象觀測數據(包括降水量、平均氣溫、最高氣溫、最低氣溫、日照時數及空氣相對濕度等)來源于中國氣象科學數據共享網(CMDSSS,http:∥cdc.cma.gov.cn/)。氣象觀測站空間位置信息(包括經度、緯度、海拔)來自各縣市內的氣象觀測站。河南、山西、陜西和甘肅共86個縣級行政區的蘋果單產數據來自《河南統計年鑒》[14]、《山西統計年鑒》[15]、《陜西統計年鑒》[16]和《甘肅發展年鑒》[17],以及各市人民政府依申請公開數據(表1)。本文剔除了各縣市單產缺失年份,共獲得1 852個有效單產數據。

表1 黃土高原蘋果產區86個生產基地縣產量記錄年份

數據歸一化處理可消除不同數據的量綱影響,提升模型各項性能[18]。因此,模型建立前統一對輸入數據進行歸一化處理,最后將模型輸出值進行反歸一化處理。計算公式為

(1)

式中xn——歸一化后的輸出數據

x——待歸一化的輸入數據

xmax——待歸一化輸入數據最大值

xmin——待歸一化輸入數據最小值

1.3 模型輸入特征變量和目標變量

1.3.1模型輸入特征變量優選

依據文獻[19-20],黃土高原產區的蘋果全生育期為本年11月至次年10月,可主要劃分為落葉期(本年11月)、休眠期(本年12月—次年2月)、萌芽幼果期(次年3—5月)、果實膨大期(次年6—8月)和著色成熟期(次年9—10月)。本文選取不同蘋果生育期內的9個氣象特征變量、3個空間特征變量和3個氣象災害特征變量作為構建蘋果相對氣象產量預測模型的輸入變量,具體特征變量如表2所示。

表2 蘋果相對氣象產量模擬模型輸入特征變量

太陽輻射數據根據各氣象站點觀測的日照時數和Angstrom-Prescott經驗公式[21]進行估算,公式為

(2)

其中

Ra=(24×60/π)Gscdr(ωssinφsinδ+

cosφcosδ)

(3)

dr=1+0.033cos(2πJ/365)

(4)

δ=0.409sin(2πJ/365-1.39)

(5)

ωs=arccos(-tanφtanδ)

(6)

N=24ωs/π

(7)

式中N——最大可能日照時數,h

ωs——太陽時角,rad

φ——緯度,rad

δ——太陽磁偏角,rad

J——年內某天的日序數

dr——日地間相對距離的倒數

Gsc——太陽常數,取0.082 MJ/(m2·min)

Ra——大氣外總輻射,MJ/(m2·min)

as、bs——經驗系數,取0.19和0.54[22]

n——實際日照時數,h

Rs——地表總輻射,MJ/(m2·min)

1個月尺度標準化降水指數(SPEI)根據Thornthwaite法[23]通過R語言中的“SPEI”包計算得到,具體計算過程主要分為3個步驟。

(1)計算潛在蒸散量PET,計算式為

(8)

(9)

A=6.75×10-7H3-7.71×10-5H2+

1.792×10-2H+0.49

(10)

式中A——常數

H——年熱量指數

PETi——月潛在蒸散量,mm/d

(2)計算氣候水平衡,計算式為

Di=Pi-PETi

(11)

式中Di——月降水量與蒸散量差值,mm/d

Pi——月降水量,mm/d

(3)對Di數據序列標準化,采用三參數的log-logistic概率分布F(x)對其進行擬合,計算出每個Di對應的SPEI值,計算式為

(12)

(13)

(14)

式中SPEI——1個月尺度標準化降水指數

其中C0、C1、C2、d1、d2、d3為常數項,取2.515 517、0.802 853、0.010 328、1.432 788、0.189 269、0.001 308。

為消除氣象變量多年周期性循環的影響,本文將蘋果多年生長季內的氣象特征變量進行平均,再將其與目標變量(蘋果相對氣象產量)進行斯皮爾曼相關性分析(Spearman correlation analysis),選擇對蘋果產量影響最大的重要氣象特征變量,以減少輸入數據的復雜程度。在每類氣象特征變量中,選擇與目標變量的相關系數絕對值最大且顯著的特征變量。如果同類特征變量之間的相關系數小于0.5且其與目標變量顯著相關時,則可選擇多個特征變量。

1.3.2模型目標變量構建

蘋果產量的形成受多種因素的影響,主要包括氣象要素、技術措施和其他因素,相應地蘋果產量可以分解為氣象產量、趨勢產量和隨機產量。為了能更好地反映氣象要素造成的蘋果產量波動,降低時間和地域對產量影響的限制,采用相對氣象產量作為目標變量定量評估氣象要素對產量形成的影響。計算公式為

(15)

其中

(16)

yc=y-yt+yr

(17)

式中y——實際產量,kg/hm2

yw——相對氣象產量,正值表示氣象要素有利于作物生長發育即產量增加,負值表示產量減少

yt——趨勢產量,kg/hm2,可采用一階傅里葉擬合來估算[24]

yc——氣象產量,kg/hm2

yr——隨機產量,kg/hm2,本文忽略不計

a0——常系數,取-2.94×1010~2.17×1011

w——常系數,取0.30~0.90

ai——各級系數,取-2.17×1011~2.94×1010

bi——各級系數,取-2.09×104~1.22

M——傅里葉展開級數,取1

t——年份

1.4 蘋果相對氣象產量模擬模型

1.4.1機器學習算法

(1)梯度提升樹

梯度提升樹(GBDT)是基于Booting方法的集成模型。該類方法采用加法模型和前向分步算法實現學習優化[25]。GBDT回歸算法中以回歸樹作為弱學習器,學習任務時,利用損失函數的負梯度作為當前學習器的偽殘差,根據偽殘差擬合回歸樹,直到滿足要求停止重復此過程。GBDT算法一般比隨機森林算法的訓練結果更準確[9],收斂速度快且不易出現過擬合。R語言中提供了GBDT算法包“gbm”,所需要的參數包括:分布函數(distribution,選擇“gaussian”)、樹終節點的最小個數(n.minobsinnode,取10)、學習率(shrinkage,取0.01)、回歸樹數量(n.trees,取200)以及單棵回歸樹最大深度(interaction.depth,以1為步長在[0,10]內取值)。

(2)支持向量機

支持向量機(SVM)通過非線性映射將自變量映射到高維的特征空間,在高維特征空間中尋找一個最優超平面,使得所有訓練樣本距離該最優分類面誤差最小[26]。對于回歸應用,SVM算法主要利用核函數構造線性回歸方程求得最優超平面[27]。該算法可利用R語言提供的“e1071”包來實現,所需參數包括:核函數類型(Kernel,定為高斯徑向基核函數)、核函數系數(gamma,以0.01為步長在[0.01,1.00]內選擇)以及懲罰系數(cost,以0.1為步長在[0.1,100]內確定)。

(3)貝葉斯正則化反向傳播神經網絡

貝葉斯正則化反向傳播神經網絡(BRBP)融合傳統反向傳播神經網絡算法和貝葉斯理論自動選擇最優的正則化參數,能夠避免過擬合問題,極大提高模型的泛化能力[28]。采用包含輸入層、隱含層和輸出層的3層神經網絡拓撲結構,隱含層的節點數根據試湊法,以預測誤差最小為原則來確定。Matlab軟件中的“newff”函數可以實現該類算法,所需參數包括:輸入節點數a、輸出節點數b、隱含層節點數l、節點傳遞函數(隱含層為tanh,輸出層為purelin)、訓練函數(trainbr)、迭代次數k、學習率η以及目標函數誤差(goal)。其中,參數k、η、goal經反復試算后分別取1 000、0.1、10-5。

(4)多元線性回歸

多元線性回歸(MLR)是一種廣泛應用于單個目標變量與2個及以上輸入特征變量的線性回歸方法[29]。目標變量通常受多種特征變量的影響,因此多元線性回歸相對于一元線性回歸更具適用性。在多元線性回歸中,方程的參數通過最小二乘法獲得[30]。R語言提供的“lm”函數可實現MLR算法。

1.4.2蘋果相對氣象產量模擬模型構建

如圖2(圖中M、G、D分別表示最重要氣象災害特征變量、空間特征變量、氣象災害特征變量)所示,以GBDT算法為例,簡述蘋果相對氣象產量yw預測模型的建立過程。首先,基于蘋果全生育期最重要氣象特征變量,逐次添加空間特征變量和氣象災害特征變量,形成不同的模型輸入特征變量組合。其次,應用GBDT算法建立模型估算蘋果相對氣象產量,以yw估算值和實測值之間的誤差最小化為優化目標,獲得最佳模型輸入特征變量組合。然后,逐次添加蘋果落葉休眠期、萌芽幼果期、果實膨大期、著色成熟期內的最佳模型輸入變量組合,構建不同生育期的蘋果相對氣象產量預測模型,以模型測試集均方根誤差(RMSE)最小化為依據,確定蘋果相對氣象產量預測的提前生育期。最后,逐次添加蘋果生長季內各月份的最佳模型輸入特征變量組合,構建蘋果生長季內不同月份的蘋果相對氣象產量預測模型,以模型測試集歸一化RMSE最小化為依據,確定蘋果相對氣象產量預測的提前月份。并且在不同生育期和生長季內不同月份的模型預測精度分析過程中,將相對氣象產量轉換為實際產量,比較其與以相對氣象產量為目標變量的機器學習模型精度,從而判斷蘋果相對氣象產量模擬模型構建方法精度。

圖2 蘋果相對氣象產量模擬模型流程圖

模型模擬前,隨機選取70%觀測數據作為訓練數據集,30%數據作為測試數據集,以10折交叉驗證誤差為原則對模型參數進行尋優。為降低模型精度極大值和極小值的影響,模型的最終精度為100次運行誤差的50%分位數。

1.5 模型精度評價

采用皮爾遜相關系數(Pearson correlation coefficient,r)和均方根誤差(Root mean square error,RMSE)2個統計指標來評價模型模擬精度。

2 結果與分析

2.1 影響蘋果產量的氣象特征變量

本文分析了目標變量(蘋果相對氣象產量)與氣象特征變量之間的相關關系(圖3,P<0.05),發現氣溫特征變量Tmean、Tmin、Tmax、Td、AT、NT與目標變量之間存在正相關關系,其中Tmax與目標變量的相關性最高(r=0.26)。為了避免輸入因子間共線性對模型精度的影響,可同時選擇與Tmax相關系數小于0.5的其他氣溫特征變量,其中符合要求的兩個氣溫特征變量為Tmin與NT,但是它們之間存在較強的相關性,且Tmin與目標變量之間的相關性強于NT,因此最終只選擇Tmax和Tmin作為模型輸入的氣溫特征變量。需水特征變量RH與目標變量之間呈負相關關系,而供水特征變量P、輻射特征變量R與目標變量之間的相關性系數較小。因此,本文最終選取Tmax、Tmin、RH、P、R作為蘋果相對氣象產量模擬模型輸入的最重要氣象特征變量。

圖3 目標變量(蘋果相對氣象產量)與氣象特征變量關聯熱圖

2.2 基于多種特征變量的不同蘋果產量模型模擬精度分析

分別使用蘋果整個生長季內的最重要氣象特征變量組合(M),最重要氣象特征變量和空間特征變量組合(M+G),以及最重要氣象特征變量、空間特征變量和氣象災害特征變量組合(M+G+D)作為不同的模型輸入特征變量組合,分別驅動基于GBDT、SVM、BRBP和MLR算法的蘋果相對氣象產量模擬模型,并比較不同模型測試數據集的模擬精度(圖4,圖中虛線表示1∶1線;**表示P<0.01)。當僅以最重要氣象特征變量M作為模型輸入變量特征組合時,SVM模型具有最大的r值(0.70),而BRBP模型的預測誤差最小(RMSE為0.46)且數據點均勻分布在1∶1線的兩側(圖4a、4d、4g、4j)。當以M+G作為模型輸入特征變量集時,與僅以M作為模型輸入特征變量的情形相比,GBDT和BRBP的RMSE分別降低2%、2.17%,同時GBDT、BRBP和MLR模型的r分別提升4.76%、2.99%和1.72%,但SVM模型的精度無變化(圖4b、4e、4h、4k)??梢娫谀P洼斎霘庀筇卣髯兞恐性偌尤肟臻g特征變量,可以提高蘋果相對氣象產量模擬模型的預測精度。進一步在上述模型輸入變量中再添加氣象災害特征變量(M+G+D),結果表明增加氣象災害特征變量可使GBDT、BRBP和MLR模型預測精度進一步提升,其中GBDT模型的模擬精度提升效果最為明顯,其r增加16.67%,RMSE減少10.20%,而SVM模型的模擬精度則有所下降(圖4c、4f、4i、4l)。

總體而言,基于GBDT和BRBP這2種機器學習算法和M+G+D輸入特征變量組合建立的蘋果相對氣象產量預測模型,其模擬精度普遍優于MLR算法模擬。這可能是因為蘋果相對氣象產量與最重要氣象特征變量、空間特征變量和氣象災害特征變量之間存在較強的非線性關系,而機器學習算法比多元線性回歸方法更能準確描述這種非線性關系。因此,本文采用M+G+D組合作為最佳的模型輸入特征變量組合。

2.3 模型模擬誤差空間分析

以蘋果整個生長季內的M+G+D特征變量組合作為模型輸入變量,驅動基于不同算法建立的蘋果相對氣象產量模擬模型,可進一步分析不同模型在黃土高原各省份的總體模擬精度(圖5,圖中每個箱體包含各省蘋果生產基地縣的蘋果相對氣象產量模擬結果,箱體上、下限為數據的上四分位數和下四分位數,中間實線為數據中位數,箱體外的兩條線為上邊緣和下邊緣,超出上下邊緣的值為異常值)。由圖5可知,不同模型在不同省份的表現存在較大差異,其中BRBP模型在河南省和陜西省表現最佳,SVM模型在山西省和甘肅省表現較佳。河南、山西、陜西和甘肅各省最佳模型的 RMSE均值分別為0.47、0.11、0.39和0.20。在這4個省份中,山西省的模型總體估計誤差相對較小,4個模型的RMSE平均值僅為0.24,且誤差分布相對較為集中。但河南省RMSE箱型圖的箱體最長,這可能由于本文中河南省僅有3個蘋果基地縣,數據量較少使得箱型圖的分布范圍較大。

圖5 基于最重要氣象、空間和氣象災害特征變量組合和不同算法的模擬模型在4個不同省份模擬蘋果相對氣象產量的RMSE箱型圖

2.4 蘋果不同生育期輸入特征變量組合對模型模擬精度的影響

進一步探究在M+G+D輸入變量組合下,不同模型在不同生育期(落葉休眠期、萌芽幼果期、果實膨大期、著色成熟期)的蘋果產量預測精度(圖6)。當以相對氣象產量作為目標變量時,對于GBDT和BRBP模型,各生育期模型的模擬精度無明顯變化,其RMSE分別保持在0.44~0.46和0.44~0.45之間,這表明這2種模型在蘋果各個生育期內均能獲得相對較高的相對氣象產量預測精度(圖6a)。在不同蘋果生育期,SVM模型的RMSE先減小后增加,次年8月產量預測的RMSE具有最低值(0.51),可見SVM模型可在果實膨大期獲取最好的預測結果。MLR模型模擬的RMSE隨著蘋果生長發育的推進而逐漸減小,并在次年8月獲得最佳的預測結果,與次年10月該模型的蘋果相對氣象產量預測精度僅相差0.01,表明該模型可在蘋果果實膨大期就獲取較為理想的蘋果相對氣象產量預測結果。當將相對氣象產量轉換為實際產量時,GBDT、BRBP、MLR模型在各生育期的模擬精度均呈現減小趨勢(圖6b)。具體而言,GBDT和BRBP模型在蘋果各個生育期內均能獲得相對較高的實際產量預測精度,其RMSE分別保持在4.42~4.90 kg/hm2和4.62~5.20 kg/hm2之間。MLR模型在果實膨大期的預測精度與著色成熟期僅相差0.03 kg/hm2,表明該模型在果實膨大期也能獲取較為理想的蘋果產量預測精度。SVM模型的RMSE先減小后增加,并且在果實膨大期獲取最好的預測結果(5.04 kg/hm2)。

圖6 基于GBDT、SVM、BRBP和MLR算法的不同模擬模型在蘋果不同生育期模擬黃土高原蘋果產量的精度對比

2.5 蘋果生長季內不同月份的模型預測精度

在生長季內不同月份對蘋果相對氣象產量進行預測模擬并分析其精度,可確定出蘋果產量預測的最佳提前期。根據生長季內不同月份各模型模擬結果歸一化RMSE,可知4種模型的模擬精度都呈現出類似的變化趨勢(圖7a)。即隨著蘋果生育期的推進,模型輸入變量不斷增多,各模型的歸一化RMSE逐漸減少。當以相對氣象產量作為目標變量時,對于GBDT和BRBP算法,基于生長季內所有月份輸入特征變量的結果最佳。與基于生長季所有月份輸入變量的模型模擬結果歸一化RMSE相比,在次年9月這2個模型的歸一化RMSE分別與之僅相差0.62%和1.04%,精度非常相近。SVM算法可在次年8月獲取最佳的預測精度。基于MLR算法的蘋果相對氣象產量預測模型可在次年9月獲得最小的歸一化RMSE。當將相對氣象產量轉換為實際產量時,GBDT和BRBP算法在次年9月的產量預測精度分別與次年10月僅相差0.38%和1.34%,而SVM和MLR算法分別在次年8月和次年9月模型預測精度最佳(圖7b)。綜上所述,本文建立的4種不同模型均可在蘋果成熟期前1~2個月實現蘋果相對氣象產量的相對準確預測。

圖7 基于GBDT、SVM、BRBP和MLR算法的不同模擬模型在蘋果生長季內各月份模擬黃土高原蘋果產量的歸一化RMSE

3 討論

3.1 影響蘋果產量的特征變量和產量去趨勢方法

氣象要素和氣象災害對蘋果產量具有重要的影響。本文選擇了蘋果產量形成過程中具有代表性的氣象變量和氣象災害變量,包括Tmean、Tmin、Tmax、Td、AT、NT、RH、P、R、N4≤0℃、CR和SPEI。其次,氣象特征變量篩選結果表明Tmin、Tmax、RH、P、R是影響黃土高原蘋果相對氣象產量預測模型的精度的重要氣象特征變量,這與前人的研究結果相一致。白秀廣等[31]和張強[32]研究表明,氣溫對蘋果產量有正向影響,降水量、空氣相對濕度和日照時數對蘋果產量有負面影響。本文中降水量和太陽輻射與蘋果相對氣象產量之間的相關系數較小,這可能是因為黃土高原降水不均勻特征和灌溉等因素影響了降水量與蘋果產量間的相關性[33]。此外,本文中蘋果產量的樣本量可能也影響了太陽輻射與蘋果產量之間的相關性。隨后,在最重要氣象特征變量中依次加入空間特征變量和氣象災害特征變量,均可進一步提升基于GBDT、BRBP和MLR算法的蘋果相對氣象產量模擬模型的預測精度。當模型輸入特征組合為“氣象特征變量M+空間特征變量G+氣象災害特征變量D”時模型精度最高。劉峻明等[34]研究表明,氣象站點空間位置會影響作物的積溫和物候,但由于氣候條件往往存在一定的年際變化,導致空間位置和氣象要素的相關性較弱。所以,作物產量預測模型中需要同時考慮氣象特征變量和空間特征變量。FENG等[35]研究發現,需要在作物產量預測模型中加入氣象災害,以此減少氣象災害給作物產量預測結果帶來的不確定性。然而,本文中加入氣象災害特征變量會導致SVM模型的預測精度降低,這可能是因為該算法易受數據維度的影響,而氣象災害因子的加入增加了樣本維度,從而導致模型性能受損[36]。

蘋果相對氣象產量僅受氣象條件的影響,但是該產量不能通過測量直接獲取,因此需對實際蘋果產量數據進行預處理,而數據處理方法的選擇就甚為重要。本文采用了一階傅里葉對所有基地縣的蘋果單產去趨勢得到蘋果相對氣象產量,這可以在一定程度上消除其他因素對產量的影響,從而能準確地反映蘋果產量隨氣象因子的非線性變化。然而,產量去趨勢其他方法還包括:線性回歸、多項式回歸、指數回歸、對數回歸、滑動平均、Logistic回歸、HP濾波、局部加權回歸等[37-40]。此外,由于社會、經濟發展不平衡,不同區域的作物產量變化趨勢也會存在差異性[41]。因此,在今后的研究中需要在各蘋果生產縣采用不同的去趨勢方法獲得更加準確、客觀的蘋果相對氣象產量,從而提升模型的模擬精度。

3.2 基于機器學習算法的蘋果相對氣象產量模擬模型

機器學習模型能夠較好地建立氣象災害因子與產量之間的關系,而這是作物模型普遍無法實現的[42]。在模擬黃土高原蘋果相對氣象產量的過程中,本文發現非線性算法GBDT、BRBP優于線性算法MLR。當以M+G+D組合作為模型輸入特征變量組合來驅動本文所建立的模型模擬蘋果相對氣象產量時,機器學習模型(GBDT、BRBP模型)的r和RMSE分別比線性模型(MLR模型)高11.11%~22.22%和低10.20%,這表明模型輸入特征變量與蘋果相對氣象產量之間存在較強的非線性關系,機器學習算法比線性算法能夠更為準確地描述這種非線性關系。前人研究也發現氣溫、太陽輻射、降水量、空氣相對濕度等氣象要素、空間要素和氣象災害要素與蘋果產量之間存在非線性關系[11,24,34,43-44],本文結果與這些結論基本相同。然而,基于SVM算法建立的蘋果相對氣象產量預測模型的RMSE均高于線性模型,這可能是因為輸入變量之間存在較強的線性關系,破壞了SVM模型的預測性能,從而導致SVM模型預測結果與線性模型相近甚至更差[45]。此外,本文還探究了在蘋果生長季內不同月份各模型預測蘋果相對氣象產量的精度。結果表明,當以M+G+D特征變量組合作為模型輸入變量時,本文建立的4種模型均可在果實成熟前的1~2個月獲得較高精度的蘋果相對氣象產量預測結果。本文所構建的蘋果相對氣象產量模擬模型在蘋果生長季內不同月份的預測中模擬精度存在差異,這一方面可能因為不同月份氣象特征變量對蘋果產量的影響并非同等重要[13]。另一方面可能是由于特征變量的輸入個數隨著月份的遞增而增加,機器學習模型對更多數量的輸入特征通常模擬精度可能更佳。已有研究表明小麥、玉米、水稻等糧食作物均可在收獲前的1~2個月實現較為準確的早期產量預測,這些結果也與本文的結果較為一致[21,46]。并且將相對氣象產量轉換為實際產量后,4種模型在蘋果生長季內不同月份的模擬精度變化趨勢基本一致,僅在數值上存在部分差異,可能是蘋果實際產量受到技術措施等其他因素影響所導致的。這表明本文所構建的蘋果產量模型具有較好的預測精度。

3.3 氣象特征變量和氣象災害特征變量對蘋果相對氣象產量模擬精度的影響

本文通過篩選,最終確定了預測蘋果相對氣象產量的輸入特征變量為:氣象特征變量Tmax、Tmin、RH、P、R,氣象災害特征變量N4≤0℃、CR、SPEI,空間特征變量Lat、Lon、Ele。以機器學習模型(GBDT、SVM、BRBP、MLR模型)在蘋果生長季內不同月份的表現來看,空間特征變量在模型輸入中是固定不變的,但是隨著蘋果生育期從冬季休眠期(本年11月)發展到收獲期(次年10月),輸入模型的最重要氣象特征變量和氣象災害特征變量的時間序列逐漸遞增,而此過程中所有模型的RMSE均逐漸減小(圖7)。這表明氣象特征變量和氣象災害特征變量在模型性能的后續提升過程中發揮著關鍵作用。因此,相比于空間特征變量,氣象特征變量和氣象災害特征變量對蘋果相對氣象產量模擬模型精度的影響更大。

3.4 蘋果相對氣象產量模擬模型的不足

本文建立的黃土高原蘋果相對氣象產量預測模型也存在一定的不足。首先,本文所建立模型的輸入數據較為單一,然而蘋果的生長發育過程非常復雜,產量形成過程中受到眾多因素的影響,例如土壤[40,47]、灌溉、施肥以及園藝管理措施[48]等。因此,在未來的研究中應考慮將上述因子納入模型的輸入特征變量組合,這將會進一步提高蘋果相對氣象產量模型的模擬精度。其次,本文選用的3種機器學習算法均為黑箱模型,并不能定量化解釋輸入變量對目標變量的影響[49-50]。最后,本文還未能將所選的最佳預測模型在其他不同蘋果種植區域和不同的氣候環境下進行充分驗證。例如,LI等[11]建立了陜西省縣域產量預測模型,并預測了未來氣候條件下28個蘋果基地縣的產量。因此,在隨后的研究中擬將本文建立的蘋果相對氣象產量預測模型推廣至整個黃土高原的蘋果種植適宜區,并利用其分析未來氣候變化條件下黃土高原產區的蘋果相對氣象產量變化。

4 結論

(1)基于GBDT和BRBP機器學習算法的蘋果相對氣象產量模擬模型的精度均優于基于傳統線性回歸算法的模型,這表明最重要氣象特征變量、空間特征變量和氣象災害特征變量與蘋果產量之間存在較強的非線性關系,而機器學習算法能夠更為準確地描述這種非線性關系。

(2)以最重要氣象特征變量、空間特征變量和氣象災害特征變量作為模型輸入變量組合,GBDT和BRBP算法模型在各個生育期內均能獲得相對較高的蘋果相對氣象產量預測精度,SVM和MLR算法模型可在果實膨大期獲取較為理想的蘋果相對氣象產量模擬結果。

(3)基于最重要氣象特征變量、空間特征變量和氣象災害特征變量組合,機器學習算法(GBDT、SVM、BRBP)和線性算法(MLR)的產量模擬模型均可在蘋果成熟期前1~2個月實現對黃土高原蘋果相對氣象產量較為準確的預測。

猜你喜歡
產量特征模型
一半模型
2022年11月份我國鋅產量同比增長2.9% 鉛產量同比增長5.6%
今年前7個月北海道魚糜產量同比減少37%
當代水產(2021年10期)2021-12-05 16:31:48
重要模型『一線三等角』
海水稻產量測評平均產量逐年遞增
今日農業(2020年20期)2020-11-26 06:09:10
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
2018上半年我國PVC產量數據
聚氯乙烯(2018年9期)2018-02-18 01:11:34
抓住特征巧觀察
主站蜘蛛池模板: 国产91无码福利在线| 欧美日韩国产在线观看一区二区三区| 国产主播在线一区| 午夜精品区| 91精品啪在线观看国产91九色| 国产精品手机视频| 色欲国产一区二区日韩欧美| 欧洲精品视频在线观看| 美女无遮挡被啪啪到高潮免费| 狼友视频一区二区三区| 亚洲AV色香蕉一区二区| 中日无码在线观看| 九九这里只有精品视频| 欧美成人免费一区在线播放| 国产日韩精品欧美一区灰| 老司国产精品视频| 丁香婷婷激情网| 老司国产精品视频| 国产欧美日韩专区发布| 欧美日韩精品一区二区在线线| 国产精品分类视频分类一区| 19国产精品麻豆免费观看| 91精选国产大片| 韩日无码在线不卡| 日韩毛片在线播放| 欧美精品伊人久久| 国产精品九九视频| 亚洲高清无码久久久| 国产在线观看99| 婷婷六月综合网| 欧美一级在线看| 福利视频99| 亚洲国产一区在线观看| 欧美亚洲另类在线观看| 国内精品视频区在线2021| 亚洲国产成人无码AV在线影院L| 伊人激情综合| 国产玖玖玖精品视频| 天天摸夜夜操| 亚洲一区二区约美女探花| 亚洲国产日韩一区| 国产精品所毛片视频| 91 九色视频丝袜| 一级做a爰片久久免费| 中文字幕永久在线看| 国产97视频在线| 自偷自拍三级全三级视频 | 亚洲欧美人成人让影院| 亚洲日韩欧美在线观看| 国产精欧美一区二区三区| 中文字幕日韩丝袜一区| 久久亚洲国产最新网站| 国产青榴视频在线观看网站| 国产无人区一区二区三区| 中文字幕 日韩 欧美| 免费A级毛片无码无遮挡| 九九视频在线免费观看| 国产精品亚洲日韩AⅤ在线观看| 成人免费网站在线观看| 日韩欧美国产成人| 国产午夜福利在线小视频| 日韩美毛片| 国产精品男人的天堂| 日韩一级毛一欧美一国产| 老汉色老汉首页a亚洲| 国产精选小视频在线观看| 国产精品偷伦视频免费观看国产 | 伊人91视频| 99手机在线视频| 四虎成人在线视频| 精品一区二区久久久久网站| 欧美性久久久久| 午夜福利亚洲精品| 亚洲国内精品自在自线官| 一级在线毛片| 在线观看亚洲精品福利片| 欧美笫一页| 国产在线拍偷自揄观看视频网站| 97亚洲色综久久精品| 毛片在线播放a| 久久亚洲天堂| 国产成人精品无码一区二 |