



摘要:本研究采用逐步回歸、決策樹與隨機森林模型分析方法,分析了影響湖北省孝感市小麥赤霉病病穗率的主要氣象因子,建立了基于病穗率的預報模型。結果表明,總體上降水量、氣溫、日照時數、空氣相對濕度等因子對小麥赤霉病病穗率的影響顯著,其中影響最大的氣象因子是4月上旬降雨量,其次是4月中旬降雨量、3月中旬平均空氣相對濕度及4月中旬平均氣溫;逐步回歸預報模型驗證表明,該模型對病穗率大于1%的年份回驗準確率達87.2%,實際預報準確率達到89.8%。決策樹與隨機森林模型分析表明,4月上旬降水量大于36 mm、4月中旬降水量大于43 mm、5月上旬日照時數小于51 h,3月中旬平均空氣相對濕度大于83%,小麥赤霉病發病率顯著增加。研究建立的赤霉病發病率氣象預報模型和基于機器學習方法的赤霉病預警氣象指標可為指導相關業務服務提供參考。
關鍵詞:小麥赤霉病;雨量;濕度;日照時數;平均氣溫;預測模型
中圖分類號:S435.121.45;S165" 文獻識別碼:A" 文獻編號:1005-6114(2024)04-013-06
收稿日期:2024-04-16
作者簡介:韓杳(1984-),女,氣象工程師,從事氣象服務工作。E-mail:286899979@qq.com
小麥赤霉病是小麥真菌性病害之一,這種病原菌首先遺留散落于田間的秸稈上,越冬后于春季在適宜的環境下進行繁殖擴散,在小麥揚花期侵染花粉[1,2]。小麥在受到赤霉病的侵染后,會使得小麥植株的莖基部位、莖稈部位及植株穗部發生腐爛癥狀,其中最嚴重的是穗腐病癥,對產量和品質影響最大[3,4]。小麥赤霉病的發生與天氣有很大關系,一般發生在3月中下旬至4月上旬,4月份以后氣溫升高若降雨多或持續潮濕易發生小麥赤霉病[5,6]。春季氣溫7℃以上,病原菌在土壤含水量大于50%形成子囊殼,氣溫高于12℃形成子囊孢子,在降雨或空氣潮濕的情況下,子囊孢子成熟并散落在花藥上,經花絲侵染小穗發病[7]。據孝感市2002~2021年的小麥赤霉病測報資料統計,病穗率以小于或等于1%和大于10%的年份居多,分別為7年(占35%)、12年(占60%),小麥大部分在4月上旬齊穗揚花,此期間降雨較多,對赤霉病子囊殼及子囊孢子的形成、孢子的釋放和侵染發病等極為有利,導致了小麥赤霉病偏重流行。然而,有關湖北孝感地區小麥赤霉病發生和流行與氣象條件的關系仍停留在定性的初步認知,本地化的氣象指標和有效的預報模型仍十分欠缺,嚴重制約了赤霉病防治和氣象預警服務工作的開展。為此,本研究擬通過對孝感市小麥生育期內的氣象因素進行系統分析,綜合利用經典的回歸分析和機器學習方法,明確影響小麥赤霉病發病率的關鍵時段、主要氣象因子及其閾值,并建立定量化的預報模型,以期為小麥赤霉病的預測防治提供依據。
1" 材料與方法
1.1" 資料來源
根據赤霉病發生規律以及對環境條件的要求[8-11],2002-2024年氣象觀測資料主要選用由孝感國家基準氣候站提供的的2月下旬至5月上旬降雨量、相對濕度、日照時數和平均氣溫等4個氣象要素的逐旬數據。2002-2024年小麥赤霉病測報資料,來源于孝感市農業技術推廣中心提供的小麥病穗率監測資料。
1.2" 模型與分析方法
采用傳統的回歸分析與機器學習兩類方法對小麥赤霉病病穗率及其影響因子進行分析和建模。
1.2.1" 逐步回歸模型
逐步回歸是經典回歸分析中的一種常用方法,自動從大量可供選擇的變量中選取最重要的變量,建立最優或合適的回歸預測或者解釋模型[12,13]。本研究利用DPS數據處理系統,對赤霉病病穗率及影響因素進行逐步回歸分析,通過調整Fx臨界值引入一些配合較好和方差貢獻大的自變量,組建回歸方程,當F引=F剔=0時,所有變量全部被引入[14-16]。
1.2.2" 決策樹與隨機森林模型
決策樹模型是一種經典的機器學習算法,采用遞歸分割技術,將數據空間不斷劃分為不同子集,探測數據的潛在結構、重要模式和關系,且無需提前對自變量和因變量的關系進行假設,可以克服自變量間的多重共線性。隨機森林是由眾多決策樹構成的集成算法,可有效提高模型預測精度和泛化能力,同時,通過自助抽樣技術和袋外誤差估計,可以給出各變量對因變量的響應曲線及重要性排序[17],在分析生物與環境因子關系的生態學研究中取得了較好的應用效果[18]。
利用R語言Rpart和RandomForest程序包可分別構建決策樹和隨機森林模型。Rpart包使用二分遞歸的分類回歸樹(CART)算法,以節點不純度最小為劃分標準,每次將當前樣本集重復一分為二至不可再分,生成一棵二叉樹。RandomForest包引入了隨機抽樣技術,在每個分裂節點,隨機選取所有特征變量的一個子集進行訓練,并對袋外數據進行模型性能估計,通過多次抽樣構建眾多決策樹進行組合獲得最終結果。利用隨機森林袋外數據對自變量值進行隨機擾動后代入預測模型,可構建因變量與自變量的偏依賴圖(partial dependence plot),通過計算自變量擾動后分裂節點的不純度,可對自變量進行重要性排序[19,20]。
本研究選取小麥赤霉病病穗率為因變量,2月下旬至5月上旬逐旬4個氣象因子為自變量,通過決策樹CART算法獲得一棵二叉樹,展示小麥赤霉病病穗率與各氣象因子的關系,并通過隨機森林模型對氣象因子重要性進行排序,分析各氣象因子與小麥赤霉病發生的關系及影響程度。
2" 結果與分析
2.1" 逐步回歸模型分析
通過分析,孝感市赤霉病病田率與病穗率間相關系數為0.98,極達顯著水平,因此選擇終病期大田普查平均病穗率作為因變量Y[21,22]。根據小麥赤霉病主要發生時期,選用2002~2021年2~5月降雨量、空氣相對濕度、日照時數和平均氣溫共40個逐旬氣象因子作為自變量。通過調整Fx的臨界值,引入回歸方程中F值最小的因子是X1,F值=0.1688時,X1~X14(表1)14個變量被引進回歸方程,復相關系數R=0.9838,得到以下小麥赤霉病預測模型:
Y=-197.2140-0.0816X1-0.4019X2+0.3635X3+0.2952X4+0.2580X5+0.0682X6-0.5829X7+0.6883X8+0.2606X9-0.4295X10+0.1763X11+0.8830X12+3.1265X13+4.8246X14
方差分析F值的顯著水平P=0.008,方程中各偏相關系數均在-0.9129~0.9216間(偏相關系數絕對值越接近于1,表示兩組數據之間的相關性越強,正值表明正相關,負值表明負相關)。DW統計量d=2.625(大于2,說明自相關程度小)。我們利用該模型對孝感地區2002-2021年赤霉病病穗率進行了檢驗(表1),平均準確率可達到64.5%;如將病穗率小于1%的7個輕發生年份進行剔除,檢驗準確率達到87.2%。對2022-2024年數據進行實際預報檢驗發現(表2),對小麥赤霉病平均預測準確率達到79.2%,最高達到93.6%(2022年);如剔除病穗率小于1%的2023年數據,平均預報準確率達到89.8%,說明該模型在小麥赤霉病預報中準確率較高。
通徑分析和相關分析表明(表3),對孝感市小麥病穗率影響顯著程度的前幾個因子依次為:第一個因
注:表中X1、X2、X3、X4、X5、X6分別表示2月下旬、3月中旬、4月上旬、4月中旬、4月下旬和5月上旬的降雨量(mm);X7、X8分別表示2月下旬和3月中旬的平均空氣相對濕度;X9、X10、X11分別表示3月下旬、4月下旬和5月上旬的旬日照時數(h);X12、X13、X14分別表示4月中旬、4月下旬和5月上旬的旬平均氣溫(℃);下表同。
計算公式:擬合正確率(%)=[1-ABS(擬合誤差/擬合值)]×100[9]。
子是4月上旬降雨量(X3),相關系數為0.5558(P=0.0109),對病穗率的影響達顯著水平,直接通徑系數為1.2865,通過其他因子對病穗率的間接通徑系數為0.2377。第二個因子是4月中旬降雨量(X4),相關系數為0.3342(P=0.1497),直接通徑系數為0.6867,通過其他因子對病穗率的間接通徑系數為-0.258。第三個因子是3月中旬平均空氣相對濕度(X8),相關系數為0.2503(P=0.2871),直接通徑系數為0.4604,通過其他因子對病穗率的間接通徑系數為1.3066。第四個因子是4月中旬旬平均氣溫(X12),相關系數為0.2307(P=0.3279),直接通徑系數為0.1574,通過其他因子對病穗率的間接通徑系數為-0.3720。該預測模型采用的各自變量對因變量的決定系數(R2)=0.96791,說明有96.791%可由入選的氣象因子來解釋;剩余通徑系數為0.17913,值很小。
2.2" 決策樹與隨機森林模型建立及病穗率影響因素分析
利用CART算法對小麥病穗率和相關氣象因子指標進行建模,生成的決策樹如圖1所示。圖中每一個分裂節點根據判定條件依次將樣本分為兩類,左側為判定結果為真的樣本空間,右側為判定結果為假的樣本空間。頂層節點為根節點,根節點以4月上旬降水量<36 mm為判定條件,根節點以下左側反映4月上旬降水量偏少情況,當4月上旬降水量在36 mm以下時(12個樣本,占總樣本的60%),小麥赤霉病病穗率偏少,平均為6.3%;右側反映4月上旬降水量偏多情況,當4月上旬降水量在36 mm以上時(占總樣本的40%),小麥赤霉病病穗率偏多,平均為20%。說明4月上旬降水量對小麥病穗率有顯著影響,降水偏多容易發生赤霉病,降水偏少不容易發生赤霉病。沿左側分支繼續向下,在4月上旬降水量較少的條件下,當4月中旬降水量<43 mm,即4月中旬降水繼續偏少的條件下,小麥赤霉病病穗率平均為2.5%(占總樣本的40%),而4月中旬降水出現偏多條件下小麥赤霉病病穗率平均為14%(占總樣本的20%),表明4月中旬降水對小麥赤霉病發生有顯著影響。其它分裂節點中,5月上旬日照時數大于51小時,小麥赤霉病病穗率平均為0.03%,反之發生率為6.3%,4月中旬降水量<26 mm,小麥赤霉病病穗率接近0,反之發生率為0.07%。根結點以下右側4月上旬降水量>36 mm時,2月下旬平均空氣相對濕度<83%時,小麥赤霉病病穗率平均為17%,反之達到30%,在3月中旬平均相對濕度<83%下,小麥赤霉病病穗率平均為14.0%,反之僅減產23%,表明3月中旬平均相對濕度對小麥赤霉病有顯著影響。
為避免CART單棵決策樹易導致過擬合和較大不穩定性的情況,進一步利用隨機森林算法設置分裂節點變量數目為5,進行多個決策樹組合建模,生成了1 000棵相互獨立的決策樹集合,模型總體解釋方差達78.8%。同時利用模型構建過程中預留的袋外數據對自變量值進行隨機擾動后代入預測模型,以自變量擾動前后分裂節點不純度的平均下降量為測度,對自變量進行重要性排序,結果如圖2所示。該圖表明,總體上降水量、氣溫、日照時數、空氣相對濕度等因子對小麥赤霉病病穗率的影響最大。其中降水量以4月上旬的影響最明顯,氣溫和日照時數以5月上旬影響最明顯,空氣相對濕度以2月下旬影響最明顯。
3" 小結與討論
通過小麥赤霉病病穗率與氣象因子的逐步回歸模型和通徑分析表明,湖北省孝感市2002-2021年小麥赤霉病病穗率嚴重程度受2月下旬至5月上旬氣象因素不同程度的影響。其中,影響因素最大的為4月上旬降雨量,其次是4月中旬降水量及3月中旬平均空氣相對濕度,結合當地實際調查情況表明,孝感市小麥大部分在4月上旬齊穗揚花,而在此期間降雨較多,極易導致小麥赤霉病的侵染和蔓延。其他氣象因素雖然影響較小,但是累加效應不可忽視。該模型對2002-2021年赤霉病病穗率回代檢驗平均準確率達87.2%,2022-2024年實際預報準確率達到89.8%,預測精度較高,可作為當地小麥赤霉病預測模型,結合天氣預報提前對小麥赤霉病嚴重程度做出預測。
利用決策樹和隨機森林模型為代表的機器學習算法建模分析表明,影響小麥赤霉病的氣象因子重要性排序依次是4月上旬降水量、4月中旬降水量、4月下旬日照時數和5月上旬日照時數等,總體上降水量、日照時數、氣溫、空氣相對濕度等因子對小麥赤霉病病穗率影響顯著,所得結果與逐步回歸分析結論基本一致。根據決策樹模型分析表明,4月上旬降水量大于36 mm、4月中旬降水量大于43 mm、5月上旬日照時數小于51 h,旬平均空氣相對濕度大于83%,小麥赤霉病發病率顯著增加,上述指標和閾值可作為赤霉病預警的氣象指標。
小麥赤霉病除受氣象因素影響外,還受到品種、不同田塊、不同播期的影響[23-25]。如2017年孝感市小麥不同品種赤霉病病情田間調查發現,孝感市種植的小麥各品種間發病程度有一定差異,病穗率最高的品種為鄂麥23,病穗率62.5%,病指59.3;病穗率最低的品種為襄麥25,病穗率5.7%,病指2.6;小麥種植面積最大的品種鄭麥9023病穗率39.8%,病指23.2[26]。這也充分說明了小麥赤霉病受到了多重因素影響,而氣象因素并非為完全決定因素。而本文中所建立的預測模型所用到的病穗率,僅代表了田間病情調查的平均值,且沒有考慮其它非氣象因子的影響,但是在具體的防治工作中,還是要充分考慮其發生特點,以氣象因素為參考,多方面考慮,最終因地制宜,在防治實踐中不斷總結。
致謝:武漢區域氣候中心秦鵬程高級工程師在數據處理和分析中提供了技術指導,謹致謝忱。
參考文獻
[1]" "Yang L,van der Lee T,Yang X,et al.Fusarium populations on Chinese barley show a dramatic gradient in mycotoxin profiles[J].Phytopathology,2008,98(6):719-727
[2]" Yuan Q S,Yang P,Wu A B,et al. Variation in the microbiome,trichothecenes,and aflatoxins in stored wheat grains in Wuhan,China[J].Toxins,2018,10(5):171
[3]" 李學軍,劉媛媛,沈新磊.小麥赤霉病發病癥狀及防治措施[J].河北農業,2023(1).
[4]" 程順和,張勇,別同德,等.中國小麥赤霉病的危害及抗性遺傳改良[J].江蘇農業學報,2012,28(5):938-942.
[5]" 劉富明,徐崇浩,何險峰,等.四川小麥赤霉病流行的環流背景和天氣趨勢[J].四川氣象,1994,14(3):18-21.
[6]" 劉常青,臧俊嶺,李明志,等.小麥赤霉病發生規律及防治[J].河南氣象,2006(2):57.
[7]" 肖晶晶,霍治國,李娜,等.小麥赤霉病氣象環境成因研究進展[J].自然災害學報,2011,20(2):146-152.
[8]" 王向陽.小麥赤霉病流行的氣象指標分析及在測報上的應用[J].安徽農業科學,2005,33(1):35-36,38.
[9]" 張旭暉,高蘋,居為民,等.小麥赤霉病氣象等級預報模式研究[J].安徽農業科學,2008,36(23):10030-10032.
[10]" 安徽省植保總站.農作物病蟲害預測預報方法與技術[M].北京:中國致公出版社,1995:85-89.
[11]" 雷曉英,韓仲宇,同延安,等.戶縣小麥赤霉病發病與氣象條件關系研究[J].陜西氣象,2017(1):31-36.
[12]" 陳斐,楊沈斌,申雙和,等.基于主成分回歸法的長江中下游雙季早稻相對氣象產量模擬模型[J].中國農業氣象,2014,35(5):522-528.
[13]" 楊銀娟.黃瓜霜霉病春秋季發生的氣象要素預警模型[J].中國植保導刊,2018,38(8):43-47,70.
[14]" 唐啟義.DPS數據處理系統15.10(第4版)[M].北京:科學出版社,2017.
[15]" 李軍,蔣耀培,蔣建忠,等.小麥赤霉病發生程度的氣象動態預測模型[J].西南農業大學學報,2004,26(6):776-780.
[16]" 李富占,陳振麗,宗鑠。河南新野小麥赤霉病發生的氣象因素分析及預報模型[J].中國植保導刊,2019,39(6):6-44,5.
[17]" Breiman L.Random forests[J].Machine Learning,2001,45(1):5-32.
[18]" Cutler D R,Edwards Jr T C,Beard K H,et al.Random forests for classification in ecology[J].Ecology,2007,88(11):2783- 2792.
[19]" 秦鵬程,劉志雄,萬素琴,等.基于決策樹和隨機森林模型的湖北油菜產量限制因子分析[J].中國農業氣象,2016,37(6):691-699.
[20]" 秦鵬程,劉敏,李蘭.有效降水指數在暴雨洪澇監測和評估中的應用[J].中國農業氣象,2016,37(1):84-90.
[21]" 賈金明.黃河中下游小麥赤霉病氣象指數的建立與應用[J].氣象,2002,28(3):51-54.
[22]" 姜明波,翟順國,王守強,等.信陽地區小麥赤霉病發生與春季降水的相關性分析[J].河南農業科學,2018,47(11):80-84.
[23]" 唐洪,彭恒,劉明龍,等.小麥赤霉病田間病情與抽穗揚花期氣象條件和病粒率關系[J].中國植保導刊,2012,32(7):10-12.
[24]" 鐘雪明,王曄青,朱金良.嘉興市小麥赤霉病發生特點及原因分析[J].中國植保導刊,2017,37(4):41-44.
[25]" 趙娜,杜秀明,李令蕊,等.我國小麥赤霉病發生與控制研究進展[J].河北農業科學,2020,24(2):54-58.
[26]" 劉正.孝感市小麥赤霉病發生特點分析及防控對策[J].湖北植保,2018(2):051-003.