999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習構建葡萄霜霉病預測模型及驗證

2023-10-10 06:49:00邊鳳霞劉凱歌容新民
中國農業科技導報 2023年8期
關鍵詞:分類模型

邊鳳霞, 劉凱歌, 容新民*

(1.石河子農業科學研究院,新疆 石河子 832000; 2.石河子大學農學院,新疆 石河子 832003)

葡萄霜霉病是葡萄生產中傳播快、危害大的真菌病害之一,如不及時防治將直接影響葡萄的產量和品質,造成嚴重的經濟損失[1-2]。目前,農戶常采用化學藥劑進行防治,但大量、多次用藥易造成農藥殘留、威脅食品安全,并導致環境污染等,因此,對該病害進行精準可靠的預測[3]將便于農戶提前采取管理或防治措施,有利于減少田間農藥用量,降低病害對作物和果實的危害,進而提高葡萄產量及品質。

氣象數據是病害預測模型的主要驅動力[4-6],而葡萄霜霉病的發生與溫、濕度等有極大關系。研究表明,溫度在12~20 ℃、相對濕度在90%~95%并保持2~4 h 的黑暗條件利于發病[7-9]。近年來,國內外學者基于氣象數據開展了霜霉病相關預測模型構建的研究,包括初侵染模型[10]、流行動態模型[11-12]、在早期微型計算機上建立的預測系統[13]以及利用數理統計法[14-15]和歸納邏輯程序設計法 (inductive logic programming, ILP)[16-17]等的多種病害預測方法,但由于氣象因子間相互聯系又相互制約,沒有固定的變化速率(即具有非線性特點),且隨著數據類別和規模的增加,模型變量的定義和建模效率會受到影響,很難充分對數據進行挖掘并構建高精度的預測模型[18-19]。隨著物聯網、大數據、機器學習等技術的不斷發展及其在農業上的應用[20],為病害預測提供了更多解決方案。Mezei 等[21]基于低功耗的網絡物聯網技術開發了葡萄霜霉病預警系統;Volpi 等[22]和Chen 等[23]基于機器學習算法對霜霉病病害癥狀及發生嚴重程度進行預測,根據病害發生風險水平預測了病害的發生,并通過評估表明模型的應用降低了殺菌劑的施用量;吳寧[24]將灰色關聯分析和機器學習算法結合,構建了葡萄霜霉病短期預測模型,通過設計開發的葡萄霜霉病預測系統實現了面向用戶的發病程度預測、預警功能;Menesatti 等[25]構建的多元預測模型對葡萄霜霉病的合理防治管理進行了優化,驗證了模型對不同殺菌劑施用量在病害防控中的可能性;Firanj等[26]依托病害預測模型開發了基于氣象的預報系統,可預測未來10 d 左右的氣象,能更好地掌握氣象條件,進一步幫助農戶采取防治措施。可見,利用這些技術對病害進行預測是可行且有效的,且對生產上的指導作用也將具有至關重要的意義。但目前將多個機器學習算法應用于新疆地區葡萄霜霉病預測模型構建的研究尚未見報道。

為降低葡萄生產中因病害帶來的產量與經濟損失,本文依托氣象站采集的葡萄生長期間的氣象數據,結合霜霉病發生調查情況,基于4 種機器學習算法,對新疆地區葡萄園構建霜霉病發生預測模型,并進行評價與驗證,篩選出適宜用于對當地病害進行預測的模型,給大數據、機器學習等技術在葡萄病害預測上的應用研究提供參考,進而為葡萄霜霉病預警系統的開發奠定技術基礎,以期為農戶進一步采取管理或防治措施提供決策支持。

1 材料與方法

1.1 試驗概況

試驗于2020 年4 月—2021 年11 月在新疆石河子市石河子葡萄研究所試驗地進行,供試葡萄樹為5 年生樹體,選用對霜霉病抗性較強的‘夏黑’葡萄品種作為試驗材料,栽培架式為雙廠“U”型架,株行距為3.0 m×0.8 m。該園為平地果園,土壤肥力中等,灌溉條件較好,園內所有葡萄栽培管理措施保持一致,均按常規高產優質栽培模式進行,其中2020年試驗數據用于模型構建,2021年試驗數據用于模型的驗證與篩選。

1.2 數據采集

葡萄樹生長期間的氣象數據來源于田間安裝的HOBO 小型自動氣象站,采集時間間隔為1 h,病害發生數據通過人工調查獲得,每周調查1 次。調查方法如下:在試驗園隨機選擇5 個固定的觀測點,每點隨機調查10 個當年抽生新蔓,自上而下調查全部葉片,記錄總葉數和病葉數;若果實發病,則在每點調查不同部位的果穗6 個,記錄病穗數和病穗總果粒數及病果粒數,計算病穗率和病果率。當葉片首次出現淡黃綠色水浸狀病斑、果梗/花序首次出現淺色水浸狀斑點時[27]記錄發病時間。其中2020 年首次發病日期為8 月29 日;2021年首次發病日期為8月14日。

1.3 變量選取及數據集構建

根據葡萄霜霉病的發生規律及傳播特點,溫、濕度及光照均影響孢子嚢的形成和萌發[2],病菌能在病葉殘體和土壤中越冬或越夏,主要以氣流、雨水為媒介進行擴散。本研究選取有利于病菌孢子嚢擴散與侵染的關鍵氣象數據作為預測模型輸入變量,分別為氣象站采集的每小時空氣溫度、濕度、降雨量、風速、太陽輻照度、40 cm 土層土壤溫度的平均值,霜霉病是否發病(二分類,是/否用1/0表示)作為模型輸出變量。

使用PyCharm 2019.3 和Python 3.7.11 對采集的數據進行歸一化處理及模型代碼實現,進而將數據轉化為0~1 的有監督無量綱數據,消除量綱數據間的相互影響,降低模型運算量,提高運算速度及模型精度和性能,歸一化公式如下。

式中,Xi為所有樣本數據(i=1,2,3,…,n),Xmin為所有樣本數據中的最小值,Xmax為所有樣本數據中的最大值,X*為歸一化的結果。

由于病害是否發生為1/0 分類標簽,已經符合位于[0, 1]之間,故不需進行歸一化處理。歸一化后得到病害發生預測模型數據集,將其70%作為模型訓練集(用于模型對數據中包含的信息進行學習與記憶),剩余30%作為模型測試集(用于模型對數據的學習效果進行測試驗證及分類預測)。

1.4 模型構建

選用在處理二分類問題時常用且效果較好的機器學習算法構建模型,包括二項邏輯斯蒂(binary logistic regression, BLR)模型[28]、支持向量機(support vector machine, SVM)模型[29]、決策樹(decision tree, DT)模型[30]和K 最近鄰(K-nearest neighbors, KNN)模型[31]。

1.4.1BLR 模型 BLR 模型由條件概率分布P(Y|X)表示,其中,X為樣本值,Y取值為0或1,通過輸入的X,得出Y為0或1的概率并比較,將X歸至所得概率較大的一類。從而完成對輸入變量預測后的是否發病(1/0)進行預測,需遵循以下條件分布。

式中,w為權重向量;b為偏置項。

1.4.2SVM模型 SVM模型是通過對樣本數據的類別進行分割,以尋求超平面對所需分類問題進行劃分,來確定各類別中與超平面間最短距離的點,而該點即為支持向量,原理如式(6)和圖1所示。

圖1 SVM模型原理Fig. 1 SVM model principle

式中,w為權重向量;b為偏置項;s.t.為約束條件;T為矩陣轉置;Y為樣本分類值(用于本研究的二分類問題時,Y為是/否發病的1/0 值);X為樣本值;i=1,2,3,…,n。

1.4.3DT 模型 DT 模型是通過樹形結構來對每個特征進行測試、響應的過程,在機器學習中常用于分類問題建模。目前已針對模型衍生出多種改進模型。原理如圖2所示。

圖2 Decision Tree模型原理Fig. 2 Decision tree model principle

1.4.4KNN 模型 KNN 是用特征空間中的K 個最鄰近樣本的大多數類別來代替目標樣本類別的分類方法,其原理如圖3所示。與BLR 相比,KNN是更具體的標簽而不是概率;與SVM 相比,KNN去除了原理中公式對距離的運算過程,更加簡便、快捷。

圖3 KNN模型原理Fig. 3 KNN model principle

1.5 模型評價指標

病害發生預測模型采用受試者工作特征曲線(receiver operating characteristic,ROC)、AUC 值(area under the roc curve)、混淆矩陣(confusion matrix)、Kappa 系數(k值)、準確率(Accuracy)、精準率(Precision)、召回率(Recall)及F1分值(F1-score)對模型性能和分類預測指標進行評價[32]。

其中,ROC 曲線是以假陽性率(false positive rate,FPR)為橫坐標、真陽性率(true positive rate,TPR)為縱坐標得到的的用于展示模型分類效果的曲線圖;AUC 值是ROC 曲線下的面積,其值越接近1,表示模型的分類性能越好。計算公式如下。

式中,TP 指實際為陽性且預測為陽性的樣本數;FP 指實際為陰性但預測為陽性的樣本數;TN指實際為陰性且預測為陰性的樣本數;FN 指實際為陽性但預測為陰性的樣本數。

混淆矩陣是通過n行×n列的矩陣分別將樣本真實值與預測值間的異同數量對比進行可視化的一個評價指標,用于展示模型分類預測情況,并通過對每個矩陣的數值計算得出k值、準確率、精準率、召回率和F1分值,以衡量模型整體精度。混淆矩陣列聯表如表1所示。

表1 混淆矩陣列聯表Table 1 Confusion matrix contingency table

Kappa 檢驗是一種一致性檢驗方法,計算得出的值通常在0 到1 之間,且越接近1,表明模型的整體性能越好。k值的計算公式如下,其一致性分類標準如表2所示。

表2 k值一致性劃分標準Table 2 The k value consistency classification criteria

式中,P0為觀測一致率;Pe為機遇一致率。

準確率(Accuracy)表示預測正確的樣本數占樣本總數的比例;精準率(Precision)表示正確預測發病的樣本數占預測發病樣本數的比例;召回率(Recall)表示正確預測發病的樣本數占實際發病樣本數的比例;F1分值(F1-score)是綜合了精準率和召回率的評價指標。計算公式如下。

2 結果與分析

2.1 病害發生不同預測模型比較分析

2.1.1不同預測模型分類預測指標分析 如圖4A,BLR 模型分類預測的ROC 曲線下面積(AUC值)為0.817 9;根據混淆矩陣(圖4B),4 個矩陣中的總數目為測試集1 395 條的數量,其中TN、TP、FN、FP 分別為875、321、135、64,由公式(9)~(15)得出k值為0.66,預測準確率、預測發生精準率、召回率和F1分值分別為86%、83%、70%、76%。由此表明,預測精度具有高度一致性,模型性能較好。

圖4 BLR模型分類預測指標Fig. 4 BLR model classification prediction indicators

SVM 模型的預測結果中,AUC 值為0.813 6;TN、TP、FN、FP 分別為878、317、145、55;k值為0.66;預測準確率、預測發生精準率、召回率和F1分值分別為86%、85%、69%、76%,模型預測精度具有高度一致性(圖5)。

圖5 SVM模型分類預測指標Fig. 5 SVM model classification prediction indicators

DT模型的預測結果中,AUC值為0.928 8;TN、TP、FN、FP 分別為900、410、46、39;k值為0.86;預測準確率、預測發生精準率、召回率和F1分值分別為94%、91%、90%、91%,模型預測精度幾乎完全一致(圖6)。

圖6 DT模型分類預測指標Fig. 6 DT model classification prediction indicators

KNN 模型的預測結果中,AUC 值為0.923 7;TN、TP、FN、FP分別為879、416、41、59;k值為0.84;預測準確率、預測發生精準率、召回率和F1分值分別為93%、88%、91%、89%,模型預測精度幾乎完全一致(圖7)。

圖7 KNN模型分類預測指標Fig. 7 KNN model classification prediction indicators

不同模型預測的AUC 值表現為DT>KNN>BLR>SVM,表明在關于預測葡萄霜霉病是否發病的問題上,DT和KNN模型表現較好,具有較高性能。

2.1.2不同預測模型分類預測結果對比 將BLR、SVM、DT、KNN 預測模型的評價指標進行對比,結果(表3)表明,在病害發生預測模型的構建上,DT 模型稍有優勢,但此結果只是基于2020 年試驗數據,因此還需對模型進行驗證和評價,以選出總體相對最優的模型。

表3 不同預測模型的分類結果Table 3 Classification results of different prediction models

2.2 病害發生不同預測模型驗證比較分析

2.2.1不同預測模型分類預測驗證指標分析 使用2021 年試驗采集數據對上述4 個模型進行驗證,結果(圖8)表明,BLR 模型的驗證結果與根據上年數據所構建模型的預測結果相比,AUC 值為0.702 4,TN、TP、FN、FP分別為730、303、267、106;k值為0.42;預測準確率、預測發生精準率、召回率和F1分值分別為73%、74%、53%、62%。綜上所述,各項評價指標降低,表明該模型魯棒性較差。如圖9 所示,SVM 模型的驗證結果與BLR 模型驗證結果類似,各項指標也均降低,其中AUC值為0.721 5;TN、TP、FN、FP 分別為731、324、228、123;k值為0.46;預測準確率、預測發生精準率、召回率和F1分值分別為75%、72%、59%、65%。結合病害發生預測模型構建結果,SVM 和BLR 模型的穩定性及分類預測性能均未能達到較高水平,表明并不適用于預測葡萄霜霉病是否發病的問題。

圖8 BLR 模型分類預測2021年驗證指標Fig. 8 BLR model classification prediction validation indicators in 2021

圖9 SVM模型分類預測2021年驗證指標Fig. 9 SVM model classification prediction validation indicators in 2021

如圖10 所示,DT 模型預測結果中的AUC 值為0.897 0;TN、TP、FN、FP 分別為774、492、67、73;k值為0.79;預測準確率、預測發生精準率、召回率和F1分值分別為90%、87%、88%、88%。即模型預測精度具有高度一致性,評價指標均處于較高水平,具有較好的泛化性及魯棒性。

圖10 DT模型分類預測2021年驗證指標Fig. 10 DT model classification prediction validation indicators in 2021

由圖11可知,KNN 模型的驗證結果較預測結果也有所降低。其中,AUC 值為0.828 2;TN、TP、FN、FP 分別為725、450、121、110;k值為0.66;預測準確率、預測發生精準率、召回率和F1分值分別為84%、80%、79%、80%。從評價指標來看,模型性能總體仍處于較高水平。

圖11 KNN模型分類預測2021年驗證指標Fig. 11 KNN model classification prediction validation indicators in 2021

不同模型的AUC 值表現為DT>KNN>SVM>BLR。即在預測及驗證結果中,DT和KNN模型具有較強魯棒性和泛化性; BLR模型的表現較差。

2.2.2不同預測模型分類預測驗證結果對比 4個模型驗證結果如表4 所示。DT 模型在病害發生預測模型的構建與驗證上均表現最優;其次是KNN 模型。結合模型原理,表明在多變量作為輸入的病害預測問題上,DT模型更適于挖掘特征與標簽間的關系,同時在驗證數據上也能保持較高穩定性和泛化性。

表4 不同預測模型分類驗證結果Table 4 Classification validation results of different prediction models

3 討論

本研究基于葡萄生長期間的氣象數據,結合人工調查的葡萄霜霉病發生數據,分別利用4 種機器學習算法構建了葡萄霜霉病發生預測模型,并進行了評價與驗證,結果表明,DT 模型在葡萄霜霉病發生預測模型的構建與驗證結果均高于其他3 個模型。對于4 個模型分類預測結果的差異性及優劣原因,一方面是由于模型本身,不同模型在處理不同問題時的表現可能存在差異;另一方面是由于本研究中的數據為氣象站每小時采集的數據,分類預測結果的偏差(假陽性、假陽性)可能是每小時間數據的特征信息過于詳細或區別較小,使模型不易學習和分類,導致分類錯誤。總體來說,本研究構建模型的分類預測精度較高,綜合性能較好。這與宋旺[33]、Volpi 等[22]、秦華[34]分別基于氣象數據構建的SVM 模型、隨機森林模型、自適應神經網絡模型表現較好的結果不同,可能是由于模型對于數據集和時空尺度上的差異導致,且模型在構建手段、參數設置不同的情況下,也會對不同問題產生不同的適應性及結果。

本研究首次將4 種機器學習模型應用于預測新疆石河子地區葡萄霜霉病發生的模型構建,還存在一些不足,如沒有考慮病原菌的致病性、沒有探究品種抗性以及不同樹齡植株對病害的抗性等,限制了模型的通用性。但由于本研究是根據葡萄是否發病構建的預測模型,因此,從適用性角度出發,在病害循環過程中,如能滿足“病害三角”致病關系,導致寄主顯癥,則可用于發病預測模型的構建與驗證,進而實現模型應用場景和范圍的擴充。Rossi等[10]通過接種葡萄霜霉病病原菌來構建初侵染階段發病癥狀的模型;Francesca等[9]構建了氣候變化下預測葡萄霜霉病流行情況的模型。本研究與前人研究結果一致,均從單個水平探究其對病害的影響,即在提出假設(如假設病原存在或會由外界傳播,且具備其生長、繁殖、侵染的氣候條件及寄主非避病),并根據病害已經發生的事實,表明假設確實成立的基礎上,確保病害發生理論和病害循環的完整性,對其中環節進行分析。

在未來的研究中,將在不同地點選用不同抗性品種進行驗證,同時,考慮田間孢子囊密度帶來的影響,通過監測、預測孢子數量[35-36]實現對葡萄霜霉病發生嚴重程度的預測,探索葡萄霜霉病發生各階段機理模型[37-39]的構建,將其與本研究中模型融合使用,為預警系統的開發應用奠定技術基礎,并通過預警系統短期預報結果為病害前期防治提供決策,進而更好地指導生產。[1] 蘆屹,努爾孜亞·亞力麥麥提,付文君,等.新疆伊犁河谷地區葡萄霜霉病流行與氣候條件的關系[J].新疆農業科學,2020,57(10):1855-1862.LU Y, Nuerziya Yalimaimaiti, FU W J,et al.. Research the relationship between epidemic of grape downy mildew and climatic conditions in Ili Valley of Xinjiang [J]. Xinjiang Agric.Sci., 2020, 57(10): 1855-1862.

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲成在人线av品善网好看| 午夜丁香婷婷| 青青青国产视频手机| 欧美人与动牲交a欧美精品| 国产一区在线观看无码| 三上悠亚在线精品二区| 色播五月婷婷| 亚洲AV无码一区二区三区牲色| 亚洲三级a| 无码日韩视频| 国产伦片中文免费观看| 人妻夜夜爽天天爽| 亚洲伊人久久精品影院| 国产二级毛片| 日韩毛片免费观看| 无码一区18禁| 国产制服丝袜91在线| 依依成人精品无v国产| 国产黄色视频综合| 国内老司机精品视频在线播出| 亚洲区欧美区| 亚洲AV色香蕉一区二区| 色婷婷色丁香| 亚洲精品日产精品乱码不卡| 91最新精品视频发布页| 巨熟乳波霸若妻中文观看免费| 久久亚洲日本不卡一区二区| 国产成人亚洲无吗淙合青草| 免费激情网站| 亚洲综合激情另类专区| 国产成人一级| 国产99热| a欧美在线| 日韩av电影一区二区三区四区| 男女性色大片免费网站| 欧美一区日韩一区中文字幕页| 国产亚洲欧美在线人成aaaa| 亚洲成人动漫在线| 国产爽爽视频| 国产精品第| 亚洲成人精品在线| 免费Aⅴ片在线观看蜜芽Tⅴ| 国产一二三区视频| 国产精品粉嫩| 青草免费在线观看| 成色7777精品在线| 国产成人91精品| 伊在人亚洲香蕉精品播放| 无码日韩视频| 国产va在线观看| 亚洲视频一区| 亚洲国产精品美女| 久久这里只精品国产99热8| 国产69精品久久久久妇女| 午夜精品国产自在| 成人免费视频一区| 亚洲精品福利网站| 91最新精品视频发布页| 久久精品嫩草研究院| 伊人中文网| 精品乱码久久久久久久| 国产91蝌蚪窝| 欧美激情视频一区| 91无码人妻精品一区二区蜜桃| 国产成人在线无码免费视频| 久久国产乱子伦视频无卡顿| 亚洲成人播放| 国产主播喷水| a级毛片一区二区免费视频| 日韩av手机在线| 精品人妻一区无码视频| 亚洲国产日韩视频观看| yjizz视频最新网站在线| 亚洲综合在线网| 亚洲va在线观看| 乱码国产乱码精品精在线播放| 亚洲永久色| 欧美日韩一区二区在线播放| 国产免费羞羞视频| 欧美无专区| 亚洲AV无码一区二区三区牲色| 九月婷婷亚洲综合在线|