999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CNN-XGBoost模型的多類型棉花葉片病害識(shí)別

2024-12-31 00:00:00戴臻費(fèi)洪曉
江蘇農(nóng)業(yè)科學(xué) 2024年13期

摘要:為提高棉花生產(chǎn)和質(zhì)量,需要對(duì)棉花葉片病害進(jìn)行及時(shí)和準(zhǔn)確的識(shí)別。然而,現(xiàn)有研究方法往往只能處理少數(shù)幾種常見(jiàn)的病害類型,而無(wú)法覆蓋更多的病害種類。本研究提出一種基于CNN-XGBoost模型的多類型棉花葉片病害識(shí)別方法,該方法能夠識(shí)別出21種不同的病害類型,涵蓋了細(xì)菌、真菌、病毒、營(yíng)養(yǎng)缺乏等多種因素導(dǎo)致的病害。首先,收集約1.2萬(wàn)張棉花葉片病害圖像樣本,構(gòu)建一個(gè)包含多種類型病害的數(shù)據(jù)集,對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理和增強(qiáng)操作,增加數(shù)據(jù)的多樣性和難度;其次,設(shè)計(jì)一個(gè)CNN模型,利用卷積層和池化層提取棉花葉片圖像的特征向量,將CNN模型的輸出作為XGBoost模型的輸入,使用XGBoost模型對(duì)特征向量進(jìn)行分類;最后,采用加權(quán)交叉熵?fù)p失函數(shù)作為優(yōu)化目標(biāo),通過(guò)反向傳播算法更新CNN模型和XGBoost模型的參數(shù)。結(jié)果表明,本研究提出的CNN-XGBoost模型在21種類型棉花葉片病害上都能達(dá)到高精度的識(shí)別,平均準(zhǔn)確率達(dá)到0.98,遠(yuǎn)高于其他對(duì)比方法,為棉花生產(chǎn)者提供了一個(gè)實(shí)用和高效的植物病害診斷工具,有助于及時(shí)發(fā)現(xiàn)和處理棉花葉片病害,從而提高棉花產(chǎn)量。

關(guān)鍵詞:CNN-XGBoost;棉花葉片病害;多類型病害;加權(quán)交叉熵?fù)p失函數(shù)

中圖分類號(hào):TP391.41" 文獻(xiàn)標(biāo)志碼:A

文章編號(hào):1002-1302(2024)13-0205-09

棉花是世界上最重要的纖維作物之一,也是我國(guó)的主要經(jīng)濟(jì)作物之一[1]。棉花的生產(chǎn)和質(zhì)量受到多種因素的影響,其中,棉花葉片病害是一個(gè)重要的制約因素[2]。棉花葉片病害不僅會(huì)導(dǎo)致棉花葉片的脫落、枯萎、變色等現(xiàn)象,影響光合作用和養(yǎng)分吸收,還會(huì)降低棉花的抗逆性和產(chǎn)量,甚至造成棉花的死亡[3-5]。因此,及時(shí)準(zhǔn)確地識(shí)別和診斷棉花葉片病害,對(duì)于指導(dǎo)棉花的合理施肥、灌溉、病蟲害防治等農(nóng)業(yè)管理措施,提高棉花的生產(chǎn)效率和質(zhì)量,具有重要的意義。

棉花葉片是棉花植株的主要光合器官,也是病害發(fā)生的主要部位[6]。棉花葉片病害有多種類型,包括細(xì)菌、真菌、病毒、營(yíng)養(yǎng)缺乏等,每種類型又有多種不同的病原體和癥狀[7]。目前,棉花葉片病害的識(shí)別方法主要有2種:一是依靠人工觀察和經(jīng)驗(yàn)判斷,二是利用計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)等技術(shù)進(jìn)行自動(dòng)識(shí)別[8-10]。人工觀察和經(jīng)驗(yàn)判斷雖然簡(jiǎn)單易行,但存在諸多缺點(diǎn),如主觀性強(qiáng)、易受環(huán)境因素干擾、耗時(shí)耗力、準(zhǔn)確性低等。而計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)等技術(shù)則能夠克服這些缺點(diǎn),實(shí)現(xiàn)快速、客觀、準(zhǔn)確的棉花葉片病害識(shí)別[11]。近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展和應(yīng)用,特別是卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型在圖像處理領(lǐng)域的突出表現(xiàn),基于CNN模型的植物病害識(shí)別方法也得到了廣泛的關(guān)注和研究[12-14]。

為實(shí)現(xiàn)自然條件下棉花病害圖像準(zhǔn)確分類,張建華等提出基于改進(jìn)VGG-16的病害識(shí)別模型,實(shí)現(xiàn)對(duì)棉花的褐斑病、炭疽病、黃萎病、枯萎病、輪紋病、正常葉片的準(zhǔn)確區(qū)分[15]。劉海濤等設(shè)計(jì)了一種基于YOLO v4網(wǎng)絡(luò)的方法,能夠在復(fù)雜的自然場(chǎng)景中準(zhǔn)確檢測(cè)頂芽的位置和大小,檢測(cè)頂芽效果好于其他模型,且逆光環(huán)境對(duì)檢測(cè)影響?。?6]。為了解決棉花頂芽在田間密植環(huán)境下難以識(shí)別的問(wèn)題,陳柯屹等提出了一種改進(jìn)的快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)算法,實(shí)現(xiàn)了大田環(huán)境下棉花頂芽的有效檢測(cè),為棉花精準(zhǔn)打頂提供了技術(shù)支持[17]。

然而,現(xiàn)有基于深度學(xué)習(xí)的植物病害識(shí)別方法也存在一些問(wèn)題和不足。首先,多數(shù)研究只考慮了少數(shù)幾種常見(jiàn)的植物病害類型,而忽略了許多其他類型。這樣就無(wú)法滿足實(shí)際應(yīng)用中對(duì)多類型植物病害識(shí)別的需求。其次,多數(shù)方法只使用了單一的模型或算法進(jìn)行特征提取和分類。這樣就無(wú)法充分利用圖像數(shù)據(jù)中的多層次和多維度信息,也無(wú)法有效地處理圖像數(shù)據(jù)中的噪聲、變形、遮擋等問(wèn)題。針對(duì)上述問(wèn)題和不足,本研究提出了一種基于 CNN-XGBoost 模型的多類型棉花葉片病害識(shí)別方法。主要貢獻(xiàn)和創(chuàng)新點(diǎn)如下:

(1)本研究收集了一個(gè)包含22種不同類型棉花葉片病害的數(shù)據(jù)集,該數(shù)據(jù)集包含了約1.2萬(wàn)張高質(zhì)量的圖像樣本,覆蓋了細(xì)菌、真菌、病毒、營(yíng)養(yǎng)缺乏等多種原因引起的棉花葉片病害。

(2)提出一種基于CNN-XGBoost模型的多類型棉花葉片病害識(shí)別方法。首先使用CNN模型對(duì)棉花葉片圖像進(jìn)行特征提取,然后將提取的特征輸入XGBoost模型進(jìn)行分類。CNN模型能夠自動(dòng)學(xué)習(xí)圖像中的高層次語(yǔ)義特征,XGBoost模型能夠有效地處理特征之間的非線性關(guān)系和特征選擇問(wèn)題。

(3)設(shè)計(jì)加權(quán)交叉熵?fù)p失函數(shù)解決類別不平衡問(wèn)題的損失訓(xùn)練,給每個(gè)類別分配一個(gè)權(quán)重,使得少數(shù)類的損失更大,從而增加其分類的重要性。

1 試驗(yàn)數(shù)據(jù)

1.1 圖像數(shù)據(jù)

首先,從棉田內(nèi)實(shí)際拍攝取得大量的棉花葉片圖片,包括正常和不同類型的病害。這些圖片可以反映棉花葉片在不同光照、角度、背景等條件下的真實(shí)情況,有利于提高模型的泛化能力和魯棒性。

其次,通過(guò)互聯(lián)網(wǎng)獲取部分棉花圖片對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充。這些圖片可以增加數(shù)據(jù)集的多樣性和數(shù)量,有利于提高模型的準(zhǔn)確性和穩(wěn)定性。

最后,經(jīng)過(guò)篩選后選取6 000張相關(guān)圖片作為初始數(shù)據(jù)集。這些圖片包括1 000張正常葉片和 5 000 張病害葉片,其中病害葉片按照4種疾病類型(細(xì)菌、病毒、真菌、營(yíng)養(yǎng)不足)進(jìn)行分類,圖1為可視化棉花葉片的圖像數(shù)據(jù)集。這些圖片可以覆蓋棉花葉片的主要特征和病害類型,有利于提高模型的識(shí)別能力和分類效果。

1.2 棉花葉片病害類型

棉花葉片病害對(duì)棉花的產(chǎn)量和品質(zhì)有重要的影響,也反映了棉花的生長(zhǎng)狀況和抗逆能力。通過(guò)對(duì)棉花葉片病害類型的研究,可以為棉花高效栽培提供參考依據(jù)[18]。然而先前工作未對(duì)具體疾病分類,且研究類型較少,本研究的棉花葉片病害分為以下4種類型:

(1)細(xì)菌性疾?。哼@類疾病是由細(xì)菌引起的,主要有葉斑、枯萎和軟腐等,細(xì)菌性疾病會(huì)導(dǎo)致葉子變色、枯萎、出現(xiàn)黑色或軟質(zhì)的斑點(diǎn)等。(2)病毒性疾病:這類疾病是由病毒引起的,主要有花葉、侏儒、畸形和卷曲等。病毒性疾病會(huì)導(dǎo)致葉子變形、變色、出現(xiàn)不規(guī)則的斑駁或突起等。(3)真菌性疾?。哼@類疾病是由真菌引起的,主要有銹斑、斑點(diǎn)、霉斑和腐敗等。真菌性疾病會(huì)導(dǎo)致葉子出現(xiàn)棕色或灰白色的粉末或斑點(diǎn),或者導(dǎo)致葉子和棉桃腐爛等。(4)營(yíng)養(yǎng)缺乏性疾病:這類疾病是由缺乏某種營(yíng)養(yǎng)元素引起的,主要有氮、磷、硫、鎂、鈣、鉀、鐵、硼和鋅等。營(yíng)養(yǎng)缺乏性疾病會(huì)導(dǎo)致葉子變黃、變紅、變白或變小,或者導(dǎo)致植株生長(zhǎng)不良等。

根據(jù)以上類型,圖2為可視化21種棉花葉片病害類型,表1分析不同類型的詳細(xì)特征。

2 棉花葉片識(shí)別模型

2.1 模型概述

本研究提出一種結(jié)合CNN和XGBoost的混合模型, 用于多類型棉花葉片病害識(shí)別任務(wù)。模型的基本算法流程如圖3所示,模型的各個(gè)層次和工作流程如圖4所示。CNN-XGBoost模型主要由2個(gè)部分組成:特征提取器CNN和特征分類器XGBoost。

特征提取器CNN是一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò),用于從輸入圖像中自動(dòng)提取空間特征[19]。CNN由多個(gè)卷積層、激活層、池化層、歸一化層和丟棄層組成,每個(gè)層都有一些可訓(xùn)練的參數(shù),如濾波器的大小、數(shù)量和步長(zhǎng)。

特征分類器XGBoost是一個(gè)集成學(xué)習(xí)模型,用于對(duì)CNN提取的特征進(jìn)行分類[20]。XGBoost是一種基于樹(shù)的算法,可以自適應(yīng)地調(diào)整樹(shù)的深度、分裂點(diǎn)和權(quán)重,以達(dá)到最優(yōu)的分類效果。

CNN-XGBoost模型的優(yōu)勢(shì)在于它可以充分利用CNN的特征提取能力和XGBoost的分類能力,同時(shí)避免了單一分類器的不足,如過(guò)擬合、噪聲干擾等。模型參數(shù)詳細(xì)設(shè)置見(jiàn)表2。

2.2 卷積神經(jīng)網(wǎng)絡(luò)

CNN可以通過(guò)多層的卷積、池化、激活等操作,從圖像中提取不同層次的特征,從而實(shí)現(xiàn)對(duì)圖像的分類、檢測(cè)、分割等任務(wù)[21]。采用CNN提取多類型棉花葉片病害的特征,分為以下步驟:

首先,將棉花葉片的圖像作為CNN的輸入,對(duì)圖像進(jìn)行預(yù)處理,如縮放、裁剪、歸一化等,以適應(yīng)CNN的輸入格式。

然后,通過(guò)多個(gè)卷積層和池化層,對(duì)圖像進(jìn)行特征提取。卷積層可以使用不同大小和數(shù)量的卷積核,在圖像上滑動(dòng),進(jìn)行局部感知和特征提取。卷積層的輸出是一個(gè)特征圖,表示圖像的局部特征。卷積層的數(shù)學(xué)表達(dá)式如下:

a(l)i,j,k=∑M-1m=0∑N-1n=0∑P-1p=0w(l)m,n,p,kx(l-1)i+m,j+n,p+b(l)k。(1)

式中:a(l)i,j,k表示第l層第k個(gè)特征圖在(i,j)位置的激活值;w(l)m,n,p,k表示第l層第k個(gè)卷積核在(m,n,p)位置的權(quán)重值;x(l-1)i+m,j+n,p表示第l-1層第k個(gè)特征圖在(i,j)位置的輸入值;b(l)k是第l層第k個(gè)卷積核的偏置值;M、N、P表示卷積核的尺寸。

池化層是CNN的另一個(gè)重要組成部分,本研究使用最大值函數(shù),對(duì)卷積層的輸出進(jìn)行降維和抽象。池化層的輸出也是一個(gè)特征圖,表示圖像的全局特征。池化層的數(shù)學(xué)表達(dá)式如下:

a^(l)i,j,k=max{x(l-1)m,n,k|m∈[i,i+M),n∈[j,j+N)}。(2)

式中:a^(l)i,j,k表示第l層第k個(gè)特征圖在(i,j)位置的激活值,{x(l-1)m,n,k|m∈[i,i+M),n∈[j,j+N)}表示第l-1層第k個(gè)特征圖在(i,j)位置周圍的一個(gè)子區(qū)域,M、N表示池化窗口的尺寸。

最后,通過(guò)1個(gè)或多個(gè)全連接層,將提取出的特征向量進(jìn)行整合和映射,得到最終的特征表示:

a(l)i=sigmoid[∑J-1j=1w(l)i,jx(l-1)j+b(l)i]。(3)

式中:a(l)i表示第l層第i個(gè)神經(jīng)元的激活值;w(l)i,j表示第l層第i個(gè)神經(jīng)元和第l-1層第j個(gè)神經(jīng)元之間的連接權(quán)重;x(l-1)j表示第層第j個(gè)神經(jīng)元的輸入值;b(l)i表示第l層第i個(gè)神經(jīng)元的偏置值;J表示第l-1層的神經(jīng)元個(gè)數(shù)。

2.3 XGBoost

XGBoost是一種基于GBDT的算法,也是一種基于推進(jìn)集成思想的加法模型,訓(xùn)練時(shí)采用前向分布算法進(jìn)行貪婪的學(xué)習(xí),每次迭代都學(xué)習(xí)一棵CART樹(shù)來(lái)擬合之前t-1棵樹(shù)的預(yù)測(cè)結(jié)果與訓(xùn)練樣本真實(shí)值的殘差[22]。XGBoost對(duì)多類型棉花葉片病害進(jìn)行分類,本研究采用以下步驟:

首先,初始化一個(gè)常數(shù)作為第0棵樹(shù)的預(yù)測(cè)結(jié)果,通常是訓(xùn)練樣本真實(shí)值的均值或者對(duì)數(shù)概率。初始化的數(shù)學(xué)表達(dá)式如下:

y^(0)i==1n∑ni=1yi。(4)

式中:y^(0)i表示第i個(gè)樣本在第0次迭代時(shí)的預(yù)測(cè)值;表示初始化常數(shù);yi表示第i個(gè)樣本的真實(shí)值;n表示樣本總數(shù)。

然后,對(duì)于每一次迭代t(t=1,2,…,T),計(jì)算每個(gè)訓(xùn)練樣本的負(fù)梯度(殘差)作為新的響應(yīng)變量,并用這些新變量去擬合一棵CART樹(shù)。這棵樹(shù)由多個(gè)葉子節(jié)點(diǎn)組成,每個(gè)節(jié)點(diǎn)有一個(gè)權(quán)重值。迭代的數(shù)學(xué)表達(dá)式如下:

ri,t=l[yi,y^(t-1)i]y^(t-1)i;(5)

ft(xi)=wq(xi)。(6)

式中:ri,t表示第i個(gè)樣本在第t次迭代時(shí)的負(fù)梯度(殘差);l表示損失函數(shù);y^(t-1)i表示第i個(gè)樣本在第p次迭代時(shí)的預(yù)測(cè)值;ft(xi)表示第t棵樹(shù)對(duì)第i個(gè)樣本的預(yù)測(cè)值;wq(xi)表示第t棵樹(shù)中第i個(gè)樣本所屬葉子節(jié)點(diǎn)的權(quán)重值;q(xi)表示第t棵樹(shù)中第i個(gè)樣本所屬葉子節(jié)點(diǎn)的索引。

接著,為防止過(guò)擬合和增加模型的泛化能力,XGBoost在目標(biāo)函數(shù)中加入了正則項(xiàng),并用泰勒公式對(duì)目標(biāo)函數(shù)進(jìn)行二階展開(kāi)。這樣就可以得到每個(gè)葉子節(jié)點(diǎn)的最優(yōu)權(quán)重值和每棵樹(shù)的最優(yōu)分?jǐn)?shù)。正則化和展開(kāi)的數(shù)學(xué)表達(dá)式如下:

Obj(t)=∑ni=1l[yi,y^(t)i]+∑ti=1Ω(fi);(7)

Obj(t)≈∑ni=1{l[yi,y^(t-1)i]+gifi(xi)+12hif2i(xi)}+Ω(ft);(8)

Obj(t)≈∑Tj=1[(∑i∈Ijgi)wj+12(∑i∈Ijhi+λ)w2j]+γT;(9)

W*j=-∑i∈Ijgi∑i∈Ijhi+λ;(10)

Obj*=-12∑Tj=1(∑i∈Ijgi)2∑i∈Ijhi+λ+γT。(11)

式中:l表示損失函數(shù);y^(t)i表示第i個(gè)樣本在第t次迭代時(shí)的預(yù)測(cè)值;Ω是正則化項(xiàng);fi是第i棵樹(shù);gi和hi分別是損失函數(shù)的一階和二階導(dǎo)數(shù);fi(xi)是第t棵樹(shù)對(duì)第i個(gè)樣本的預(yù)測(cè)值;T是葉子節(jié)點(diǎn)的個(gè)數(shù);Ij是第j個(gè)葉子節(jié)點(diǎn)上的樣本集合;wj表示第j個(gè)葉子節(jié)點(diǎn)的權(quán)重值,λ和γ是正則化參數(shù)。

最后,更新當(dāng)前模型,在原有模型的基礎(chǔ)上加上本次迭代學(xué)習(xí)到的樹(shù),并乘上一個(gè)步長(zhǎng)(學(xué)習(xí)率):

y^(t)i=y^(t-1)i+ηfi(xi)。(12)

式中:y^(t)i表示第i個(gè)樣本在第t次迭代時(shí)的預(yù)測(cè)值;η表示學(xué)習(xí)率;fi(xi)是第t棵樹(shù)對(duì)第i個(gè)樣本的預(yù)測(cè)值。

2.4 模型訓(xùn)練

為解決樣本不平衡或部分域不穩(wěn)定的問(wèn)題,設(shè)計(jì)加權(quán)交叉熵?fù)p失函數(shù)訓(xùn)練更新CNN-XGBoost模型參數(shù),用于多類型棉花葉片病害識(shí)別任務(wù)。

假設(shè)有N個(gè)樣本,每個(gè)樣本屬于M個(gè)類別中的一個(gè),用yic表示第i個(gè)樣本是否屬于第c個(gè)類別,用pic表示第i個(gè)樣本被CNN-XGBoost模型預(yù)測(cè)為第c個(gè)別的概率,用wk表示第c個(gè)類別的權(quán)重。那么加權(quán)交叉熵?fù)p失函數(shù)可以定義為:

L=-1N∑Ni=1∑Mc=1wkyiclnpic。(13)

為了最小化損失函數(shù),需要對(duì)CNN-XGBoost模型的參數(shù)進(jìn)行梯度下降更新。CNN-XGBoost模型由2個(gè)部分組成:CNN部分和XGBoost部分。CNN部分由多個(gè)卷積層、池化層和全連接層組成,用θ表示其參數(shù)。XGBoost部分由多棵CART樹(shù)組成,用T表示其參數(shù)。那么CNN-XGBoost模型的輸出可以表示為:

pic=σ[fc(xi;θ)+gc(xi;T)]。(14)

式中:fc是CNN部分的輸出函數(shù),gc是XGBoost部分的輸出函數(shù),σ是sigmoid函數(shù)。

為了更新CNN部分的參數(shù)θ,需要計(jì)算損失函數(shù)對(duì)θ的梯度:

Lθ=-1N∑Ni=1∑Mc=1wkyiclnpicθ。(15)

利用鏈?zhǔn)椒▌t,可以得到:

lnpicθ=1picpicθ=1picpicfcfcθ=pic(1-pic)fcθ。(16)

式中:fcθ可以通過(guò)反向傳播算法計(jì)算。

為了更新XGBoost部分的參數(shù)T,需要計(jì)算損失函數(shù)對(duì)T的梯度:

LT=-1N∑Ni=1∑Mc=1wkyiclnpicT。(17)

利用鏈?zhǔn)椒▌t,可以得到:

lnpicT=1picpicT=1picpicgcgcT=pic(1-pic)gcT。(18)

式中:gcT可以通過(guò)XGBoost算法計(jì)算。

根據(jù)梯度下降法則,可以得到參數(shù)更新公式:

θ=θ-αLθ;(19)

T=T-αLT。(20)

式中:α表示學(xué)習(xí)率。

通過(guò)反復(fù)迭代,直到損失函數(shù)收斂或達(dá)到最大迭代次數(shù),就可以得到訓(xùn)練好的CNN-XGBoost模型,用于多類型棉花葉片病害識(shí)別任務(wù)。

3 結(jié)果與分析

3.1 試驗(yàn)測(cè)試平臺(tái)

試驗(yàn)于2023年8月在我國(guó)華南地區(qū)的某棉花研究所進(jìn)行,測(cè)試平臺(tái):處理器為Intel CoreTM i7-8750 CPU@ 2.20 GHz,操作系統(tǒng)為Windows 11,顯卡為NVIDIA GeForce RTX2060,8 GB顯存,64位系統(tǒng)。

訓(xùn)練環(huán)境:由Anaconda3創(chuàng)建,使用Python 3.7語(yǔ)言和Pytorch 1.4深度學(xué)習(xí)框架。

3.2 圖像數(shù)據(jù)預(yù)處理

為擴(kuò)充數(shù)據(jù)集,對(duì)數(shù)據(jù)集圖片進(jìn)行了離線數(shù)據(jù)增強(qiáng)方法,包括翻轉(zhuǎn)、柔化、銳化和灰度等操作,如圖5所示。然后,使用labelImg軟件對(duì)數(shù)據(jù)集進(jìn)行了標(biāo)注,選擇了PASAL VOC2007格式作為標(biāo)注格式,并用隨機(jī)函數(shù)將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,比例為 4 ∶1。

3.3 評(píng)價(jià)指標(biāo)

根據(jù)精確率(P)、召回率(R)、F1分?jǐn)?shù)和準(zhǔn)確率(A)等評(píng)價(jià)指標(biāo)對(duì)所提出的CNN-XGBoost模型進(jìn)行評(píng)估。為了評(píng)估不同類別之間的平衡性,本研究還計(jì)算了平均精度。精確率(P) 、召回率(R)、F1 分?jǐn)?shù)和準(zhǔn)確率(A)的計(jì)算公式如下:

P=TPTP+FP;(21)

R=TPTP+FN;(22)

F1分?jǐn)?shù)=2P×RP+R;(23)

A=TP+FNTP+TN+FP+FN。(24)

式中:TP表示真陽(yáng)性;TN表示真陽(yáng)性真陰性;FP表示假陽(yáng)性;FN表示假陰性。

3.4 評(píng)估指標(biāo)分析

圖6為可視化本研究模型在訓(xùn)練集和測(cè)試集上的準(zhǔn)確率和損失。本研究模型在訓(xùn)練集上的準(zhǔn)確率隨著訓(xùn)練批次的增加而逐漸提高,從約0.6增加到約0.98,表明該模型能夠有效地學(xué)習(xí)訓(xùn)練數(shù)據(jù)的特征和規(guī)律。該模型在測(cè)試集上的準(zhǔn)確率也隨著訓(xùn)練批次的增加而逐漸提高,從約0.1增加到約0.95,表明該模型具有較好的泛化能力,能夠適應(yīng)新的數(shù)據(jù)。在訓(xùn)練集上的損失隨著訓(xùn)練批次的增加而逐漸降低,從約0.5降低到約0.1,表明該模型能夠有效降低預(yù)測(cè)誤差,提高分類性能。在測(cè)試集上的損失值也隨著訓(xùn)練批次的增加而逐漸降低,從約0.9降低到約0.1,表明該模型能夠避免過(guò)擬合,保持較好的穩(wěn)定性。

表3展示了不同模型的平均識(shí)別準(zhǔn)確率,從數(shù)據(jù)中可以看出,CNN-XGBoost模型在訓(xùn)練集和測(cè)試集上的準(zhǔn)確率都是最高的,分別達(dá)到了0.98、0.93,說(shuō)明該模型具有很強(qiáng)的泛化能力和預(yù)測(cè)能力。此外,本模型相比于其他模型(如AlexNet、MobileNet v2、ResNet50、ResNet101、VGG16、VGG19),可以有效地降低過(guò)擬合的風(fēng)險(xiǎn),因?yàn)閄GBoost可以通過(guò)正則化項(xiàng)和剪枝技術(shù)來(lái)控制樹(shù)的復(fù)雜度。

本研究模型使用了數(shù)據(jù)增強(qiáng)方法,通過(guò)對(duì)圖像進(jìn)翻轉(zhuǎn)、銳化、柔化等變換,增加數(shù)據(jù)集的大小和多樣性,減少模型對(duì)噪聲和異常值的敏感性。表4展示了不同數(shù)據(jù)類型的識(shí)別準(zhǔn)確率對(duì)比,可以看出數(shù)據(jù)增強(qiáng)對(duì)CNN-XGBoost模型的準(zhǔn)確率有一定的提升作用。在數(shù)據(jù)增強(qiáng)的情況下,訓(xùn)練集和測(cè)試集的準(zhǔn)確率分別提高了0.03、0.04,達(dá)到了0.97、0.95,表明模型能夠更好地適應(yīng)不同的數(shù)據(jù)變化,避免過(guò)擬合或欠擬合。

混淆矩陣是一種用于評(píng)估分類模型性能的工具,它顯示了模型對(duì)每個(gè)類別的預(yù)測(cè)結(jié)果和實(shí)際結(jié)果的對(duì)比?;煜仃嚨男斜硎緦?shí)際類別,列表示預(yù)測(cè)類別。對(duì)角線上的元素表示模型正確預(yù)測(cè)的樣本數(shù),非對(duì)角線上的元素表示模型錯(cuò)誤預(yù)測(cè)的樣本數(shù)。由圖7可以看出,本研究模型在多類型棉花葉片病害識(shí)別任務(wù)上表現(xiàn)出了較高的準(zhǔn)確率和較低的誤差。對(duì)角線上的元素都是100以上,表明模型能夠正確識(shí)別出大部分的樣本。非對(duì)角線上的元素都是30以下,表明模型很少將一個(gè)類別誤判為另一個(gè)類別。

為更好地評(píng)估模型的性能,通過(guò)混淆矩陣計(jì)精確率、召回率、F1分?jǐn)?shù)等指標(biāo)。由表5可知,每個(gè)類別的精確率、召回率和F1分?jǐn)?shù)都接近或達(dá)到了1,表明模型在每個(gè)類別上都有很好的性能,沒(méi)有明顯的偏差或不平衡。

4 結(jié)論

本研究提出了一種基于CNN-XGBoost模型的多類型棉花葉片病害識(shí)別方法,利用CNN提取棉花葉片圖像的特征,然后使用XGBoost分類器進(jìn)行多分類任務(wù)。在收集的棉花葉片病害數(shù)據(jù)集上進(jìn)行廣泛試驗(yàn),與CNN、AlexNet、MobileNet v2、ResNet50、ResNet101、VGG16、VGG19等方法進(jìn)行了對(duì)比。結(jié)果表明,本研究提出的CNN-XGBoost模型在多種類型棉花葉片病害的實(shí)例上都能準(zhǔn)確識(shí)別,能夠充分利用圖像數(shù)據(jù)中的多層次和多維度信息,同時(shí)具有較強(qiáng)的魯棒性和泛化能力,為棉花種植業(yè)提供了一種準(zhǔn)確、低成本的病害診斷方法,有助于提高棉花的產(chǎn)量和質(zhì)量,促進(jìn)棉花產(chǎn)業(yè)的發(fā)展。

參考文獻(xiàn):

[1]陶云平. 棉花經(jīng)濟(jì)效益的影響因素及競(jìng)爭(zhēng)力提升:評(píng)《我國(guó)棉花國(guó)際競(jìng)爭(zhēng)力研究》[J]. 棉花學(xué)報(bào),2022,34(4):361.

[2]霍 遠(yuǎn),張 敏,王 惠. 新疆棉花成本及經(jīng)濟(jì)效益分析[J]. 干旱區(qū)地理,2011,34(5):838-842.

[3]Olmstead A L,Rhode P W. Biological innovation and productivity growth in the antebellum cotton economy[J]. The Journal of Economic History,2008,68(4):1123-1171.

[4]Subramanian K,Sarkar M K,Wang H M,et al. An overview of cotton and polyester,and their blended waste textile valorisation to value-added products:a circular economy approach–research trends,opportunities and challenges[J]. Critical Reviews in Environmental Science and Technology,2022,52(21):3921-3942.

[5]Najork K,F(xiàn)riedrich J,Keck M. Bt cotton,pink bollworm,and the political economy of sociobiological obsolescence:insights from Telangana,India[J]. Agriculture and Human Values,2022,39(3):1007-1026.

[6]張 泓,吐?tīng)栠d江·買買提,張少民,等. 近30年全國(guó)棉花生產(chǎn)區(qū)域時(shí)空變化及區(qū)域優(yōu)勢(shì)分析[J]. 新疆農(nóng)業(yè)科學(xué),2023,60(4):1028-1040.

[7]王如意,宋玉蘭. 產(chǎn)業(yè)鏈視角下中國(guó)棉花生產(chǎn)布局演化及影響因素研究[J]. 資源開(kāi)發(fā)與市場(chǎng),2022,38(3):337-343,384.

[8]Manavalan R. Towards an intelligent approaches for cotton diseases detection:a review[J]. Computers and Electronics in Agriculture,2022,200(1):107255.

[9]Caldeira R F,Santiago W E,Teruel B. Identification of cotton leaf lesions using deep learning techniques[J]. Sensors,2021,21(9):3169.

[10]楊 野,楊德昌,孫 紅,等. 基于無(wú)人機(jī)多光譜遙感和機(jī)器學(xué)習(xí)算法的南疆棉花生物量估算[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(15):179-187.

[11]Wei F,F(xiàn)eng H J,Zhang D Z,et al. Composition of rhizosphere microbial communities associated with healthy and Verticillium wilt diseased cotton plants[J]. Frontiers in Microbiology,2021,12:618169.

[12]祁佳峰,郭 鵬,劉 笑,等. 基于無(wú)人機(jī)高清影像的棉花苗期長(zhǎng)勢(shì)監(jiān)測(cè)及后期長(zhǎng)勢(shì)預(yù)測(cè)[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(16):170-178.

[13]Zambare R,Deshmukh R,Awati C,et al. Deep learning model for disease identification of cotton plants[J]. Specialusis Ugdymas,2022,1(43):6684-6695.

[14]劉桂鋒,楊 倩,劉 瓊. 農(nóng)業(yè)科學(xué)數(shù)據(jù)集的本體構(gòu)建與可視化研究:以“棉花病害防治”領(lǐng)域?yàn)槔跩]. 情報(bào)雜志,2022,41(9):143-149,175.

[15]張建華,孔繁濤,吳建寨,等. 基于改進(jìn)VGG卷積神經(jīng)網(wǎng)絡(luò)的棉花病害識(shí)別模型[J]. 中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2018,23(11):161-171.

[16]劉海濤,韓 鑫,蘭玉彬,等. 基于YOLO v4網(wǎng)絡(luò)的棉花頂芽精準(zhǔn)識(shí)別方法[J]. 中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),2022,24(8):99-108.

[17]陳柯屹,朱龍付,宋 鵬,等. 融合動(dòng)態(tài)機(jī)制的改進(jìn)型Faster R-CNN識(shí)別田間棉花頂芽[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(16):161-168.

[18]Patil S P,Zambre R S. Classification of cotton leaf spot disease using support vector machine[J]. International Journal of Engineering Research,2014,3(4):1511-1514.

[19]何相良,戴建國(guó),侯文慶,等. 基于深度卷積神經(jīng)網(wǎng)絡(luò)的棉花葉片缺氮診斷[J]. 江蘇農(nóng)業(yè)科學(xué),2022,50(22):180-191.

[20]金松林,來(lái)純曉,鄭 穎,等. 基于特征選擇和CNN+Bi-RNN模型的小麥抗寒性識(shí)別方法[J]. 江蘇農(nóng)業(yè)科學(xué),2022,50(10):201-207.

[21]Naeem A B,Senapati B,Chauhan A S,et al. Deep learning models for cotton leaf disease detection with VGG-16[J]. International Journal of Intelligent Systems and Applications in Engineering,2023,11(2):550-556.

[22]張 超,陳 暢,徐海清,等. 基于XGBoost算法的多云多霧地區(qū)多源遙感作物識(shí)別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(4):149-156.

主站蜘蛛池模板: 精品撒尿视频一区二区三区| 久久精品嫩草研究院| 欧美69视频在线| 日韩免费视频播播| 蜜桃视频一区二区| 欧美日韩中文国产| 重口调教一区二区视频| 国产亚洲第一页| 青青青视频免费一区二区| 国产精品永久免费嫩草研究院| 国产综合网站| 成人午夜网址| 国产噜噜噜| 麻豆国产精品一二三在线观看| 久久伊伊香蕉综合精品| a天堂视频| 国产成人亚洲无码淙合青草| 亚洲丝袜中文字幕| 日韩精品久久久久久久电影蜜臀| 国产成人无码Av在线播放无广告| 国产视频一二三区| 亚洲AⅤ永久无码精品毛片| 欧洲日本亚洲中文字幕| 免费毛片全部不收费的| 欧美亚洲激情| a毛片在线免费观看| 精品国产一区二区三区在线观看| 第一页亚洲| 激情无码字幕综合| 99re经典视频在线| 亚洲视频免费在线| 午夜免费小视频| 国内丰满少妇猛烈精品播| 福利在线不卡| 日本免费一级视频| 在线免费观看AV| 不卡无码h在线观看| 99久久精品国产精品亚洲| 91久久偷偷做嫩草影院精品| 国产欧美视频在线| 人妻中文字幕无码久久一区| 亚洲日韩精品欧美中文字幕| 中文字幕久久精品波多野结| 国产精品久久久久久影院| 美女潮喷出白浆在线观看视频| 青青热久免费精品视频6| 亚洲天堂视频在线免费观看| 国产超碰一区二区三区| 亚洲黄色成人| 香蕉色综合| 黄色福利在线| 亚洲伊人天堂| 国产黄色爱视频| 亚洲伊人天堂| 欧美国产菊爆免费观看 | 亚洲日本精品一区二区| 中文字幕免费视频| 国产微拍一区二区三区四区| 精品国产乱码久久久久久一区二区| 亚洲妓女综合网995久久| 91国内外精品自在线播放| 九色国产在线| 欧美中文字幕在线视频| 在线观看欧美精品二区| 色综合热无码热国产| 免费高清a毛片| 国产成人高清精品免费| 国产成在线观看免费视频| 国产亚洲现在一区二区中文| 欧美人人干| 另类欧美日韩| 日韩国产一区二区三区无码| 蜜桃臀无码内射一区二区三区 | 五月六月伊人狠狠丁香网| 亚洲成人高清无码| 国产精品无码久久久久久| 亚洲免费毛片| 一级高清毛片免费a级高清毛片| 免费在线不卡视频| 亚洲九九视频| 国产精品主播| 99ri国产在线|