基于遷移學(xué)習(xí)的GoogLeNet果園病蟲害識(shí)別與分級(jí)

2021-12-23 13:50:40萬軍杰祁力鈞盧中奧周佳蕊

中國農(nóng)業(yè)大學(xué)學(xué)報(bào) 2021年11期

關(guān)鍵詞：模型研究

萬軍杰祁力鈞盧中奧周佳蕊張豪

(中國農(nóng)業(yè)大學(xué) 工學(xué)院，北京 100083)

果園病蟲害影響水果的品質(zhì)和產(chǎn)量，自動(dòng)識(shí)別病蟲害是一個(gè)重要研究方向。隨著果園生產(chǎn)種植模式不斷復(fù)雜化，果園生產(chǎn)中所遇到的病蟲害情況也越來越復(fù)雜，對果樹生長造成了嚴(yán)重影響，快速、準(zhǔn)確、有效地識(shí)別出病蟲害危害程度并采取相關(guān)防治措施及時(shí)止損[1-2]，對于提高水果品質(zhì)和產(chǎn)量至關(guān)重要。

隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展，植物病蟲害檢測技術(shù)也取得了長足的進(jìn)步。植物病蟲害識(shí)別方法主要分為傳統(tǒng)方法和深度學(xué)習(xí)方法。傳統(tǒng)方法需要人工提取病害紋理、顏色等特征，往往識(shí)別種類有限且識(shí)別精度不高，難以大規(guī)模的推廣應(yīng)用。如肖志云等[3]提出了一種基于小波域的馬鈴薯典型蟲害特征提取與識(shí)別方法。黨滿意等[4]利用GrapCut算法與直方圖分割算法提取馬鈴薯晚疫病特征用于晚疫病識(shí)別，該方法對于中晚期病害識(shí)別準(zhǔn)確率能達(dá)到90%以上。肖志云等[5]提出了一種馬鈴薯典型病害圖像的自適應(yīng)特征融合與快速識(shí)別方法。張建華等[6-7]利用BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)進(jìn)行棉花病蟲害識(shí)別，識(shí)別精度基本能達(dá)到90%以上。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network，CNN)能夠不依賴特定特征，在圖像識(shí)別領(lǐng)域已經(jīng)得到了廣泛應(yīng)用[8-11]。如孫俊等[12]提出了一種批歸一化與全局池化相結(jié)合的卷積神經(jīng)網(wǎng)絡(luò)識(shí)別模型，對于多種植物葉片病害的識(shí)別準(zhǔn)確率達(dá)到了99.56%。房若民等[13]設(shè)計(jì)了一種嵌入式農(nóng)業(yè)病蟲害識(shí)別防治系統(tǒng)，可以識(shí)別多種病蟲害且識(shí)別準(zhǔn)確率達(dá)92.6%。于小東等[14]設(shè)計(jì)了一款實(shí)時(shí)在線農(nóng)作物病蟲害等級(jí)識(shí)別手機(jī)APP，能夠在0.1～0.5 s獲取識(shí)別結(jié)果。任守綱等[15]構(gòu)建了一種基于反卷積引導(dǎo)的VGG網(wǎng)絡(luò)模型，能同時(shí)實(shí)現(xiàn)植物葉部病害種類識(shí)別與病斑分割。Gonzalez-Huitron等[16]構(gòu)建了一種輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)，并將其成功應(yīng)用在Raspberry Pi 4上進(jìn)行番茄病蟲害的識(shí)別。李就好等[17]提出了一種改進(jìn)Faster R-CNN模型來識(shí)別田間苦瓜葉片病蟲害，改進(jìn)后平均準(zhǔn)確率為86.39%。王春山等[18]利用改進(jìn)Multi-scaleResNet模型進(jìn)行蔬菜葉部病害識(shí)別，在真實(shí)環(huán)境下識(shí)別準(zhǔn)確率達(dá)到了93.05%。

上述研究大多以常見病蟲害識(shí)別為主，少有對病蟲害危害程度進(jìn)行分級(jí)識(shí)別研究。目前在果園精細(xì)化管理中，僅僅識(shí)別果樹病蟲害種類，難以滿足果園精準(zhǔn)變量施藥的要求。基于此，本研究擬采用遷移學(xué)習(xí)技術(shù)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法研究果園病蟲害識(shí)別與危害程度分級(jí)問題，以期為現(xiàn)代果園智能化、精細(xì)化管理提供一定的技術(shù)支持。

1 材料與方法

1.1 試驗(yàn)數(shù)據(jù)

1.1.1數(shù)據(jù)來源

試驗(yàn)數(shù)據(jù)主要來源于PlantVillage官網(wǎng)(https:∥plantvillage.psu.edu)。從PlantVillage官網(wǎng)收集了11 653張病蟲害樣本圖像。另外，從北京市通州區(qū)(116.65° E，39.92° N)中農(nóng)富通現(xiàn)代果園中，利用飛螢8 SE相機(jī)(分辨率1 280像素×720像素)人工拍攝了1 500張果樹健康與患病葉片圖像，總計(jì)13 153張樣本圖像。在全部樣本圖像中，含有桃、蘋果、櫻桃、葡萄、柑橘、草莓等6種果園作物，共計(jì)25種病蟲害類型樣本(10種病害，9種蟲害，6種健康)。本研究所收集病蟲害樣本數(shù)量見表1。

1.1.2數(shù)據(jù)預(yù)處理

由統(tǒng)計(jì)樣本分布情況可知，各類病蟲害樣本數(shù)量在232～1 899張不等(表1)。為了防止因訓(xùn)練樣本數(shù)量過少而導(dǎo)致模型發(fā)生過擬合現(xiàn)象，本研究對已有圖像進(jìn)行隨機(jī)翻轉(zhuǎn)、平移、縮放以及對比度增減等操作(圖1)將圖像擴(kuò)充至105 224張。同時(shí)，考慮到樣本來源不同，導(dǎo)致所收集的圖像格式、大小等存在差異，使用MATLAB自編函數(shù)將所有圖像調(diào)整為統(tǒng)一大小(224像素×224像素)。

1.1.3病害危害程度分級(jí)

通過觀察不同患病葉片顏色以及病斑大小劃分病害級(jí)別。本研究具體分級(jí)標(biāo)準(zhǔn)參考GB/T 17980.24—2000 《農(nóng)藥田間藥效試驗(yàn)準(zhǔn)則(一)殺菌劑防治梨黑星病》[19]中葉片病情分級(jí)標(biāo)準(zhǔn)，按照病斑占整個(gè)葉片面積比例劃分6個(gè)等級(jí)：0級(jí)，無病斑；1級(jí)，0<病斑≤10%；3級(jí)，10%<病斑≤25%；5級(jí)，25%<病斑≤40%；7級(jí)，40%<病斑≤65%；9級(jí)，病斑>65%。本研究采用人工分級(jí)方式將果樹病害危害程度分為3級(jí)：0級(jí)為健康，無病斑；Ⅰ級(jí)為一般，0<病斑≤30%；Ⅱ級(jí)為嚴(yán)重，病斑>30%。本研究病害樣本分級(jí)后數(shù)量見表2。

在總體樣本集中，隨機(jī)選出60%和20%的圖像樣本分別作為訓(xùn)練集(Train set)與驗(yàn)證集(Validation set)，剩余20%的圖像樣本作為測試集(Test set)。其中，驗(yàn)證集用來對模型進(jìn)行修正，測試集用于評估最終模型的泛化能力[17]。

表1 病蟲害樣本原始數(shù)量及增強(qiáng)后數(shù)量Table 1 Data from original and augmented samples of pests and diseases

圖1 圖像增強(qiáng)效果Fig.1 The effect of image data augmentation

1.2 模型搭建

1.2.1模型簡介

GoogLeNet網(wǎng)絡(luò)模型主要由9個(gè)模塊化結(jié)構(gòu)(Inception v1)串聯(lián)而成，結(jié)構(gòu)見圖2。在第一個(gè)Inception模塊之前，模型含有3個(gè)卷積層(Convolution layer)，3個(gè)激活層(Relu layer)，2個(gè)最大池化層(Max pooling layer)，2個(gè)歸一化層(Normalization layer)。在第2、3個(gè)Inception模塊以及第7、8個(gè)Inception模塊之間都含有一個(gè)最大池化層(Max pooling layer)。在Inception模塊之后，依次是全局平均池化層(Global average pooling layer)、Dropout層(Dropout layer)、全連接層(Fully connected layer)、Softmax層(Softmax layer)、分類層(Classification layer)。本研究主要將模型最后3個(gè)網(wǎng)絡(luò)層進(jìn)行替換，并將全連接層的輸出大小修改為35，其他參數(shù)保持不變。

圖2 GoogLeNet網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 GoogLeNet structure diagram

Softmax層用于計(jì)算某張病蟲害圖像屬于各等級(jí)的概率值，選擇最大概率值對應(yīng)的等級(jí)作為預(yù)測輸出，輸出層通過交叉熵?fù)p失函數(shù)計(jì)算誤差，評價(jià)實(shí)際輸出與期望輸出的接近程度[8]，在反向傳播過程中對各層參數(shù)進(jìn)行優(yōu)化更新，交叉熵?fù)p失函數(shù)表達(dá)式為：

(1)

式中：W為權(quán)重矩陣；b為偏置向量；N為樣本數(shù)；K為類別數(shù)；tij為第i個(gè)樣本屬于類別j的概率；yij為類別j中樣本i的輸出概率。

1.2.2遷移學(xué)習(xí)

遷移學(xué)習(xí)是把在大型數(shù)據(jù)集(如ImageNet)上學(xué)到的圖像分類知識(shí)成功運(yùn)用到待解決的新目標(biāo)分類中[20-22]。相比原模型，其優(yōu)勢在于：1)以現(xiàn)有最佳網(wǎng)絡(luò)模型為基礎(chǔ)，通過微調(diào)網(wǎng)絡(luò)層結(jié)構(gòu)來構(gòu)建本研究的模型，比構(gòu)建和訓(xùn)練隨機(jī)初始化的新網(wǎng)絡(luò)更快且更容易；2)預(yù)訓(xùn)練網(wǎng)絡(luò)模型由于已學(xué)習(xí)了豐富的特征，無需龐大的數(shù)據(jù)量再訓(xùn)練，可以有效縮短訓(xùn)練時(shí)間。因此，本研究以經(jīng)典的GoogLeNet作為預(yù)訓(xùn)練模型，利用模型結(jié)構(gòu)微調(diào)和參數(shù)微調(diào)的遷移學(xué)習(xí)方法，對果園病蟲害圖像的識(shí)別與危害程度分級(jí)進(jìn)行研究。

1.2.3超參數(shù)設(shè)置

在深度學(xué)習(xí)訓(xùn)練時(shí)，超參數(shù)選擇困難且費(fèi)時(shí)，因?yàn)槌瑓?shù)最優(yōu)組合不僅僅取決于模型本身，還取決于軟件與硬件環(huán)境。本研究模型的超參數(shù)經(jīng)多次微調(diào)確定。在利用GoogLeNet模型進(jìn)行訓(xùn)練時(shí)，采用批量訓(xùn)練方式，隨機(jī)將訓(xùn)練集與驗(yàn)證集劃分多個(gè)批次，訓(xùn)練批次(Minibatch)大小為32，輪(Epoch)為30，每輪迭代1 265次，共迭代37 950次。每1 000次迭代驗(yàn)證1次，初始學(xué)習(xí)率設(shè)為0.001，權(quán)重衰減值為1×10-5。優(yōu)化器采用帶動(dòng)量的隨機(jī)梯度下降法(Stochastic gradient descent with momentum，SGDM)，動(dòng)量為0.9。為了進(jìn)一步防止過擬合，將Dropout層隨機(jī)丟棄概率設(shè)置為0.4，即隨機(jī)丟棄40%的節(jié)點(diǎn)。模型訓(xùn)練其它初始參數(shù)權(quán)重采用經(jīng)過ImageNet數(shù)據(jù)集訓(xùn)練的權(quán)重值。

1.3 評價(jià)指標(biāo)

為評價(jià)模型的優(yōu)劣，選擇模型大小(M)、識(shí)別時(shí)間(T)、損失值(L)、準(zhǔn)確率(Acc)作為模型訓(xùn)練結(jié)果的評價(jià)指標(biāo)。其中，模型大小反映該模型訓(xùn)練完成后所占用的計(jì)算機(jī)儲(chǔ)存空間[8]，單位為MB。損失值能夠估計(jì)模型預(yù)測值與真實(shí)值的偏差程度，損失值越小，表示模型預(yù)測結(jié)果越接近真實(shí)結(jié)果，計(jì)算公式為：

(2)

式中：yi為第i個(gè)樣本對應(yīng)的標(biāo)簽；f為模型輸出函數(shù)；j為求和變量；K為樣本總數(shù)。

準(zhǔn)確率[23]反映的是識(shí)別結(jié)果中識(shí)別正確的圖像數(shù)量占全部識(shí)別圖像數(shù)量的比率，可以反映模型的訓(xùn)練效果，計(jì)算公式為：

(3)

式中：TP(True positive)為被模型預(yù)測為正的正樣本；TN(True negative) 為被模型預(yù)測為負(fù)的負(fù)樣本；FN(False negative) 為被模型預(yù)測為正的負(fù)樣本；FP(False positive) 為被模型預(yù)測為負(fù)的正樣本。

2 結(jié)果與討論

本研究采用中國農(nóng)業(yè)大學(xué)植保機(jī)械實(shí)驗(yàn)室計(jì)算機(jī)，其硬件配置為：Windows10專業(yè)版64位操作系統(tǒng)，CPU為英特爾 i7-10700，GPU為英偉達(dá)GTX 1660 Super 6 GB，主板為微星MAG B460M，內(nèi)存為32 G。攝像頭為免驅(qū)USB攝像頭，焦距F6.0 mm，視像解析度640像素×480像素。軟件開發(fā)環(huán)境為MATLAB2020a版本。

2.1 訓(xùn)練結(jié)果

為驗(yàn)證本研究方法的有效性與優(yōu)越性，隨機(jī)選取AlexNet、VGG-16、ResNet-18、GoogLeNet、SqueezeNet和MobileNet-v2這6種模型。在相同訓(xùn)練參數(shù)設(shè)置條件下，進(jìn)行6種模型訓(xùn)練與驗(yàn)證，訓(xùn)練曲線見圖3。本研究將經(jīng)過遷移學(xué)習(xí)的GoogLeNet網(wǎng)絡(luò)模型記為GoogLeNet*，與原模型以示區(qū)別。

訓(xùn)練精度曲線可以描述隨著迭代次數(shù)的增加，模型預(yù)測精度的波動(dòng)情況。由圖3(a)可知，除SqueezeNet模型，其余6種模型在收斂時(shí)訓(xùn)練精度均達(dá)到了90%以上。其中，收斂速度最快的模型是GoogLeNet*，最慢的是SqueezeNet。當(dāng)?shù)螖?shù)為400次時(shí)，GoogLeNet*模型訓(xùn)練精度率先達(dá)到80%，迭代5 000次后趨于收斂，此時(shí)模型訓(xùn)練精度為95%，最終模型訓(xùn)練精度為99%。然而，SqueezeNet模型在迭代次數(shù)為12 000次時(shí)，其訓(xùn)練精度才達(dá)到80%，并且在訓(xùn)練過程中訓(xùn)練精度曲線波動(dòng)幅度較大，最終模型訓(xùn)練精度為88%。其余5種模型訓(xùn)練精度曲線大致相同，最終模型訓(xùn)練精度為90%～95%。訓(xùn)練結(jié)果表明，本研究模型無論在收斂速度方面，還是模型精度方面都表現(xiàn)出色。

損失曲線則表示隨著迭代次數(shù)的增加，模型預(yù)測值與真實(shí)值之間偏差波動(dòng)情況。損失值越小，表明模型精度越高，預(yù)測出錯(cuò)概率越小[8]。由圖3(b)可知，GoogLeNet*模型率先達(dá)到收斂，最終損失值為 0.007 8，均低于其他6種模型。SqueezeNet模型損失值最大為0.353 7，其余模型損失值介于二者之間。在模型平均訓(xùn)練時(shí)長方面，7種模型平均訓(xùn)練時(shí)長分布在2.15～24.17 h。其中，AlexNet與SqueezeNet模型訓(xùn)練時(shí)間最短約2 h，VGG-16模型最長約24 h，其余模型訓(xùn)練時(shí)長均在10 h以內(nèi)。然而，本研究模型訓(xùn)練時(shí)長為4.13 h，比原GoogLeNet模型縮短0.25 h。

對于病蟲害識(shí)別最重要的是識(shí)別精度與識(shí)別時(shí)間，其次是模型大小。因此，本研究按照優(yōu)先級(jí)：識(shí)別精度>識(shí)別時(shí)間>模型大小進(jìn)行模型評價(jià)。7種模型驗(yàn)證精度分布在85.49%～96.93%(圖4)。其中，GoogLeNet*模型驗(yàn)證精度最高為96.93%，SqueezeNet模型驗(yàn)證精度最低為85.49%，其他模型驗(yàn)證精度均在90%以上。在識(shí)別時(shí)間方面，SqueezeNet模型識(shí)別時(shí)間最短約1.4 ms，最長為VGG-16模型約5.9 ms。其中，AlexNet、SqueezNet、GoogLeNet、GoogLeNet*、MobileNet-v2模型平均識(shí)別時(shí)間均在5 ms以內(nèi)，而VGG-16與ResNet-18模型平均識(shí)別時(shí)間則超過5 ms。這主要是模型結(jié)構(gòu)、層數(shù)、參數(shù)量不同所致。在模型大小方面，由于ResNet-18、SqueezeNet、GoogLeNet、MoblieNet-v2模型為輕量級(jí)神經(jīng)網(wǎng)絡(luò)，所以訓(xùn)練完成后模型大小都在10 MB以下。其中，SqueezeNet模型最小僅為2.47 MB，最大為MobileNet-v2模型的8.24 MB。另外，3種模型(VGG-16、AlexNet、GoogLeNet*)稍微大一些，分別為474、199和21.3 MB。

識(shí)別時(shí)間為圖像平均識(shí)別時(shí)間，ms；氣泡上的數(shù)值表示訓(xùn)練完成后模型的大小，MB。The recognition time is the average image recognition time, ms. The value on the bubble indicates the memory size of the model after the training is completed, MB.圖4 7種模型訓(xùn)練結(jié)果Fig.4 Training results of seven models

綜合看，本研究模型所占儲(chǔ)存空間雖不是最小，但其驗(yàn)證精度最高，比其他6種模型提高了2.38%～11.44%，且單張圖片平均識(shí)別時(shí)間僅為2.6 ms，其模型大小僅為21.3 MB。因此，本研究提出的基于遷移學(xué)習(xí)的GoogLeNet模型是明顯優(yōu)于其他6種模型的。

2.2 模型性能探討

2.2.1數(shù)據(jù)集大小對模型性能的影響

數(shù)據(jù)集在很大程度上決定了模型的識(shí)別性能[24-25]。為了研究數(shù)據(jù)集大小對病蟲害分級(jí)精度的影響，設(shè)置了5種不同大小的數(shù)據(jù)集進(jìn)行模型訓(xùn)練。從原有數(shù)據(jù)集中每類樣本隨機(jī)選取100、200、500、1000、2000張圖像形成新的數(shù)據(jù)集，記為100、200、500、1 000、2 000。使用5種不同大小數(shù)據(jù)集訓(xùn)練出的模型精度見表3。可知，模型精度隨著數(shù)據(jù)集的增大而提高。經(jīng)過不同大小數(shù)據(jù)集訓(xùn)練得到的模型驗(yàn)證精度與測試精度范圍分別在87.42%～96.23%，85.62%～95.07%。經(jīng)過遷移學(xué)習(xí)的GoogLeNet模型，即使在每類樣本只有100張圖像的情況下，模型仍具有85%以上的測試精度。這表明經(jīng)過遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)，對于小樣本數(shù)據(jù)集也具有良好的識(shí)別性能。但是為了模型能夠具有更高的精度以及泛化能力，仍就需要足夠的圖像樣本來確保模型能夠充分學(xué)習(xí)到細(xì)微特征，以便區(qū)分相似病蟲害。

表3 本研究模型在不同大小數(shù)據(jù)集下的驗(yàn)證精度與測試精度Table 3 The verification and testing accuracy under different data set sizes based on this model

2.2.2優(yōu)化算法對模型性能的影響

目前，常用優(yōu)化算法有Adam(Adaptive moment estimation)、SGDM(Stochastic gradient descent with momentum)、RMSprop(Root mean square prop)等。其中Adam和SGDM在機(jī)器視覺、自然語言處理等方面應(yīng)用最為廣泛。

為探究不同優(yōu)化算法對模型性能的影響，選取了3種常用優(yōu)化算法進(jìn)行模型訓(xùn)練，得到不同優(yōu)化算法下的模型精度見表4。在相同試驗(yàn)條件下，經(jīng)過3種優(yōu)化算法得到的模型精度差別很大。在訓(xùn)練時(shí)長方面，三者比較接近，均在5 h左右，其中SGDM算法耗時(shí)最短。在驗(yàn)證精度方面，SGDM算法比Adam、RMSprop算法分別提高了5.3%、19.82%；在測試精度方面，SGDM算法比Adam、RMSprop算法分別提高了6.29%、27.85%。因此，SGDM優(yōu)化算法更適合本研究模型。

表4 不同優(yōu)化算法下的模型精度Table 4 Model accuracy under different optimization algorithms

2.3 模型驗(yàn)證

為驗(yàn)證本研究模型的實(shí)用性，開發(fā)了一款果園病蟲害分級(jí)識(shí)別系統(tǒng)進(jìn)行試驗(yàn)驗(yàn)證，開發(fā)環(huán)境為MATLAB2020a。軟件包含前端用戶操作界面和后臺(tái)識(shí)別模塊這2部分。其中，前端設(shè)計(jì)采用APP Designer設(shè)計(jì)器進(jìn)行可視化界面布局，采用了Button組件、Label組件、圖像窗口組件、坐標(biāo)區(qū)域組件、文本區(qū)域組件。其軟件工作流程和前端界面見圖5。后臺(tái)處理通過使用MATLAB語言編寫程序打開或關(guān)閉相機(jī)，并調(diào)用訓(xùn)練好的GoogLeNet*

圖5 本研究設(shè)計(jì)的軟件工作流程(a)與用戶操作界面(b)Fig.5 The software work flow chart (a) and user interface diagram (b) designed in this research

模型進(jìn)行果樹病蟲害識(shí)別與危害程度分級(jí)。同時(shí)，該軟件還能根據(jù)識(shí)別結(jié)果調(diào)用本地瀏覽器自動(dòng)檢索病蟲害防治建議和防治藥品展示給用戶。

2.3.1病蟲害識(shí)別

本研究從測試集隨機(jī)選取20種病蟲害類型(10種病害、8種蟲害、2種健康)，每類選取20張圖像進(jìn)行模型識(shí)別效果分析，測試結(jié)果見表5。可知，本研究模型對蟲害識(shí)別精度要高于病害識(shí)別精度。其中，病害的平均識(shí)別精度達(dá)到了98.70%，健康葉片以及蟲害平均識(shí)別精度都達(dá)到了100%，病蟲害總體平均識(shí)別精度為99.35%。同時(shí)，該系統(tǒng)識(shí)別單張圖像的平均用時(shí)約為0.43 s。測試結(jié)果表明本研究模型識(shí)別病蟲害效果較好，能夠滿足果園病蟲害實(shí)時(shí)監(jiān)控系統(tǒng)識(shí)別要求。

表5 本研究模型識(shí)別病蟲害圖像的精度與時(shí)間Table 5 The accuracy and time of recognizing images of diseases and pest based on this model

本研究模型對病害與蟲害識(shí)別精度存在差異。分析其原因，主要是害蟲具有清晰地紋理、顏色特征(圖6(a2)、(a3))，卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)到更多關(guān)鍵特征用于識(shí)別。相比之下，病害主要依靠顏色特征進(jìn)行識(shí)別(圖6(b3))，而紋理特征相對較少(圖6(b2))，加之病斑形態(tài)各異，給模型識(shí)別帶來了一定的難度。

圖6 黑守瓜(a)與葡萄輪斑病(b)的可視化激活特征圖Fig.6 Visualized activation feature map of Aulacophora lewisii (a) and Acrospermun viticola (b)

2.3.2病害分級(jí)

目前在果園精細(xì)化管理中，僅僅識(shí)別病蟲害種類是不能滿足精準(zhǔn)施藥的要求。所以需要進(jìn)一步對病蟲害危害程度進(jìn)行分級(jí)，從而更好的進(jìn)行精準(zhǔn)變量施藥。為了驗(yàn)證本研究模型病害危害程度分級(jí)效果，從測試集中隨機(jī)選取6種病害進(jìn)行危害程度分級(jí)，每等級(jí)樣本數(shù)量為20張。本研究模型對病害危害程度分級(jí)結(jié)果見表6。可知，病害危害程度分級(jí)精度相比病害識(shí)別精度有所下降。其分級(jí)精度在80%～100%，但平均分級(jí)精度也達(dá)到了92.78%。分析個(gè)別病害分級(jí)精度低的原因，主要是病害危害程度Ⅰ級(jí)(一般)與Ⅱ級(jí)(嚴(yán)重)之間分級(jí)特征較少，僅有病斑大小這一細(xì)微特征。模型在學(xué)習(xí)時(shí)難以找出兩者之間明顯的分界閾值。其次，模型訓(xùn)練的分級(jí)樣本標(biāo)簽由人工標(biāo)定，嚴(yán)格而標(biāo)準(zhǔn)的分級(jí)工作是十分繁瑣、耗時(shí)的，難免會(huì)發(fā)生個(gè)別樣本標(biāo)記錯(cuò)誤。最后，數(shù)據(jù)來源不同也導(dǎo)致同等級(jí)樣本在圖像背景、光照強(qiáng)度、圖像尺寸、果樹種類等方面存在著一定差異。在后續(xù)研究中，考慮采取病斑分割與識(shí)別相結(jié)合的方式來進(jìn)一步提高病害分級(jí)精度。

表6 本研究模型識(shí)別病害危害等級(jí)分級(jí)精度Table 6 Grading accuracy of the grade of disease damage based on this model

3 結(jié) 論

1)針對現(xiàn)有果樹病蟲害危害程度分級(jí)模型存在精度不高，難以滿足精準(zhǔn)施藥要求的問題，本研究采用遷移學(xué)習(xí)技術(shù)與GoogLeNet模型相結(jié)合的方法，對果園病蟲害樣本進(jìn)行了識(shí)別和危害程度分級(jí)研究。所設(shè)計(jì)模型大小為21.3 MB，平均識(shí)別精度達(dá)到了99.35%。其中，病害識(shí)別精度為98.70%，蟲害識(shí)別精度為100%。對病害樣本進(jìn)行危害程度分級(jí)，平均分級(jí)精度為92.78%。

2)在相同訓(xùn)練參數(shù)下，本研究模型較AlexNet、VGG-16、ResNet-18、SqueezeNet、原GoogLeNet及MobileNet-v2模型驗(yàn)證精度提高了2.38%～11.44%，并且損失值最低。同時(shí)，探究了不同數(shù)據(jù)集大小與不同優(yōu)化算法對模型性能的影響。研究結(jié)果表明，遷移學(xué)習(xí)技術(shù)能夠在一定程度上加快模型收斂速度；本研究模型精度隨著數(shù)據(jù)集的增大而提高；在3種優(yōu)化算法中，SGDM算法耗時(shí)最短且精度最高，更適合本研究模型。

3)基于MATLAB平臺(tái)，設(shè)計(jì)了一款可視化的果園病蟲害分級(jí)識(shí)別系統(tǒng)。經(jīng)過400次實(shí)際測試，該系統(tǒng)識(shí)別單張圖像僅需0.43 s。本研究所設(shè)計(jì)系統(tǒng)實(shí)用性與穩(wěn)定性較強(qiáng)，可為現(xiàn)代果園智能化、精細(xì)化管理提供一定的技術(shù)支持。