








摘 要:精準識別花椒病害可以幫助農民采取合適的措施對花椒進行對癥治療,從而減少對花椒產量和經濟造成的損失。本研究選取ShuffleNetV2模型作為基礎模型對花椒葉片是否存在病害進行智能識別。為提升識別精度,在基礎模型中嵌入坐標注意力機制(CA)改進主體網絡架構,增強模型對重點位置信息和重要特征的關注指數,并采用遷移學習訓練策略來優(yōu)化模型,獲得CA-ShuffleNetV2模型。經由自建花椒葉片數據集進行實驗測試,結果表明,CA-ShuffleNetV2網絡模型獲得的識別準確率高達92.6%,而參數量僅為2.72 MB。由此表明,該模型不僅具有較高的識別精度,且能較好地平衡模型大小與識別率,為花椒葉片病害的實時檢測提供了新的技術支持。
關鍵詞:花椒葉片病害;CA-ShuffleNetV2;坐標注意力機制;遷移學習;葉片檢測;識別率
中圖分類號:TP391 文獻標識碼:A 文章編號:2095-1302(2025)06-00-05
DOI:10.16667/j.issn.2095-1302.2025.06.008
0 引 言
花椒是我國的主要經濟作物之一,其產量會受到病害的嚴重影響[1-3]。對花椒病害進行檢測,有利于及早診斷出花椒作物的病害跡象,提前采取防治措施,從而提升花椒作物的產量與品質,提高農業(yè)收益及椒農的經濟收益。對花椒葉片病害進行高效實用地快速識別有助于提高病害識別的準確性和科學性,有助于農作物病害的研究和防治工作。
早期的農作物葉片病害識別研究主要基于傳統(tǒng)的機器學習方法。文獻[4]將棉花葉片邊緣殘缺、葉片孔洞作為主要特征,評估棉花蟲害對棉花健康的影響程度。文獻[5]運用差分百分率直方圖法提取無土栽培番茄缺乏營養(yǎng)元素葉片的紋理特征,經過遺傳算法的優(yōu)化組合后作為 K 近鄰模式識別的輸入項展開模式識別。文獻[6]結合圖像處理、色度學、計算機視覺等先進技術理論,借助模糊K-近鄰算法對植株病害展開模式識別。文獻[7]使用 K-均值+聚類算法和分水嶺算法對向日葵葉病圖像進行分割,從患病區(qū)域中提取了19個顏色特征和紋理特征的特征值,并構造了隨機森林算法來識別患病區(qū)域。文獻[8]提出了基于結合 Retinex的二進制小波變換和人工蜂群算法的番茄葉病識別框架,能夠對番茄病害進行有效識別。
近年來,深度學習技術取得了令人矚目的成就,在人臉識別、目標檢測等領域都取得了良好的效果。基于卷積神經網絡(Convolutional Neural Network, CNN)的深度學習模型逐漸被應用于農業(yè)領域,隨著AlexNet、VGG16、ResNet50、GoogLeNet以及輕量網絡MobileNetV2和EfficientNet B0等神經網絡的結構不斷深化[9-14],CNN對圖像的識別準確率越來越高,在農作物的病害識別方面得到了更加廣泛的應用。文獻[15]提出了一種新的兩階段輕量化CNN模型結構,對小麥病害的分類準確率達到了93.3%。文獻[16]基于EfficientNet模型設計了新的Dise-efficient網絡架構,在Plant Village植物病蟲害數據集上的分類準確率達99.80%。文獻[17]通過對GoogLeNet網絡結構以及激活函數的改進,獲得的模型在農作物檢測方面能力較強,特別是對玉米的9種病害的分類準確率達到了98.9%。文獻[18]針對蘋果等典型農作物的常見葉片病害問題,使用卷積神經網絡VGG16 及 ResNet50 對葉片病害進行識別,分別達到了 82.57% 和 86.34%的準確率。文獻[19]在Xception的基礎上提出一種新的通道擴增模塊,采用特殊的通道分配權重增強了特征提取效率,對27種植物病害進行識別分類,識別準確率達到了91.9%。文獻[20]利用坐標注意力機制(Coordinate Attention, CA)替換MobileNetV3網絡,通過引入SVM多分類器,對識別水稻病害的準確率高達 97.12%。
雖然基于深度學習的病害圖像智能處理算法發(fā)展迅速,但由于花椒葉片病害的可用數據較為稀少,基于深度學習的花椒葉片病害檢測方法依然有待深入研究。本文借助ShuffleNetV2檢測模型[21]完成了對花椒葉病害的智能檢測,并在ShuffleNetV2的基本單元中引入坐標注意力機制,增強了網絡對花椒葉重要位置信息的獲取,并借助遷移學習加強網絡對模型的訓練。另外,在自建數據集上的測試評估與對比實驗研究表明,CA-ShuffleNetV2的檢測準確率為92.6%,參數量為2.72 MB,實現了該模型對花椒葉病害檢測精度和檢測速度的平衡。
1 材料與方法
1.1 數據集處理
本研究先在Plant Village數據集上進行訓練獲得預訓練模型,后遷移到自建花椒數據集進行訓練和微調。公共數據集Plant Village共包含14類農作物或植物的39種病害類型,合計共有61 486張圖片[22]。本研究自建的花椒葉部病害數據集均為網絡爬取,涵蓋農作物花椒葉的銹病、斑病以及未受病害入侵的花椒葉片,共計3種類型的葉片狀態(tài)。實驗中為了確保檢測效率和精準度,假定葉片主體清晰,背景真實可見,共網絡爬取230張圖片;該數據集經過翻轉和葉片剪裁,共獲得690張花椒葉圖片。數據集樣例如圖1所示。
1.2 ShuffleNetV2模型
ShuffleNetV2是一種輕量級神經網絡架構,主要由Stage2、Stage3和Stage4三個網絡訓練階段組成,該神經網絡結構能夠在移動或嵌入式設備上執(zhí)行高效的花椒病害葉片檢測和分類任務。此外,ShuffleNetV2通過引入逐通道組卷積和通道混洗操作來有效減少模型的參數量和計算量[23]。同時還采用了一種類似殘差連接的設計,即每個階段包含一個直接連接的分支來保持特征圖的高維表達能力。這種設計可以有效減緩信息丟失,并提高模型的分類準確率。
逐通道組卷積是將不同花椒葉片的特征圖進行有序分組,然后借助不同的模版(卷積核)對各分組進行有效卷積,此模版應用于特征圖輸入的每一個分組通道,而非對整個輸入特征圖進行卷積操作。因此,利用該方法有助于減少網絡訓練的參數量和計算量,并提高模型的計算和執(zhí)行效率。深度可分離卷積(Depth Wise Separable Convolution, DWSC)通過將空間和通道維度拆開,并分析其維度的相關性,以獲得模版計算時的參數數量,是相對比較特殊的一種卷積神經網絡模型。具體操作:將Inception模塊劃分為兩個部分,首先對通道進行空間模版計算,獲得輸出后再次對1×1卷積核進行通道卷積計算得到最佳特征圖。通道混洗操作的目的是為了打破分組卷積后產生的特征圖中通道之間的依賴關系,它將特征圖中的通道重新排列和混合,以增加特征圖之間的信息傳遞和多樣性。通道混洗過程如圖2所示。
1.3 遷移學習
遷移學習是一種在源域進行學習,解決目標域問題的機器學習方法。遷移學習效果取決于源、目標領域的圖片共性程度[24],通過學習卷積層共有特征后進行知識遷移,將訓練于源域數據集的模型參數應用到目標域,從而解決目標域數據集不足而引起的訓練效果不理想的問題。本研究基于Plant Village數據集,將ShuffleNetV2網絡模型放在該數據集上進行充分訓練,獲得初始權重值。然后針對自建花椒葉片數據集,經由優(yōu)化學習機制更進一步微調該網絡模型參數值,增強網絡模型對自建花椒葉片數據集的學習性能,加快模型收斂并提高模型的泛化能力。本研究遷移學習工作流程如圖3所示。
1.4 CA
通道注意力機制有助于對輸入特征圖中的不同通道進行選擇性強調,它可以自動學習每個通道的重要性,并提供更有判別力的特征表示[25]。雖然通道注意力機制能夠有效提升模型獲取特征的能力,但是卻忽略了圖像的位置信息。CA不僅可以捕捉到跨通道信息,還可以捕捉到位置敏感信息[26]。另外,CA將通道注意力拆分為垂直方向和水平方向上1×1的特征編碼,允許沿著一個空間方向捕捉依賴關系,與此同時保留另一個空間方向上的位置信息。注意力機制的具體結構如圖4所示。對于輸入X而言,高度為h的第c通道的輸出見式(1):
寬度為w的第c個通道的輸出見式(2):
級聯兩個方向上生成的特征圖,使用1×1卷積核進行通道壓縮F1,生成中間特征圖f,其表達式見式(3):
沿著空間方向上的維度將f切分為兩個獨立張量,再次利用1×1卷積核進行通道膨脹,獲得gh和gw,CA模塊的最終輸出見式(4):
由圖4可知,將CA插入到ShuffleNetV2網絡的基本單元中,具體的網絡結構如圖5(a)和圖5(b)所示。在深度可分離卷積模塊之后加入CA 模塊,通過此操作,利用CA模塊捕獲了網絡通道間的依賴關系,同時又能保留精確坐標信息的特性,使模型在注意花椒葉片的精確位置信息的同時強調重要病害特征。
2 實驗設置
2.1 實驗設置
試驗環(huán)境:CPU型號為 Intel?CoreTMi7-9700K,GPU為12 GB顯存的NVIDIA RTX2080ti,RAM為32 GB的DDR4,CUDA版本為11.7,深度學習框架為Pytorch 2.0.1。為驗證本研究選取ShuffleNetV2 模型對花椒病害識別的準確性與實時性,選用傳統(tǒng)VGG16 網絡模型和 ResNet50 網絡模型進行對比試驗。對3種網絡均采取遷移學習方式。實驗測試將數據集按照8∶2的比例劃分為訓練集和測試集,每一次迭代數據都會被隨機打亂,每張輸入圖像大小被固定為224×224,優(yōu)化器使用Adam (Adaptive Momentum)[27],批次設定為16,初始化學習率設定為0.000 1,每訓練10個Epoch,學習率衰減20%。網絡模型訓練迭代次數約定為60,且損失函數同樣設定為交叉熵損失函數。
2.2 實驗指標
借助準確率(Accuracy, A)、模型參數量(Parameters, P)、浮點運算量(FLOPs)評估網絡模型性能。網絡模型參數量與浮點運算量反映了該網絡模型的計算復雜度,準確率客觀反映了模型識別出的所有預測正確樣本數占總樣本數的比重,即直觀反映出網絡模型的性能指標。其計算公式見式(5):
式中:Pc代表花椒葉病害種類被正確預測的樣本數量;PALL代表花椒葉病害測試集的總樣本數量;Af為模型獲得的準確率。
3 實驗結果與分析
為驗證本研究模型對花椒葉病害識別的準確性與實時性,選取AlexNet、VGG16、 ResNet50、GoogleNet、MobileNetV2和EfficientNet B0等網絡模型進行對比試驗。試驗時參數保持不變,對5種網絡都采取相同的遷移學習方式。由表1數據可知,CA-ShuffleNetV2的數據測試集準確率在參與對比模型中略低于EfficientNet B0模型,而CA-ShuffleNetV2的浮點運算量、參數范圍等均遠低于EfficientNet B0模型。相較于其他網絡,CA-ShuffleNetV2用更少的參數量和運算量實現了更高的驗證集準確率。
CA-ShuffleNetV2 模型參數量僅為2.72 MB,浮點運算量為0.15 B。相比于經典分類網絡 VGG16和ResNet50,其模型參數量僅是這些網絡模型參數量的1.97%和11.46%。相較于輕量級網絡MobileNetV2,準確率高出6.1個百分點的同時參數量降低了22.29%。綜上所述,本文提出的CA-ShuffleNetV2網絡模型兼具準確率高、計算復雜度低、易于部署等優(yōu)點。基于以上特點可將其部署于移動端,以滿足使用設備識別花椒葉片病害的需要。
4 結 語
本文基于遷移學習提出并改進了ShuffleNetV2模型,獲得了一種農作物花椒葉片病害識別網絡模型算法。在ShuffleNetV2的基本Inception模塊中插入能兼顧通道特征和位置信息的坐標注意力機制模塊,由此構造出一種改進CA-ShuffleNetV2 網絡模型,并借助遷移學習策略來輔助網絡模型訓練,以獲得檢測精確率。實驗測試結果表明,本文提出的CA-ShuffleNetV2改進網絡模型的葉片病害識別算法能夠有效識別各花椒樹葉片上的害蟲類別,借助自建花椒葉片數據集,使得模型的識別準確率可達92.6%。與對比的同類經典模型相比,本文提出的改進型CA-ShuffleNetV2 網絡模型能夠在較低的模型參數量和浮點運算量前提下,獲得較優(yōu)的識別檢測準確率,可廣泛部署和應用于農作物花椒葉片病害檢測領域。
注:本文通訊作者為王天一。
參考文獻
[1]田晉榮,楊俊杰.花椒產業(yè)發(fā)展與市場前景預測[J].南方農業(yè),2019,13(11):95-96.
[2]李曉莉,黃登艷,刁英.中國花椒產業(yè)發(fā)展現狀[J].湖北林業(yè)科技,2020,49(1):44-48.
[3]任媛媛,翟曉巧,張晨.我國花椒產業(yè)發(fā)展現狀及存在問題和發(fā)展前景[J].河南林業(yè)科技,2020,40(4):31-34.
[4]陳佳娟,紀壽文,李娟,等.采用計算機視覺進行棉花蟲害程度的自動測定[J].農業(yè)工程學報,2001(2):157-160.
[5]徐貴力,毛罕平,李萍萍.差分百分率直方圖法提取缺素葉片紋理特征[J].農業(yè)機械學報,2003(2):76-79.
[6]程鵬飛. 植物病害的圖像處理及特征值提取方法的研究[D].太原:山西農業(yè)大學,2005.
[7] LIU J, LV F, DI H. Identification of sunflower leaf diseases based on random forest algorithm [C]// Proceedings of 2019 International Conference on Intelligent Computing, Automation and Systems (ICICAS). Chongqing, China: IEEE, 2019: 459-463.
[8] CHEN X, ZHOU G, CHEN A, et al. Identification of tomato leaf diseases based on combination of ABCK-BWTR and B-ARNet [J]. Computers and electronics in agriculture, 2020, 178: 105730.
[9] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [J]. Communications of the ACM, 2017, 60(6): 84-90.
[10] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [C]// Proceedings of 3rd International Conference on Learning Representations (ICLR 2015), [S.l.]: [s.n.], 2015: 1-14.
[11] HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition [C]// Proceedings of 2016 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV, USA: IEEE, 2016: 770-778.
[12] SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions [C]// Proceedings of 2015 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Boston, MA, USA: IEEE, 2015: 1-9.
[13] SANDLER M, HOWARD A, ZHU M, et al. MobileNetV2: inverted residuals and linear bottlenecks [C]// Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Salt Lake City, UT, USA: IEEE, 2018: 4510-4520.
[14] TAN M, LE Q V. EfficientNetV2: smaller models and faster training [Z/OL]. (2021-06-23) [2023-12-30]. https://arxiv.org/abs/2104.00298.
[15] RAHMAN C R, ARKO P S, ALI M E, et al. Identification and recognition of rice diseases and pests using convolutional neural networks [J]. Biosystems engineering, 2020, 194: 112-120.
[16] GUAN H, FU C, ZHANG G, et al. A lightweight model for efficient identification of plant diseases and pests based on deep learning [J]. Frontiers in plant science, 2023, 14: 1227011.
[17] ZHANG X, QIAO Y, MENG F, et al. Identification of maize leaf diseases using improved deep convolutional neural networks [J]. IEEE access, 2018, 6: 30370-30377.
[18]朱家輝,蘇維均,于重重.基于卷積神經網絡的農作物葉片病害診斷[J].植物檢疫,2021,35(2):28-32.
[19]項小東,翟蔚,黃言態(tài),等.基于Xception-CEMs神經網絡的植物病害識別[J].中國農機化學報,2021,42(8):177-186.
[20]崔金榮,魏文釗,趙敏.基于改進MobileNetV3的水稻病害識別模型[J].農業(yè)機械學報,2023,54(11):217-224.
[21] MA N, ZHANG X, ZHENG H T, et al. ShuffleNet V2: practical guidelines for efficient CNN architecture design [C]// Proceedings of European Conference on Computer Vision 2018. [S.l.]: [s.n.], 2018: 122-138.
[22] ATILA U, UCAR M, AKYOL K, et al. Plant leaf disease classification using efficientnet deep learning model [J]. Ecological Informatics, 2021, 61: 101182.
[23] ZHANG X, ZHOU X, LIN M, et al. ShuffleNet: an extremely efficient convolutional neural network for mobile devices [C]// Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA: IEEE, 2018: 6848-6856.
[24] SHORTEN C, KHOSHGOFTAAR T M. A survey on image data augmentation for deep learning [J]. Journal of big data, 2019, 6(1): 60.
[25] HU J, SHEN L, ALBANIE S, et al. Squeeze-and-excitation networks [J]. IEEE transactions on pattern analysis and machine intelligence, 2020, 42(8): 2011-2023.
[26] HOU Q B, ZHOU D Q, FENG J S. Coordinate attention for efficient mobile network design [C]// Proceedings of 2021 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Nashville, TN, USA: IEEE, 2021: 13713-13722.
[27] KINGMA D P, BA J. Adam: a method for stochastic optimization [C]// Proceedings of 3rd International Conference on Learning Representations (ICLR). [S.l.]: [s.n.], 2015: 1-15.
作者簡介:周江龍(1999—),男,貴州六盤水人,碩士,研究方向為機器學習、智能圖像處理。
王天一(1989—),男,遼寧錦州人,博士,副教授,研究方向為深度學習、大數據與人工智能。
收稿日期:2024-04-15 修回日期:2024-05-22
基金項目:貴州省科技計劃項目(黔科合支撐[2021]一般176)