□文/譚智峰 賀志磊 張磊 苗娟
關鍵字:深度學習;病蟲害;圖像識別

農作物病蟲害是影響農業生產和糧食安全的重要因素之一。及時、準確地識別和監測農作物病蟲害,采取有效的防控措施,對保護農作物健康有重要的作用。隨著深度學習技術的迅速發展,基于深度學習的農作物病蟲害識別正成為農業智能化的重要研究焦點[1]。
深度學習技術在農作物病蟲害識別中的應用已經取得了顯著的進展,對于提高農作物病蟲害早期檢測和精準診斷具有重要意義。以下將介紹幾個典型的深度學習模型在農作物病蟲害識別上的應用。
首先,卷積神經網絡(CNN)模型是最常用的深度學習模型之一,在農作物病蟲害識別中取得了重要成就。通過多層卷積和池化操作,CNN 模型可以自動從圖像中提取關鍵的特征信息。如ResNet、Yolo 系列等經典的CNN模型在農作物病蟲害識別任務上取得了良好的效果。
其次,循環神經網絡(RNN)模型被應用在農作物病蟲害識別預測中。RNN 模型能夠處理時序信息,適合于處理農作物病蟲害的時間序列數據。長短期記憶網絡(LSTM)和門控循環單元(GRU)等RNN 模型在農作物病蟲害分類和預測方面取得了不錯的結果。
此外,融合模型和遷移學習在農作物病蟲害識別中也得到了廣泛應用。融合模型結合多種深度學習模型或特征提取方法,充分利用各自的優勢來提高分類準確率。遷移學習則是將已經訓練好的深度學習模型應用于新的農作物病蟲害識別任務上,通過調整參數或微調網絡來適應新的數據集,提高分類效果。
基于深度學習的農作物病蟲害圖像處理流程通常包括圖像獲取、數據預處理、網絡模型構建與訓練,以及結果評估和應用四個主要步驟。流程如下圖所示。

(一)圖像獲取。目前絕大多數深度學習研究所采用的數據集規模龐大,圖像的數量達到數千,甚至上萬[2]。基于深度學習的農作物病蟲害圖像識別研究中涉及的數據集獲取主要分為兩類:一類是自主獲取,另一類來源于公開數據集。
1.自主獲取。主要包括使用高分辨率相機或智能手機進行拍攝,從互聯網獲取并進行裁剪合成,以及借助高光譜成像儀捕獲圖像或運用農業互聯網傳感器收集昆蟲數據信息。
2.公開數據集。目前網絡上有非常多公開的農作物病蟲害識別數據集,如農業病蟲害研究圖庫(IDADP)是由中國科學院合肥智能機械研究所牽頭,整合了大量的農業病蟲害圖像樣本資源,每種病蟲害具有幾百到幾千張高質量圖像。該數據集數量最大,作物類別、病蟲害類別最齊全,數據量超過200G,包括水稻、小麥、玉米等作物。以水稻為例,提供了水稻白葉枯病、水稻稻曲病等病害,東方螻蛄、稻蝗、稻棘緣蝽等十幾種蟲害的數據。AI Challenger 2018 病蟲害分類數據集,這個數據集是AI Challenger 2018競賽的數據,包含10種不同植物(蘋果、櫻桃、番茄、辣椒、玉米、馬鈴薯等)的5萬張圖像數據集,27 種不同的病害,總共有61 個分類,分類基于“物種-病害-程度”來劃分。Large Wheat Disease Classification Dataset (LWDCD) 小麥病害分類數據集,包含12000張照片,其中9個病害類別和1個健康類別[3]。
(二)數據預處理。為了實現最優的識別效果,在將圖像輸入深度學習模型之前,通常需要對圖像進行預處理。其中,圖像的亮度、對比度等屬性在圖像識別方面具有顯著影響,不同亮度和對比度下的相同物體差異很大。農業病蟲害圖像檢測識別中常遇到陰影、光照等因素,這些因素不應該影響最終的識別結果,因此需要對圖像進行預處理,使實驗結果盡可能減少無關因素的影響。
(三)網絡模型構建與訓練。常用的模型包括卷積神經網絡(CNN)、循環神經網絡(RNN)和融合模型等。模型的構建一般分為網絡結構設計、參數初始化和損失函數選取等步驟。然后,使用已標注的訓練集對模型進行訓練,利用梯度下降等優化算法來不斷調整網絡參數以最小化損失函數。訓練過程中需要控制模型的過擬合問題,可以采用正則化、dropout等技術來提高模型的泛化能力。
(四)結果評估和應用。在模型訓練完成后,需要對其性能進行評估。通常會使用測試集中的圖像進行預測和分類,并計算準確度、召回率、精確率以及F1-score等指標來評價模型的表現。如果模型達到了預期的性能要求,就可以將其應用于實際農作物病蟲害識別場景中。
(一)復雜的環境因素。由于農田環境復雜,變化多樣,例如農作物遮擋、灰塵等因素,這些因素會對圖像數據采集產生帶來困難。從而導致數據集的質量不高,使得直接將深度學習技術應用于田間變得困難[4]。
(二)模型優化問題。在開發深度神經網絡模型時,提高模型的識別準確率是至關重要的目標。這要求模型能夠有效地提取數據的特征信息,并且需要進行理論分析以確保模型的穩健性。同時,深度神經網絡模型的架構也需要進一步研究,以適應不同的應用問題,研究人員正在積極嘗試新的模型架構。
(三)研發及推廣成本問題。深度學習技術現在主要在學術和工業領域中應用。將深度學習技術應用于農業領域時,成本問題是一個重要考慮因素。深度學習模型的研發需要大規模樣本數據和GPU 資源。與傳統檢測方法相比,使用深度學習技術的成本明顯增加。
深度學習技術在農作物病蟲害識別領域已經取得了重要的成果,但仍然存在一些挑戰和改進空間。未來的發展趨勢將集中于以下幾個方面:
(一)數據增強與模型優化:在農作物病蟲害圖像數據不足或不平衡的情況下,如何通過數據增強策略來擴充和改善數據集,以提高模型的魯棒性和泛化能力,將是一個重要的研究方向。此外,還需要對現有的深度學習模型進行優化,設計更加輕量級和高效的網絡結構,以滿足實時性和計算效率的要求。
(二)聯合學習和遷移學習方法:聯合學習是一種多任務學習方法,在農作物病蟲害識別中可以通過同時學習多個相關任務(如病害分類、病程監測等)來提高整體性能。遷移學習則是將在大規模數據集上訓練好的模型參數應用于新的農作物病蟲害識別任務中,以加速模型的收斂速度和提升性能。
(三)結合傳感器技術進行無監督學習:傳感器技術可以實時采集和監測農作物的物理和生理信息,結合深度學習,能夠更全面地了解農作物的生長和病蟲害情況。這種結合可以提供更為準確的農作物病蟲害監測和預警能力。
總之,未來發展的方向將是進一步提高農作物病蟲害識別和預測的準確性、實時性和可操作性。深度學習技術將與其他技術結合,構建完整的農業智能化系統,為農民提供實用、快速和精確的農作物病蟲害管理工具,推動農業可持續發展。
本文介紹了基于深度學習的農作物病蟲害識別的應用情況。通過深度學習算法,特別是卷積神經網絡(CNN)和循環神經網絡(RNN)模型在農作物病蟲害識別任務中表現出較高的準確率和魯棒性,有助于及早發現病蟲害問題并采取有效的防治措施。但深度學習農作物病蟲害識別領域仍面臨一些挑戰。數據集的不平衡和缺乏多樣性,模型的泛化能力與實時性等問題仍需要進一步解決。未來的研究可以從優化數據集的構建與擴充,設計輕量級且高效的深度學習模型,加強深度學習與傳感器技術的結合等方面入手,以提高農作物病蟲害識別的準確性、實時性和可操作性。