郭 棟,葛黎黎
(1.山西省氣象服務中心,山西 太原 030002;2.山西省氣象信息中心,山西 太原 030006)
在農業生產領域當中,病蟲害問題直接影響到農業生產的產量以及糧食質量安全。根據最新的糧食及農業組織報告,當前每年都會有超過四成的自然損失是由于農業種植和生長過程中出現了病蟲害問題[1]。當前病蟲害的類型眾多,通過傳統人工觀察結合識別經驗的方法很容易造成對病蟲害的錯誤診斷,進而采用錯誤的治理方法,不僅會造成人力、物力以及生產成本的損失,同時也無法達到預期對農作物治理的效果[2]。同時,由于當前農業技術人員缺乏經驗和對各類現代技術的實踐應用的能力,在農作物種植過程中很難對病蟲害問題進行及時識別和預警。針對這一問題,農業生產領域的研究人員開展了深入的探究,但現有病蟲害的識別方法大多是在現場應用,無法實現對農業種植現場圖像的傳輸,更無法實現從圖像上對病蟲害問題進行識別。當前計算機視覺技術以及機器學習技術得到了快速的發展,并應用到了眾多領域當中[3]。作為智慧農業的重要構成,通過現代化的技術可以實現對農業病蟲害圖像數據的采集、分析和處理,進而建立相應的學習模型,實現對圖像的特征提取,從而為農業病蟲害的防治提供更有利的技術條件。基于此,本文嘗試應用機器學習中的遷移學習技術,針對智慧農業,對其病蟲害圖像識別方法進行設計研究。
為實現對農業智慧生產過程中病害圖像的精準識別,需要在開展識別方法設計前,進行農作物病蟲害圖像的專項獲取。將此過程劃分為兩個步驟,具體內容如下。
通過不同渠道獲取的圖像或不同類別的圖像在表征層面存在一定的雷同性,因此可根據現有的圖像資源,構建一個針對農作物病蟲害的圖像數據庫,進行所獲取圖像與局部圖像的匹配,匹配圖像中的機械損傷部位、病害部位,通過此種方式,初步獲取農作物病蟲害圖像。
在此基礎上,劃分農作物病蟲害圖像的類別,根據病蟲害的類別,將其劃分為m種,每個類別中的圖像數量應控制在4 000.0張~6 000.0張范圍內。
將農作物病蟲害圖像中的局部病害作為測試目標,人工使用拍照的方式進行圖像細部信息獲取。拍攝時,將A4紙作為背景,使用常規的拍攝工具進行圖像獲取,將按照上述處理后的圖像進行主動獲取,將對應的圖像與數據庫中現有的圖像進行匹配,參照病害類別進行圖像的精準分類,并以此為依據,將對應的圖像導入建立的測試模型中,使用模型的細部操作工具,進行該圖像的預處理[4]。處理時,應根據輸入圖像的標準,進行邊緣尺寸的調整,按照實際要求對整體圖像進行裁剪與分割,分割的方式包括兩種,分別為224.0 ppi×224.0 ppi與299.0 ppi×299.0 ppi,為避免所獲取的圖像存在模糊性問題,可在上述處理基礎上,進行圖像背景的增強化處理,輔助使用Python工具,進行所獲取圖像的翻轉、剪切等處理方式,以此種方式確保所獲取的圖像具有清晰性特征。
在完成對農作物圖像的獲取后,為了確保對病蟲害圖像識別的精度,引入遷移學習技術,并建立圖像識別訓練模型。在滑動窗口當中輸入上述獲取到的圖像,并對其進行掃描,通過計算圖像與網格參數的操作,提取圖像的特征圖圖表,并通過激活函數構建下一層特征圖矩陣,其輸出的特征表達式為:

公式(1)中,yn+1表示為在n+1層輸出的特征結果;yn表示為在第n層輸出的特征結果;w表示為權值;bi表示為n層與n+1層之間存在的偏置指數。根據上述公式,確定圖像識別訓練模型的基本層次結構[5]。將該模型結構導入到遷移學習框架當中,對其進行訓練,遷移學習框架如圖1所示。

圖1 圖像識別訓練模型的遷移學習框架
在訓練過程中,為了防止模型出現過擬合現象,應用歸一化和干擾標記兩種方法對其進行優化,最后框架輸出的結果即為圖像識別訓練模型。
完成上述研究后,引進Incption-M3模型,使用此模型進行農作物病蟲害圖像的處理。處理時,將圖像置于一個維度降低的處理空間內,對相關信息進行聚類,為確保對農作物病蟲害圖像中特征信息聚類的完善性,需要在此過程中做好對網絡寬度與資源深度的平衡性處理。利用Incption-M3模型中的最小卷積核,對所獲取的圖像進行線性表達,表達后根據圖像的逐點卷積性能,進行參數特征量的計算[6]。通過此種方式,提取關鍵節點參數輸出通道,當參數輸出通道可以在卷積網絡中量化為具體值時,使用縮小版的net網絡,對圖像特征進行識別。識別時設定一個超參數,進行卷積配置,當實現參數的全連接或全匹配后,輸出匹配點的參數數值,即可將其作為農作物病蟲害特征。按照上述處理方式,逐點進行參數特征的匹配,從而實現對病蟲害圖像中特征點的精準識別,以此完成圖像識別方法的設計。
為了進一步驗證本文上述提出的識別方法在實際應用中的可行性,選擇將農業病蟲害研究圖庫當中的IDADP作為實驗的測試圖像。為了確保最終得出的實驗結果具有對比性,選擇將基于CNN的識別方法作為對照組,將本文提出的基于遷移學習的識別方法作為實驗組,將兩組識別方法應用到相同測試圖像上,并實現對其病蟲害問題的識別。針對獲取到的測試圖像,還需要對其進行篩選和處理,選擇在露天或大棚場景中,且在自然光照射條件下拍攝的圖像,圖像的拍攝角度應當能夠使光路盡可能垂直于農作物的器官所在平面,以此確保農作物的器官均勻受光,并且農作物應當盡可能在圖像中央位置。已知拍攝圖像的攝像機分辨率為6 000 ppi×4 000 ppi和 5 472 ppi×3 648 ppi兩種。在完成對測試圖像的選擇后,針對圖像中農作物實際病蟲害問題,對其進行分類,大致劃分為正常葉片類型、炭疽病類型、黑斑病類型和褐斑病類型,共四種,為了方便論述分別編號為類型A、類型B、類型C和類型D。四種類型的圖像均選用6 000 ppi×4 000 ppi的高分辨率圖像,圖像的數量均為150張。利用兩種圖像識別方法對測試圖像進行識別,記錄最終的識別結果,并繪制成表1。

表1 實驗組與對照組識別方法識別結果記錄表
從表1中記錄的識別結果可以看出,實驗組識別方法得出的結果與實際測試圖像當中病蟲害類型完全相同,而對照組識別方法得出的識別結果與實際病蟲害類型相差較大,并且存在未得出識別結果的圖像,且數量較多。因此,通過上述得出的實驗結果可以初步證明,本文提出的基于遷移學習的識別方法在實際應用中能夠實現對農業病蟲害圖像的準確識別,其識別精度高達100%。
為了進一步探究本文識別方法的適應性,分別針對上述測試圖像中兩種不同分辨率的圖像進行病蟲害識別,仍然將基于CNN的識別方法作為對照組,對比兩種識別方法在不同分辨率下對圖像中病蟲害識別的速度。識別速度的計算公式為:

公式(2)中,ν表示為識別方法對圖像中病蟲害識別的速度;t1表示為識別開始時間;t2表示為識別結束時間;s表示為規定識別時間中的圖像識別個數。根據上述公式,計算得出實驗組和對照組兩種識別方法的識別速度,并將結果記錄見表2。

表2 實驗組與對照組病蟲害圖像識別速度記錄表
從表2中得出的實驗結果可以看出,實驗組識別方法在分別對兩種不同分辨率圖像進行識別時,其識別速度均在18~20張/s范圍內,而對照組識別方法在對6 000 ppi×4 000 ppi分辨率圖像識別時其識別速度為11~12 張/s,而對 5 472 ppi×3 648 ppi分辨率圖像識別時識別速度明顯降低。因此,通過上述得出的實驗結果進一步證明,實驗組識別方法能夠具備更快的識別速度,并且識別速度不會受到圖像分辨率的影響。綜合上述,兩組實驗得出的結果綜合證明,本文提出的基于遷移學習的識別方法在實際應用中能夠實現對病蟲害圖像準確識別,并且能夠在保證識別精度的前提條件下提升識別速度,且識別速度不會受到外界條件因素影響。
本文嘗試將遷移學習技術應用到圖像識別方法中,為了滿足智慧農業要求,利用該方法對病蟲害圖像進行識別,并結合實驗的方式驗證了該方法的實際應用效果。在實際應用中,本文提出的圖像識別方法能夠有效解決由數據采集難度大、標注成本高等問題而造成的農作物病蟲害問題識別精度低的問題。同時,通過對本文識別方法的應用能夠進一步降低對農作物圖像采集和人工識別的工作量,促進智慧農業的進一步完善。