張建華,陳申寬,張曉振,韓應欣,姜嬌陽
(扎蘭屯職業學院,內蒙古 呼倫貝爾 162650)
隨著農業生產方式的不斷發展和進步,對于農作物種植過程中的病蟲害防治也提出了更高要求。目前,我國已經建立了較為完善的植物病理診斷系統以及相關檢測方法體系,但是由于受到傳統人工操作方式影響,導致部分植物病害難以精準識別,而通過運用智能機器學習算法識別植物葉片病害可以有效提升其應用效率。
目前常用于植物病害識別的方法主要有人工神經網絡(ANN)和支持向量機(SVM)等。
人工神經網絡(ANN)是將大量的樣本輸入到一個神經網絡系統中,通過不斷優化訓練樣本集使模型能更好地適應環境變化。
支持向量機(SVM)是利用大數據挖掘出與目標相關的信息并從中提取出有用特征,然后根據這些特征建立相應的預測模型,從而實現對病害發生規律的分析。由于不同種類的病原菌具有一定差異性,導致其在疾病診斷方面存在較大的差別,因此針對這種情況,相關學者開始嘗試使用多種不同的檢測方式來提高檢測結果的精確度,卷積神經網絡便是其中之一。
該算法需要構建一個全新的圖像識別框架,用以處理多個類別的樣本數據。而且每一次迭代都會將原始數據作為基礎進行重新編碼,以保證分類器可以獲得較好的性能,此外還有其他幾種常見的分類方法,如支持向量機和決策樹等也被廣泛運用于植物病害的診斷工作當中[1]。
目前常用于圖像處理領域的深度學習模型主要有卷積神經網絡(CNN)和循環神經網絡(RNN)等,其中卷積神經網是最為常見的方法。該方法通過對大量數據進行訓練來獲得一個高維特征圖[2],然后利用這個特征圖去預測未知樣本,從而實現對圖像的分類。由于CNN 可以將輸入層和隱含層之間建立起聯系,所以其能夠更好地處理非線性問題,而RNN 具有很好的泛化能力且不需要預先知道每一層的輸出值,因此被廣泛應用于各種復雜場景下的機器學習任務。近年來,隨著計算機技術以及互聯網絡的發展,人們開始嘗試使用其他類型的網絡結構去代替傳統的卷積神經網絡結構,例如LSTM、SVM 等[3]。然而這些網絡結構并沒有得到普遍認可,因為目前還沒有任何一種網絡結構能夠達到完全替代現有的LSTM-ANN-GRU(Long Shortest Memory)網絡結構的程度。為了解決這一問題,一些專家提出了許多新的方法來提取圖像的深層次信息,其中最常用的是深度學習方法,主要通過構建多層前饋網絡從而使得模型具備更強的泛化性能,但是該方法存在著訓練速度慢、計算效率低等缺點[4],具體見圖1。

圖1 基于卷積神經網絡的故障預警過程
隨著計算機技術和大數據分析技術的不斷發展,越來越多的學者開始將機器學習與其他領域相結合。其中最典型也是應用較廣泛的就是深度學習算法,通過對海量的原始數據集進行訓練來實現對大樣本數據的高效處理,從而提高預測精度并且減少人工干預所帶來的誤差,使得該類方法能夠更好地適應于復雜環境下多類別、多尺度的特征分析問題[5]。
有些學者提出了基于遷移學習的分類模型,即根據輸入圖像的空間結構信息構建一個包含大量神經元的多層感知器網絡,然后利用這個網絡提取出每一層神經元之間的連接關系,再用這些連接關系建立一個分類模型用于后續的分類工作,最后利用該分類模型得到最終的分類結果[6]。
目前常用于病害檢測的算法主要有2 種。第1 種是傳統的機器學習方法(ANN 和RNN 等),通過對輸入圖像進行預處理后得到一個二維或三維空間上的特征圖;第2 種則是神經網絡模型,可以根據訓練數據來預測出樣本之間相似性的強弱及其分布情況。其中,第1 種算法利用了大量的原始圖像作為基礎特征集對其進行處理;而第2 種算法則將所有的圖像都看成一系列由許多卷積核組成的線性組合。這2 種方法均能夠有效地提取出圖像中的信息并且具有較高的泛化性能。但無論哪種分類器都存在著一定的局限性,即不能準確地描述復雜的問題,因此文章針對上述2 類網絡結構分別設計了相應的改進策略以提高其應用效果。目前有以下幾種機器學習算法:一是支持向量回歸,二是隨機森林,三是決策樹,四是支持向量機。其中,支持向量回歸和隨機森林主要是對原始數據集進行預處理;決策樹和支持向量機則利用分類器來完成分類任務。通過構建一個包含多棵樹和若干個節點構成的分類模型,然后根據每棵樹的不同屬性以及這些樹之間相互作用、關系等建立一棵完整的分類樹來實現對樣本數據的預測與分類。
目前,常用的機器視覺系統有卷積神經網絡和長短期記憶網絡等。卷積神經網絡是一種多層感知器結構,具有較好的非線性映射能力,該方法能夠通過對輸入圖像進行預處理來獲取目標區域的局部特征。例如,將輸入圖像進行灰度化處理后,再利用高斯濾波器去除噪聲。但是這種預處理過程會使得輸出圖像出現過擬合現象,從而影響到后續的預測精度與準確性。為了提高模型的泛化性能,通常需要多次重復迭代訓練,并采用多個不同類別的樣本來構建模型[7]。
目前,針對上述方法的缺陷,有學者提出了一種基于卷積神經網絡(CNN)和支持向量機(SVM)的植物病害識別系統。該方法通過對輸入圖像進行預處理,提取出特征向量,并將其與疾病診斷相關聯,再使用訓練好的模型來預測出最終的結果。同時,還可以利用這個網絡來對不同類型的病斑進行分類。但是文章認為由于數據集大小以及所需樣本數量等因素的限制,該系統只能適用于小規模的病害檢測,而且也只有少數幾種常見病害能夠被正確地檢測到。此外,該系統對光照條件要求比較嚴格,因此不能很大程度上提高檢測器的準確性。另外,該系統需要大量的樣本作為訓練樣本,所以很難實現大規模的物體檢測[8]。
人工神經網絡是一種模擬生物大腦結構和功能的計算機模型,通過對輸入數據的非線性映射,將大量神經元連接起來形成復雜的非線性系統并實現信息傳遞與處理。目前,人工神經網絡已經被廣泛應用于圖像處理、模式識別等領域。相關學者提出了一種新的卷積神經網絡用以提取圖像的紋理特征,該算法先利用深度學習方法從原始圖片中獲取每個像素點的灰度值,然后根據灰度值構建一個3 層的多層前饋網絡結構來預測目標區域的顏色分布情況,最后使用多尺度融合的方式將3 層網絡連接成更加精細的三維結構,以便對其進行分類或回歸分析。相關學者采用CNN 作為分類器對不同類型的植物病害進行檢測,先用CNN 對不同種類的植物病原菌進行訓練,之后再用RNN-SVM 算法對其進行分類。結果表明,所提的模型能夠很好地處理高維和低維數據集上的問題,并且具有較高的準確性和置信度(均方誤差),而且可以有效降低過擬合現象。此外,由于LSTM 是一種無監督的循環神經網絡,所以相較于其他傳統的機器學習模型擁有更大的泛化能力以及更好的魯棒性。
卷積神經網絡是一種多層前饋型非線性映射模型,通過將輸入圖像與輸出圖像之間的關系用二維數組表示,然后對每個像素點進行卷積運算來提取其特征向量,最后再利用反向傳播算法,從而實現目標函數最大化。卷積神經網絡可以分為2 類:全連接層和部分連接層。其中全連接層又可進一步細分為3 類:第1 類是無監督學習方法,第2 類是有監督學習方法,第3 類是半監督學習方法。由于不同類型的分類器所需的訓練樣本不一樣,因此需要選擇合適的訓練集來獲得最佳的分類結果。目前常用的卷積神經網絡主要包括SVM、KNN 等。其中最為經典也被廣泛使用的是Resnet 50,該網絡能夠有效地處理大樣本數據,并且具有較好的泛化性能以及魯棒性。
卷積神經網絡是將輸入數據映射到一個二維矩陣上并對其做歸一化處理后再進行運算得到輸出結果。該方法具有結構簡單且計算速度快等特點。相關學者引用了一種新的圖像分割算法來實現對不同種類害蟲的檢測和分類。需要使用卷積神經網絡提取出圖像中的每個像素點所對應的顏色信息,然后通過特征提取模塊(FPNs)對這些特征向量進行降維操作以獲得更加準確的類別標簽。相關學者利用卷積神經網絡建立了一個包含3×3 層的卷積神經網絡模型,用于區分玉米螟與棉鈴蟲兩種昆蟲的差異。相關學者用CNN 作為框架結構來構建卷形編碼器。還有其他學者采用深度學習模型來提高模型的泛化能力。
遷移學習是一種通過對原始數據集中的特征向量進行降維處理來提高分類精度的方法。該類方法需要將原始數據集轉換為低維空間并構建相應的模型,然后利用這類模型預測未知樣本的分布情況,從而實現高精度的分類任務。
遷移學習是一種將多個不同來源和處理方式的原始數據集通過某種機制結合到同一個目標上的新一代機器學習方法。該方法主要有以下幾點:一是對輸入樣本進行預處理,二是利用訓練好的模型對其分類,三是用測試結果驗證模型的有效性。其中,前2 點為基礎,最后1 點則需要根據實際情況選擇合適的參數來實現。由于不同種類的病菌具有差異化特征,因此文章采用了多種不同的網絡結構來構建模型。
隨著科技的進步和社會經濟水平的提高,人們越來越重視信息技術在農業生產過程中的作用。目前,對于人工智能在植物葉片病蟲害識別方面還存在一些不足之處。一方面,主要是受到傳統人工經驗和知識的影響,導致其無法準確地判斷病害類型。另一方面,由于缺少相應的理論基礎,使得其不能有效預測未來可能出現的問題,從而造成了一定程度上的誤判。為了解決這些問題,需要進一步完善相關的理論體系,并加強對人工智能技術應用于植物葉片病蟲害識別領域的研究與實踐,以便更好地推動我國農業現代化建設進程。