范海紅
(浙江郵電職業技術學院,浙江 紹興 312366)
作為世界茶葉大國,茶葉的質量是茶園經濟效益的關鍵。茶葉嫩牙是衡量茶葉產量的重要因素。茶葉嫩牙發育和茶葉病害預防和治療之間有著十分密切的關系。國內對于茶葉病害種類已經記錄了30多種。該種類型的疾病最常見的包括如下四種,即炭疽病、白星病、茶芽疫病和茶環斑病。如何合理預防和控制茶葉病害是保證茶葉品質的關鍵。在實際生產中,茶農大多依靠自己的多年的茶樹種植經驗,或者參考相關資料,利用網絡在線查詢和咨詢專家來識別茶樹病害,但這些這些方法存在許多問題:鑒別能力、時效性等。首先,從發生茶樹病害到發現病害,再到對病害的診斷,最后對病害采取的防治措施的過程可能需要很長時間,而這個期間內,茶葉的病害可能進一步加劇。第二,茶葉種植往往是大面積種植。如果需要確定哪個地區發生了病蟲害,而哪個地區沒有病害問題,這個需要的勞動力成本肯定不低。另外茶樹一般種植在高低起伏不平的山區,同樣也會增加了人工識別的難度。最后,茶農對疾病診斷的相關知識的缺乏,而僅憑主觀經驗容易出現診斷錯誤。總結上述原因,因此傳統的種植方式顯然難以滿足現代農業種植的要求。如何有效地識別和預防這些病害是茶葉界關注的焦點。通過對茶葉病害的識別和分類,能夠給茶園管理人員提供防治依據,具有一定的現實意義。
神經網絡是利用生物神經網絡來近似解決問題的方法,是將神經元連接而成的具有自適應的一種動態網絡。Pitts等人首先提到了神經網絡模型。利用這個模型給出了神經元的數學形式和網絡結構,從而使神經網絡的研究和探索得到了血多研究人員的重視。Rumelhart等人為了解決單層感知器存在的缺點,提出了BP神經網絡的概念,并且把BP神經網絡算法運用到了機器學習理論中去。但神經網絡中里面所包含的參數比較多,訓練的時間比較長,還存在過擬合等問題,Hinton等人提出了深度學習,利用多層神經網絡具有更好的學習能力的特點,無監督訓練的模式來克服深度神經網絡的難度。卷積神經網絡是目前比較常用的深度網絡模型。病蟲害是影響茶葉質量的主要原因之一,而目前主要預防方式是人工去主觀判斷,人工的主觀判斷不可避免的會帶來主觀性和模糊性的問題,使病蟲害無法被有效的識別,從而影響防治效果。所以,怎樣精準快速的認識病害已經變成了一個不可忽視的研究課題。
最近一些年以來,由于機器學習的發展,使用機器學習的理論來對該疾病進行識別的研究已經受到研究人員的關注。王佳平以白星病、葉斑病和葉枯病作為研究對象,運用神經網絡、支持向量機原理和圖像特征提取等方法提出了基于圖像的茶葉病害分類方法。張帥堂利用茶葉病害的高光譜分析,提出了針對病害識別的支持向量機分類模型、隨機森林模型和BP神經網絡模型。
神經網絡其中包含三種,即輸入層、隱藏層以及輸出層。卷積網絡是具有卷積構造特征的一種極為獨特的深度網絡,不僅能夠降低深層網絡的存儲數目以及參數目,并且還能夠緩解過擬合情況。該種類型的網絡不僅具有輸入層以及輸出層,并且其隱藏層主要包括卷積層、池化層、全連接層三個類別。其中前兩種也能夠使用卷積層以及池化層交替等情況多層出現。
卷積層中核心部分為卷積核,通過卷積運算對圖像數據的處理,從而可以提取輸入信號的深層次信息,增強原信號的特征信息,降低噪音數據。主要方式是利用對特征圖和卷積核進行卷積運算z=Wx+b,再利用激活函數x=f(z),得到特征圖。其中,x是第l-1層的輸出信息,W是從第l-1層到第l層的卷積核,b稱為偏移項,f(?)是激活函數。池化層基本上使需要達到對信息的降維,用更顯著的表現形式來展現圖像。其任務主要想要減少冗余信息、增加模型的不變特征并且可以有效的預防過擬合的情況出現。比較常見的池化層運算方式共有以下幾種類型,主要可包括平均值池化算法,最大值池化算法,組合池化算法以及隨機池化算法等。對于全連接層來說,對前面特征逐層提取之后,則可予以分類回歸操作。將二維特征圖轉化為一維數據,并輸入到全連接網絡中。同時通過激活函數進行輸出。通過情況下,主要選用ReLU函數進行操作。基于softmax函數為依托,則可實現分類輸出處理。
工人在對茶葉葉部病害葉片進行人工采摘時,將采摘到的葉片通過人工依次拍照,主要提取包含6類常見的茶葉葉部病害葉片和損傷葉片的圖像。人工采集的圖像由于葉片存在差異,導致采集到的病害圖像的需要進行裁剪處理,選取圖像清晰度比較高的茶葉病害圖像進行切割,可以減少圖像中的干擾信息,同時能夠使得圖像目標區域更加突出和明顯,有利于對圖片的特征提取。因此利用目前所有存在的比較完善的像處理技術來切割圖像,其流程如下圖。

圖像切割處理后,刪除拍攝質量較差的圖像后,把其余所有圖像進行統一尺寸,圖像歸一化為188x188,對圖像數據進行命名,并作為一整個數據集從而得到茶葉葉部病害的部分圖像樣本。
卷積神經網絡適用于大樣本數據。為了避免過度擬合,可以適當增加訓練數據集的數量。Goodflow等人經過研究后,所得出的結論為生成對抗網絡GAN,基于此實現圖像的生成。主要可以分成兩個部分,包括生成器與判別器。在前者的作用下,則可對原始數據的分布狀態進行獲取,并產生新的樣本信息。后者則可作為二分類器,對輸入樣本進行有效區分。DCGAN是在生成對抗網絡模型的基礎上加入了卷積運算過程,從而達到無監督訓練的目的,由于卷積神經網絡模型具有強大的特征提取能力,從而可以達到DCGAN模型的學習能力。因此可以采用GAN來模擬單一背景下生成茶葉病害圖像,擴展樣本數據集。
DCGAN網絡的池化層包含了判別網絡和生成網絡,分別采用了步幅卷積和微步幅卷積。與生成對抗網絡所不同,此網絡是沒有完全連接層和池層,假設輸入維數為一百的均勻分布數據,通過微步幅卷積運算,將一百維的數據轉換為一個64位像素的圖像。
在操作過程中,所應用的即為九層的卷積神經網絡模型,主要由以下幾個部分組成,其中可包含池化層、卷積層、響應規范層、全連接層以及輸出。在試驗期間,為了避免發生過擬合的情況,在全連接層中引入dropout丟棄機制。對于卷積層來說,主要是由多個特征映射層共同構成的,其中包含了較多的神經元。通過卷積濾波器提取圖像的深層次特征數據,并連接卷積核與前層的特征映射,從而增加節點矩陣的深度核增強信號的特征的輸入。由于先前對圖像尺寸歸一化為188×188,選用簡單的卷積核,其大小規格為3×3。選擇數目為16的特征卷積核,所產生的特征圖共計為16個。
由于存在太多特征數據,因而在擬合處理是,容易導致過擬合現象,可以利用池化操作來避免過擬合,我們利用最大池化算法對輸入特征映射的數據特征進行聚合,計算圖像中某區域的特征的最大值,作為特征數據輸出。該層以2的步長選擇最大池化算法處理數據。
為了保證模型具有良好的泛化效果,可將LRN層應用到局部響應規范化層中。LRN層是為了讓具有小反饋的神經元暫時不被使用,從而獲得相對較大的響應值因此通過創造競爭環境來抑制某些神經元,所以局部響應規范化層用于水平抑制激活函數的輸出數據。此外,LRN和ReLU的結合可以擴展ReLU激活函數的優點,并從許多卷積核的響應中獲得較大的反饋。因此,利用局部響應規范化層提高數據峰值,抑制環境因素,提升數據特征,提高效率。
該模型中有2個全連接層,連接所有特征得到輸出值,并輸入到softmax函數中。為了避免實驗中的過擬合現象,則將一個丟棄層連接在全連接層后,修改損失函數和網絡結構實現權值衰減,從而優化神經網絡。
本文采用不同學習速率下的識別精度對比實驗來模擬卷積神經網絡模型對茶葉病害圖像進行識別和分類。通過對卷積神經網絡進行分析后發現,能夠實現分類器訓練與提取圖像特征的同時操作,促使識別精度得到了顯著提升。在操作期間,初始迭代次數為5萬,步長則達到了100,所產生的學習率則可表示為千分之一。選擇不同的學習率進行對比實驗,結果如表1。從表1中我們可以看出,當迭代步數為5萬,學習率為千分之一時,

表1 不同學習速率下的實驗精度(*表示采用丟棄機制)


通過進行實驗研究后,基于DCGAN網絡構成相應的茶葉病害圖像,經過篩選與切割圖像之后,則可產生一定的圖像數據集。然后運用卷積神經網絡模型識別分類茶葉病害圖像。通過隊學習速率、迭代步數的調整和Dropout機制的引入,最終達到了較高的識別精度,有助于茶葉病害的識別和分類。