路 陽 ,郭 丹 ,沈 賀 ,李 欣 ,韓正君
(1黑龍江八一農墾大學電氣與信息學院 黑龍江 大慶 163319)
(2內蒙古自治區額爾古納市公安局 內蒙古 額爾古納 022250)
(3中國移動北京公司 北京 100007)
水稻是我國主要糧食作物之一,北方寒地水稻種植過程中,常常發生多種病害,其中稻瘟病、紋枯病對水稻產量影響最為嚴重,其次為惡苗病、葉鞘腐敗病和立枯病。這些病害造成了水稻品質下降和嚴重的經濟損失。現階段水稻病害的識別主要是通過人工觀察的方法,但此方法效率低,容易出現誤診并延誤最佳診斷時間,影響了水稻病害防治的準確性和時效性[1]。
隨著圖像處理技術和人工智能技術的發展,國外從60年代起開始研究系統控制理論在害蟲治理中的應用問題。Girshick等[2]使用基于HIS的顏色共生矩陣和Canny邊緣檢測算子獲取紋理特征,并使用廣義二乘矩判別式分類器進行柑桔病害的識別。Hitimana[3]采用圖像處理技術從形狀特性角度建立了識別參數對咖啡葉子病害進行了自動判斷與識別。為了提高作物病害診斷效果,許多學者研究了基于機器學習方法的作物病害自動診斷與識別。如黃雙萍等[4]基于深度卷積神經網絡GoogleNet模型對水稻穗瘟病檢測,預測準確率達到92%。李長纓等[5]利用計算機視覺技術實現對溫室植物生長的無損監測。這些模式識別技術提高了病害診斷的自動化水平,但在特征提取及泛化能力方面還存在一定的局限。
2006 年,Hinton等人首次提出深度信念網絡的概念,標識著深度學習的誕生,引起機器學習研究的第二次浪潮。在目標識別中,深度學習方法已經獲得了比傳統分類算法更好的性能。如深度神經網絡(DNNs)已經被應用到精神分裂癥的全腦靜態FC的分類中。Sidong Liu等應用深度學習理論對老年癡呆癥進行早期診斷。為了提高分類性能,Ren等提出了一種新的最大邊緣多模式深度神經網絡(3mDNN),以利用圖像的多個局部描述符。與標準算法相比,這種方法考慮到多個描述符的信息,在學習多層非線性特征中表現出區別能力。文獻中,Szegedy指出,由于DNNs具有捕獲目標位置等幾何信息的強大能力,DNNs已經被廣泛用于檢測,并表現出卓越的性能。深度信念網絡(DBN)已經廣泛用于目標檢測任務中。例如,我們可以用圖像檢測找出醫學圖像中可能異常的組織或細胞。Abdel-Zaher等使用基于DBN計算機輔助診斷(CAD)系統對乳腺癌早期檢測,取得非常好的效果。
深度學習方法通過組合多個非線性處理層對原始數據特征進行淺層到深層的逐層抽象用于診斷識別。具有以下優點:1)“深層”模型結構:與其他淺層模型相比,深度學習模型的多層結構與大腦的視覺處理系統非常相似,深度學習模型擁有更多的隱層,更多的非線性變換,這使得深度學習擬合復雜模型的能力大大增強。2)多層數據特征表示:深度學習模型可以直接輸入圖像,之后將當前層的輸出作為下一層的輸入,逐層堆疊,由此得到更高級的特征,更清晰刻畫原始輸入的復雜數據結構。
本文將利用深度學習模型對無標簽的水稻病害圖像數據進行訓練,提高稻瘟病、紋枯病、惡苗病、葉鞘腐敗病及立枯病等水稻病害診斷的智能化和自動化水平。
部分水稻病害圖像在田間自然光照條件下,使用佳能EOS 5D Mark Ⅲ (EF24–70mm F2.8L Ⅱ USM)數碼相機獲取。針對北方寒地水稻生長中期葉部分別采集稻瘟病、紋枯病、惡苗病、葉鞘腐敗病及紋枯病等病害圖像。部分水稻病害圖像從《水稻病蟲害防治圖解》、《北方水稻病蟲害防治彩色圖譜》等圖書中掃描獲取。每種病害采集200幅圖像,共采集2000幅圖像,每幅圖像采用JPG格式存儲并歸一化處理為64╳64大小。采集的原始水稻病害圖像預處理后如圖1所示:
由于采集的水稻病害原始圖像數據量非常大,不利于計算機處理,因此采用PCA(Principal component analysis)主成分分析方法對水稻病害圖像數據進行降維。在降維之前,首先對水稻病害圖像進行均值化處理,即對水稻病害圖像每個特征維,通過除以每維的最大值,得到該維的平均值,再減去該維的平均值,從而將不同維的數據范圍歸一化到同一范圍。
然后根據下述公式求出降維后的各個向量的方向和原先的樣本在新的方向上投影后的值。其中表示原始圖像,為圖像像素總數,為在方向上的投影。

這種預處理后,利用PCA使得每個圖像由64*64*3=12288維降低到400維,保留了97%的主要成分,同時大大加快了訓練速度。
本文設計的深度網絡結構,主要包括4個卷積層、3個Pooling層和1個全連接層、線性修正單元層以及標志所屬類別的輸出層。網絡最后一個全連接層的輸出需要設置為類別數,輸入水稻病害圖像尺寸為96╳96╳3。輸出屬于每種病害的概率值。選擇網絡結構中的全連接層作為要提取的病斑特征層,使用的網絡結構如圖2所示。

圖1 水稻葉部主要病害圖像Fig.1 Image of main leaf disease in Rice

圖2 深度網絡模型結構Fig.2 Deep network model structure
本文卷積神經網絡搭建在深度學習框架Caffe上,Ubuntu14.04操作系統,模型的訓練以及整體測試過程在Matlab 平臺上進行。
Caffe深度學習框架中,train_val.prototxt文件定義了深度網絡結構、訓練集和驗證集,Solver.prototxt文件定義了訓練網絡所需的網絡參數,deploy.prototxt用于提取病斑特征。通過反復試驗,深度網絡模型中最優各項參數為:

使用上述參數構建深度網絡,然后從建立的水稻病害圖像數據庫中隨機選取60%樣本來訓練,40%用于測試,采用10重交叉驗證方法,水稻葉部主要病害識別結果如表1所示。從表中可以看出深度網絡結構對水稻葉部病害平均識別率達到96.9%,而SVM方法與BP方法的識別率分別為86.4%和89.3%,在訓練時間上,深度網絡所需的時間為78ms,低于SVM方法的81ms和BP方法的85ms,結果表明深度網絡結構方法針對水稻葉部病害的識別準確率比較高。

表1 水稻病害識別結果Table 1 Rice disease recognition results
本文針對寒地水稻稻瘟病、紋枯病、惡苗病、葉鞘腐敗病及立枯病等主要病害,建立水稻病害圖像數據庫并使用PCA方法降維,基于深度學習方法研究了水稻病害的識別技術,通過10重交叉驗證,平均識別率達到96.9%,優于常見的SVM模型和BP模型。