王旭啟+張善文+王獻鋒
摘要:針對作物病害識別的復雜性,提出一種基于不變矩(invariants moments,IM)算法的病害識別方法。對作物病害葉片圖像進行不變矩特征提取,采用最近鄰分類器對作物病害葉片進行識別。以芹菜病害葉片為材料,進行病害識別,結果表明,該方法是有效可行的。
關鍵詞:作物病害葉片;特征提??;不變矩;最近鄰分類器
中圖分類號: TP391.41文獻標志碼: A文章編號:1002-1302(2014)06-0378-02
收稿日期:2013-10-09
基金項目:國家自然科學基金(編號:61272333);陜西省教育廳自然科學研究項目(編號:2013JK887)。
作者簡介:王旭啟(1976—),男,河南遂平人,碩士,講師,從事模式識別研究。E-mail:wjdw716@163.com。作物病害是限制我國農業生產的重要因素。由于作物病害造成的損失巨大,所以作物病害檢測一直是農業科技工作者的研究重點。實際生產中,農民及農業科技工作者主要依靠自身經驗診斷作物病害,這種診斷方法的識別能力有限,通常在作物病害程度比較重時才能識別,而且費時費力,嚴重影響作物病害預報準確率。絕大多數作物病害會通過葉子表現出來,因此基于作物葉片癥狀的作物病害識別方法是研究熱點之一。近年來,學者們對作物病害識別及檢測方法進行了廣泛研究,通過對農作物病害圖像進行預處理,提取病害特征參數,使用不同分類器達到智能識別的目的[1-6]。程鵬飛從顏色、紋理兩方面人為地選擇合適的病害分類特征參數,利用模糊K近鄰法建立分類器對植株葉片進行模式識別,但人為選擇特征參數會影響植物病害的識別準確度[7]。田有文等探討利用SVM對黃瓜病害進行分類,提取黃瓜葉片病斑的形狀、顏色、質地、發病時期等特征作為特征向量,利用SVM分類器,選取4種常見核函數,以Matlab7.0為平臺對10類常見病害進行識別,結果表明,SVM方法在處理小樣本問題時具有良好的分類效果[8]。祁廣云等應用改進的GA訓練BP神經網絡實現了大豆葉斑病病斑區域的提取,結果表明,應用該方法識別病斑區域的準確率達90%,克服了彩色直方圖熵法分割病斑圖像不清晰的弊端[9]。由于病害葉片形狀、顏色的復雜性,導致很多作物病害識別方法及技術不能滿足自動化作物病害檢測系統的需要。本研究提取作物病害葉片的不變矩分類特征,利用最近鄰分類器對作物病害進行檢測,旨在為作物病害識別提供一種新方法。
1作物病害葉片圖像特征提取
不變矩作為復雜圖像的分類特征被廣泛應用于二維圖像識別領域。有學者由二維圖像幾何矩的非線性組合推導出了7項具有旋轉、平移、尺度不變性的不變矩,并且證明了這些矩保留了數據的分類信息[10]。具體算法如下:
對于二維圖像f(x,y),其定義域為C,它的p+q級矩定義為:
Mpq=∫Cxpyqf(x,y)ds。(1)
實際應用中人們經常采用離散化形式來近似計算圖像的p+q級矩:
Mpq=∑(x,y)∈Cxpyqf(x,y)。(2)
圖像的中心距μpq定義為:
μpq=∑(x,y)∈C(x-x)p(y-y)qf(x,y)。(3)
式中,x=M10M00,y=M01M00。
對μpq進行正則化得:
ηpq=μpq/μγ00。(4)
式中,γ=p+q+1為正則化因子,p、q為正整數。
利用ηpq可以計算以下7個不變矩:
Hu1=η20+η02,(5)
Hu2=(η20-η02)2+4η211,(6)
Hu3=(η30-3η12)2+(η03-3η21)2,(7)
Hu4=(η30+η12)2+(η03+η21)2,(8)
Hu5=(η30-3η12)(η30+η12)[(η30+η12)2-3(η03+η21)2]+
(3η21-η03)(η21+η03)[3(η30+η12)2-(η03+η21)2],(9)
Hu6=(η20-η02)[(η30+η12)2-(η03+η21)2]+
4η11(η30+η12)(η03+η21),(10)
Hu7=(3η21-η03)(η30+η12)[(η30+η12)2-3(η03+η21)2]+
(3η12-η30)(η21+η03)[3(η30+η12)2-(η03+η21)2]。(11)
這些不變矩組成的向量[Hu1,Hu2,…,Hu7]對于平移、旋轉、比例尺變化具有保持不變的性質,因此可以作為作物病害葉片圖像的分類特征,對作物病害葉片進行識別。
2結果與分析
本研究以芹菜病害葉片作為研究對象,針對高發病率且具有顯著危害的斑枯病、灰霉病、葉斑病、霜霉病進行病害識別。利用圖像采集系統,選擇光照強度適中的時間拍攝病害葉片,從發病初期開始直至病情非常嚴重時期,平均每隔2 d采集1次病葉圖像。拍攝前調節相機白平衡,確保拍攝到的作物葉片圖像顏色盡量接近葉片本身的顏色。利用Matlab軟件中的‘rgb2gray 提取分割后病斑圖像每點像素的R、G、B值,將病斑圖像轉換為灰度圖像:
Gray=0.299R+0.587G+0.114B。(12)
采集到芹菜4種病害葉片樣本的灰度圖像如圖1所示。從斑枯病、灰霉病、葉斑病、霜霉病4種病害葉片數據庫中各選擇100幅葉片。從圖2可以看出,同種病害的葉片之間差異很大,利用經典的模式識別方法對芹菜病害葉片進行識別的識別率不高。因此,本研究利用不變矩作為病害的識別特征,對芹菜病害進行識別。
將所有葉片圖像劃分為訓練集與測試集,訓練集用于訓練最近鄰分類器,測試集用于測試算法的性能。本試驗從斑枯病、灰霉病、葉斑病、霜霉病每種病害100幅葉片中分別隨機分配n幅圖像作為訓練集,其余作為測試集。首先利用最大方差法[11]對每幅黃瓜病斑葉片進行分割,得到黃瓜葉片的病斑圖像。將每幅圖像轉換成灰度圖像Gray,再利用公式(1)至公式(11)計算灰度圖像Gray的7個不變矩,由此組成1個特征向量X=[Hu1,Hu2,…,Hu7]。計算每種病害的訓練集中病害葉片特征向量的平均值,分別記為Mi(i=1,2,3,4)。對于待分類的葉片圖像特征向量X,計算X到每個模式類均值Mi的歐氏距離平方‖X-Mi‖2,然后把X判別至距離最小的類。
‖X-Mi‖2=(X-Mi)T(X-Mi)=XTX-2MTiX+MTiMi。(13)
由于公式(13)的第1項與i無關,所以可以將公式(13)的第1項去掉,整理成1個線性判別函數:
MTiX-12MTiMi=ΔTiA。(14)
式中:Δi=Mi
-12MTiMi,A=X
1。
在識別過程中,要求取ΔTiA最小值對應的下標病害類別,也是本測試樣本所屬的病害類別。
重復50次上面葉片圖像的劃分及病害識別試驗,記錄每次試驗中識別率的最大值,再計算50次試驗識別率最大值的平均值,作為基于不變矩(invariants moments,IM)算法的識別結果(表1)。為了比較,表1還給出了基于PCA+PNN、神經網絡(ANN)、貝葉斯方法(Bayesian)[12]等植物病害識別方法的識別結果。
表1芹菜病害識別結果
識別方法識別率(%)訓練樣本30個訓練樣本40個訓練樣本50個PCA+PNN72.48±2.53 75.30±2.3580.28±2.55ANN70.38±2.43 74.22±2.30 78.97±2.36Bayesian74.41±2.75 79.46±2.3881.27±2.15IM79.14±2.87 81.17±2.7985.50±2.41
由表1可以看出,IM算法的識別率最高,這是由于IM算法的不變矩分類特征具有旋轉、平移、尺度不變性,有利于病害分類、識別。所有算法的識別率都隨著訓練集中樣本數的增多而增加,這是由于訓練樣本越多,得到的識別特征越穩定。試驗過程中還發現,本系統對于芹菜病害的識別率不高,這是因為發病初期病斑較小、癥狀較輕,葉片的完整度與無病害情況相似,發病后期無論哪種病害,葉片都出現大面積干枯、壞死,并且病斑顏色也從最初的綠色逐漸變成灰褐色,甚至出現病葉萎縮,給病害分割帶來困難,導致后期特征提取差別不明顯。一般情況下可以通過增大訓練樣本量的方法提高識別精度。
3結論
本研究針對病害葉片圖像的復雜性,提出了一種基于不
變矩的病害識別方法。本方法能夠得到病害葉片的分類特征,利用最近鄰分類器進行病害識別。本方法識別率高,不足之處是不變矩對圖像的描述太過籠統,沒有反映作物病害葉片的細節,而且計算量較大。所以,筆者下一步研究方向是挖掘簡單魯棒的作物病害葉片分類特征。
參考文獻:
[1]Camargo A,Smith J S. An image-processing based algorithm to automatically identify plant disease visual symptoms[J]. Biosystems Engineering,2009,102(1):9-21.
[2]Pydipati R,Burks T F,Lee W S. Statistical and neural network classifiers for citrus disease detection using machine vision[J]. Transactions of the ASAE,2005,48(5):2007-2014.
[3]姜淑華,田有文,孫海波. 農作物病害危害程度自動測定與分級的研究[J]. 農機化研究,2007(5):61-63.
[4]柴阿麗,李寶聚,石延霞,等. 基于計算機視覺技術的番茄葉部病害識別[J]. 園藝學報,2010,37(9):1423-1430.
[5]李波,劉占宇,黃敬峰,等. 基于PCA和PNN的水稻病蟲害高光譜識別[J]. 農業工程學報,2009,25(9):143-147.
[6]岑喆鑫,李寶聚,石延霞,等. 基于彩色圖像顏色統計特征的黃瓜炭疽病和褐斑病的識別研究[J]. 園藝學報,2007,34(6):1425-1430.
[7]程鵬飛. 植物病害的圖像處理及特征值提取方法的研究[D]. 晉中:山西農業大學,2005.
[8]田有文,牛妍. 支持向量機在黃瓜病害識別中的應用研究[J]. 農機化研究,2009(3):36-39.
[9]祁廣云,馬曉丹,關海鷗. 采用改進遺傳算法提取大豆葉片病斑圖像[J]. 農業工程學報,2009,25(5):142-145.
[10]吳冬梅,李俊威,劉凌志,等. 基于Zernike不變矩的人形識別研究[J]. 計算機應用與軟件,2013,30(8):162-165.
[11]王祥科,鄭志強. Otsu多閾值快速分割算法及其在彩色圖像中的應用[J]. 計算機應用,2006,26(增刊):14-15.
[12]趙玉霞,王克如,白中英,等. 貝葉斯方法在玉米葉部病害圖像識別中的應用[J]. 計算機工程與應用,2007,43(5):193-195.
‖X-Mi‖2=(X-Mi)T(X-Mi)=XTX-2MTiX+MTiMi。(13)
由于公式(13)的第1項與i無關,所以可以將公式(13)的第1項去掉,整理成1個線性判別函數:
MTiX-12MTiMi=ΔTiA。(14)
式中:Δi=Mi
-12MTiMi,A=X
1。
在識別過程中,要求取ΔTiA最小值對應的下標病害類別,也是本測試樣本所屬的病害類別。
重復50次上面葉片圖像的劃分及病害識別試驗,記錄每次試驗中識別率的最大值,再計算50次試驗識別率最大值的平均值,作為基于不變矩(invariants moments,IM)算法的識別結果(表1)。為了比較,表1還給出了基于PCA+PNN、神經網絡(ANN)、貝葉斯方法(Bayesian)[12]等植物病害識別方法的識別結果。
表1芹菜病害識別結果
識別方法識別率(%)訓練樣本30個訓練樣本40個訓練樣本50個PCA+PNN72.48±2.53 75.30±2.3580.28±2.55ANN70.38±2.43 74.22±2.30 78.97±2.36Bayesian74.41±2.75 79.46±2.3881.27±2.15IM79.14±2.87 81.17±2.7985.50±2.41
由表1可以看出,IM算法的識別率最高,這是由于IM算法的不變矩分類特征具有旋轉、平移、尺度不變性,有利于病害分類、識別。所有算法的識別率都隨著訓練集中樣本數的增多而增加,這是由于訓練樣本越多,得到的識別特征越穩定。試驗過程中還發現,本系統對于芹菜病害的識別率不高,這是因為發病初期病斑較小、癥狀較輕,葉片的完整度與無病害情況相似,發病后期無論哪種病害,葉片都出現大面積干枯、壞死,并且病斑顏色也從最初的綠色逐漸變成灰褐色,甚至出現病葉萎縮,給病害分割帶來困難,導致后期特征提取差別不明顯。一般情況下可以通過增大訓練樣本量的方法提高識別精度。
3結論
本研究針對病害葉片圖像的復雜性,提出了一種基于不
變矩的病害識別方法。本方法能夠得到病害葉片的分類特征,利用最近鄰分類器進行病害識別。本方法識別率高,不足之處是不變矩對圖像的描述太過籠統,沒有反映作物病害葉片的細節,而且計算量較大。所以,筆者下一步研究方向是挖掘簡單魯棒的作物病害葉片分類特征。
參考文獻:
[1]Camargo A,Smith J S. An image-processing based algorithm to automatically identify plant disease visual symptoms[J]. Biosystems Engineering,2009,102(1):9-21.
[2]Pydipati R,Burks T F,Lee W S. Statistical and neural network classifiers for citrus disease detection using machine vision[J]. Transactions of the ASAE,2005,48(5):2007-2014.
[3]姜淑華,田有文,孫海波. 農作物病害危害程度自動測定與分級的研究[J]. 農機化研究,2007(5):61-63.
[4]柴阿麗,李寶聚,石延霞,等. 基于計算機視覺技術的番茄葉部病害識別[J]. 園藝學報,2010,37(9):1423-1430.
[5]李波,劉占宇,黃敬峰,等. 基于PCA和PNN的水稻病蟲害高光譜識別[J]. 農業工程學報,2009,25(9):143-147.
[6]岑喆鑫,李寶聚,石延霞,等. 基于彩色圖像顏色統計特征的黃瓜炭疽病和褐斑病的識別研究[J]. 園藝學報,2007,34(6):1425-1430.
[7]程鵬飛. 植物病害的圖像處理及特征值提取方法的研究[D]. 晉中:山西農業大學,2005.
[8]田有文,牛妍. 支持向量機在黃瓜病害識別中的應用研究[J]. 農機化研究,2009(3):36-39.
[9]祁廣云,馬曉丹,關海鷗. 采用改進遺傳算法提取大豆葉片病斑圖像[J]. 農業工程學報,2009,25(5):142-145.
[10]吳冬梅,李俊威,劉凌志,等. 基于Zernike不變矩的人形識別研究[J]. 計算機應用與軟件,2013,30(8):162-165.
[11]王祥科,鄭志強. Otsu多閾值快速分割算法及其在彩色圖像中的應用[J]. 計算機應用,2006,26(增刊):14-15.
[12]趙玉霞,王克如,白中英,等. 貝葉斯方法在玉米葉部病害圖像識別中的應用[J]. 計算機工程與應用,2007,43(5):193-195.
‖X-Mi‖2=(X-Mi)T(X-Mi)=XTX-2MTiX+MTiMi。(13)
由于公式(13)的第1項與i無關,所以可以將公式(13)的第1項去掉,整理成1個線性判別函數:
MTiX-12MTiMi=ΔTiA。(14)
式中:Δi=Mi
-12MTiMi,A=X
1。
在識別過程中,要求取ΔTiA最小值對應的下標病害類別,也是本測試樣本所屬的病害類別。
重復50次上面葉片圖像的劃分及病害識別試驗,記錄每次試驗中識別率的最大值,再計算50次試驗識別率最大值的平均值,作為基于不變矩(invariants moments,IM)算法的識別結果(表1)。為了比較,表1還給出了基于PCA+PNN、神經網絡(ANN)、貝葉斯方法(Bayesian)[12]等植物病害識別方法的識別結果。
表1芹菜病害識別結果
識別方法識別率(%)訓練樣本30個訓練樣本40個訓練樣本50個PCA+PNN72.48±2.53 75.30±2.3580.28±2.55ANN70.38±2.43 74.22±2.30 78.97±2.36Bayesian74.41±2.75 79.46±2.3881.27±2.15IM79.14±2.87 81.17±2.7985.50±2.41
由表1可以看出,IM算法的識別率最高,這是由于IM算法的不變矩分類特征具有旋轉、平移、尺度不變性,有利于病害分類、識別。所有算法的識別率都隨著訓練集中樣本數的增多而增加,這是由于訓練樣本越多,得到的識別特征越穩定。試驗過程中還發現,本系統對于芹菜病害的識別率不高,這是因為發病初期病斑較小、癥狀較輕,葉片的完整度與無病害情況相似,發病后期無論哪種病害,葉片都出現大面積干枯、壞死,并且病斑顏色也從最初的綠色逐漸變成灰褐色,甚至出現病葉萎縮,給病害分割帶來困難,導致后期特征提取差別不明顯。一般情況下可以通過增大訓練樣本量的方法提高識別精度。
3結論
本研究針對病害葉片圖像的復雜性,提出了一種基于不
變矩的病害識別方法。本方法能夠得到病害葉片的分類特征,利用最近鄰分類器進行病害識別。本方法識別率高,不足之處是不變矩對圖像的描述太過籠統,沒有反映作物病害葉片的細節,而且計算量較大。所以,筆者下一步研究方向是挖掘簡單魯棒的作物病害葉片分類特征。
參考文獻:
[1]Camargo A,Smith J S. An image-processing based algorithm to automatically identify plant disease visual symptoms[J]. Biosystems Engineering,2009,102(1):9-21.
[2]Pydipati R,Burks T F,Lee W S. Statistical and neural network classifiers for citrus disease detection using machine vision[J]. Transactions of the ASAE,2005,48(5):2007-2014.
[3]姜淑華,田有文,孫海波. 農作物病害危害程度自動測定與分級的研究[J]. 農機化研究,2007(5):61-63.
[4]柴阿麗,李寶聚,石延霞,等. 基于計算機視覺技術的番茄葉部病害識別[J]. 園藝學報,2010,37(9):1423-1430.
[5]李波,劉占宇,黃敬峰,等. 基于PCA和PNN的水稻病蟲害高光譜識別[J]. 農業工程學報,2009,25(9):143-147.
[6]岑喆鑫,李寶聚,石延霞,等. 基于彩色圖像顏色統計特征的黃瓜炭疽病和褐斑病的識別研究[J]. 園藝學報,2007,34(6):1425-1430.
[7]程鵬飛. 植物病害的圖像處理及特征值提取方法的研究[D]. 晉中:山西農業大學,2005.
[8]田有文,牛妍. 支持向量機在黃瓜病害識別中的應用研究[J]. 農機化研究,2009(3):36-39.
[9]祁廣云,馬曉丹,關海鷗. 采用改進遺傳算法提取大豆葉片病斑圖像[J]. 農業工程學報,2009,25(5):142-145.
[10]吳冬梅,李俊威,劉凌志,等. 基于Zernike不變矩的人形識別研究[J]. 計算機應用與軟件,2013,30(8):162-165.
[11]王祥科,鄭志強. Otsu多閾值快速分割算法及其在彩色圖像中的應用[J]. 計算機應用,2006,26(增刊):14-15.
[12]趙玉霞,王克如,白中英,等. 貝葉斯方法在玉米葉部病害圖像識別中的應用[J]. 計算機工程與應用,2007,43(5):193-195.