王燕妮,賀 莉
(西安建筑科技大學 信息與控制工程學院,西安 710055)
在中國,臨潼是最大規模的石榴生產基地。目前,臨潼區石榴栽植面積達10萬畝,年產鮮果8萬噸,從事石榴生產銷售的企業、專業合作社有30余家,石榴產業年產值達5億元以上[1]。石榴是臨潼重要的水果作物,由于石榴的病害,約有10~30%的作物損失。因此,需要在開始階段確定疾病,并向農民提出解決辦法,以便可以避免最大損害,從而提高產量。
植物的疾病大多是在它們的葉子、果實和植物的莖上,石榴由于果腐病、炭疽病、枯萎病和褐斑病等葉病而遭受巨大損失。在農業領域,對葉類疾病的早期檢測是主要的挑戰。農民一般用肉眼觀察來判斷疾病,但這種方法有時可能會造成誤判,而且在很多時候,農民還需要召集專家來檢測同樣的疾病,在大農場中,如果采取這種檢測方式是很費時的。利用數字圖像處理技術,在工業檢驗、醫學成像、遙感、農業加工等不同領域發現了大量的應用。
對于各種農業應用中的分析,數字圖像處理技術已經被建立為一種有效的方法,如植物識別、土壤質量估計以及在農業領域中作物產量的估算等。數字圖像處理技術在農業中的應用之一是對植物病害的檢測。
病害類型可分為細菌、病毒、真菌等,在中國發現的石榴葉病害主要有交鏈孢屬和炭疽病[2]。文章重點研究了應用圖像處理技術對交鏈孢屬、炭疽病和健康葉片進行識別和分類,介紹了如何實現石榴葉片疾病的自動檢測。該研究為石榴葉病的檢測和分類提供了快速、準確、成本低廉的方法。
在農業應用中,許多學者利用數字圖像處理技術對植物葉片病害的檢測進行了大量的研究。由于不同植物的病害癥狀表現大不相同,每種疾病都有自己獨特的特點,僅僅依靠傳統的病理知識和歷史經驗可能會誤判病期,所以對葉子上的疾病的視覺識別不太準確,需要有更多的經驗和知識。
植物病害自動檢測在農業領域具有優勢,因此是一個重要的研究課題。在處理較復雜的圖像背景時,張芳[3]運用了一種超像素和形狀上下文結合的分割算法使黃瓜病葉圖像的背景部分與目標區域成功分離,達到了預期效果。在Tobias Baum,Udo Seiffert[4]等人的大麥分割斑塊實驗中,預處理使用二值化進行圖像增強,然后使用Sobel邊緣檢測算子分割并最終分離葉斑。Al-Hiary H,Bani-Ahmad S[5]等,首先識別大多數綠色像素,然后根據Otsu方法計算的特定閾值對這些像素進行屏蔽,最后完全去除紅色、綠色和藍色零值像素和受感染集群邊界上的像素。張武、黃帥[6]等人首先使用K-means聚類分割算法去除圖像背景,然后使用Otsu閾值法和面積閾值法等各種算法,對小麥植株圖像進行多次分割,最終很好地分割出了帶有病斑的小麥圖像。Prasad,Shitala[7]等人提出了一種新的高效、魯棒的移動視覺系統,用于移動設備中的無監督葉子圖像分割,開發了一種基于紋理的植物葉片圖像分割聚類算法和一種像素聚類方法。尚怡君[8]等人在3種玉米病害葉片圖像數據庫上通過實驗對比了主成分分析技術(PCA)+概率神經網絡(PNN)、神經網絡(ANN)與貝葉斯方法,實驗結果表明,采用監督局部保持映射(DLPP)算法與最近鄰分類器相結合識別植物病害,識別精度達到85.5%。
植物病斑檢測過程分為圖像處理和機器學習兩部分。首先,需要獲取實驗數據圖像,然后進一步處理這些數據。最后,機器學習模型基于圖像特征對疾病進行分類。圖像處理技術的總體流程包括圖像采集、圖像預處理、圖像分割和圖像特征提取。機器學習包括特征選擇和分類,植物葉片病斑識別技術如圖1所示。

圖1 系統方框圖
具體算法步驟如下:
1)首先將采集到的彩色葉片圖像進行裁剪,保留圖像的病斑部分和綠葉正常部分,并將圖像大小統一到275×183的尺寸;
2)對裁剪后的圖像使用高斯濾波進行去噪,并使用直方圖均衡化增強病斑圖像細節;
3)采用基于權重的改進距離公式,根據k均值(k-means)算法重新計算聚類中心,以確定各部分所屬類別;
4)基于顏色矩提取HSI顏色空間3個通道的顏色特征,利用灰度共生矩提取圖像的9個紋理特征;
5)將得到的特征參數輸入到線性支持向量機中進行分類識別。
計算機的視覺和圖像處理技術具有很強的客觀性和及時性,將計算機視覺技術應用于果農業的發展研究中,依靠高科技創新技術來帶動果農業發展并提高經濟作物產量,是一項很有現實意義的課題。
圖像識別首先需要獲取實驗數據,這一步的主要任務是利用相關電子設備或通過其他途徑將所需要的實驗目標采集下來,當把采集到的圖像輸入計算機時,圖像的模擬信號轉換為數字信號。圖像采集過程的合理性將直接影響圖像的質量和后續圖像處理的效果。
在本研究中,石榴葉圖像來自AI challenger農作物病害檢測競賽中的plant village數據集,圖片格式保存為 JPG格式,用于訓練和測試。收集到的圖像包括交鏈孢屬、炭疽病和健康葉片。
獲取到的植物葉片上可能會出現灰塵、露珠、昆蟲糞便,這些被認為是圖像噪聲,為了避免這些噪聲影響后續分割病斑的效果,一般情況下,需要對采集到的原始圖像進行預處理。此外,捕捉到的圖像可能會出現一些水滴和陰影效應的失真,這將會在分割和特征提取階段造成問題,因此,可以使用不同的去噪濾波器來衰減或消除這種失真的影響。
在這個步驟中,首先調整圖像大小到275×183的尺寸,然后進行高斯濾波以去除圖像中的噪聲,最后對病害圖像進行增強。預處理既消除了背景噪聲,又抑制了不想要的失真,提高了圖像質量。
在圖像分割中,是將給定的圖像分割成與某些特征有關的均勻區域。分割的目的則是為了將圖像進行簡化表示,并將其轉換為更有意義且更易于分析的內容。聚類是將大型數據集分組為小集合或相似數據段的一種方法。本次研究中,采用K均值聚類算法將預處理后的圖像分割成三簇,如圖4所示。所述簇包含葉的患病部分,正常綠葉部分和背景區域。
k-means算法應用于植物病害圖像分割的優點[9]和k-means算法過程如下所示。
1)K-means算法的優點:
(1)聚類是一種無監督學習的方法,可以將一些沒有標簽的數據劃分成若干類,算法原理簡單,收斂速度快,能夠很好地區分圖像區域間存在較大差異的圖像。
(2)適用于球類型分布的數據。由于石榴葉出現的病斑大多呈現橢圓斑狀,所以利用K-means聚類算法分割具有很好的效果。
(3)需要調節的參數只有簇數K,當選取合適的初始聚類中心后,僅僅依據圖像的顏色信息就可以對圖像進行聚類,具有很強的魯棒性。
2)K-means算法過程:
(1)將數據集劃分為K個簇數,并將數據點隨機分配給聚類。
(2)對于每個數據點,采用近鄰思想將其劃分到最近鄰所在的簇中,本文給出的改進算法通過權重來計算距離,從而界定是否屬于一類,任意兩個數據點(x1,y1),(x2,y2)的歐式距離為:
(1)
改進的距離公式為:
(2)
其中:Si是聚類中心i所屬的類別中數據的個數,S是所有數據的個數。
(3)如果數據點最靠近它自己的群集,則將其放在它所在的位置。
(4)如果數據點不是最接近其自己的群集,則將其轉移到附近的集群中。
(5)重復所有步驟,直到所有的數據點滿足條件為止。
(6)若集群趨于穩定,聚類過程停止。
算法偽代碼:
輸入:數據集S={x1,x2,…,xn};
聚類簇數K;
過程:
從S中隨機選擇K個數據作為初始向量{α1,α2,…αk}
Repeat
令Cj=φ(1≤j≤k)
fori=1,2,…,ndo
利用權重計算數據xi與各向量αj的距離:
根據最近鄰原則確定xi的簇標記:υi=argmindij
將數據xi劃分到相應的簇:Cυi=Cvi∪{xi}
end for
Forj=1,2,…,k
Ifαj′≠αjthen
將此時的均值向量αj更新為αj′
else
保持此時的均值向量不變
end if
end for
Until 此時均值向量均未更新
輸出:簇劃分C={C1,C2,…,Ck}
其中,S為數據集,C為聚類所得簇。
特征提取用于提取可用于確定給定樣本的重要性的信息,圖像分析的特征提取方面側重于識別圖像中的固有特性或存在對象的特征,一般情況下,這些特征可以用來描述對象。圖像特征的主要類型是形狀、顏色和紋理,這些特征主要用于圖像處理技術[10]。
在該系統中,顏色是圖像的一個重要的特征,因為它可以從病葉中區分出不屬于正常葉片顏色的區域,紋理特征指出顏色圖案如何在圖像中分布。因此,顏色特征和紋理特征都被提取出來,以獲得更好的精度。以下步驟用于計算給定圖像的顏色特征:
1)首先將RGB圖像轉換為HSI顏色空間。
2)將圖像細分為3×3塊。
3)使用以下公式計算九個塊中每個塊的平均顏色:
(3)
其中:xi是像素強度,N是像素總數。
將計算出的平均值作為其中的一個顏色特征。
4)對于每個塊,使用以下公式計算方差:
(4)
所計算的方差具有測量可變性的能力。
5)計算H/S/I各塊的偏度:
(5)
利用偏度來判斷圖像表面分布的對稱情況。
這樣每個區塊將有3+3+3=9種顏色特征。
然后采用病斑圖像的9種紋理特征:對比度,能量,最大概率,均勻度,逆差分矩,差異方差,對角線方差,熵,相關性[11]。計算公式如表1所示。

表1 紋理特征的數學公式
分類是分析圖像特征的各種屬性并將其分類為各種聲明類的過程。在植物病害的分類中,利用分類技術根據圖像提取的特征對疾病進行分類,從而檢測葉片病害類型。分類處理是將給定的輸入模式與一個不同的類相關聯,不同的分類模型包括支持向量機,神經網絡,最近鄰分類器和基于規則的分類器。該系統采用線性支持向量機( Linear Support Vector Machine,簡稱LSVM)對葉病進行分類。
支持向量機是一種二元分類器,它使用一個超平面,稱為兩類之間的決策邊界。支持向量機的主要目的是實現超平面和類邊界之間的最大距離,以避免將向量錯誤劃分為其他類。這個超平面將劃分為一個包含標記為+1的目標訓練向量的類,另一類包含標記為-1的訓練向量。
使用此標記的訓練向量,SVM優化器找到一個超平面ωTx+b=0,在超平面的上方定義y=1,在超平面下方定義y=-1,然后將使兩個類中的分離邊緣最大化,如圖2所示。

圖2 支持向量機模型
分類通常涉及兩個階段,分別為訓練和測試。首先使用特征值及其相應目標值訓練分類器,然后使用這個經過訓練的分類器對測試圖像進行分類。
本研究共使用了750幅石榴葉片圖像,包括病害圖像和健康圖像,其中600幅為病害圖像,150幅為健康葉片圖像。
圖像處理第一步是預處理,圖3顯示出原始圖像和增強圖像。

圖3 原始圖像和增強圖像
然后使用k-means聚類將濾波后的圖像分割為3個簇,最后提取所有3個分割圖像的顏色和紋理特征。圖4顯示出了使用k-means聚類形成的3個簇。

圖4 使用k-means分類結果
實驗結果顯示,使用改進的k-means聚類算法成功地將圖像聚為三類,由炭疽病和交鏈孢屬原始彩色圖像可以直觀看出,聚類1為葉片背景區域,聚類2為病斑區域,聚類3為葉片正常綠色區域,分割出的交鏈孢屬病斑和炭疽病病斑圖像均完整清晰。圖5為使用標記符控制的分水嶺變換分割結果,從圖中可以看出,石榴葉的交鏈孢屬病斑圖像分割結果較好,但是炭疽病病斑圖像的右側區域分割效果不佳。

圖5 使用標記符控制的分水嶺變換分割結果
本文對單葉圖像的3個分割部分分別計算了9個顏色特征和9個紋理特征。因此,單葉圖像的特征值總數變為(9+9)×3=54。這些特征值統稱為特征向量,給出了經過訓練的支持向量機分類器,該分類器根據特征值將輸入的石榴葉圖像分為交鏈孢屬、炭疽病和健康葉片三類。
圖3所示的圖像是石榴的交鏈孢屬病斑,SVM將其分類成交鏈孢屬類,并將此結果呈現到如圖6中所示的消息框中。

圖6 消息框顯示出的分類結果
支持向量機分類器的總體性能概括為表2,圖7為支持向量機性能分析。從圖7可以看出,支持向量機對石榴葉片病斑的分類效果顯著。

圖7 支持向量機性能分析

表2 SVM分類結果

(6)
該系統使用調整大小、高斯濾波和增強對圖像進行預處理。為了分割病葉面積,采用K均值聚類技術對圖像進行分割,然后利用顏色和紋理特征進行特征提取。最后,利用支持向量機分類技術對葉片病害類型進行檢測。實驗中考慮了三類石榴葉片,即交鏈孢屬病斑、炭疽病病斑和健康葉片。實驗結果顯示,該系統對交鏈孢屬、炭疽病和健康葉片的平均準確率為89.55%。今后的研究將重點放在以下幾點:
1)利用融合分類技術,開發出多種算法的組合,提高分類過程的檢出率。
2)在檢測疾病的基礎上,根據病害面積,向種植石榴的農民提供適當的殺菌劑混合物,以便他們在農場中進一步使用。
3)在嵌入式系統的幫助下,設計一套自動噴施殺菌劑混合物的自動化系統,實現使用噴霧機構自動噴霧。