中南林業科技大學計算機與信息科學學院 余紹軍 李 虹 謝林波 胡 俊
基于油茶毛蟲圖像的特征提取
中南林業科技大學計算機與信息科學學院 余紹軍 李 虹 謝林波 胡 俊
油茶是我國華中地區重要的經濟作物,果實產量受蟲害影響較嚴重,其中油茶毛蟲的危害最大。本文首先對基于圖像的昆蟲特征提取的主要方法進行綜述,然后將搜集到的油茶毛蟲生態學、形態學、生物學等特點作為理論依據,最終提出具有針對性的特征提取方法。本文為解決油茶害蟲圖像區域分割以及模式分類等關鍵問題提供基礎數據。
圖像處理;油茶毛蟲;特征提取
油茶作為世界四大木本食用油料植物之一,具有很高的綜合利用價值,但產量卻不高。其中,由害蟲造成的落花落果是影響我國油茶產量的重要因素。在眾多種類的害蟲當中,油茶毒蛾(Euproctis Pseudoconspersa Strand)是華中地區最為常見的油茶害蟲,其幼蟲被稱為油茶毛蟲、茶辣子、毛辣蟲,以油茶葉為食,群集為害。
近年來,現代農業漸漸向著計算機化、數字化以及人工智能化的方向邁進,這就使實現油茶害蟲的自動識別和計數變成可能。圖像特征提取就是將圖像的視覺特征進行數字化,是實現昆蟲圖像自動識別和計數的基礎。本文將以油茶毛蟲作為研究對象,從生態學、形態學、生物學等角度出發,分析國內外針對類似昆蟲特征提取的現有方法,為提取油茶害蟲特征探索較為快捷、準確的方法。
顏色特征是在圖像檢索中應用最為廣泛的視覺特征,主要原因在于顏色往往和圖像中所包含的物體或場景十分相關。常用的顏色特征提取方法有顏色直方圖、顏色矩、顏色集、顏色聚合向量以及顏色相關圖等。利用顏色特征可以有效地識別顏色豐富、有明顯對比、生命周期內顏色信息穩定的昆蟲。
劉芳等利用R、G、B、L這4個顏色的一維直方圖,結合紅、綠兩種顏色和色度的二維直方圖來提取蝴蝶的顏色特征,通過對正反兩面的特征圖表數據的分析使用神經網絡實現對蝴蝶的自動識別。準確率可達95.2%。但缺點在于不同顏色的蝴蝶可能也有類似的特征統計數據,因此有必要結合顏色特征的空間位置來提高識別率。
油茶毛蟲頭部呈黃褐色,背線呈暗褐色,亞背線、氣門上線棕褐色接近黑色,密生黃白色長毛。如圖1所示:

圖1 自然環境下油茶毛蟲圖像
對油茶毛蟲圖像顏色特征進行提取,首先需將RGB圖像轉化為與人眼視覺相近的HIS空間模型,I分量與顏色無關,因此剔除I分量。根據觀察油茶毛蟲的顏色,本文提取出紅、白、黃、黑這4個顏色的H值,通過多次試驗得出每個顏色相應的H值如表1所示。
選取這四種顏色之后,就對這四種顏色提取其5種形態特征,分別為面積、周長、寬度、高度。經過試驗,各顏色的統計結果如表2所示。
其中,面積為顏色所對應的像素點的個數;周長為顏色對應的邊緣的像素點的個數;寬度為顏色水平方向上對應的像素點的個數;高度為顏色在垂直方向上對應的像素點個數。
普遍來講顏色特征對于圖片視角、方向的、尺寸的依賴比較小,魯棒性比較高。但是單憑顏色特征是無法對油茶毛蟲進行識別的,首先油茶毛蟲的圖片識別在野外環境拍攝會受到光照影響,其次油茶毛蟲在不同的生長環境、不同生長期的顏色也會發生變化。因此,需要結合其他的特征來提高識別率。

表1 各種顏色對應的H值范圍

表2 油茶毛蟲顏色提取統計結果

表3 油茶毛蟲顏色提取統計結果
紋理是指圖像中形狀較小、有規律排列的圖案,一幅圖像的紋理是在圖像計算中經過量化的圖像特征。紋理特征描述圖像某一區域的表面性質,是一種統計特征。圖像的紋理特征具有豐富性、穩定性和旋轉不變性,對噪聲有較強的抵抗能力,更加有助于昆蟲識別。
關于昆蟲的紋理特征提取,常見的方法為利用Gabor紋理特征描述子來進行紋理特征提取,但是該方法結果參數會隨著角度的改變而改變,進而影響最終識別效果。因此,有其他研究者提出一種與角度無關的AIGabor濾波器提取昆蟲圖像的紋理特征,再用SVM算法對5種蝶類進行識別。將Gabor與AIGabor紋理提取結果進行比較,結果表明AIGabor的昆蟲識別算法可以克服圖像分辨率、光照等因素的影響,識別率更高。
昆蟲紋理提取的常用方法是以灰度級空間相關矩陣作為基礎共生矩陣。圖像中連續、共線、具有相同灰值的像素點個數稱為圖像的游程長度?;抑涤坞x矩陣是用來檢測圖像像素點在特定四個方向上灰值(1~8),游程長度(1~256)為像素點串出現的次數,這里就使用灰值游離矩陣來對油茶毛蟲的紋理特征進行提取。
將油茶毛蟲圖像提取0o、45o、90o、135o四個方向的短游程長度L1、長游程長度L2、游程長度的百分率P和灰度值的不均勻度量D,這些值都是可以直接反映線性紋理的情況。經過對油茶毛蟲三幅圖像進行試驗,結果如表3所示。
紋理只是物體的表面特性不能完全反映油茶毛蟲的本質屬性,只利用紋理特征也是無法獲得高層次圖像內容的。顏色特征不同是基于像素點的特征,而紋理特征是對多個像素點的進行統計計算,因此可證兩者具有離散性,在模式匹配中,這種區域性的特征具有較大的優越性,不會由于局部的偏差而無法匹配成功。因此,可以結合使用來作為油茶毛蟲圖像的識別基礎數據。
油茶毛蟲特征提取使用多特征綜合,這樣可以提高識別率,但是缺點在于簡單將多種特征綜合在一起,紋理特征與顏色特征之間具有相關性,會影響計算機的處理速率。因此,還是需要使用優化算法來實現特征有機融合,進一步提高識別率和計算機處理速率。
[1]劉凌,澤桑梓,季梅.中國油茶林害蟲和螨類及其天敵研究綜述[J].西部林業科學,2013,42(1):42-45.
[2]Liu F,Shen Z R,Zhang J W,Yang H Z.Automatic insects identification based on color characters.Chinese Bulletin Entomology,2008,45(1):150-153.(in Chinese)
[3]Qiu D Y,Zhang F Q,Zhang H T.Study on extracting agricultural pests’color features.Journal of North China Institute of Water Conservancy and Hydroelectric Power,2004,25(1):30-32.(in Chinese).
[4]Christophe Biernacki.Initializing EM using the properties of its trajectories in Gaussian mixtures[J].Statistics and Computing.2004(3).
[5]JUN T.A Color Image Segmentation algorithm Based on Region Growing.2010 2nd International Conference on Computer Engineering and Technology.2010.
[6]蔡清,何東健.基于圖像分析的蔬菜食葉害蟲識別技術[J].計算機應用,2010,30(7):1870-1872.
[7]Verma O P,Hanmandlu M,Susan S,et al.A simple single seededregion growing algorithm for color image segmentation using adap-tive thresholding.Proceedings of 2011 International Con-ference on Communication Systems and Network Technologies andComputer.2011.
[8]崔永杰,蘇帥,王霞霞.基于機器視覺的自然環境中獼猴桃識別與特征提取[J].農業機械學報,2013,44(5):247-252.