鄭一力 鐘剛亮,2 王 強,2 趙 玥 趙燕東
(1.北京林業大學工學院, 北京 100083; 2.中國科學院電工研究所, 北京 100190)
基于多特征降維的植物葉片識別方法
鄭一力1鐘剛亮1,2王 強1,2趙 玥1趙燕東1
(1.北京林業大學工學院, 北京 100083; 2.中國科學院電工研究所, 北京 100190)
植物種類識別方法主要是根據葉片低維特征進行自動化鑒定。針對低維特征不能全面描述葉片信息,識別準確率低的問題,提出一種基于多特征降維的植物葉片識別方法。首先通過數字圖像處理技術對植物葉片彩色樣本圖像進行預處理,獲得去除顏色、蟲洞、葉柄和背景的葉片二值圖像、灰度圖像和紋理圖像。然后對二值圖像提取幾何特征和結構特征,對灰度圖像提取Hu不變矩特征、灰度共生矩陣特征、局部二值模式特征和Gabor特征,對紋理圖像提取分形維數,共得到2 183維特征參數。再采用主成分分析與線性評判分析相結合的方法對葉片多特征進行特征降維,將葉片高維特征數據降到低維空間。降維后的訓練樣本特征數據使用支持向量機分類器進行訓練。試驗結果表明:使用訓練后的支持向量機分類器對Flavia數據庫和ICL數據庫的測試葉片樣本進行分類識別,平均正確識別率分別為92.52%、89.97%,有效提高了植物葉片識別的正確率。
葉片識別; 多特征降維; 主成分分析; 線性評判分析; 支持向量機
植物的種類識別是植物學研究和農業生產的基礎性工作,傳統方法主要是根據植物形態進行人工鑒定,識別結果存在主觀性且效率較低。植物葉片含有大量種屬信息,且大部分葉片外形為扁平狀,因此可對植物葉片進行圖像采集和處理,實現植物種屬快速識別。
目前,大多數研究采用少量特征描述因子對植物葉片進行分類識別。20世紀80年代,INGROUILLE等[1]提取葉片的27個形狀特征,使用主分量分析方法對橡樹進行分類研究。王曉峰等[2]提取植物葉片的矩形度、圓形度和偏心率等8個幾何特征參數和7個圖像不變矩,應用移動中心超球分類器對20多種植物葉片進行分類識別,平均正確識別率達到92%。NETO等[3]使用傅里葉描述因子對植物葉片進行描述,采用判別式分析對4種植物分類,平均正確識別率為89.4%。姚宇飛[4]使用8個幾何特征、7個Hu不變矩特征、1個結構特征、4個灰度共生矩陣特征和1個分形維數特征共21維特征描述葉片樣本,并使用主成分分析對特征進行降維,使用支持向量機對26種植物進行識別試驗,平均識別率為91.54%。DU等[5]計算葉片邊緣和多層紋理的二維分形維數,并提取一種新的環形投影小波分形特征,采用K最近鄰(k-nearest neighbor, k-NN)分類器對30種植物葉片圖像進行分類實驗,正確識別率為87.14%。KULKARN等[6]提取植物葉片的形狀特征、靜脈特征、顏色特征與紋理特征,用徑向基概率神經網絡對32種植物進行分類,平均正確識別率為93.82%。HERDIYENI等[7]利用半徑為2、鄰域像素點為16的局部二值模式算子對植物葉片樣本進行編碼并采用概率神經網絡進行分類識別,正確識別率為78.89%。杜吉祥等[8]采用5個尺度、6個角度的Gabor濾波器對葉片樣本進行濾波,然后對各濾波子圖計算均值和方差作為子圖特征,再利用新型的徑向基概率神經網絡模型對50類植物進行分類識別實驗,正確識別率為84.4%。LE等[9]提出一種新的基于內核描述的方法用于植物葉片識別,然后用SVM分類器對Flavia數據庫和ImageClef 2013數據庫進行分類識別實驗,正確識別率分別為97.5%和58.0%。ZHAO等[10]用2個局部描述因子和3個新的三角形表達方式對葉片進行描述,然后用k-NN對Image-CLEF 2011葉片進行分類識別實驗,成功識別率最高為89.79%。劉念等[11]用Hu氏不變量、傅里葉描述子、局部二值模式、Gabor濾波和灰度共生矩陣多特征對植物葉片進行描述,獲得較高的識別結果,但由于提取特征維度較高,對分類器有較高要求。
植物種類繁多,少量的特征描述因子不能詳細描述葉片信息,導致形狀和紋理相似的植物葉片不容易被區分開。提取高維特征描述植物葉片時,所需的分類器算法復雜,增加識別難度。
本文給出一種基于多特征降維的植物葉片識別方法。該方法主要提取葉片圖像的形狀特征和紋理特征作為葉片多特征。葉片形狀特征包括葉片幾何特征、不變矩特征和結構特征,葉片紋理特征包括灰度共生矩陣特征、分形維數、局部二值模式特征和Gabor特征。然后使用主成分分析和線性評判分析對葉片多特征進行特征降維,構成葉片特征數據庫。最后通過支持向量機對訓練樣本的葉片特征數據庫進行訓練,實現對植物葉片的快速分類識別。
葉片顏色一般隨著生長季節變化,葉片蟲洞會影響葉片特征提取,以上兩種因素均會干擾葉片識別結果。此外,葉片的葉柄長度、直徑無一定規律,在葉片識別中為無用信息。為削弱葉片數字圖像中顏色、葉柄、蟲洞等無用或干擾信息,使目標區域特征更明顯,本文先對輸入的葉片彩色圖像進行旋轉處理,使葉片長軸與水平方向平行,然后對其進行預處理。預處理的輸出為用于葉片多特征提取的葉片灰度圖像、二值圖像和紋理圖像,具體過程如圖1所示。

圖1 葉片圖像預處理流程圖Fig.1 Flow chart of image preprocessing
首先,將輸入的葉片彩色圖像經灰度轉換得到原始灰度圖像,利用最大類間方差法對其進行閾值分割處理,將葉片從背景中提取出來,得到葉片的原始二值圖像。采用形態學中的開運算和閉運算對原始二值圖像進行處理,可得到不受顏色、蟲洞和葉柄影響的葉片二值圖像。
然后,將二值圖像矩陣和原始灰度圖像矩陣進行點乘運算,得到去除背景的葉片灰度圖像。
用HSI(Hue saturation intensity)色彩空間模型的S分量(飽和度)表示葉片紋理。在提取紋理圖像時,首先將葉片彩色圖像轉換為HSI色彩空間下的圖像[12],然后用S分量圖像矩陣與二值圖像矩陣進行點乘計算,得到去除數字圖像背景的葉片紋理圖像。
采用多特征對植物葉片進行全面描述,葉片多特征包括葉片形狀特征和葉片紋理特征。
2.1 形狀特征
同類的植物葉片形狀具有一定的規則性,對其進行分析可以得到能有效描述葉片形狀的特征參數。本文葉片形狀特征由葉片幾何特征、葉片不變矩特征和葉片結構特征等表示。
2.1.1 幾何特征
在葉片二值圖像中提取葉片的縱橫軸比、矩形度、球狀性、圓形度、偏心率、周長凹凸比、面積凹凸比和形狀參數8個無量綱的量[2]描述植物葉片幾何特征,這些幾何特征不受植物生長影響。
2.1.2 Hu不變矩特征
HU[13]提出的不變矩具有旋轉、平移和尺度不變性特性,故采用CHEN[14]改進的針對離散對象的不變矩算法,在葉片灰度圖像的基礎上計算得到7個Hu不變矩參數。
2.1.3 結構特征
本文采用鋸齒度ST反映葉片結構特征,定義為
(1)
式中NS——鋸齒個數P——葉片周長
NS是由SHI等[15]用Shi-Tomasi算法對葉片二值圖像進行計算獲得的。
2.2 紋理特征
葉片的紋理特征是一種全局特征,對葉片圖像整體紋理分析時表現出一定的規則性,本文采用灰度共生矩陣特征、分形維數特征、局部二值模式特征和Gabor特征來描述葉片紋理特征。
2.2.1 灰度共生矩陣特征
灰度共生矩陣(Gray level co-occurrence matrix, GLCM)可以反映圖像中任意兩點灰度值的空間相關性,采用灰度共生矩陣的對比度、相關性、能量和均勻度4個統計量[16]反映葉片圖像紋理特征。本文在灰度圖像基礎上計算得到4個共生矩陣特征參數。
2.2.2 分形維度特征
植物葉片各層級脈絡將葉片分割成具有一定自相似性的網狀結構,可用分形維度DF更細致描述葉片紋理特征。
將圖1中獲取的葉片紋理圖像看作點集Z∈R3,每個元素z∈Z被定義為三維坐標值(x,y,Y(x,y))。其中,x,y是空間域中像素的位置,Y(x,y)是對應像素點的灰度。葉片的分形維度DF的計算采用PELEG等[17]提出的“毯子法”。
2.2.3 局部二值模式特征
局部二值模式(Local binary pattern,LBP)[18]是一種用于描述紋理特征的算子。由于LBP算子具有計算簡單、旋轉不變性和灰度平移不變性等優點,故用于植物葉片的紋理特征提取。
葉片數字圖像中任意中間像素點與p個鄰域像素點的LBP算子編碼方法為
(2)
其中U(Lp,R)=|s(Yp-1-Yc)-s(Y0-Yc)|+
(3)
式中Yc——中間像素點的灰度s——符號函數,當參數為正數或零時,函數為1,否則為0
Yi——以Yc為中心、R為半徑的圓上p個鄰域像素的灰度
上標為riu2的LBP算子表示旋轉不變統一模式,該模式的種類數為p+2。
計算葉片圖像LBP參數時,為弱化圖像背景對特征提取的影響,將葉片圖像縮放至400像素×400像素。首先,提取出灰度圖像中葉片的最小包圍盒,然后將包圍盒長邊縮放為400像素,短邊按比例變化后,用零填充空白處到400像素。本文采取半徑為2、鄰域像素數為16的旋轉不變統一模式LBP算子對植物葉片灰度圖像進行編碼,得到葉片LBP編碼圖,在圖中,葉片的邊緣和紋理等特征模式均被刻畫出來,如圖2所示。

圖2 LBP編碼圖Fig.2 LBP coding image
然后將葉片LBP編碼圖均勻地分為7×7塊,統計每一塊編碼圖的直方圖,得到葉片子圖像的直方圖特征。為增大葉片紋理對識別的貢獻,減弱葉片背景對識別的影響,將每個子圖像的直方圖特征乘以相應的權值,葉片編碼模式直方圖的權值模板如圖3所示,最終得到882維(7×7×(16+2))葉片圖像LBP特征。

圖3 權值模板圖Fig.3 Diagram of weight template
2.2.4 Gabor特征
由于Gabor濾波器能同時在頻率域和空間域得到最優局部化,具有優良的方向選擇性和空間局部性,可用于植物葉片的紋理檢測[19]。
二維的Gabor濾波器可以定義為由高斯函數調制的復正弦函數,定義[20]為
(4)
其中
(5)
式中x0——旋轉后的復正弦函數橫坐標y0——旋轉后的復正弦函數縱坐標θ——復正弦函數的旋轉角度,用來控制Gabor小波的方向
w0——復正弦函數頻率
σ——Gaussian函數沿2個坐標軸標準方差
植物葉片的灰度圖像Y(x,y)與G(x0,y0,θ,w0)的卷積定義為
F(x0,y0,θ,w0)=Y(x,y)*G(x0,y0,θ,w0)
(6)
計算葉片圖像Gabor參數時,采用與計算LBP相同的縮放方法將葉片圖像縮放至400像素×400像素。本文使用5個尺度、8個方向的Gabor濾波器對葉片圖像進行濾波,得到40個子圖像,得到的子圖像如圖4所示。

圖4 Gabor子圖像Fig.4 Gabor sub-images
將每個子圖像分成4×4的子塊,在每個子塊的基礎上,計算各子塊濾波能量值的方差和均值,最后得到1 280(5×8×4×4×2)維葉片圖像Gabor特征。
本文從葉片圖像上提取8個幾何特征參數(GC),7個Hu不變矩參數(Hu),1個結構特征參數(SC),4個灰度共生矩陣特征參數(GLCM),1個分形維數(FD),882維局部二值模式特征(LBP)和1 280維Gabor特征(Gabor)來描述葉片的紋理特征,共得到2 183維特征。
由于葉片特征維度過高,本文選用主成分分析(PCA)[21]和線性判別分析(LDA)[22]相結合的方法對多特征進行降維處理,將高維特征參數降到低維空間。
3.1 主成分分析
主成分分析是一種找出數據空間中最能表達原始數據的一組向量的方法,能在保存數據主要信息的前提下,將特征數據從高維降到低維。
用向量xi(i=1,2,…,N)表示第i個葉片樣本圖像的D維特征,先對xi進行歸一化處理。在PCA轉換計算中,樣本均值計算為
(7)
樣本圖像的協方差C定義為
(8)
其中
(9)
使用奇異值分解(Singular value decomposition,SVD)定理簡化計算矩陣X,可以得到XXT的非零特征值λ[23]。根據特征值可以計算出貢獻率,通過確定貢獻率可以確定降維后特征的維度d。由此得到大小為D×d的變換矩陣Wpca,PCA轉換后的葉片圖像特征向量yi可以表示為
(10)
3.2 線性評判分析
線性評判分析與主成分分析的差別是能夠尋找最能將特征數據進行分類的低維特征,即最小化類內離散度,最大化類間離散度。將LDA運用于本文的降維處理中,有助于葉片的分類識別。
類內散度矩陣Sw和類間散度矩陣Sb在數學上的定義形式為
(11)
式中C——植物種類數Ni——第i種植物的葉片樣本數
si,j——第i種植物中第j個葉片樣本
μi——第i種植物種類樣本的特征平均值
μ——所有植物種類樣本的特征平均值

(12)
3.3 主成分分析和線性判別分析相結合
PCA能夠大幅度降低原來的多特征維度,但在進行轉換時若不區分各類別間的特征,會丟失判別信息。LDA變換是一個提取葉片低維分類特征的有效方法,但是在葉片識別中,當某些植物種類的訓練葉片樣本過少,而特征維數過高時,矩陣Sw不能滿足非奇異矩陣條件,導致LDA降維失敗。針對以上2個問題,本文采用將PCA和LDA結合的方法對葉片高維特征進行降維轉換,使葉片多特征維度得以大幅度降低,并保留類間的判別信息,本文方法的表達式為
(13)
式中hi——降維后的第i個特征參數
在提取葉片多特征后,對葉片多特征進行降維處理。然后,將降維后的多特征數據進行歸一化處理,即
(14)
式中hmin——降維后特征向量的最小值hmax——降維后特征向量的最大值
為了盡可能地保留葉片信息,選取PCA的貢獻率為99%。經過PCA降維,葉片特征能夠從高維空間大幅度降低到m維的低維空間。本文使用LDA轉換的主要目的是將特征數據進行分類。又LDA只能將n類植物的特征數據降低為1到n-1之間的維度,特征數據經過LDA轉換后的維度為
(15)
支持向量機(SVM)[24]是通過使用核函數將低維空間中的線性不可分特征數據進行非線性轉換,映射到高維空間中,從而得到在高維空間中線性可分的特征數據。繼而在新的高維空間中確定出最優的分類面。由于SVM具有良好的魯棒性,可有效解決葉片樣本數量少、非線性特征數據和特征維度高等問題,故本文選用SVM分類器進行分類識別。
SVM定義為
(16)
式中ai——Lagrange乘子SV——支持向量集li——輸出類別標號b——由葉片訓練樣本確定的閾值K(xi,x)——核函數
由于徑向基核函數(RBKF)是非線性的函數,在SVM分類器訓練過程中,能有效減少計算復雜性。因此本文選擇徑向基函數作為分類器核函數,定義為
(17)
式中δ——核函數擴展常數,該參數決定SVM分類器的預測能力
在實驗時需人工確定SVM分類器的gamma函數g和懲罰變量c。c為分類器對誤差的寬容度。g定義為
(18)
本文選用Libsvm工具箱[25]在Matlab平臺上進行SVM模型構建,工具箱中包括參數尋優的庫函數,且支持植物葉片的多分類。建立SVM的分類識別模型時,通過交叉驗證法對試驗數據庫進行參數尋優,可以得到數據庫的最佳參數g和c。
本文在建立SVM的分類識別模型時,分別對Flavia和ICL數據庫進行參數尋優,得到ICL數據庫的最佳參數g為0.007 812 5,最佳參數c為2。Flavia數據庫最佳參數g為0.125,最佳參數c為2。
5.1 數據庫
為了評估本文提出的方法,使用由WU等[26]收集的葉片圖像Flavia數據庫和由中國科學院合肥機械研究所智能計算實驗室建立的葉片圖像ICL數據庫[27]進行實驗。
Flavia數據庫包含32種植物葉片樣本圖像,每種植物葉片樣本數量最少為50個,最多為77個,共1 907個樣本。該數據庫中的葉片圖像均為白色背景,尺寸均為1 600像素×1 200像素。實驗中每種植物采用45個樣本進行訓練,剩余樣本進行測試。
ICL數據庫包含220種植物葉片樣本,每種樣本最少為26個,最多為1 078個。數據庫中葉片圖像背景為白色,每張圖片尺寸不同,一般為200像素×500像素。實驗選用樣本數量大于50的42種植物進行分類識別實驗,其中,每個種類用45個樣本訓練,剩余的樣本進行測試。
5.2 結果分析
用Matlab和C混合編程實現識別算法。用SVM分類器分別在不同的數據庫上采用不同特征方法的對比識別實驗結果如表1所示。對比實驗的特征方法主要有: 21維特征降維方法(GC+Hu+SC+GLCM+FD)、LBP特征降維方法、Gabor特征降維方法以及本文多特征降維方法(GC+Hu+SC+GLCM+FD+LBP+Gabor)。

表1 不同特征組合降維方法的對比識別實驗結果Tab.1 Comparison results of different features dimension reduction method
表1結果表明,本文提出的多特征降維方法提取的2 183維特征能更好地描述葉片信息,且在特征降維時保留大部分信息,平均識別正確率提高。由于ICL數據庫的葉片樣本圖像質量比Flavia數據庫低,Flavia數據庫正確識別率高于ICL數據庫。
將本文提出的特征與文獻[2,4,7-8]中的特征用SVM分類器對2個數據庫進行分類識別實驗,并比較識別結果。實驗前均將特征數據進行歸一化處理,其余實驗條件和文獻方法一致,文獻方法和本文多特征降維方法的識別結果如表2所示。

表2 葉片識別結果Tab.2 Leaf recognition results
從表2可以看出,在2個數據庫中,本文方法的平均正確識別率均高于進行比較的文獻方法。表明本文提出的多特征降維方法能更詳細、全面地描述葉片信息,故能有效識別植物葉片。
表3為每類植物葉片識別結果,由表3可以看出,ICL數據庫中識別率最低的3類植物為白蠟(71.63%)、全緣葉欒樹(73.08%)和石榴(75.00%)。Flavia數據庫中識別率最低的3類植物為香椿(55.00%)、楠木(57.14%)和毛竹(64.29%)。對比2個數據庫的識別結果,Flavia數據庫中識別率最低的3類植物識別效果比ICL數據的差。為了分析Flavia數據庫出現這個結果的原因,對數據庫中識別率最低的3類植物識別結果進一步分析。
表4為識別率最低的3種植物識別結果,觀察表4可知,毛竹識別正確次數是9次,錯誤識別成4種植物:羅漢松(2次)、香椿(1次)、夾竹桃(1次)、桃(1次)。香椿識別正確次數是11次,錯誤識別成2種植物:欒樹(8次)、桃(1次)。楠木識別正確次數是4次,錯誤識別成2種植物:三角楓(2次)、木藍(1次)。毛竹與羅漢松、香椿、夾竹桃、桃的葉片形狀極為相似,而且毛竹葉片很細,由于照片分辨率的原因,葉片圖像丟失大部分紋理信息,導致識別錯誤。香椿與欒樹、桃的葉片形狀和紋理都很相似。而楠木與木藍、三角楓的紋理相似,但鋸齒數目有較大差別,而實驗中鋸齒度參數只有1維,占多特征參數的權值比例小,而且Flavia數據庫中大部分葉片鋸齒數目差別不大,導致鋸齒度這一特征對識別的貢獻較小,導致正確識別率低,需進一步強化此類特征的描述。

表3 每類植物葉片識別結果Tab.3 Recognition results of each species
s采用不同特征組合降維方法對500個葉片測試樣本進行識別,所需平均時長如表5所示。由表5可以看出,采用本文多特征降維方法,算法復雜度和數據處理量增加,每張葉片圖像的平均識別時間增至550.1 ms,可滿足葉片識別快速性的要求。
表4 3種植物識別結果
Tab.4 Recognition results of three species

表5 不同特征組合降維方法的識別時間Tab.5 Average recognition time of experiments by using different features

特征特征維數降維后特征維數平均識別時間/ms21維特征2112181.4LBP特征88241232.9Gabor特征128041339.4多特征218341550.1
提出了一種基于多特征降維的植物種類葉片圖像識別方法。提取植物葉片的2 183維特征后,采用PCA與LDA相結合的方法進行多特征降維,再使用SVM分類器分別在ICL數據庫和Flavia數據庫上進行分類識別實驗。結果表明,本文提出的多特征降維方法可有效快速識別植物葉片。下一步可深入研究紋理特征參數與形狀特征各參數的權值比例,以提高紋理特征對葉片識別的貢獻。
1 INGROUILLE J M, LAIRD M S. A quantitative approach to oak variability in some north London woodlands[J]. The London Naturalist, 1986,65:35-46.
2 王曉峰, 黃德雙, 杜吉祥, 等. 葉片圖像特征提取與識別技術的研究[J]. 計算機工程與應用, 2006,42(3):190-193. WANG Xiaofeng, HUANG Deshuang, DU Jixiang, et al. Feature extraction and recognition for leaf images [J]. Computer Engineering & Applications, 2006,42(3):190-193. (in Chinese)
3 NETO J C, MEYER G E, JONES D D, et al. Plant species identification using elliptic Fourier leaf shape analysis[J]. Computers & Electronics in Agriculture, 2006,50(2):121-134.
4 姚宇飛. 基于分形維數的葉片識別方法研究[D]. 北京:北京林業大學, 2011. YAO Yufei. Research on leaves recognition based on fractal dimension [D].Beijing: Beijing Forestry University, 2011. (in Chinese)
5 DU Jixiang, ZHAI Chuanmin, WANG Qingping. Recognition of plant leaf image based on fractal dimension features[J]. Neurocomputing, 2013,116(10):150-156.
6 KULKARN A H, RAI H M, JAHAGIRDAR D K A, et al. A leaf recognition technique for plant classification using RBPNN and zernike moments[J]. Journal of Computer-Mediated Communication, 2013,2(1):984-988.
7 HERDIYENI Y, KUSMANA I. Fusion of local binary patterns features for tropical medicinal plants identification[C]∥International Conference on Advanced Computer Science and Information Systems, 2013:353-357.
8 杜吉祥, 翟傳敏. 基于Gabor紋理特征的植物圖像識別方法[C]∥第十四屆全國圖像圖形學學術會議, 2008:246-250.
9 LE T L, TRAN D T, PHAM N H. Kernel descriptor based plant leaf identification[C]∥2014 4th International Conference on Image Processing Theory, Tools and Applications, 2014:1-5.
10 ZHAO Zhongqiu, HONG Yan, ZHENG Peng, et al. Plant identification using triangular representation based on salient points and margin points[C]∥IEEE International Conference on Image Processing, 2015:1145-1149.
11 劉念, 闞江明. 基于多特征融合和深度信念網絡的植物葉片識別[J]. 北京林業大學學報, 2016,38(3):110-119. LIU Nian, KAN Jiangming. Plant leaf identification based on the multi-feature fusion and deep belief networks method[J]. Journal of Beijing Forestry University, 2016,38(3):110-119. (in Chinese)
12 孫慧賢, 張玉華, 羅飛路. 基于HSI顏色空間的彩色邊緣檢測方法研究[J]. 光學技術, 2009,35(2):221-224. SUN Huixian, ZHANG Yuhua, LUO Feilu. Color edge detection based on HSI color space [J]. Optical Technique,2009,35(2):221-224. (in Chinese)
13 HU M K. Visual pattern recognition by moment invariants[J]. IRE Transactions on Information Theory, 1962,8(2):179-187.
14 CHEN C C. Improved moment invariants for shape discrimination[J]. Pattern Recognition, 1993,26(5):683-686.
15 SHI J, TOMASI C. Good features to track[C]∥Proceedings of IEEE Conference on Computer Vision & Pattern Recognition, 1994: 593-600.
16 高程程, 惠曉威. 基于灰度共生矩陣的紋理特征提取[J]. 計算機系統應用, 2010,19(6):195-198. GAO Chengcheng, HUI Xiaowei. GLCM-based texture feature extraction[J].Computer Systems & Applications,2010,19(6):195-198. (in Chinese)
17 PELEG S, NAOR J, HARTLEY R, et al. Multiple resolution texture analysis and classification[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1984,6(4):518-523.
19 DAUGMAN J G. Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters.[J]. Journal of the Optical Society of America A (Optics & Image Science), 1985,2(7):1160-1169.
20 LEE T S. Image representation using 2D Gabor wavelet[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1996,18(10):959-971.
21 TURK M A, PENTLAND A P. Face recognition using eigenfaces[C]∥1991 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 1991:586-591.
22 BELHUMEUR P N, HESPANHA J P, KRIEGMAN D J. Eigenfaces vs. fisherfaces: recognition using class specific linear projection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997,19(7):711-720.
23 ANISSA B, NAOUAR B, ARSALANE Z, et al. Face recognition: comparative study between linear and non linear dimensionality reduction methods[C]∥2015 International Conference on Electrical and Information Technologies, 2015:224-228.
24 CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995,20(3):273-297.
25 CHANG C C, LIN C J. LIBSVM: a library for support vector machines[J]. ACM Transactions on Intelligent Systems & Technology, 2011,2(3):389-396.
26 WU S G, BAO F S, XU E Y, et al. A leaf recognition algorithm for plant classification using probabilistic neural network[C]∥2007 IEEE International Symposium on Signal Processing and Information Technology, 2007:11-16.
27 中科院智能計算實驗室.中科院智能計算實驗室植物葉片數據庫[EB/OL].http:∥www.intelengine.cn/dataset.
Method of Leaf Identification Based on Multi-feature Dimension Reduction
ZHENG Yili1ZHONG Gangliang1,2WANG Qiang1,2ZHAO Yue1ZHAO Yandong1
(1.SchoolofTechnology,BeijingForestryUniversity,Beijing100083,China2.InstituteofElectricalEngineering,ChineseAcademyofSciences,Beijing100190,China)
The identification of plant species is an essential part of botanical study and agricultural production. However, low dimension features cannot describe the leaf information. Thus, it cannot differentiate varieties of plants, and the accuracy is low. A method of plant species identification was proposed based on multi-feature dimension reduction. Firstly, color images of plant leaves were preprocessed by the digital image processing technology. The binary image, gray scale image and texture image without the petiole, wormhole and background were obtained after the preprocessing. Secondly, geometric characteristics and structural characteristic were extracted from the binary image. Hu moment invariants features, gray level co-occurrence matrix features, LBP features and Gabor features were extracted from the gray scale image. The fractal dimension was extracted from the texture images and 2 183 features were extracted to describe leaf samples in number. Thirdly, the method of combining principal component analysis (PCA) and linear discriminant analysis (LDA) was adopted to reduce the feature dimension. Then the feature data of training samples was adopted to train the support vector machine classifier. Finally, the support vector machine classifier was used to classify the feature data of test samples. The experiments were carried out on Flavia database and ICL database. The average accuracy was 92.52% and 89.97%, respectively. The experiments showed that the average accuracy of the proposed method was better than that of the compared researches.
leaf recognition; multi-feature dimension reduction; principal component analysis; linear discriminant analysis; support vector machine
10.6041/j.issn.1000-1298.2017.03.004
2016-09-03
2016-12-07
中央高校基本科研業務費專項資金項目(2015ZCQ-GX-04)和北京市科技計劃項目(Z161100000916012)
鄭一力(1981—),男,副教授,主要從事林業生態監測和林業工程裝備研究,E-mail: zhengyili@bjfu.edu.cn
TP391.41
A
1000-1298(2017)03-0030-08