畢立恒
(黃河水利職業技術學院,河南 開封 475004)
基于葉片圖像算法的植物種類識別方法研究
畢立恒
(黃河水利職業技術學院,河南 開封 475004)
為了提高植物種類的識別率,采用葉片圖像算法。首先建立植物種類特征模型,包括植物葉片顏色特征、形狀特征、紋理特征;然后確定徑向基函數神經網絡的輸入層、輸出層、隱含層之間的關系;接著對徑向基函數個數、中心及寬度優化,基于梯度下降方法對權重參數計算,自適應調節學習率;最后給出了植物種類識別過程。實驗仿真選擇植物葉片顏色特征、形狀特征、紋理特征的特征量分別為6、7、7個,其中本文算法對植物種類識別的三個組合特征平均識別率為93.5%,高于單個特征、兩個組合特征的平均識別率,形狀特征對識別率所起的作用最大。
葉片;植物種類;徑向基函數;圖像算法
植物種類識別一般是通過對植物的外部形態描述得以實現,各種植物葉片的紋理、顏色和形狀結構具有差異性,同時植物葉片一年四季變化不大,比較容易采集,因此利用葉片通過人工智能方法進行植物種類識別是一種簡單而有效的方法[1],對植物可進行方便的管理和保護。
傳統人工識別結果受主觀性影響比較大,正確識別率較低,目前智能算法主要有:Guyer等[2]提取了17種葉片形狀特征,并對40類植物進行分類;Oide等[3]將葉片形狀作為神經網絡的輸入,使用Hopfield網絡和感知器對大豆葉片進行分類;Soderkvist[4]使用葉片的幾何特征,采用BP前饋神經網絡對15種瑞典樹木進行分類,最終形成Swedish葉片標準測試數據集;Backes等[5]利用復雜網絡算法分析葉片特征并進行識別,可對不同分辨率以及一定采樣噪聲的葉片圖像識別,有很好的效果;Ghazi等[6]利用PCANet算法在掃描葉片圖像上取得了90.49%的識別率,但是普通葉片圖像識別率比較低;朱靜等[7]通過葉片圖像的形狀和葉緣特征,對14種植物337份葉片樣本的葉形測試準確率達92%;Munisami等[8]采用基于特征的神經網絡分類器對植物葉片識別,包括矩形、圓度、偏心率等;Lee等[9]提出了基于葉片輪廓質心的植物葉片識別系統,使用4種基本幾何特征和5個靜脈特征。
為了提高植物種類的識別率,采用改進徑向基函數神經網絡(improved radial basis function neural network,IRBFNN)算法。首先建立植物種類特征模型,包括植物葉片顏色特征、形狀特征、紋理特征;然后確定徑向基函數神經網絡的輸入層、輸出層、隱含層之間的關系;接著對徑向基函數個數、中心及寬度優化,基于梯度下降方法對權重參數計算,自適應調節學習率;最后給出了植物種類識別過程。實驗仿真選擇植物葉片顏色特征、形狀特征、紋理特征的特征量分別為6、7、7個,其中本文算法對植物種類識別的3個組合特征平均識別率為93.5%,高于單個特征、兩個組合特征的平均識別率,形狀特征對識別率所起的作用最大。
顏色信息集中分布在一階顏色矩、二階顏色矩和三階顏色矩上[10],通過低階顏色矩分別描述顏色的平均值、方差和斜度:
其中:M1、M2、M3分別表示一、二、三階顏色矩;qkl表示第k個顏色通道中灰度為l的像素值出現的概率;N表示圖像中像素值總個數。由于HSI顏色模型中,只有H和S分量中包含顏色信息,因此提取H和S顏色分量圖像的一、二、三階顏色矩作為葉片圖像的顏色特征,則葉片圖像的顏色特征M=[M1H,M2H,M3H,M1S,M2S,M3S]。
形狀特征是葉片的主要特征[11],主要羅列如下:

其中L、H為葉片外接矩形的長與寬。

其中:s為葉片區域面積;L×H為葉片外接矩形的面積。

其中r1、r2分別為葉片內切圓半徑與外接圓半徑。

其中:d1為邊界各點到葉片區域重心的平均距離;d2為邊界各點到葉片區域重心的均方差。



其中lmax為葉片主脈長度最大值。

其中:l為葉片短軸長度值;lmin為重心到邊界的最短距離。
1.3.1 分形特征
葉片圖像的紋理主要由葉片角質層的固有紋理和葉脈紋理構成,同時主葉脈和延伸的葉脈組成具有一定自相似性的網狀結構,符合分形特征[12],主要采用自相似性特征以及縫隙量兩個特征。
描述對象不規則度的自相似性特征:
f1=kr2-Fλ2-F。
其中:k為常數;r為尺度;F為分形維數;kλ2-F為分形表面積。
描述紋理的疏密程度的縫隙量:
f2=E[(M/E(M)-1)2]。
其中:M為分形體質量;E(M)為期望值。
1.3.2 基于灰度共生矩陣的特征
在進行植物葉片分析和處理過程中,紋理特征也是重要特征之一[13],利用灰度共生矩陣的統計特性生成0°、45°、90°、135°四個方向的共生矩陣,分別計算四個方向的特征如下。
同質性T1平均值:
其中:i、j為灰度值;p(i,j)為灰度值(i,j)同時出現的概率;L為灰度等級。
對比度T2平均值:
能量T3平均值:
相關性T4平均值:

則葉片圖像的紋理特征可表示為:
1.3.3 靜脈特征
靜脈特征v1主要通過葉片灰度圖像進行形態學運算[14-15]。
其中:A為葉片上的總像素數;A1為葉片上的靜脈像素總數。
徑向基函數(radial basis function,RBF)神經網絡在逼近能力和學習速度等方面都優于BP神經網絡[16]。輸入層是用來接受數據的,隱含層是一個非線性函數,對輸入數據進行建模,輸出層作為數據的輸出。

隱含層中最常用的函數是高斯函數,隱含層第j個神經元的輸出值zj為:

輸出層神經元的輸出公式為:
其中:wkj為輸出層第k個神經元與隱含層第j個神經元之間的調節權重。
2.2.1 徑向基函數個數、中心及寬度初始化方法
改進徑向基函數神經網絡(improved radial basis function neural network,IRBFNN)算法,隱含層結點數少量冗余能夠提高RBF的泛化能力[17],通過聚類方法求得隱結點基數,適當增加冗余,得到最佳隱結點數。設M為隱結點數;J為樣本原始聚類數;β為冗余系數,則:M=(1+β)·J。
其中:β一般取值范圍為[0,0.5],本文取值0.35。
為提高RBF訓練速度,參數Cj、Dj需要初始化。

其中:j=1,2,…,p;mini為訓練集中第i個特征所有輸入信息的最小值;p為隱含層神經元總個數;maxi為訓練集中第i個特征所有輸入信息的最大值。
類內樣本分散度大或類間距大,徑向基函數的寬度取大些,Dj為:
其中:ε為寬度調節系數,本文取值0.65。
2.2.2 基于梯度下降方法的權重參數計算
IRBFNN權重參數的訓練方法本文取為梯度下降法。迭代過程為:

其中:wkj(t)為第k個輸出神經元與第j個隱含層神經元之間在第t次迭代計算時的調節權重;cji(t)為第j個隱含層神經元對應于第i個輸入神經元在第t次迭代計算時的中心分量;η為學習率;E為IRBFNN評價函數。
其中:olk為第k個輸出神經元在第l個輸入樣本時的期望輸出值;ylk為第k個輸出神經元在第l個輸入樣本時的網絡輸出值。
將當前迭代誤差和上一次迭代誤差相比[18],若誤差變化量是負數,則認為迭代結果趨近于極小點,為了提高收斂速度可增加學習率,若誤差變化量是整數,同時值較大,則認為迭代結果偏離極小點,需減小學習率η:

2.2.3 訓練樣本初始化方法
對于給定的輸入數據,只有一小部分靠近的中心值被激活。因此,為了提高模型的計算性,在訓練之前先將訓練樣本的數據進行歸一化處理:

①初始化IRBFNN參數,輸入植物葉片訓練樣本;
②IRBFNN訓練,獲得參數;
③對權值、學習率進行調整;
④計算IRBFNN評價函數,達到E=0.05的要求或滿足訓練次數,訓練結束,進行步驟⑤;否則進行步驟②;
⑤將測試數據傳輸至訓練完成的IRBFNN模型中進行植物種類識別,輸出的即為植物種類識別數據。
實驗配置如下:CPU∶Intel Core i5-3470,操作系統:Windows 64位,內存:8 G,開發工具:Matlab7.0。利用數碼相機通過自然場景有針對性地采集了10種觀葉植物葉片圖像,每種植物葉片要求沒有明顯斑點且葉片大小完整,每種植物圖像85幅左右,統一保存為bmp格式、300×300分辨率的葉片圖像,并將每種葉片中總樣本圖像的1/3作為訓練樣本,其余作為測試樣本。
植物葉片主要有:桂花葉片、木瓜葉片、銀杏葉片、紅楓葉片、冬青葉片、禿瓣杜英葉片、夾竹桃葉片、東京櫻花葉片、龍牙花葉片和含笑葉片,各種葉片的典型特征如圖1所示。
每種植物葉片數據如下:桂花葉片90幅、木瓜葉片90幅、銀杏葉片90幅、紅楓葉片85幅、冬青葉片85幅、禿瓣杜英葉片85幅、夾竹桃葉片85幅、東京櫻花葉片90幅、龍牙花葉片90幅和含笑葉片85幅。 在對葉片圖像進行相關預處理后,通過6個顏色特征、7個形狀特征、7個紋理特征參數構成葉片圖像的多特征。
IRBFNN輸入節點數為 26,輸出節點數為 20,隱含層節點數為30,每種算法進行30次實驗,算法包括Guyer、Soderkvist、Backes、Ghaz、Trishen、Lee、IRBFNN。圖2為30次實驗不同算法對單個特征的平均識別率,分別為顏色特征、形狀特征、紋理特征的平均識別率;圖3為30次實驗不同算法的對兩個組合特征平均識別率,分別為顏色與形狀特征、顏色與紋理特征、形狀與紋理特征的平均識別率,圖4為30次實驗不同算法的對三個組合特征平均識別率,即顏色、形狀與紋理特征的平均識別率。


a,桂花葉片; b, 木瓜葉片; c, 銀杏葉片;d, 紅楓葉片;e, 冬青葉片; f, 禿瓣杜英葉片;h, 夾竹桃葉片;i, 東京櫻花葉片;j, 龍牙花葉片;k, 含笑葉片a, Fragrans;b, Papaya; c, Ginkgo; d, Acer palmatum;e,Holly; f, Elaeocarpus decipiens;h, Nerium oleander; i, Sakura; j, Erythrina corallodendron; k, Michelia figo圖1 各種葉片的典型特征Fig.1 Typical features of various leaves



圖2 不同算法的對單個特征平均識別率Fig.2 Average recognition rate of different algorithms with single characteristic
由圖2可知,僅用植物葉片單個特征識別植物種類,單個特征的平均識別率都比較低,特別是顏色特征最低,為70%以下,雖然形狀特征、紋理特征的特征量相同,都是7個,但是形狀特征對識別率貢獻較大,本文算法可達88%,以后研究可減少顏色特征數量,增加形狀、紋理特征數量;由圖3可知,兩個組合特征的平均識別率,形狀與紋理組合特征平均識別率高于顏色與形狀組合特征、顏色與紋理組合特征,同時兩個組合特征的平均識別率高于單個特征,這是因為每種植物葉子形狀、紋理具有單一性特點,組合起來避免了數據重復性,因此可作為識別的重要特征;由圖4可知,三個組合特征平均識別率高于單個特征、兩個組合特征,本文提出的IRBFNN算法的平均識別率最高,這是因為IRBFNN算法對隱結點數、權重、學習率進行了調整,克服了NN神經網絡參數難于設置的問題,提高了植物種類識別率。



圖3 不同算法的對兩個組合特征平均識別率Fig.3 Average recognition rate of different algorithms with two characteristics

圖4 不同算法的對三個組合特征平均識別率Fig.4 Average recognition rate of different algorithms with three characteristics
本文算法對徑向基函數個數、權重、學習率進行了調整,使得IRBFNN算法對植物種類的平均識別率較高,實驗仿真顯示本文算法對植物種類的三個組合特征平均識別率高于單個特征、兩個組合特征,形狀特征對識別率貢獻最大,因此以后研究可增加植物葉片形狀特征的數量,對提高植物種類識別率會有一定的幫助。
[1] 恩德,忽勝強.基于集成神經網絡的植物葉片識別方法[J].浙江農業學報,2015,27(12):2225-2233.
EN D, HU S Q. Plant leaf recognition based on artificial neural network ensemble[J].ActaAgriculturaeZhejiangensis,2015, 27(12):2225-2233.(in Chinese with English abstract)
[2] GUYER D E, MILES G E. Application of machine to shape analysis in leaf and plant identification[J].TransactionsoftheASAE,1993,36(1):163-171.
[3] OIDE M, NINOMIYA S, MURASE H. Discrimination of soybean leaflet shape by neural networks with image input[J].ComputersandElectronicsinAgriculture,2000,29(2):59-72.
[4] S?DERKVIST O. Computer vision classification of leaves from swedish trees[J].TeknikOchTeknologier,2010,33(3):202-206.
[5] BACKES A R, CASANOVA D, BRUNO O M. A complex network-based approach for boundary shape analysis[J].PatternRecognition,2009,42 (1):54-67.
[6] GHAZI M M,YANIKOGLU B,APTOULA E,et al.Sabanci-Okan system in LifeCLEF 2015 plant identification competition[C].Conference and Labs of the Evaluation forum,2015:697-705.
[7] 朱靜,田興軍,陳彬,等. 植物葉形的計算機識別系統[J].植物學通報,2005,22(5):599-604.
ZHU J, TIAN X J, CHEN B, et al. Computer recognition system of plant leaf-shape[J].ChineseBulletinofBotany,2005,22(5):599-604. (in Chinese with English abstract)
[8] MUNISAMI T, RAMSURN M, KISHNAH S, et al. Plant leaf recognition using shape features and colour histogram with K-nearest neighbour classifiers[J].ProcediaComputerScience,2015,58:740-747.
[9] LEE K B, CHUNG K W, HONG K S. An implementation of leaf recognition system based on leaf contour and centroid for plant classification[J].SpringerNetherlands,2013,214:109-116.
[10] 丁嬌.基于流形學習算法的植物葉片圖像識別方法研究[D].合肥:安徽大學,2014:38-39.
DING J. Research on image recognition method of plant blade based on manifold learning algorithm[D]. Hefei: Anhui University,2014:38-39. (in Chinese with English abstract)
[11] 王麗君,淮永建,彭月橙.基于葉片圖像多特征融合的觀葉植物種類識別[J].北京林業大學學報 ,2015,37 (1):55-61.
WANG L J, HUAI Y J, PENG Y C. Method of identification of foliage from plants based on extraction of multiple features of leaf images[J].JournalofBeijingForestryUniversity,2015,37 (1):55-61. (in Chinese with English abstract)
[12] 張寧,劉文萍.基于克隆選擇算法和K近鄰的植物葉片識別方法[J].計算機應用,2013,33(7):2009-2013.
ZHANG N, LIU W P. Plant leaf recognition method based on clonal selection algorithm and K-nearest neighbor[J].JournalofComputerApplications,2013,33(7):2009-2013. (in Chinese with English abstract)
[13] 張芳,李曉輝,楊洪偉.復雜背景下植物葉片病害的圖像特征提取與識別技術研究[J].遼寧大學學報(自然科學版),2016,43(4):311-318.
ZHANG F, LI X H, YANG H W. Image feature extraction and recognition of plant leaf disease in complex background[J].JournalofLiaoningUniversity(NaturalScienceEdition),2016,43(4):311-318. (in Chinese with English abstract)
[14] CRAVIOTTO R M, ARANGO M R, GALLO C, et al. Automatic classification of legumes using leaf vein image features[J].PatternRecognition,2014,47(1):158-168.
[15] KULKARN A H, RAI H M, JAHAGIRDAR D K A, et al. A leaf recognition technique for plant classification using rbpnn and zernike moments[J].JournalofComputer-MediatedCommunication,2013,2 (1):984-988.
[16] 闞江明,王怡萱,楊曉微,等.基于葉片圖像的植物識別方法[J].科技導報,2010,28(23):81-85.
KAN J M, WANG Y X, YANG X W, et al. Plant recognition method based on leaf images[J].Science&TechnologyReview,2010,28(23):81-85. (in Chinese with English abstract)
[17] 梁斌梅,韋琳娜.改進的徑向基函數神經網絡預測模型[J].計算機仿真,2009,26(11):191-194.
LIANG B M, WEI L N. An improved prediction model based on radial basis function neural network[J].ComputerSimulation,2009,26(11):191-194.(in Chinese with English abstract)
[18] 張景璐,趙妍.基于改進神經網絡的光纖故障監測優化[J].激光雜志, 2016,37 (6):131-134.
ZHANG J l, ZHAO Y. Fiber optic fault monitoring and optimization based on the improved neural network[J].LaserJournal, 2016, 37(6):131-134.(in Chinese with English abstract)
Plantspeciesrecognitionbasedonleafimagealgorithm
BI Liheng
(YellowRiverConservancyTechnicalInstitute,Kaifeng475004,China)
In order to improve the recognition rate of plant species, leaf image algorithm was proposed. Firstly, the plant species characteristic model was established, including leaf color, shape and texture characteristics. Secondly, relations of input, output and hidden layer of radial basis function neural network was built. Thirdly, the numbers of radial function, center and width was optimized, weighting parameter was calculated based on gradient descent method, and learning rate was adaptively adjusted. Finally, plant species recognition process was given. Plant leaf color, shape and texture characteristic numbers of simulation were selected as 6, 7 and 7, the three characteristics average recognition rate of improved radial basis function neural network algorithm was 93.5%, higher than single and two characteristics, the shape characteristic had maximum recognition rate.
leaves; plant species; radial basis functions; image algorithm
浙江農業學報ActaAgriculturaeZhejiangensis, 2017,29(12): 2142-2148
http://www.zjnyxb.cn
畢立恒. 基于葉片圖像算法的植物種類識別方法研究[J].浙江農業學報,2017,29(12): 2142-2148.
10.3969/j.issn.1004-1524.2017.12.25
2017-06-09
中國國家專利(公開號CN202189701U);河南省科學技術成果(豫科鑒委字2013年第201號)
畢立恒(1973—),男,河南信陽人,碩士,講師,主要從事嵌入式系統、數字信號處理研究。E-mail: 3065991303@qq.com
TP391.4
A
1004-1524(2017)12-2142-07
(責任編輯張 韻)