王 斌, 黃竹芹, 陳良宵
1(南京財經大學 信息工程學院,江蘇 南京 210023)
2(電子商務省級重點實驗室(南京財經大學),江蘇 南京 210023)
植物是地球生態系統的一個重要組成部分,目前已知的植物種類數量大約在40萬左右,還存在大量未被分類或未知的物種.植物的分類識別是生物和環境科學非常重要的一個研究課題,對生物多樣性保護,生態農業、生物安全等有著重要的意義.作為植物的六大器官之一的植物葉片,因其方便采集、狀態相對穩定,且不同種類植物一般在其葉片的視覺特征上存在著差異,為植物的分類識別提供了非常有價值的線索,是植物分類的重要依據.將計算機視覺技術引入植物分類的一個核心的工作就是對采集的植物葉片圖像進行描述,以用于自動地對植物進行分類識別.
一般葉片形狀往往存在較大的類內變化,如圖 1(a)中給出的屬于同一類的 5幅葉片圖像,且又有許多葉片形狀具有非常小的類間差異、如圖1(b)中給出的屬于不同類的5幅葉片圖像,這些問題的存在給葉片圖像的精確識別帶來了很大的挑戰.如何從葉片圖像中抽取具有強辨識能力的圖像特征,是解決該問題的關鍵.本文提出一種圓周特征葉片圖像描述方法,通過圓心置于葉片輪廓線上的圓與葉片圖像的輪廓線和目標區域分別相交所得到的圓心角、區域像素點在圓周上的分布,以及它們的灰度統計來分別表征葉片圖像的輪廓、區域和灰度特征.

Fig.1 Leaf image samples圖1 葉片樣本的示例
本文的主要貢獻在于:
(1) 現有的葉片圖像僅從輪廓線、葉片區域或灰度級特征中的某一方面來描述葉片圖像,而本文提出的圓周特征描述自然地組合了圖像的輪廓線、區域和灰度信息,使其對葉片圖像的描述更為全面;
(2) 現有的多尺度方法在輪廓線上各點的尺度安排都是相同的,即它們所采用的各尺度級的尺度大小一般是固定的,并不隨輪廓線上點的變化而發生改變,而本文提出的多尺度描述方法是一種具有局部特性的多尺度安排,其各個尺度級的大小,即圓的半徑,取決于圓心所在的輪廓點與輪廓線上其他各點的距離,因此,當圓心所在的輪廓點發生改變時,則圓的半徑也相應地發生改變,這種有著局部特性的多尺度安排,使得描述子能夠更好地抽取到強辨識能力的形狀特征;
(3) 本文提出的方法在著名的葉片圖像檢索測試集 Flavia[1]和葉片圖像分類測試集 Swedish[2]上得到的結果要好于目前公開發表的方法在該測試集上報告的最好結果,證明了該方法的有效性.
在葉片圖像描述方面,已提出了許多方法,這些方法可分為基于輪廓線的方法、基于區域的方法和基于灰度級特征的描述方法.基于輪廓線的方法描述葉片圖像僅考慮葉片圖像的邊界像素點[3].其中,最為著名的是Belongie等人[4]提出的形狀上下文(shape contexts)描述方法,該方法用原點位于輪廓線上的點的極坐標柵格,來統計輪廓線其他各點相對于該點的空間分布,用產生的直方圖構成基于該點的形狀描述,稱為形狀上下文,該方法非常好地描述了輪廓線上的點的空間關系,在形狀識別中效果顯著.Ling等人[5]在形狀上下文的基礎上,用輪廓點之間的內距離代替形狀上下文算法中使用的輪廓點之間的歐氏距離,這里,內部距離定義為輪廓線上兩個點關于目標區域的最短路徑長度.內部距離形狀上下文(IDSC)方法具有對關節變換的不敏感性.該方法在著名的Swedish[2]葉片圖像測試集上取得了94.13%的分類準確率.近來,Zha等人[6]提出了一種引入學習機制的形狀上下文描述子.該方法對輪廓線進行不同尺度的高斯卷積,產生多尺度的形狀上下文描述子,通過詞典學習方法[7]生成形狀模式詞典,統計一個形狀的多尺度形狀上下文描述在該模式詞典的所有模式上的分布,得到形狀的最終描述.因引入了學習機制,該方法具有非常好的形狀分類效果,在 Swedish[2]葉片圖像測試集上取得了97.07%的分類準確率.
上述方法主要考慮目標輪廓的空間關系,也有更多的方法著眼于葉片輪廓上的曲率特性.經典的方法是Mokhtarian[8]提出的曲率尺度空間方法.該方法用不同寬度的高斯核去平滑曲線,同一尺度下的曲線拐點構成一幅二值圖像(稱為CSS圖像),其中,圖像的橫軸坐標代表拐點在曲線上的位置,縱坐標代表高斯核的寬度.CSS圖像由若干個拱形輪廓組成,每一個關于形狀的凸和凹,其最大者構成形狀描述.該方法被MPEG-7推薦為標準的輪廓線形狀描述.另有一些方法用與輪廓線的曲率特性相關的幾何量來生成描述子.Alajlan等人[9]提出了一種帶符號的三角形面積表示法來表示形狀輪廓的凸凹特性,該方法用頂點位于輪廓線的三角形的面積來描述形狀,并用相關的輪廓線的弧長來控制尺度.Mouine等人[10]對該方法進行了拓展,除用三角形面積外,三角的邊長、內角等幾何量也被用于形狀描述.不同于標準的基于微分的曲率計算法,Manay[11]提出了一種基于積分運算的曲率度量方法.該方法用圓心位于輪廓線的圓盤與葉片區域相交的面積來度量輪廓線的曲率.Kumar等人[12]用該方法計算了不同尺度下輪廓線上點的曲率,構成一個多尺度曲率直方圖(HoCS)來描述葉片圖像,并用該方法開發了一個葉片種類識別系統.近年來,Hu等人[13]提出多尺度距離矩陣描述方法,Wang等人[14]提出多尺度拱高描述,Liu[15]提出基于高斯混合模型的形狀描述方法,這些基于輪廓線的描述方法都在Swedish葉片圖像測試集上取得了較好的分類效果.
輪廓線描述方法僅從葉片圖像的輪廓構造描述子,而另有一些方法將葉片形狀區域內所有的像素點作為輸入來產生描述子.Du[16]等人提取了葉片圖像的不變矩特征[17]和若干個區域度量,包括縱橫比、矩形度、凹凸性、偏心率、凸包面積比、凸包周長比等來描述形狀.Wang[18]等人用二值葉片圖像的7個幾何不變矩和16個Zernike矩來描述葉片形狀.文獻[19]將葉片圖像表示為一個2D的二值函數,用基于該函數的2D傅里葉功率譜生成不變的形狀描述子,該方法在Swedish測試集上,采用1NN分類器,取得了92.27%的精確率,而采用支持向量機作為分類器,則取得96.53%的分類精確率.文獻[20]用快速Curvelet變換得到3個Curvelet系數,對每一個系數,用其第1個不變矩表征葉片形狀.
除了利用葉片的形狀構造描述子之外,葉片圖像的灰度特征也被用來產生描述子.Wu等人[21]用多光譜技術進行綠茶葉片分類.該方法抽取不同波長的綠茶葉片圖像的熵值作為紋理特征,用支持向量機(SVM)和徑向基函數(RBF)核函數可通過100%的精確度確定茶葉類別.Dalcimar等人[22]使用Gabor小波濾波器在更大的葉片數據集上進行測試,計算每個濾波器響應的能量,識別率達到 84.00%.Chaki[20]采用 Gabor濾波器和灰度共生矩陣(GLCM)提取葉片圖像的紋理特征.Tang[23]將非重疊窗口局部二值模式(LBP)和灰度共生矩陣(GLCM)相結合,用于綠茶葉片分類,該方法可通過較低的計算成本有效地提取葉片紋理特征.
上述方法由于僅從輪廓線、葉片區域或灰度級特征中的某一方面來描述葉片圖像,在識別率方面并不十分理想.盡管其中一些方法考慮組合葉片形狀特征和紋理特征去識別葉片圖像,但其算法并不能有效地融合這兩類特征,以使葉片圖像的識別率得到更大的提升.在文獻[24]中,我們首次提出了用圓周與葉片圖像相交的幾何特性來描述葉片圖像,而本文對該想法作了較大的拓展和深化,對3類圓周特征(葉片輪廓、葉片區域和灰度特征)的有效性進行了深入的分析,并提出了一種對這3類圓周特征進行有效融合的方法,實驗結果表明,該方法取得了比現有的葉片圖像描述方法更高的識別率.
本節提出了一種圓周特征葉片圖像描述方法,下面給出該方法的細節.
首先對葉片圖像進行預處理操作,預處理的步驟如下.
(1) 彩色圖像灰度化,這里采用加權平均法,它是圖像灰度化最常用的方法,因為由該方法得出的結果更接近人的視覺感知,公式表示如下:

其中,R,G,B表示彩色圖像中每個像素點顏色的3個分量,即紅、綠、藍3種顏色,每個分量的取值區間為0~255,因此通過式(1),一個彩色圖像被變成灰度圖像,將有255個灰度級;
(2) 灰度圖像二值化,本文采用Matlab軟件中的graythresh函數來計算閾值,該函數實際采用了Otsu算法進行閾值分割,得到的二值圖像函數如下:

為方便后面的計算,我們將上述函數變反,即葉片區域像素點的取值為1,反之為0;
(3) 用經典的輪廓跟蹤算法提取葉片的輪廓線,再沿順時針方向將輪廓線均勻采樣成N個點 Ω={p1,p2,…,pN},由于輪廓線是閉合的,有pi+N=pi和pi-N=pi.
圖2給出了葉片圖像預處理的流程.經過上述操作,我們得到了灰度圖像s(x,y)、二值圖像f(x,y)和均勻采樣后的輪廓線Ω={p1,p2,…,pN}.

Fig.2 Flow chart of the leaf image preprocess圖2 葉片圖像預處理流程示意圖
給定輪廓線Ω上的一個點pi和半徑R,我們可以得到一個以pi為圓心,以R為半徑的圓,我們用該圓分別提取葉片圖像的圓心角特征、圓周積分特征和圓周灰度統計特征.
(1) 圓心角
在該圓與輪廓線Ω的所有交點中,求取與圓心pi(xi,yi)距離最近的兩個交點,即從pi點出發,分別按順時針和逆時針方向,遍歷輪廓線所經歷的第1個交點,我們將它們分別記為.定義該圓與輪廓線Ω所成的圓心角為以pi為頂點,邊繞點pi沿順時針方向旋轉到邊,所轉過的角,記為,圖3給出了圓心角的示例.

Fig.3 The illustration of the central angle feature圖3 圓心角示例

我們稱該特征為基于輪廓點pi的圓心角特征,其中,為三角形的面積.不僅能很好地描述葉片輪廓的曲率屬性,并且不需要對特征值進行額外的規范化處理;當圖像發生旋轉、平移和縮放時,這3點的相對位置并不發生改變,因此,它們形成的角度大小不變,則圓心角特征具有內在的旋轉、平移和縮放的不變性.
(2) 圓周積分
首先計算該圓的周長C=2πR,再在圓周上均勻采樣C=round(c)個點,這里,round()表示四舍五入取整,其中,坐標可用下式來計算:



Fig.4 The illustration of the circular integral features圖4 圓周積分特征示例圓周積分特征示例
(3) 圓周灰度統計
為便于提取的灰度特征與前面抽取的形狀特征組合使用,我們首先將葉片區域的像素點的灰度值用它們的最大值歸一到區間[0,1].前面我們已對圓周均勻采樣了C個點,其中,j=1,2,…,C,本文對其中落在葉片區域內,即滿足的像素點的灰度信息進行統計,得到它們的灰度均值和灰度標準差,定義如下:反映了葉片區域像素點沿圓周的灰度分布的平均水平,而則反映了葉片區域像素點沿圓周的灰度

?分布的平均波動強度.根據灰度統計特征的產生機制,其與圓周積分特征一樣具有平移、旋轉、縮放的不變性.圓周灰度統計特征的示例如圖5所示,藍色點表示圓心,紅色部分表示圓周與葉片區域相交的部分.

Fig.5 The illustration of the circular gray statistical features圖5 葉片圖像的圓周灰度統計示例
人的視覺系統對目標的視覺感知具有多尺度的特性,多尺度描述方法可以從不同層級描述葉片形狀,不但可以提取到葉片圖像的全局信息,還能捕捉到葉片圖像的局部細節.本文提出的葉片圖像的圓周特征具有潛在的多尺度描述能力,通過改變圓的半徑R,可以產生多尺度的葉片圖像描述.
對于輪廓Ω上的點pi(xi,yi),我們取Ri為該點與Ω中的最遠點的歐氏距離的一半,其數學定義如下:

由此確定圓的半徑R的取值范圍為(0,Ri].我們在該區間內產生如下K個值:

那么以半徑作為尺度,并讓R分別取上述各值,我們得到了一個具有k級的尺度安排,r0為該尺度安排中的最大尺度,rK-1則為該尺度安排中的最小尺度.需要指出的是,輪廓點改變后,Ri將發生變化,對應的尺度安排也將發生改變,因此,相較于現有的采用固定尺度的方法(它們一般在同一尺度級下,在輪廓各點都取相同的尺度值),該尺度安排具有局部特性.圖 6~圖 8分別給出多個尺度級的圓心角特征、圓周積分特征和圓周灰度統計特征的示例.

Fig.6 The illustration of the multiscale central angles under four scale levelsr0 ,r1,r2,r3圖6 多尺度的圓心角特征的示例,圖中給出了在4個尺度級r0、r1、r2、r3下的圓心角
我們用葉片圖像的多尺度圓周特征構造描述子.對于每一尺度級rk,讓輪廓點索引由1變化至N,得到圓心角特征向量,圓周積分特征向量統計特征向量,以及圓周灰度.

Fig.7 The illustration of the multiscale circular integral features under four scale levelsr0,r1,r2,r3圖7 多尺度的圓周積分特征的示例,圖中給出了在4個r0、r1、r2、r3尺度級的圓周積分

Fig.8 The illustration of the circular gray statistical features under four scale levelsr0,r1,r2,r3圖8 多尺度的圓周灰度統計特征的示例圖,圖中給出了4個尺度級r0、r1、r2、r3的圓周灰度統計特征
如圖9所示,我們對給出的3幅葉片圖像(其中,a和b屬于同一類),繪出了它們的圓周積分特征β在尺度級r0、r1、r2、r3下的曲線,以便觀察圓周特征描述子的多尺度特性.圖中給出的 3幅葉片圖像具有整體形狀的相似性,葉片c與葉片a和b的差異性在于其具有邊緣鋸齒.根據圓周特征的多尺度描述機理,其大尺度描述子對形狀的細節不敏感,主要側重于形狀的粗粒度特征,而小尺度描述子則相反,主要刻畫形狀的細節信息.而觀察圖像中的4個尺度級r0、r1、r2、r3的特征曲線可以看出,在尺度r0,3幅圖像的特征曲線相互之間非常接近,而當尺度逐漸減小(從r0變化到r3),葉片a與葉片b的特征曲線仍然保持相互靠近,而c的特征曲線逐漸遠離葉片a和b的特征曲線.從圖9給出的特征曲線,可以清楚地觀察到圓周特征描述子的這種多尺度行為特性.

Fig.9 The curves of the circular integral featuresβ under four scale levelsr0,r1,r2,r3 for leaf images a,b and c(leaf a and leaf b blong to the same class)圖9 3幅樹葉圖像a、b、c(其中,a與b為同一類)的圓周積分特征β在尺度級r0、r1、r2、r3下的曲線
需要指出的是,本文提出的圓周特征描述子通過抽取圓心角和圓周積分特征描述葉片的形狀,通過抽取圓周灰度統計特征描述葉片的灰度信息.現有的葉片圖像識別方法大多僅通過形狀特征來進行識別.而本文提出的圓周特征描述子,通過圓周與葉片圖像相交的幾何特性,有效地組合了葉片的形狀特征和灰度信息,從而具有較高的識別能力.我們在圖10中給出了一個例子,以進一步說明圓周特征描述子的描述能力.圖10給出了3幅葉片灰度圖像(a和b屬于同一類),從形狀上看,它們非常相似,難以區分.圖中繪出了這3幅葉片圖像的圓心角特征α、圓周積分β、灰度統計特征μ和δ的特征曲線.對于各類特征,圖中還給出了葉片a的特征曲線分別與葉片b和葉片c的特征曲線的L1距離,以便于量化比較.從該圖可以看出,3幅圖像的圓心角特征α、圓周積分β曲線都非常靠近,如果僅依據該兩類特征進行識別,就會將葉片a誤識別為與葉片c同一類.而觀察該圖的灰度統計特征μ和δ的特征曲線,葉片a和b的曲線相互靠近,而葉片c的曲線則遠離葉片a和b的曲線.說明葉片c有著與a和b顯然不同的灰度信息,依據灰度統計特征,葉片a可以正確地識別為與葉片b同屬一類.

Fig.10 The curves of the central angle featureα,the circular integral featureβ,the circular gray statistical feature μ and circular gray statistical featureδ at scale levelr0 for leaf images a,b and c (a and b belong the same class),|.| denote theL1 distance between two curves圖10 3幅樹葉圖像a、b、c(其中,a與b為同一類)的圓心角特征α、圓周積分特征β、灰度統計特征μ和δ在尺度級r0下的曲線,|.|表示兩條曲線的L1距離
本文提出的圓心角特征、圓周積分特征和圓周灰度統計特征已滿足平移、旋轉和縮放的不變性,但是由于葉片的輪廓線是一條閉合曲線,任意輪廓點都可以作為輪廓線的起始點,因此為得到歸一化的描述,我們僅需將描述子進行始點歸一.我們用離散傅里葉變換來完成這一任務.對尺度級rk下的圓心角序列,其離散傅里葉變換為


因輪廓起始點的變化僅改變傅里葉系數的相位信息,對于上述傅里葉系數序列,我們只取每個系數的幅度值,同時,為了使描述子更加緊致且對噪聲更具魯棒性,我們取前M個系數(M< 自此,我們得到了完全不依賴于形狀的平移、旋轉、縮放和輪廓線起始點的5類特征α、β、γ、μ和δ.但這5類特征一般有著不同的數量級,將它們組合使用去完成葉片圖像的分類和檢索任務,可能會出現某類高數量級的特征在比較中處于支配地位,而使得其他低數量級的特征失效的問題.我們進一步對它們進行數量級的歸一.因為本文的工作主要是為了完成葉片圖像的分類和檢索任務,在分類任務中,我們用訓練集中的所有圖像,而對檢索任務,我們用所有的數據庫圖像,來對這5類特征進行數量級的歸一.這里,我們以執行分類任務對圖像的圓周特征描述的α特征的數量級歸一為例,闡述其操作步驟如下. (1) 對每一幅訓練集圖像,計算其α特征的所有尺度的 0階傅里葉系數的均值,得到訓練集圖像的索引號; (3) 用Mα對所有的樣本(包括訓練集和測試集)的α特征向量進行歸一,即用特征向量α/Mα替換原來的特征向量α. 對特征μ和δ,我們進行同樣的歸一化操作.但對特征β和γ的歸一化處理稍有不同.由β和γ的定義(見公式(5)),它們同屬圓周積分特征,分別計算的是圓周的內弧和外弧與葉片區域相交的長度.用它們各自的Mβ和Mγ去進行特征歸一,不能保持內弧積分特征和外弧積分特征的原有比例關系這一有用的信息.為此,在上述歸一化操作的第3步,我們用max(Mβ,Mγ)去歸一所有樣本的β特征向量和γ特征向量.經過上述歸一化操作,各類特征將具有同樣的數量級,方便在后續形狀特征的比較中對它們組合使用.對于執行圖像檢索任務,處理方法相似,不同的是,執行歸一操作時,用的是所有的數據庫圖像,而不是訓練集圖像(檢索任務沒有訓練集),用計算的均值對所有樣本(包括檢索圖像和數據庫圖像)進行歸一操作. 給定葉片圖像A和B,抽取它們的歸一化的圓周特征描述{αA,βA,γA,μA,δA}和{αB,βB,γB,μB,δB}.它們之間的距離定義為 其中,|.|表示L1距離.較小的dis(A,B)表示葉片A和葉片B之間有著較大的相似度,而dis(A,B)越大,則說明它們的差異越大.這里需要說明的是,在圓周特征描述中,圓心角特征α描述葉片圖像的輪廓線特征,圓周積分特征β和γ描述的是葉片區域的幾何特征,而圓周灰度統計特征μ和δ描述的是葉片圖像的灰度特征.因為在描述子中,圓心角特征只有一個特征向量,而圓周積分和圓周灰度特征各有兩個特征向量,為保證這 3類特征在特征比較中的特征數的平衡,在公式(16)中,對后兩類特征進行了除2處理. 本文的實驗平臺是一臺操作系統為Windows 10、CPU為Intel(R) Core(TM) i5、內存8GB的個人計算機,算法的編程實現工具為MATLAB R2010b.我們通過將本文提出的算法分別應用于葉片圖像檢索和葉片圖像的分類,以驗證本文提出的算法的有效性.在實驗中,本文提出的算法的參數設置為:輪廓線采樣點的個數為256,所用的尺度個數為7,傅里葉變換中保留的傅里葉系數的個數為7. 為了進行葉片圖像檢索實驗,我們選用了著名的Flavia葉片圖像測試集[1].該測試集包含32種總共1 907個葉片樣本,每類包含50~72個樣本,大部分采自中國長江三角地區,如中國七葉樹、紫荊、銀杏樹、廣玉蘭等.圖11給出了每一類的一個樣本,由該圖可以看出,許多樣本在形狀特征上具有很大的相似性,為正確區分它們帶來了挑戰. Fig.11 Image samples of 32 types of leaf samples in Flavia data set[1]圖11 Flavia數據集中的32類葉片樣本圖像示例[1] 已有許多方法[10,13,14,25,26]在該測試集上報告了結果,在實驗中,我們采用標準的檢索性能評估方法.常見的評估方法有兩種,一種是查準率(precision)/查全率(recall)曲線法[10,14],另一種是平均精度均值(mean average precision,簡稱MAP)法[10,14,19].查準率/查全率定義如下: 這里,n1是一次查詢返回的樣本的個數,r是返回的圖像中與查詢圖像屬于同一類的個數,n2是數據集中與查詢圖像屬于同一類的圖像個數.查準率是測量查詢的精度,而查全率則是測量從數據集中檢索相似形狀的能力.以數據集中每一幅圖像作為查詢樣本,與測試集中所有圖像進行匹配,即計算它們之間的形狀差異度,再根據差異度由小到大,對返回的圖像進行排序.對于每一個待查詢的形狀,令查全率從10%~100%發生變化,并計算所對應的查準率,由此繪出查準率/查全率曲線.這里給定查全率,對應的查準率的計算方法為:根據公式(17),計算出返回圖像中與查詢圖像屬于同一類的個數,再在排好序的圖像中確定應返回的圖像個數,從而計算查準率,最后計算所有查詢圖像的查準率的平均,得到平均查準率. 對于平均精度均值MAP法,精度均值(average precision,簡稱AP)定義為 其中,n表示檢索中返回的圖像的個數,p(j)是前j最佳匹配的準確率,g(j)是標記函數,當第j個最佳匹配與查詢圖像屬于同一類時為1,否則為0,Q表示數據集中與查詢圖像屬于同一類的圖像個數.計算出所有查詢圖像的AP值,求均值后便可得到MAP值. 為了驗證本文提出的圓周特征描述法的有效性和優越性,本文選取了近年來發表的 5種具有良好性能的葉片圖像檢索算法進行比較:三角形面積法(TAR)[10]、多尺度距離矩陣(MDM)[13]、內距離形狀上下文(IDCS)[5]、三角形邊長角度法(TSLA)[10]、多尺度拱形高度法(MARCH)[14].其中,多尺度距離矩陣(MDM)有多種不同的版本,我們選取的是效果最好的版本.在圖 12中,我們繪制了本文提出的算法和其他參與比較的算法的查準率/查全率曲線.從該圖可以看出,對給定的每一個查全率,本文提出的圓周特征描述法都取得了比其他 5種方法更高的查準率.當查全率為 5%時,即平均每次查詢返回 2~3個與待查詢葉片最相似的葉片樣本,圓周特征描述法的查準率達到了98.95%,比其他兩種最好方法MARCH[14]高和TSLA[10]分別高出了2.62%和5.49%;當查全率達到50%時,即測試集中與待查詢樣本的同類樣本數的一半被返回時,圓周特征描述法的查準率達到84.97%,分別高于其他兩種最好方法MARCH[14]和TSLA[10]達7.78%和11.75%.當查全率達到100%時,圓周特征描述法的查準率為29.88%,仍然高于其他參與比較的算法. Fig.12 The precision/recall curves of the proposed circular features description and the other compared methods on the Flavia dataset圖12 在Flavia測試集上本文提出的圓周特征描述法和其他方法的查準率/查全率曲線 本文提出的方法和其他5種參與比較的方法的MAP值,均在表1中列出.從該表可以看出,本文提出的圓周特征描述法取得了最高的MAP值79.9%,比方法TAR[10]、MAM-RM[13]、IDSC[5]、TSLA[10]和MARCH[14]分別高出了27.1%、20.8%、20.0%、10.0%、6.9%.值得指出的是,我們查閱了現有的在該測試集上公開報道的MAP值,本文提出的算法所報告的結果是目前的最好結果.以上數據表明,本文提出的算法的檢索性能要優于其他葉片圖像檢索算法. 由于圓周特征描述法是一個多尺度描述子,我們做了另一組實驗來研究尺度個數K的選取對實驗結果的影響.在實驗中,我們讓尺度個數由1~11變化,并得到所對應的MAP值,將實驗結果在圖13中繪制成折線圖.從該圖可以看出,當僅取一個尺度時,即只取尺度安排中的最大尺度時,MAP值只有 59.2%,說明此時描述能力較弱,此時描述子只能描述出葉片的全局特征.隨著尺度個數K的增加,描述的粒度越來越小,捕捉葉片圖像的細節特征的能力越來越強,直到K為7時,MAP達到最高:79.9%,而當K再取更大的值時,MAP值并沒有繼續增長,其原因是,當圓的半徑足夠小時,圓內所包含的葉片像素點只有圓心甚至一個像素點也沒有,此時的尺度級已不具描述能力,因此我們以為取7個尺度級就能很好地完成葉片圖像檢索任務. Table 1 The comparisons of the MAP value of the proposed circular features description method with the other methods on Flavia data set表1 在Flavia數據集上的本文提出的圓周特征描述法與其他方法的MAP值的對比 Fig.13 The MAP scores of the proposed methods of taking various number of scale levelsKon the Flavia dataset圖13 在Flavia數據集上,本文提出的方法在尺度個數K取不同值情況下相應的MAP值 本文提出的圓周特征描述法包括 3類特征:圓心角特征、圓周積分特征和圓周灰度統計特征,為研究它們在葉片圖像檢索中的貢獻,我們做了另外 4組實驗:(1) 僅使用圓心角特征α;(2) 僅使用圓周積分特征β+γ;(3)僅使用圓周灰度統計特征μ+δ;(4) 所有特征組合α+β+γ+μ+δ.表 2中給出了該組實驗的結果. Table 2 The MAP scores of using various kinds of circular features on the Flavia dataset表2 在Flavia數據集上,使用各類圓周特征描述的MAP值 從表2可以看出,本文提出的圓周特征描述在單獨使用某一類特征的情況下,圓心角特征的MAP值最高,達到了 71.91%,檢索效果最好,其次是圓周積分特征,MAP值為 60.37%,單獨使用圓周灰度統計特征時,MAP為44.97%,而組合所有的圓周特征,MAP達到79.94%.該組實驗說明,葉片圖像的輪廓線特征在識別中起到的作用最大,區域特征次之,灰度特征再次,這一結果也與葉片的實際識別依據相一致.但這3種特征組合使用可以彌補它們單個使用的不足,如形狀非常相似的葉片,再加入它們的灰度特征,將會明顯地提高識別效果. 為進行葉片圖像分類性能的評估,我們選用了著名的 Swedish[2]測試集.該測試集中樣本采自瑞典,其中有15種類,每類有75個樣本,總共1 125幅圖像.圖14對其中的每一類給出了一個樣本,它們包括挪威楓、榆樹、夏櫟、灰榿木、椴樹、爆竹柳等. Fig.14 15 speccies from the Swedish leaf dataset[2]圖14 Swedish數據集中的15類葉片樣本圖像示例[2] 現有算法[5,6,10,13-15,19]在該測試集上的分類性能評估方法是:將 Swedish[20]數據集每類 75個樣本圖像隨機分為25個訓練樣本和50個測試樣本,因此總共有25×15=375個訓練樣本構成訓練集,50×15=750個測試樣本構成測試集,計算測試集中每個圖像和訓練集中的每個樣本的相似度,并用最鄰近分類器(1-NN)進行分類,即得到的與待測葉片樣本最相似的葉片圖像若與待測樣本屬于同一類,則認為是一次正確的分類,統計所有測試的正確率記為分類率.在實驗中,我們采用與該方法相同的分類性能評估方法.由于測試集和訓練集是隨機劃分的,與現有的算法[5,6,10,13-15,19]一樣,我們將實驗重復執行10次,取其平均值.本文提出的圓周特征算法的有關參數與在Flavia測試集上的參數相同.為進一步評估本文提出的圓周特征描述方法的分類性能,我們還將基于監督學習的分類器引入該分類實驗,將訓練集中的樣本的圓周特征描述子作為支持向量機(SVM)的輸入,用得到的分類器對測試集中的樣本進行分類,統計分類率.在實驗中,我們所用的SVM程序為文獻[27]的作者提供的源代碼LIBSVM. 在表3中,我們給出了本文提出的圓周特征描述法在Swedish測試集上,分別采用1-NN分類器和SVM分類器的分類率.為與其他方法進行對比,表3也列出了近年來在該測試集報告了較好結果的其他8種算法,這些方法大都報告了采用 1-NN分類器的分類率,文獻[19]中所提方法則報告了采用 SVM分類器的分類率.從該表可以看出,本文提出的方法在Swedish測試集上采用1-NN分類器,取得了98.84%的分類率,已高于其他參與比較的各種方法,值得指出的是,我們查閱了現有的在該測試集上公開報道的分類率,本文提出的算法所報告的結果是目前所見到的最好結果.而采用基于監督學習的分類器SVM,本文所提方法的分類率又比98.84%的分類率進一步提高了0.18%,達到了99.02%.該實驗結果表明,本文提出的葉片圖像描述方法在葉片圖像的分類性能方面優于現有其他方法,證明了本文提出的方法的有效性以及相較于其他方法的優越性. Table 3 Comparison of classification rate of circular features description method proposed in this paper and other methods on Swedish dataset表3 Swedish數據集上本文提出的圓周特征描述法和其他方法的對比 本文提出了描述葉片圖像的圓周特征描述方法.該方法通過圓心位于輪廓線的圓,從葉片圖像提取了葉片圖像的輪廓線特征——圓心角、形狀區域特征——圓周積分特征、灰度特征——圓周灰度統計特征,從而比其他方法更為全面地描述了葉片圖像,且抽取的特征具有內在的平移、旋轉、縮放的不變性.本文所提出的多尺度的描述框架,使得描述子能由粗到細地描述葉片特征.這種對葉片的形狀和灰度特征的全面描述和多尺度的安排,使得本文提出的方法具有非常強的葉片識別能力.在著名的Flavia葉片圖像測試集上的檢索實驗和Swedish葉片圖像測試集上的分類實驗,都獲得了比其他現有的葉片圖像描述方法更高的精確率,證明了本文提出的算法的有效性.
3.5 差異性度量

4 實驗結果及分析
4.1 葉片圖像檢索實驗







4.2 葉片圖像分類實驗


5 結 論