陳肖蒙,王瑜,肖洪兵
(北京工商大學 計算機與信息工程學院,北京 100048)
植物是地球上最廣泛存在的生命形式之一,與人類的生活密切相關。植物的分類鑒別對于探索植物的自身價值、生態監測以及生物多樣性保護有著重要的意義。植物分類的主要依據是植物的外觀特征,傳統的識別方法需要業內專家對大量植物進行觀察、測量,效率較低。由于植物外觀特征能以數字圖片方式獲得,隨著計算機圖像識別技術的發展,借助計算機輔助處理進行植物分類,成為人們越來越關注的課題之一。
當前對植物識別方法的研究較多,但大多都是基于葉片幾何特征的識別[1-3]。葉片幾何特征是指葉片的外部形狀和維度的各種參數特征,如葉片形狀的圓形度、中心偏離半徑,以及葉緣鋸齒數等量化的數據。這類方法存在如下問題:1)進行幾何特征提取的計算量很大,且不適用于所有的葉片樣本;2)對植物圖像要求較高,必須是單一背景下單個完整葉片圖像,而實際能獲得的植物圖像通常是成片的,很難進行幾何特征的度量。僅限于單個葉片的識別方法在圖像采集上仍需耗費大量人工,不能有效提高植物識別的效率。為達到完全自動識別的效果,研究自然復雜背景下的植物識別是十分必要的。
人工在野外采集的植物圖像通常背景復雜,且植物枝葉分布具有隨機性,存在葉片重疊現象,單純提取葉片特征的方法并不適用,利用邊緣提取植物輪廓信息是合適的思路。邊緣是數字圖像中像素值明顯變化的點的集合,邊緣的顯著變化通常表現了圖像屬性的重要變化。圖像邊緣檢測能夠剔除不相關的干擾信息,保留圖像的主體結構,大幅度減少數據量,目前已在復雜植物圖像的識別中有所應用?,F有的邊緣提取方法[4-6]很多,如 Roberts[7]算子、Sobel[8]算子、Prewitt[9]算子、Canny[10]算子和Laplacian[11]算子等。在這些經典算子的基礎上,也有許多學者進行了改進工作[12-14]。這些傳統邊緣算子雖然在圖像分割、圖像檢索等領域中獲得了良好的性能,但是仍然存在方向較為固定、尺度單一等缺點,因此對復雜植物圖像邊緣特征的提取效果不盡如人意。針對傳統邊緣算子的固有缺陷,本文采用一種具有多尺度與多方向特性的可變局部邊緣模式算子(varied local edge pattern,VLEP)提取綠色植物圖像的紋理邊緣信息,這種算子是靈活的圓形結構,半徑和近鄰點數目可以任意取值,因此可以提取不同尺度,不同方向的邊緣特征,有效彌補了傳統算子由于邊緣方向過少,或尺度單一而容易丟失其他邊緣信息的缺陷。
在復雜植物圖像中,植物葉片的分布具有多方向性,而傳統邊緣算子的方形形式導致其通常只包含 0°、90°兩個方向,或者 0°、45°、90°和135°這4個方向,因此在一定程度上忽略了其他方向上必要的邊緣信息。人工采集植物圖像時,拍攝距離等因素會影響葉片區域在圖像上的尺度大小,傳統邊緣算子只覆蓋2像素×2像素或3像素×3像素的圖像單元,只能反映圖像很小范圍內的某個局部強度變化,而不同尺度的支持空間會包含不同的信息,因此其檢測到的邊緣特征并不完全。VLEP算子采用圓形結構,通過設置不同半徑和近鄰點數目,能獲得多方向、多尺度的邊緣特征。因此,VLEP算子能針對復雜背景下植物圖像的特點,有效提取其邊緣信息。
VLEP算子[15]是一種靈活的圓形可變局部邊緣模式算子,用表示,為近鄰點個數,為半徑,表示邊緣方向。該算子包括兩大類,一類是局部邊緣模式算子,另一類是局部非邊緣模式算子。

圖 1 兩組局部邊緣模式算子Fig. 1 Two groups of local edge pattern operators
局部非邊緣檢測算子包括P個均勻分布在R圓上的近鄰點,其中P大于4且能被4整除,R為正實數。過圓心作兩條相互垂直的第一方向線和第二方向線。對于第一類局部非邊緣模式算子,位于第一方向線的兩個近鄰點賦值為1,位于第二方向線的兩個近鄰點賦值為–1,除此之外,其余近鄰點均賦值為0,如圖2(a)所示;對于第二類局部非邊緣模式算子,位于第一方向線和第二方向線上的4個近鄰點賦值為0,第一方向線和第二方向線將圓周平均分為4份,其中位于對角的兩份圓周上的近鄰點賦值為1,位于另一對角的兩份圓周上的近鄰點賦值為–1,如圖2(b) 所示。圖中兩條虛線分別為第一方向線與第二方向線,以圓心為旋轉中心,不斷將兩條方向線按順時針或逆時針旋轉固定角度,可以衍生出不同的非邊緣模式算子。

圖 2 一組局部非邊緣模式算子Fig. 2 A group of local non-edge pattern operators
由于P、R取值的不同,VLEP算子可以刻畫不同局部空間尺度和方向的紋理信息。不同尺度的VLEP算子,其近鄰點P的個數相同,半徑R不同,如圖3所示。

圖 3 不同尺度VLEP算子實例Fig. 3 An example of multi-scale VLEP operators
半徑R越大,提取邊緣特征的圖像紋理基元尺寸越大。使用不同尺度的VLEP算子提取紋理邊緣時,可以刻畫出圖像中不同的局部空間尺度的邊緣信息。不同方向 (分辨率)的VLEP算子,其半徑R相同,鄰近點P的個數不同,如圖4所示。近鄰點P越大,對圖像紋理基元提取邊緣的方向越多,紋理特征越細致,分辨率越高。此外,VLEP算子的近鄰點個數P與半徑R可以同時不同, 如圖5所示,可以分別提取圖像紋理邊緣不同方向,不同尺度空間的信息??梢?,VLEP算子具有多尺度和多方向特性,利用VLEP算子提取特征,可以有效解決傳統算子由于邊緣方向過少、尺度單一而丟失其他邊緣信息的問題。

圖 4 不同方向(分辨率)VLEP算子實例Fig. 4 An example of multi-direction (or multi-resolution)VLEP operators

圖 5 不同尺度與不同方向(分辨率)VLEP算子實例Fig. 5 An example of multi-scale and multi-resolution VLEP operators



漳州核電創新提出建立百萬千瓦級核電機組技經模型,并與專業咨詢機構合作開發技經模型,研究并分析國內百萬千瓦級核電機組造價平均水平用于漳州核電項目對標,并及時開展一期工程造價咨詢分析和項目總投資的經濟性分析工作,從項目可研估算、敏感性分析和核電標桿電價倒算項目總投資,對工程造價費用組成中可核減部分進行分析,形成百萬千瓦級核電機組建設成本控制目標,將漳州核電造價水平控制在行業平均水平以下。

為了獲得更緊致的特征向量,特征空間可以細分,每種類型的邊緣和非邊緣可以更詳細地分類,每種類型的邊緣和非邊緣的細分閾值使用下面的方法計算:
首先,將所有訓練圖像的相同邊緣類型或非邊緣類型(或VLEP算子)的值按從最小到最大的順序排列。然后,使用式(5)確定閾值:

式中:N代表所有訓練圖像中相同邊緣或非邊緣(或VLEP算子)類型的數目;B是每種類型的VLEP算子需要被進一步劃分的類別數目,B需要提前設置;表示隊列中“第幾個的值;是從1 到 B – 1 的正整數。



目前,植物分類算法研究領域的一大問題是缺少一個公認的統一的數據平臺。本文實驗中所使用的綠色植物圖像來自北京工商大學計算成像實驗室拍攝的數據庫,為了使數據更好地模擬真實世界的綠色植物環境,保證研究算法更具實用性,該圖像庫構建過程中考慮了多種因素,包括光照強度、葉片大小、拍攝背景、植株數量(多株與單株)、拍攝角度、拍攝距離等,這些因素雖然保證了數據更具實際意義,但同時也會增加物種識別的難度。圖6展示了幾幅數據庫中的圖例。本實驗選取數據庫中80類植物圖像,其中,每類植物6幅圖像作為訓練圖像,9幅作為測試圖像,因此共有480幅訓練圖像,720幅測試圖像。

圖 6 綠色植物物種數據庫圖例(銀杏樹)Fig. 6 Some examples of the green plants database (ginkgo)
在閾值數相同(閾值數均為8)的情況下,利用不同P、R值的算子在綠色植物物種數據庫上進行識別實驗,獲得了不同的識別率,結果如表1所示。
表 1 相同閾值數下的算法識別率Table 1 Recognition results of with the same thresholds %

表 1 相同閾值數下的算法識別率Table 1 Recognition results of with the same thresholds %
P R=1 R=2 R=3 R=5 P=8 26.11 24.25 23.16 19.17 P=16 23.06 33.89 27.92 31.72 P=24 20.14 30.86 35.28 34.12
分析表1可知,在閾值數相同的情況下,近鄰點個數P和半徑R的選取會影響識別率。因此,P、R的取值具有最優組合,其中,近鄰點個數8,當時,識別率相對最高;近鄰點個數,當時,識別率最高;近鄰點個數,當時,識別率最優。
表 2 不同閾值數下的算法識別率Table 2 Recognition results of with differentthresholds %

表 2 不同閾值數下的算法識別率Table 2 Recognition results of with differentthresholds %
閾值數算子0 13.12 14.06 12.36 8 26.11 33.89 35.28 16 30.47 40.29 38.18 32 37.94 44.12 43.21 40 32.64 27.92 35.14
由表2可知,在算子半徑R和近鄰點P確定的情況下,閾值數越多,識別率越高。值得注意的是,閾值不能過多,閾值太多會劃分出許多不具備區分性的特征子類,同時會導致落入有效特征子類的特征值過少,從而使特征直方圖失去特征分類意義。在所測識別率中,使用圓形算子并設置32個閾值時,算法結果最優,識別率達到44.12%。
為了與傳統邊緣提取算法進行對比,本文使用 Canny、Roberts、Prewitt、Sobel算子提取圖像邊緣特征,并同樣進行32閾值細化,實驗結果如表3所示。

表 3 對比算法識別率Table 3 Recognition results of contrast algorithms %
從表3可以看出,所提的可變局部邊緣模式算子提取植物邊緣特征的效果遠遠優于傳統的邊緣模式算子,識別率有大幅度的提高??勺兙植窟吘壞J剿阕泳哂卸喾较蛱匦?,提取的圖像邊緣方向信息相對豐富,同時該算子具有多尺度特性,能提取大小不同尺度的紋理結構,因此,在邊緣特征提取的表現上,要比傳統算子有優勢。
本文針對傳統邊緣算子方向少、尺度固定的缺點,提出了一種基于靈活可變的圓形局部邊緣模式的綠色植物物種識別算法,該算法由于所用邊緣算子具有多尺度、多方向特性,能夠提取更為豐富、完整的邊緣信息。在自建綠色植物物種數據庫上進行的一系列物種識別實驗中,獲得了滿意的識別結果,這表明本文提出的算法可以有效彌補傳統算子由于邊緣方向過少,尺度單一而丟失其他邊緣信息的缺陷。