羅宏波 曾海歐 周蘇娟 黃展鵬 蔣世忠
(廣東藥學院醫(yī)藥信息工程學院)
基于水平集復雜背景下毒蘑菇圖像的提取*
羅宏波 曾海歐 周蘇娟 黃展鵬 蔣世忠
(廣東藥學院醫(yī)藥信息工程學院)
毒蘑菇圖像的提取是對其進行分析與模式識別的關(guān)鍵步驟。數(shù)字摳圖作為一種把圖像的前景部分從背景中分離出來的技術(shù),存在繁瑣和容易產(chǎn)生小區(qū)域不相關(guān)像素的缺點。針對野外采集的毒蘑菇圖像背景復雜的特點,在MatlabR2010a環(huán)境下,采用Kmeans算法自動分割、數(shù)字摳圖及數(shù)字摳圖和水平集結(jié)合3種方法進行毒蘑菇圖像分割。實驗結(jié)果表明:通過引入水平集進行目標圖像提取,結(jié)合水平集的自動收斂,在復雜背景下,能很好地提取目標圖像,為進一步識別毒蘑菇提供有效的基礎。
水平集;毒蘑菇;圖像提取
毒蘑菇(毒菌)在中國種類繁多,分布廣泛。據(jù)不完全統(tǒng)計,在我國被發(fā)現(xiàn)的毒蘑菇有250多種,其中在廣東省就有112種[1]。在廣大山區(qū)和鄉(xiāng)鎮(zhèn),誤食毒蘑菇中毒的事件時有發(fā)生,幾乎每年都有嚴重中毒致死的報告。針對有些毒菌和食用菌的宏觀特征沒有明顯區(qū)別的情況,將圖像特征檢索技術(shù)中顏色、紋理和形狀3種檢索方式引入毒蘑菇識別中,構(gòu)建一個綜合圖像特征的野生毒蘑菇輔助識別平臺,有助于提高人們對毒蘑菇的認識與鑒別,為科研工作者以及普通民眾提供相對客觀的參考借鑒。
野生毒蘑菇通常生長在環(huán)境復雜的野外,因此,利用圖像處理技術(shù)輔助識別毒蘑菇,前提是有效地將毒蘑菇圖像從復雜的背景中分割出來。圖像分割是把圖像分成若干個特定的、具有獨特性質(zhì)的區(qū)域并提出感興趣目標的技術(shù)和過程,是圖像處理到圖像分析的關(guān)鍵步驟。如何從復雜背景中快速有效地分割出目標圖像是圖像技術(shù)研究中的熱點。
人類的視覺系統(tǒng)是一個智能的識別系統(tǒng),人眼觀察復雜場景時,很容易區(qū)別各個物體,即很容易辨別物體的邊緣,從而將各個物體區(qū)分開來。如果能在圖像分割中有效引入用戶的參與,可以更準確地輔助提取出目標區(qū)域。所以交互式的分割方式在圖像處理中顯得尤為重要。基于圖論的交互式分割方法有很多,如活動輪廓模型[2]、智能剪刀[3]、活線法和圖切分方法[4]等等。本文在快速提取目標圖像的基礎上,采用交互式分割[5],引入水平集[6]進行自動收斂截取,得到最優(yōu)目標圖像。
交互式分割最簡單的方法之一就是數(shù)字摳圖[7],明確定義哪些屬于目標圖像,哪些是背景,用戶圍繞目標圖像的邊界繪制曲線,然后對該曲線進行優(yōu)化。Photoshop里面的智能剪刀和魔杖工具就是采用這種方法。
首先,需要建立一個與圖像對應的加權(quán)無向圖G(E,V)。圖的頂點E與圖像的像素對應;邊V與圖像的各個像素之間的聯(lián)系相對應;頂點的屬性與圖像的灰度信息相對應;邊的權(quán)值與像素之間的差別相對應。圖中包含2個終端頂點:源點和匯點。其他點都稱為中間點。手動選擇圖的目標和背景的種子點,分別與源點和匯點相連接,設計它們的權(quán)重α。這樣可以實現(xiàn)最小的分割,將目標與背景分割開來。

其中,F(xiàn)為目標圖像;G(E,V)圖像對應加權(quán)無向圖;α是權(quán)重,這里取255;Cat表示最小割集。
水平集方法是S.Osher和J.A.Sethian于1988年,在研究曲線以曲率相關(guān)的速度演化時提出來的[8],用于描述曲線的演化過程。其基本思想是將當前正在演化的閉合曲線(曲面)的問題轉(zhuǎn)化為更高維空間中的水平集函數(shù)曲線(曲面)的隱式解。與其他曲線演化方法相比,其最大優(yōu)勢是穩(wěn)定性和拓撲無關(guān)性。
在傳統(tǒng)水平集方法中,為了使演化曲線得到穩(wěn)定的結(jié)果,需要周期性地初始化演化曲線,這樣費時而且計算繁瑣。而李純明[9]等人根據(jù)符號距離函數(shù)的特征引入一個內(nèi)部能量糾正水平集函數(shù)與符號距離函數(shù)的誤差,使演化曲線一直保持在符號距離函數(shù)附近,從而在演化過程中無需再周期性地初始化演化曲線,進而可以采用大時間步長,提高演化速度。

基于水平集的目標圖像快速提取是一種能夠從粗到細將目標圖像自適應分割的方法,分為3個步驟:1) 目標對象標記,它是在較粗糙的尺度上操作,用戶根據(jù)需要勾勒出目標圖像的大體形狀;2) 水平集自適應,它是根據(jù)用戶定義的邊界,自適應收縮,實現(xiàn)目標最優(yōu)化;3) 目標圖像提取,對已經(jīng)收斂最佳的目標圖像進行數(shù)字摳圖提取。
3.1 目標對象標記
目標對象的主要功能是允許用戶對目標圖像和背景圖像進行標記,以提取用戶感興趣的區(qū)域。通過繪制直線或者曲線指定感興趣的區(qū)域,一方面定義感興趣的區(qū)域,明確分割目的;另一方面,標記目標圖像,實際已經(jīng)構(gòu)建好加權(quán)無向圖,初始化邊界,為水平集分割提供前提和減少計算量。
3.2 水平集自適應
在用戶繪制的標記線條形成封閉無向圖后,開啟自適應,系統(tǒng)自動進行自適應收縮。使用定義的封閉無向圖作為水平集的初始演化曲線,引入一個內(nèi)部能量來糾正水平集函數(shù)與符號距離函數(shù)的誤差,從而使演化曲線一直保持在符號距離函數(shù)附近,使演化范圍始終保持在用戶定義的區(qū)域內(nèi);同時加入外部能量提高演化速度。水平集收斂達最優(yōu)時停止收斂,完成目標圖像外輪廓的標記u。
3.3 目標圖像提取
水平集收斂的最優(yōu)目標輪廓u作為快速提取算法的無向圖,用式(1)對目標圖像進行分割提取。在對水平集演化結(jié)束后,自動實現(xiàn)目標圖像快速提取。所以交互操作只是對目標圖像的標記,無需過多的用戶交互,減少用戶的工作量。
本文對一張野外采集的毒蠅傘蘑菇圖像進行實驗。選取一張摻雜多個背景的圖像,用不同方法分別從中提取毒蠅傘蘑菇目標圖像。圖1對原始圖片需要提取的目標邊緣進行標記;圖2使用Kmeans算法自動分割;圖3是數(shù)字摳圖的效果;圖4是數(shù)字摳圖和水平集結(jié)合后的目標圖像分割效果。
由圖1可以看出,目標圖像與周圍背景混合在一起,這是野外采集標本時不可避免的情況。采用Kmeans聚類分割[10],由于光照因素,目標圖像的邊緣有些無法聚類到目標區(qū)域,造成目標提取的缺失。其中小蘑菇對分析可能會造成干擾,但是聚類分割無法將其剔除。聚類、閾值分割等自動分割,在復雜背景下,存在多個閾值或中心時,無法達到很好的分割效果,交互式的分割就成為首選。快速目標圖像提取的數(shù)字摳圖,可以較好地快速提取目標圖像,占用系統(tǒng)資源少,如圖3所示。但是,提取的目標圖像仍然存在一些小的干擾區(qū)域。經(jīng)過多次截取,可以將不需要的區(qū)域縮小到最小。限于人的視覺效果,對于細小的區(qū)域很難分辨。

圖1 原始的目標邊緣提取

圖2 Kmeans聚類分割

圖3 數(shù)字摳圖效果

圖4 數(shù)字摳圖和水平集結(jié)合效果
針對數(shù)字摳圖存在的細小無相干邊緣的不足,將水平集引入數(shù)字摳圖。勾勒出目標區(qū)域,采用水平集自適應收縮,最終使用數(shù)字摳圖分割。如圖4所示,目標圖像被準確提取出來,而且保持輪廓和形狀特征完好。
本文提出的基于水平集復雜背景下毒蘑菇圖像提取,不但綜合了數(shù)字摳圖占用系統(tǒng)資源小、速度快等優(yōu)點,而且縮小了水平集收縮的區(qū)域,極大地提高水平集的收縮速度,取得了很好的分割效果。
[1] 鄧旺秋,李泰輝,宋斌,等.廣東已知毒蘑菇種類[J].菌物研究, 2005,3(1):7-12.
[2] 陳波,賴劍煌.用于圖像分割的活動輪廓模型綜述[J].中國圖象圖形學報,2007,12(1):11-20.
[3] 薛犇犇.半自動的虛擬人切片圖像分割方法研究[D].南京:南京理工大學,2011.
[4] 龔菲.基于圖切分的快速交互式圖像分割方法研究[D].武漢:華中師范大學,2013.
[5] 郭麗.交互式圖像分割算法的研究與應用[D].沈陽:東北大學,2008.
[6] 王曉峰.水平集方法及其在圖像分割中的應用研究[D].合肥:中國科學技術(shù)大學,2009.
[7] 林生佑,潘瑞芳,杜輝,等.數(shù)字摳圖技術(shù)綜述[J].計算機輔助設計與圖形學學報,2007,19(4):473-479.
[8] 陳金男.基于水平集方法的圖像分割研究[D].秦皇島:燕山大學,2007.
[9] Li Chunming, Xu Chenyang, Gui Changfeng, et al. Level set evolution without re-initialization; a new variational formulation[C]. In: Proc. of the IEEE Computer Society Conf. on Computer Vision and Pattern Recognition, 2005:430-436.
[10] 譚靜.基于半監(jiān)督聚類的圖像分割算法研究[D].青島:中國海洋大學,2012.
Extraction of Poisonous Mushrooms Image from Complex Background by Level Set
Luo Hongbo Zeng Haiou Zhou Sujuan Huang Zhanpeng Jiang Shizhong
(College of Medical Information Engineering, Guangdong Pharmaceutical University)
Extraction of poisonous mushrooms image is a key step from image processing to image analysis and pattern recognition. As a technique to separate a foreground portion from the background, digital matting is prone to bring unassociated pixels of small areas. For images of poisonous mushrooms taken from outdoors often exist in complex backgrounds, three methods of image segmentation like Kmeans, digital matting and digital matting combining with level set are used. Experimental results show that by introducing level set into target image extraction, with automatic convergence, target image can be well extracted from complex background image. This can provide an effective foundation for identifying poisonous mushrooms.
Level Set; Digital Matting; Target Image Extraction
羅宏波,男,1990年生,本科,研究方向:醫(yī)學應用。
廣東省大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目(1057313024)
周蘇娟(通訊作者),女,1978年生,碩士,講師,研究方向:圖像處理與模式識別。E-mail:susona2002@163.com