摘 要:在計(jì)算機(jī)視覺的相關(guān)研究中,圖像分割是連接低級(jí)視覺和高級(jí)視覺的橋梁和紐帶,而圖像分割是計(jì)算機(jī)視覺系統(tǒng)中最關(guān)鍵和重要的一個(gè)環(huán)節(jié)。在概要介紹幾種常用圖像分割方法的基礎(chǔ)上,比較了每種圖像分割算法的優(yōu)缺點(diǎn)及其適應(yīng)范圍,結(jié)果表明:不同工程應(yīng)用中,應(yīng)根據(jù)其需求與圖像特點(diǎn)合理采用不同的圖像分割方法以達(dá)到更好的處理效果。
關(guān)鍵詞:圖象分割;圖象處理
中圖分類號(hào):TP
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1672-3198(2010)12-0361-02
1 引言
近年來,隨著工業(yè)、農(nóng)業(yè)、醫(yī)學(xué)、軍事等領(lǐng)域自動(dòng)化和智能化需求的迅速發(fā)展,對(duì)圖像處理技術(shù)的要求也日益提高。其中,對(duì)圖像的自動(dòng)識(shí)別與理解就是一項(xiàng)重要任務(wù),而對(duì)圖像進(jìn)行分割來提取目標(biāo)是其關(guān)鍵步驟之一,如果得不到合理的圖像分割圖,也就無法對(duì)圖像進(jìn)行正確的識(shí)別與理解。在過去的四十多年里,圖像分割的研究一直受到人們高度的重視。迄今為止,研究者提出了上千種不同類型的分割算法,而且近年來每年都有上百篇相關(guān)研究成果發(fā)表。但是,現(xiàn)有的方法多是為特定應(yīng)用設(shè)計(jì)的,有很大的針對(duì)性和局限性,對(duì)圖像分割的研究還缺乏一個(gè)統(tǒng)一的理論體系。Fu和Mui從細(xì)胞學(xué)圖像處理的角度將圖像分割技術(shù)分為三大類:特征閾值或聚類、邊緣檢測(cè)和區(qū)域提取。依據(jù)算法所使用的技術(shù)或針對(duì)的圖像,Pal and Pal把圖像分割算法分成了6類:閾值分割、像素分割、深度圖像分割、彩色圖像分割、邊緣檢測(cè)和基于模糊集的方法。本文將依據(jù)上述兩種分類方法進(jìn)行深入研究。
2 圖象分割方法
簡(jiǎn)而言之,圖像分割(Image Segmentation)就是把圖像中的物體與背景或物體與物體分割開,實(shí)現(xiàn)不同區(qū)域的特殊處理。
2.1 基于閾值的分割方法
這類方法簡(jiǎn)單實(shí)用,在過去的幾十年間備受重視,其分類也不一而足。根據(jù)使用的是圖像的整體信息還是局部信息,可以分為上下文相關(guān)方法和上下文無關(guān)方法;根據(jù)對(duì)全圖使用統(tǒng)一閾值還是對(duì)不同區(qū)域使用不同閾值,可以分為全局閾值方法和局部閾值方法;另外,還可以分為單閾值方(bileverthresholding)和多閾值方法。
閾值分割的核心問題是如何選擇合適的閾值。其中,最簡(jiǎn)單和常用的方法是從圖像的灰度直方圖出發(fā),先得到各個(gè)灰度級(jí)的概率分布密度,再依據(jù)某一準(zhǔn)則選取一個(gè)或多個(gè)合適的閾值,以確定每個(gè)像素點(diǎn)的歸屬。選擇的準(zhǔn)則不同,得到的閾值化算法就不同。
下面就常見的幾種閾值分割算法進(jìn)行比較:
表1 幾種閾值分割算法
準(zhǔn)則閾值化方法優(yōu)點(diǎn)缺點(diǎn)
分割得到的目標(biāo)和背景的概率應(yīng)該等于其先驗(yàn)概率p-分位數(shù)(p-title)法無需任何迭代和搜索嚴(yán)重依賴對(duì)先驗(yàn)概率的估值
最優(yōu)閾值位于目標(biāo)和背景兩個(gè)概率分布的交疊處最頻值法(也稱mode法)計(jì)算簡(jiǎn)單要求直方圖具有明顯的雙峰性
使目標(biāo)和背景類的類內(nèi)方差最小、類間方差最大Otsu方法計(jì)算簡(jiǎn)單、效果穩(wěn)定要求目標(biāo)與背景的面積值相近
圖像的某種后驗(yàn)熵最大熵方法計(jì)算簡(jiǎn)單對(duì)直方圖模型有要求
Bayes判別誤差最小最小誤差法計(jì)算簡(jiǎn)單,適用于目標(biāo)與背景很不均衡的圖像對(duì)直方圖模型有要求
分割前后圖像的矩量保持不變矩量保持法無需任何迭代和搜索穩(wěn)定性不佳
2.2 基于邊緣的分割方法
這類方法主要基于圖像灰度級(jí)的不連續(xù)性,它通過檢測(cè)不同均勻區(qū)域之間的邊界來實(shí)現(xiàn)對(duì)圖像的分割,這與人的視覺過程有些相似。依據(jù)執(zhí)行方式的不同,這類方法通常又分為串行邊緣檢測(cè)技術(shù)和并行邊緣檢測(cè)技術(shù)。
串行邊緣檢測(cè)技術(shù)首先要檢測(cè)出一個(gè)邊緣起始點(diǎn),然后根據(jù)某種相似性準(zhǔn)則尋找與前一點(diǎn)同類的邊緣點(diǎn),這種確定后繼相似點(diǎn)的方法稱為跟蹤。根據(jù)跟蹤方法的不同,這類方法又可分為輪廓跟蹤、光柵跟蹤和全向跟蹤三種方法。全向跟蹤可以克服由于跟蹤的方向性可能造成的邊界丟失,但其搜索過程會(huì)付出更大的時(shí)間代價(jià)。串行邊緣檢測(cè)技術(shù)的優(yōu)點(diǎn)在于可以得到連續(xù)的單像素邊緣,但是它的效果嚴(yán)重依賴于初始邊緣點(diǎn),由不恰當(dāng)?shù)某跏歼吘夵c(diǎn)可能得到虛假邊緣;較少的初始邊緣點(diǎn)可能導(dǎo)致邊緣漏檢。
并行邊緣檢測(cè)技術(shù)通常借助空域微分算子,通過其模板與圖像卷積完成,因而可以在各個(gè)像素上同時(shí)進(jìn)行,從而大大降低了時(shí)間復(fù)雜度。常見并行邊緣檢測(cè)方法有如下幾種:Roberts算子,Laplacian算子,Sobel算子,Prewitt算子,Kirsh算子,LOG算子,Canny算子。
上述算法和其他邊緣檢測(cè)算法雖然在檢測(cè)的準(zhǔn)確性和邊緣定位精度上有所差異,但是他們都有一個(gè)共同的缺點(diǎn):不能得到連續(xù)的單像素邊緣,而這對(duì)于分割來說是至關(guān)重要的。因此,通常在進(jìn)行上述邊緣檢測(cè)之后,需要進(jìn)行一些邊緣修正的工作,如邊緣連通、去除毛刺和虛假邊緣。常用的方法包括啟發(fā)式連接、相位編組法和層次記號(hào)編組法等。與串行邊緣檢測(cè)算法一樣,邊緣修正算法的代價(jià)也非常高。
2.3 基于區(qū)域的分割方法
基于區(qū)域的分割技術(shù)有兩種基本形式:區(qū)域生長(zhǎng)和分裂合并。前者是從單個(gè)像素出發(fā),逐漸合并以形成所需的分割結(jié)果。后者是從整個(gè)圖像出發(fā),逐漸分裂或合并以形成所需要的分割結(jié)果。與閾值方法不同,這類方法不但考慮了像素的相似性,還考慮了空間上的鄰接性,因此可以有效消除孤立噪聲的干擾,具有很強(qiáng)的魯棒性。而且,無論是合并還是分裂,都能夠?qū)⒎指钌钊氲较袼丶?jí),因此可以保證較高的分割精度。
區(qū)域生長(zhǎng)算法先對(duì)每個(gè)要分割的區(qū)域找一個(gè)種子像素作為生長(zhǎng)的起點(diǎn),然后將種子像素鄰域內(nèi)與種子像素有相似性的像素合并到種子像素集合。如此往復(fù),直到再?zèng)]有像素可以被合并,一個(gè)區(qū)域就形成了。顯然,種子像素、生長(zhǎng)準(zhǔn)則和終止條件是算法的關(guān)鍵。然而,種子點(diǎn)的選擇并不容易,有人試圖通過邊緣檢測(cè)來確定種子點(diǎn),但是,由于邊緣檢測(cè)算法本身的不足,并不能避免遺漏重要的種子點(diǎn)。
分裂合并算法則是先從整個(gè)圖像開始不斷的分裂得到各個(gè)區(qū)域,再將相鄰的具有相似性的區(qū)域合并以得到分割結(jié)果。這種方法雖然沒有選擇種子點(diǎn)的麻煩,但也有自身的不足:一方面,分裂如果不能深達(dá)像素級(jí)就會(huì)降低分割精度;另一方面,深達(dá)像素級(jí)的分裂會(huì)增加合并的工作量,從而大大提高其時(shí)間復(fù)雜度。
2.4 基于統(tǒng)計(jì)模式分類的分割技術(shù)
模式可以定義為對(duì)圖像中的目標(biāo)或其它感興趣部分的定量或結(jié)構(gòu)化的描述,圖像分割可以被視為以像素為基元的模式分類過程,這一過程主要包括兩個(gè)步驟:特征提取和模式分類。閾值分割就相當(dāng)于在一維(灰度)或二維(共生矩陣)特征空間進(jìn)行的模式分類,它所使用的特征并沒有充分反映像素的空間信息和其鄰域像素的相關(guān)信息。為了改善分割的效果,我們自然的想到使用能夠充分利用圖像信息的高維特征來描述每一個(gè)像素。這類方法,對(duì)于無法由灰度區(qū)分的復(fù)雜的紋理圖像顯得尤為有效。由于模式分類可以借鑒模式識(shí)別技術(shù)中的成熟算法,所以這類分割技術(shù)的主要差別在于特征提取的方法。
3 圖像分割領(lǐng)域存在的問題
實(shí)踐證明,圖像分割問題的困難在于它既不屬于完全的圖像特征提取的問題,又不屬于完全的物體識(shí)別的問題,其主要原因可歸結(jié)如下:
(1)在簡(jiǎn)單的情況下,可以用圖像中同一物體像素點(diǎn)的連通性和物體與背景的灰度差進(jìn)行分割,但在有噪聲的影響下或物體互相遮擋的情況下,連通性會(huì)被破壞;在復(fù)雜背景的情況下,僅用灰度差也不能區(qū)別物體與背景,而需要更復(fù)雜的灰度統(tǒng)計(jì)值。
(2)不同物體所對(duì)應(yīng)的圖像區(qū)域特征在一般情況下應(yīng)是該區(qū)域中局部特征的統(tǒng)計(jì)量(例如灰度的均值、方差、相關(guān)性等),而統(tǒng)計(jì)量必須在己知區(qū)域邊界的情況下才能計(jì)算。這樣,就陷入一個(gè)矛盾,即要分割必須計(jì)算統(tǒng)計(jì)量,要計(jì)算統(tǒng)計(jì)量又必須己知分割結(jié)果。
4 結(jié)論
在圖像分割問題上,至今還沒有建立起完善的理論體系,對(duì)眾多的圖像分割方法沒有進(jìn)行很好的歸納整理,還有大量的工作亟需完成。與之同時(shí),將多種圖像分割方法綜合運(yùn)用,發(fā)揮各自的優(yōu)勢(shì)進(jìn)行圖像處理將成為這一領(lǐng)域的發(fā)展趨勢(shì)。
參考文獻(xiàn)
[1]R. M. Haralick, L. G. Shaprio, “Image segmentation techniques”, Computer Vision, Graphics,and Image Processing, 1985,(29):100-132.
[2]吳一全,朱兆達(dá).圖像處理中閾值選取方法30年(1962-1992)的進(jìn)展(一)[J].數(shù)據(jù)采集與處理,1993,(3):193-201.
[3]趙榮椿,遲耀斌,朱重光.圖像分割技術(shù)進(jìn)展[J].中國(guó)體視學(xué)與圖像分析,1998,(2):121-128.
[4]王愛民,沈蘭蓀.圖像分割研究綜述[J].測(cè)控技術(shù),2000,19,(5):1-6.
[5]羅希平等.圖像分割方法綜述[J].模式識(shí)別與人工智能,1999,12(3),300-312.