摘要:提出了一種新穎的物體輪廓提取方法,即通過多級(jí)邊緣檢測(cè)來提取物體的主要邊界。雙邊濾波器用來建立多級(jí),同時(shí)Canny邊緣算子相應(yīng)地產(chǎn)生邊緣圖,組合邊緣圖構(gòu)造出一幅多級(jí)圖。次段被定義為邊緣像素的連接結(jié)構(gòu),提取并連接這些次段可以構(gòu)成閉合輪廓。最終圖像中最相關(guān)的閉合輪廓被判定為真實(shí)的物體輪廓。實(shí)驗(yàn)結(jié)果表明,該物體輪廓提取方法具有較高的可靠性并且受噪聲影響較小。
關(guān)鍵詞:多極; 雙邊濾波; 坎尼邊緣檢測(cè); 物體輪廓
中圖分類號(hào):TP391文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2007)12-0396-03
靜態(tài)圖像的內(nèi)容描述是一個(gè)復(fù)雜的問題。它包括根據(jù)人的感官系統(tǒng),在最優(yōu)結(jié)構(gòu)化方式下對(duì)不同低水平特征的檢測(cè)和綜合。在用于描述視覺場(chǎng)景的不同特征中,物體形狀是語義分析最重要的特征之一。關(guān)于圖像輪廓提取的研究可以參考相關(guān)文獻(xiàn)。本文所提出的物體輪廓提取方法可歸類在基于邊界的方法之下,如文獻(xiàn)[1]中所描述的那樣。根據(jù)生理學(xué)中的橫向抑制過程[2],人類的視覺系統(tǒng)(HVS)是趨于對(duì)同性質(zhì)區(qū)域之間的變化和不同作出反應(yīng),而不是對(duì)各區(qū)域自身內(nèi)部作出反應(yīng)。從這個(gè)考慮出發(fā),基于Canny邊緣算子[2,3]的邊緣檢測(cè)器可以用于在給定圖像中檢測(cè)這些邊界的位置。理想狀態(tài)下希望自動(dòng)從圖像中提取關(guān)于物體邊界的所有邊緣。但是無論怎樣利用邊緣檢測(cè)器,圖像輸出總是會(huì)因?yàn)樵肼?、紋理或光照丟失及分散一些邊緣。本文提出了一種感知能動(dòng)的方法來連接邊緣,用于提取語義物體輪廓。為了完整化斷開的物體輪廓,在邊緣次段(SSs)域內(nèi)應(yīng)用基于圖形學(xué)的搜索算法去尋找最小代價(jià)的閉合回路,然后在鄰近的次段之間建立虛鏈路。此外,基于各次段相應(yīng)的級(jí),可以構(gòu)建一個(gè)原始次段的等級(jí)。級(jí)可以被理解為圖像簡(jiǎn)化的不同階段,即在原始圖像上進(jìn)行非線性雙邊濾波[5,6]的迭代次數(shù)。通過對(duì)不同簡(jiǎn)化階段得到的邊緣進(jìn)行分析,可以推斷出每個(gè)初始次段的相對(duì)重要性信息。在代價(jià)函數(shù)中,級(jí)信息作為附加量結(jié)合到次段的分組搜索中,使搜索輸出為物體邊界的最相關(guān)邊緣。因此,通過對(duì)特定數(shù)量的最重要次段進(jìn)行搜索,可以獲得一組閉合的輪廓,并且這些閉合輪廓可以按照相關(guān)重要性排序。
1基于圖像邊緣域的次段形成
來源于靜態(tài)圖像或視頻流的圖像,首先被轉(zhuǎn)換成灰度圖,然后作進(jìn)一步分析。Canny邊緣算子用來檢測(cè)邊緣,采用一個(gè)平滑因子參數(shù)σ和兩個(gè)閾值參數(shù)[7](高thrhigh和低thrlow)。Canny邊緣輸出通過使用簡(jiǎn)單的模板進(jìn)行細(xì)化,使得每個(gè)邊緣像素最多與兩個(gè)邊緣像素相鄰(在八鄰域定義中)。細(xì)化算法對(duì)于獲得單像素厚度的邊緣次段來說是必要的,而對(duì)于分離連接邊緣分支(T-連接)也是必需的。次段被定義為包含連續(xù)系列的八連通邊緣像素結(jié)構(gòu)。這些結(jié)構(gòu)或者包含兩個(gè)端點(diǎn),或者是形成一個(gè)閉合回路(輪廓)。本文所提出的算法流程如圖1所示。
2雙邊濾波和權(quán)值計(jì)算
非線性雙邊濾波器[5,6]可以有效地保留強(qiáng)邊緣,同時(shí)去除圖像細(xì)節(jié)(即各向異性擴(kuò)散[8])。線性高斯濾波器去除圖像噪聲和細(xì)節(jié)的同時(shí),也使得重要邊緣模糊化,導(dǎo)致它們的位置發(fā)生改變。在級(jí)空間理論中,級(jí)的構(gòu)造可以通過對(duì)圖像應(yīng)用不同的高斯空間濾波器寬度(σ)來實(shí)現(xiàn)。然而,由于重要邊緣的模糊化效應(yīng),通過不同級(jí)來追蹤邊界信息仍然是一個(gè)障礙。本文應(yīng)用一個(gè)級(jí)表達(dá)式,為通過雙邊濾波器后保留下來的邊緣維持固定位置[9]。如果I(xiàn)in表示輸入圖像幀,根據(jù)以下表達(dá)式,可以獲得雙邊濾波的輸出:
5結(jié)束語
本文采用基于多級(jí)的邊緣檢測(cè)算法提取圖像物體輪廓。實(shí)驗(yàn)結(jié)果顯示,以上方法具有較高的可行性和可靠性。本文提出了一種新穎的圖像多級(jí)構(gòu)造算法,即控制雙邊濾波器在原始圖像上的迭代次數(shù)來形成多級(jí)。Canny邊緣算子從圖像的每一級(jí)中提取邊緣,最終構(gòu)成一幅多級(jí)圖。多級(jí)圖用于形成次段,并提供次段的長(zhǎng)度和權(quán)值信息,通過次段的連接構(gòu)成閉合回路。這些閉合回路被用來描述圖像中的主要物體輪廓。
參考文獻(xiàn):
[1]FELZENSZWALB P F, HUTTENLOCHER D P. Efficient graph-based image segmentation[J]. Int Journal of Computer Vision, 2004,59(2):167-181.
[2]HAYKIN S. 神經(jīng)網(wǎng)絡(luò)的綜合基礎(chǔ)[M].2版.北京:清華大學(xué)出版社, 2001.
[3]王磊,莫玉龍,戚飛虎.基于Canny理論的邊緣提取改善方法[J].中國圖象圖形學(xué)報(bào), 1996,1(3):191-195.
[4]CANNY J. A computational approach to edge detection[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1986,8(6):679-698.
[5]MAHAMUD S, WILLIAMS L R, THORNBER K K, et al. Segmentation of multiple salient closed contours from real images[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2003,25(4):433-444.
[6]TOMASI C, MANDUCHI R. Bilateral filtering for gray and color images[C]//Proc of the 6th International Conference on Computer Vision. Bombay:[s.n.], 1998.
[7]SAHOO P K, SOLTANI S, WONG A K C. A survey of thresholding techniques[J]. Computer Vis Graph Image Proc, 1988,41(2):233-260.
[8]BARASH D. A fundamental relationship between bilateral filtering, adaptive smoothing, and the nonlinear diffusion equation[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2002,24(6):844-847.
[9]PERONA P, MALIK J. Scale-space and edge detection using anisotropic diffusion[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1990,12(7):629-639.
“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文”