吳琳娜
(上海宇航系統工程研究所,上海 201108)
圖像分割是將圖像劃分為有意義區域的處理技術,它可顯著減少隨后的圖像識別、分析等階段的數據處理量。因分割中出現的誤差會傳播到更高層次處理階段,故其精準度至關重要。圖像分割技術在醫學診斷及運動分析、結構分析、衛星遙感圖像分析等領域有極為廣泛的應用。工程中常對圖像分割算法有一定的速度要求,并希望減少人工干預,因此圖像分割算法的效率和自動化程度同樣不可忽略。
目前,常用的三維圖像分割算法各有優缺點。如分類器算法是一種監督性算法,具有迭代特點,計算量較小,可用于多通道圖像,但需要大量人工干預,算法自動化難度較大;三維邊緣檢測方法對不同區域對比度強烈的數據分割效果很好,但即使檢測出邊緣,卻很難檢測出邊緣與感興趣區域邊界的關系;區域增長算法是一種根據預先定義的連接標準從三維圖像數據中提取連續區域的技術,算法的實現非常簡單,但需要人工交互的選取種子點,對噪聲和局部體效應敏感,分割出的區域在空間上離散[1]。針對在噪聲較高、待分割的區域的邊界和背景區域的對比度非常低條件下分割圖像,以快速準確提取感興趣區域(ROI)的邊界、形狀和體積等信息,本文對不同分割算法的組合進行了研究。
文獻[2]首次提出了運用活動輪廓模型進行2D圖像分割的方法。Snake模型以曲線演化方式實現圖像分割。已知三維圖像中所有點的灰度值信息,u0(x,y,z)為圖像每點(x,y,z)的灰度值。令S為ROI的邊界;inside S,outside S分別表示ROI內、外部的點。MUMFORD等提出了能量方程:三維圖像在以S為輪廓邊界時能量函數可表示為

式中:area S為ROI輪廓的表面積;s+,s-分別為ROI內、外部所有體素灰度值的均值,s-即為圖像中視作ROI背景所有體素灰度值的均值;υ,λ1,λ2為權重系數[3]。式(1)中,等號右端第二部分是對ROI內部所有點的積分,是ROI內部體素灰度值的方差;第三部分是對ROI外部所有點的積分,是ROI外部體素灰度值的方差。對所分割的圖像有如下的先驗知識,先收縮ROI的表面積,并盡可能擬合連通的區域;其次,最小化ROI內部和外部體素灰度值的方差之和,使內部和外部的體素灰度值特征盡可能均衡。由此,圖像分割轉化成能量方程的最小化

基于以上概念,文獻[4]提出了無邊緣的活動輪廓法,但在解決本文問題時該經典算法的效果并不理想。實驗中發現該算法在一定程度上消除了離散的點和區域,但同時也將部分ROI外的體素劃進ROI內部。
為進一步利用圖像中除灰度值以外的信息,考慮通過變化提取更多的圖像信息(目前能量方程僅包含單通道圖像的信息)。GABOR在1946年就提出了Gabor方程,之后DAUGMAN將其推廣到了二維[5-6]。本文研究的圖像因采集方式的關系,圖像ROI區域具備紋理特征。Gabor方程常用于有一定紋理特征的圖像[7]。Gabor變換可分割空間頻域、元素密度、方向、相位、能量有區別的區域[8]。二維Gabor方程或稱Gabor濾波器可表示為

式中:gσ(x,y)=為二維高斯方程;F,θ分別為頻率和相位參數,決定了該變換作用的方向。此處:σ2為方差,其值越大,變化影響的鄰近區域就越大。u0→(u0)σ,F,θ是空間點u0(x,y,z)在Gabor變換之下的值。該變換的特點是與θ向垂直的邊界會被突出,而對所作用的圖像來說,變換結果會變得平滑,起到降低噪聲和增強局部紋理特征的作用。每選取一個θ對圖像進行變化,就能獲得圖像在一個新通道上的信息。通過N次Gabor變化所得N通道的信息可用能量方程表示為

能,其是滿足顧客入住需求的關鍵。這個過程中酒店人員利用酒店前臺管理系統對顧客信息進行錄入,客人正式入住后邊可通過相應系統為客人做其他需求服務辦理。通常酒店前臺管理系統本身靈活性也相對較高,比如其在權限操作上,不同管理人員所具有的操作權限也有一定差異性。結合實際來看當前酒店前臺管理系統服務需求主要體現在房間預訂、登記入住、換房、加房、修改房價等特性,注重前臺管理系統完善性和功能要點的靈活設置,是整個酒店管理系統得以流暢運行的關鍵[1]。
分別為圖像在第i個通道ROI內、外部變換值的均值;s0+,s0-分別為ROI內、外部在每個通道上變換值均值的向量,且,S更新時兩組向量值將重新計算;λi,γi為權重系數,取值源于實驗或經驗數據。當υ的取值固定后,對比實驗結果選取合適的λi,γi值。
為表示輪廓S,本文引入水平集方程。水平集無顯式的定義邊界,僅規定邊界上的值φ(x,y,z)=0,ROI內部φ(x,y,z)>0,而外部取負值。最簡單的度量水平集的函數是Dirac方程,inside S取值為1,outside S取值為0。BAYER研究了多種近似Dirac方程的方法[9]。本文采用其中正則化的Heaviside函數:H2,ε(z)=,δ2,ε(z)=H′2,ε(z)=擬合Dirac方程的δ函數表達。此處:ε為當z在0附近時H2,ε(z)的斜度。
為優化能量模型并簡化計算,本文引入統計模型。以2D圖像為例,作如下假設:
a)輪廓(分割邊界)的長度與其成為邊界的概率滿足關系p(P(Ω))∝e-υ|C|,υ>0。此處:|C|為輪廓的長度,即輪廓Ω越短,成為圖像邊界的概率越大。
b)無關分布,最大后驗概率(MAP)可表示為

式中:I為待分割圖像的已知信息。
c)ROI內、外部的像素灰度值均滿足正態分布,如圖1所示。兩部分灰度值均值接近,且灰度值的取值范圍有重疊,但各自滿足正態分布。
對式(4)求負對數。令E(Ω)=-lg(p(P(Ω)|I)),Ω1為inside S的區域,Ω2為outside S,則有


圖1 ROI內外灰度取值分布Fig.1 Distribution of gray valueinside/outside ROI
基于這些概率假設,最大化p(P(Ω)|I)和最小化E(Ω)等價。可發現此處E(Ω)也可視作2D圖像能量方程的表示。這些假設和推導對三維圖像同樣有效。對三維圖像的能量方程,綜合概率統計的模型和水平集的表達式為

式中:

此處:φ為水平集函數,定義了點(x,y,z)所處的區域;H(φ(x,y,z))為水平集函數的正則化表達,取值為(0,1),以免數值范圍過大;δ(φ(x,y,z))為H(φ(x,y,z))的導數。
三維圖像處理中,須考慮數值計算量。圖像大小1 024×1 024×1 024時,點的存儲空間可達GB級別的存儲量,在確保不丟失ROI信息的前提下,應采用預提取或重新采樣法減小圖像尺寸。水平集已廣泛用于描述輪廓和分割物體中,但由于其計算的復雜度與圖像的體素成正比,而普通的水平集法是用尺寸固定的網格點計算未知點,用偏微分方程推進水平集的移動,導致迭代周期過長。
ADALSTEINSSON提出了窄帶技術以加快水平集方程的移動速度,大幅降低額外的計算開銷,進而提高算法的效率[10]。方法要點是考慮將輪廓在一定距離范圍內的體素點看作一個帶狀,如圖2所示。在每步迭代中,窄帶會由最新的輪廓重新計算而得。SETHIAN提出了快速步進法計算距離[11]。該法的要點是在零水平集中建立可適應的網格。
圖2僅考慮零水平集的在管道內部鄰近點,計算復雜度從O(n3)降至O(n2)。此處:n為圖像在一個維度上的點數。同樣,對內存的需求也由三階降為二階。窄帶方法的缺點是,管道永遠不能覆蓋整個圖像區域。對管道,初始化方法有多種,最簡單的是將圖像中心作為球心,以指定長度為半徑畫出球形作為初始管道,如半值過大會導致計算量增加,半徑過小又會導致管道與ROI無交集,從而混淆ROI的內部和外部。另外引進重新計算距離技術,可避免水平集方程演進過程中因過于平坦而粘滯在局部區域。

圖2 不使用和使用窄帶的水平集Fig.2 Level Set without/with narrow band
通常,偏微分方程求解采用標準的半隱式方法和AOS方法。AOS特點是:適于并行計算,可直接推導到更高階的問題無需修改算法的結構。WEICKERT等證明了AOS法效率較顯式方法高10倍[12]。對實時性能要求,必須為算法收斂性和收斂速度考慮合理的收斂條件。CHEN-VESE給出的收斂條件是在管道內,點的水平集的變化絕對值均值小于某收斂值,即輪廓在迭代中“幾乎”不再移動時算法收斂,此時能量方程也趨于穩定。同時還會設定一個固定的最大迭代次數值以控制迭代次數。
求解水平集的數值實現是基于對偏微分方程的有限差分逼近。通過改變水平集方程來驅動輪廓的運動。其步驟如下:
步驟a)由于窄帶方法假設管道邊界上的網格點和管道鄰近點有相同的符號,每次迭代前邊界上的值均需重新初始化。
步驟b)每次迭代中,重新計算每個通道的水平集統計信息。
步驟c)用新的水平集統計信息值更新水平集的力場值,對應偏微分方程用向前歐拉步進法更新。平均曲率的運動用加性分裂算子(AOS)逼近。
步驟d)重新計算水平集距離,更新窄帶。
步驟e)在下次迭代開始前,根據收斂條件判斷循環是否停止。
實驗取4個方向作為Gabor變換的方向,均位于與Z軸垂直的平面中,θ的取值為0,,即N=4。設4個通道Gabor變換的權重參數為λi==200,i=0,1,2,3。通過對一組數據進行20組實驗,選取不同的λ值,對比實驗結果的誤差,發現當λ=800時,分割誤差值最小。在15組三維圖像的數據的分割運算中,平均在20次迭代之內,算法就能達到收斂,平均運算時間小于5 s,應用中能實現快速分割。
用戶用工具手動畫出的輪廓如圖3(a)所示,本文算法提取的圖像如圖3(b)所示。用HUTTENLOCHER的Hausdorff距離判別兩條輪廓曲線的誤差。其中,15組數據的分割圖像結果的Hausdorff距離平均值為0.966 5,表明算法提取的輪廓與驗證結果的像素偏離很小,準確度達到期望結果。

圖3 三維圖像分割結果的一個二維截面Fig.3 2D section from 3D segmentation results
本文根據常用三維圖像分割算法,提出了綜合圖像紋理和統計學信息的活動輪廓算法,并進行了實驗驗證。算法的重點是紋理提取變換在多通道中的合成,可提供較原始圖像更完整的分割信息;水平集方法克服了參數化表示輪廓的缺陷,半隱式的數值算法可顯著加大每次迭代的步長,加快收斂速度,收斂準則在迭代趨于穩定時輪廓移動較小,可減少總迭代次數。在三維活動輪廓模型采用了Gabor變換,算法在效率和準確度均達到實用要求。算法的缺陷是不同采集方式獲得的圖像的λ取值并不確定,故還需研究不同類型圖像的不同收斂性和精確度的λ值確定方法。后續研究還可包括知識庫建立,以及典型圖像特征求解及系列參數值存貯。
[1]LI S Z,Markov random field modeling in computer vision[M].Tokyo:Springer-Verlag,1995.
[2]MUMFORD D,SHAH J,Optimal approximations by piecewise smooth functions and associated variational problems[R].Center for Intelligent Control Systems,1988.
[3]CHAN T F,VESE L A.Active contours without edges[J].Image Processing,IEEE Transactions on,2001,10(2):266-277.
[4]DAUGMAN JG.Uncertainty relation for resolution in space,spatial f requency,and orientation optimized by two-dimensional visual cortical filters[J].Optical Society of America,Journal,A:Optics and Image Science,1985(2):1160-1169.
[5]SANDBERG B,CHAN T,VESE L.A level-set and Gabor-based active contour algorithm or segmenting textured images[R].UCLA Department of Mathematics CAM Report,2002:02-39.
[6]CLARK M,BOVIK A C,GEISLER W S.Texture segmentation using Gabor modulation/demodulation[J].Pattern Recognition Letters,1987,6(4):261-267.
[7]BEYER R P,LEVEQUE R J.Analysis of a one-dimentional model for the immersed boundary method[J].SIAM J Number Anal,1992,29(2):332-364.
[8]ADALSTEINSSON D.A fast level set method for propagating interfaces[D].Oakland:University of California,1994.
[9]SETHIAN J A.Level set methods and fast marching methods[J].Computer Vision and Materials Science,Cambridge University Press,1999.
[10]WEICKERT J,ROMENY B,VIERGEVER M A.Efficient and reliable schemes for nonlinear diffusion filtering[J].IEEE Transactions on Image Processing,1998,7(3):398-410.
[11]HUTTENLOCHER D P,KLANDERMAN G A,RUCK LIDGE W J.Comparing images using the Hausdorff distance[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1993,15(9):850-863.
[12]CHEN Y,TAGARE H D,THIRUVENKADAM S,et al.Using prior shapes in geometric active contours in a variational framework[J].International Journal of Computer Vision,2002,50(3):315-328.