中南林業科技大學計算機與信息工程學院 陳愛斌 江 霞
圖像分割是根據圖像的某些特征或特征相似的集合,對圖像進行分組聚類,把圖像分成若干個特定的,有意義的區域并提取出感興趣的目標技術和過程。它使圖像高級處理階段的圖像分析和圖像識別等處理過程的數據量大大減少,并保留圖像結構的重要信息。細胞分割的精度對細胞分割有重要作用,它的好壞直接影響細胞分析。細胞分割到今天仍沒有取得圓滿成功的幾個重要原因是:(1)細胞圖像很復雜,不僅有白血細胞、紅細胞和血小板還有其它東西,而且根據白細胞的成熟程度不同可以分為20多種不同的類別。(2)細胞圖像經常受染色不均勻,光照不一致的影響,導致灰度值發生變化。(3)細胞圖像經常重疊,沒有明顯的邊界。(4)細胞的大小變化很大,細胞核的形狀各種各樣。這些使得細胞分割是一個困難和富有挑戰的任務。所以,我們有必要針對醫學圖像這個領域對細胞圖像分割方法進行研究。本文對細胞分割的各種方法進行系統分析。
為了解決醫學圖像細胞分割的難題,多年來許多研究人員做了大量的工作,研究出了很多有用的分割方法。隨著閾值分割,活動輪廓,邊緣檢測和形態學等方法在圖像分割中廣泛應用,活動輪廓,多光譜等新出現的算法也不斷的用于解決細胞分割的問題,國內外學者針對一些具體應用的醫學圖像分割提出了不少好的分割方法。
閾值分割法是一種基于區域的圖像分割技術,其基本原理是:通過設定不同的特征閾值,把圖像象素點分為若干類。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。閾值選取方法有多種,如Mode法、Otsu法、熵方法、P-tile法和最小誤差法等。由于閾值分割算法原理簡單,計算量比較小,但它依賴閾值的選擇,廣泛的應用于早期的細胞分割。在目標和背景差異比較大的圖像可以用全局閾值,柯行斌,王汝傳[1]在已經經過預處理的圖像上用全局閾值分割白血細胞,發現比匹配法分割的效果好一些。而細胞的胞漿和背景相差不大,因此用單一的閾值分割很難取得很好的效果。王任揮[2]提出用最大信息熵原理來確定多閾值分割彩色細胞,能基本區分細胞的細胞核、細胞漿及背景區域,但不能得到清晰的細胞輪廓。由于多閾值一般是設置兩個值,而細胞圖像一般比較復雜,很難得到明顯的雙峰的直方圖,這就需要設置局部閾值。局部閾值分割法是將原始圖像劃分成較小的圖像,并對每個子圖像選取相應的閾值。自適應閾值可以根據特征不同產生不同的合適的閾值,因此適合分割處理大多數圖像。馬保國,喬玲玲[3]提出的自適應閾值分割,先對圖像各像素進行梯度計算,然后局部用最大類間方差法分割。這種算法對有噪聲的白血細胞圖像也能取得一定的效果。下列圖1對四個圖的細胞對比閾值分割的效果。總的來說,閾值分割只考慮灰度信息沒有考慮空間信息,不適用于多通道圖像,也不適用于特征值相差不大的圖像,并且對噪聲和灰度不均勻敏感。

圖1 閾值分割的細胞比較

圖2 分水嶺分割過程及結果

圖3 幾種類型細胞的手動分割和自動分割的比較
分水嶺分割方法,是一種基于拓撲理論的數學形態學的分割方法,其基本思想是把圖像看作是測地學上的拓撲地貌,圖像中每一點像素的灰度值表示該點的海拔高度,每一個局部極小值及其影響區域稱為集水盆,而集水盆的邊界則形成分水嶺。分水嶺的概念和形成可以通過模擬浸入過程來說明。在每一個局部極小值表面,刺穿一個小孔,然后把整個模型慢慢浸入水中,隨著浸入的加深,每一個局部極小值的影響域慢慢向外擴展,在兩個集水盆匯合處構筑大壩,即形成分水嶺。在細胞處理過程中,由于設備或人為原因,有時候會出現細胞粘連程度分布不均勻的情況,這樣分割起來很困難,分水嶺算法經常用于處理這類問題。丁宏和王澤提出用先對細胞圖像用距離變換和對種子點改進,再用分水嶺算法分割,如果種子定位精確的情況下,粘連的細胞分割能取得很好的效果。分水嶺算法直觀,快速,可以并行處理并具有分割精度高的優點。但用分水嶺方法進行圖像分割時,容易造成圖像的過度分割而且對噪聲特別敏感。一般都通過對圖像進行預處理和區域合并的改進來抑制圖像過分分割。謝文娟[4]等提出采用形態學基本運算,運用交替序貫濾波對白血細胞圖像進行濾波處理,然后采用多尺度形態梯度代替形態學梯度。利用開重建細胞圖像,減少極小值標記點,減少過分割產生的區域。通過對白血細胞預處理的改進,有效的解決噪音引起的白血細胞過分分割。包振健,邸書靈[5]提出一種混合的分水嶺策略來分割骨髓細胞圖像,它是用標記的形態學重建和基于區域相似度的區域合并算法來克服分水嶺對標記點敏感的缺點。針對分水嶺算法的缺點并結合自身的研究需求,許多學者提出4種方法對其進行改進,預處理濾波,這個主要是在預處理消除圖像噪聲,標記、區域合并和其它方法,后面這三種方法主要是針對過分分割這一優點進行改進。圖2為標記分水嶺算法實驗效果。

圖4 細胞核的分割過程
有些分割方法很容易產生過分分割,如上面提到的分水嶺算法,而模糊聚類分割算法就很好彌補了這一方面的缺失。模糊聚類是根據事物間的相似性進行區分和分類的過程,它將數據劃分為不同組或類的過程,并使同一個組內的數據對象具有較高的相似程度,而且不同組中的數據對象則是不相似。模糊理論算法中最常用的是模糊C-均值聚類算法,模糊C均值聚類(FCM),是用隸屬度確定每個數據點屬于某個聚類的程度的一種聚類算法。模糊C均值聚類算法的優點是運算簡單,收斂比較快,適合處理數據量大的圖像,它的缺點是對初始中心很敏感,易陷入局部極小值而難收斂到聚類中心。用模糊C均值處理圖像一般采用改進的C均值聚類算法,或者用C均值聚類算法和別的算法結合使用,這樣可以揚長避短。S.Chinwaraphat[6]提出改進FCM算法消除由于散射或假的聚類造成不明顏色或像素之間的相似性和等離子體胞質背景。Nipon Theera-Umpon[7]用模糊C均值聚類方法對細胞過份分割,然后再結合形態學對細胞進行開與閉運算去除小孔和平滑邊緣。下面圖3為此方法自動分割和用手動分割圖的比較。聚類算法中還有一個常用的是K均值聚類。EunSang Bak,KayvanNajarian[8]提出K均值聚類算法和自適應閾值分割方法結合使用分割細胞,由實驗結果得出分割效果比較好。現在研究人員主要研究是模糊聚類算法如何優化初始中心和如何不陷入局部最小值。
Myeloblast Promylocyte Myelocyte Mctamyclocyte Band PMN
可形變模型最初用來解決計算機視覺和計算機圖像的一種方法,但很快就被應用到醫學圖像細胞處理技術中,如邊緣檢測,匹配等等。可形變模型可以分為參數可形變模型和幾何可形變模型。參數可形變模型就是把研究的曲線或曲面直接表示出來,它可以對模型直接干預,并且可以為快速實時應用提供緊湊的表達形式,但不可以改變模型的拓撲結構。而幾何可形變模型容易實現拓撲學的變化,容易空間維數擴展。細胞分割常用的可形變模型有參數型的Snake算法和幾何型的水平集算法。傳統的可形變模型的缺陷是運算量大,難收斂于凹形區域。Snake模型是通過尋找自身能量函數的極小值,這個值是由內部和外部函數獲得,使曲線由初始區域向目標真實輪廓靠近并調整形狀以逼近目標輪廓的算法。所以基于參數的活動輪廓算法的缺點是對初始輪廓的要求很高,優點是整個算法就是一個特征提取的過程。一般對參數形輪廓進行改進,一方面會針對獲得高質量的初始輪廓進行改進,另一方面對外部能量算法進行改進以便有效指引關鍵點朝著正確的目標方向運動。楊誼[9]提出基于Snake模型的細胞圖像分割新方法研究就是從這兩方面分別進行改進的。Farnoosh Sadeghian,Zainina Seman[10]也是先對細胞圖像先預處理再用canny算子進行邊緣檢測,然后才用改進的GVF Snake獲取清晰的邊緣,如圖4。水平集活動輪廓對初始輪廓并不很敏感但它的收斂速度比較慢。傳統的水平集分割比較適合分割不粘在一起的細胞,而YayunZhou[11]提出的多相水平集能較好的分割粘連細胞,并提出改進水平集收斂于Mumford-Shah函數以提高收斂速度。
除了上面提到的細胞分割算法,還有遺傳算法,形態學,區域增長,光譜算法等。
遺傳算法是模擬達爾文生物進化論的自然選擇和遺傳學機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優解的方法。它的優點是有很好的收斂性,計算時間少,魯棒性。缺點是不可以很好的處理大規模計算量的問題。候振杰,潘新[12]提出一種基于熵的遺傳聚類算法。用遺傳算法和聚類分析及熵結合分割骨髓細胞。
數學形態學是由一組形態學的代數運算子組成的,它的基本運算有4個:膨脹、腐蝕、開啟和閉合,它們在二值圖像和灰度圖像中各有特點。基于這些基本運算還可推導和組合成各種數學形態學實用算法,用它們可以進行圖像形狀和結構的分析及處理。孫萬蓉,俞卞章[13]提出用形態金字塔分割細胞圖像,再用流域算法對低分辨率圖像進行分割,然后再復合得到原始圖像。
區域增長算法一般和別的算法結合一起使用,單獨分割效果很差。王瑞胡[14]提出用自適應曲面多尺度曲面擬合的方法,對腐蝕圖像得到的種子區域進行擬合和區域生長。在分水嶺算法中有時也用到區域增長算法。由于遺傳算法計算量很大而且分割效果不是很好,一般和其它的算法結合使用。
多光譜算法郭寧寧[15][16]提出的多光譜算法和其它算法不同,它更依賴于硬件設備,是一種新穎的分割方法。它把光譜圖像看成一個三維的圖像表示光譜信息和空間信息,不同的灰度對應不同的波長,得到唯一的光譜曲線。再用支持向量機分割圖像。Xuqing Wu,Shishir K.Shah[17]提出自下而上和自上而下的條件隨機域模型,它不僅從光譜域來考慮還從空間域考慮分割。
細胞分割的算法有很多,但每種算法都有各自的優缺點,單獨用于分割的時候算法均不是很理想。所以現在很多的學者把多種算法結合利用,取其所長,避其所短,這樣得到的分割效果就大大的提高,但它的缺點是運算量特別的大。蔡雋[17]提出先用HIS空間中的S飽和度分割細胞核,然后利用連通域標記法得到白細胞個數確定細胞窗再用改進的流域算法得到細胞漿的粗分割并用它作為細胞的初始輪廓,再用改進的GVF算法得到細胞的精確分割。這樣子分割出來的細胞準確率高,魯棒性好但運算時間特別長。Farnoosh Sadeghian,Zainina Seman[9]用canny算子進行邊緣檢測,然后用GVF Snake獲取清晰的邊緣,分割細胞質是用zack閾值分割,并且在這算法中還用到形態學里的開與閉運算。J.Cheewatanon,T.Leauhatong[19]提出用mean shift濾波方法去除噪音,保持很好的細胞結構邊緣,再用CIE LAB彩色空間用區域增長的方法進行分割,再用活動輪廓提出提取白血細胞的邊界。
細胞分割的算法有很多,但每種算法都有各自的優缺點,單獨用于分割的時候算法均不是很理想。所以現在很多的學者把多種算法結合利用,取其所長,避其所短,這樣得到的分割效果就大大的提高,但它的缺點是運算量特別的大。蔡雋[17]提出先用HIS空間中的S飽和度分割細胞核,然后利用連通域標記法得到白細胞個數確定細胞窗再用改進的流域算法得到細胞漿的粗分割并用它作為細胞的初始輪廓,再用改進的GVF算法得到細胞的精確分割。這樣子分割出來的細胞準確率高,魯棒性好但運算時間特別長。Farnoosh Sadeghian,Zainina Seman[8]用canny算子進行邊緣檢測,然后用GVF Snake獲取清晰的邊緣,分割細胞質是用zack閾值分割,并且在這算法中還用到形態學里的開與閉運算。J.Cheewatanon,T.Leauhatong[18]提出用mean shift濾波方法去除噪音,保持很好的細胞結構邊緣,再用CIE LAB彩色空間用區域增長的方法進行分割,再用活動輪廓提出提取白血細胞的邊界。
通過對醫學領域白血細胞中常用的圖像分割算法比較,系統分析各種算法的優缺點。近年來,許多研究人員致力于研究白血細胞分割算法,并出了很多的研究成果。但由于白血細胞分割本身的困難,至今還沒有一種通用算法分割細胞圖像。除了細胞結構的復雜性,準確率要求必須很高。雖然細胞分割取得一定的成就,但面對臨床應用的準確率還是遠遠不夠的。人們逐漸認識到任何一種算法單獨分割都難達到很好的效果,在不斷的研究和改進某種算法和創新算法的同時也注重多種算法結合使用,并研究怎么樣結合才能突出各自的優點。同時三維甚至多維的彩色圖像分割技術也一直受到人們的關注。在彩色圖像中能夠提取到的信息量比灰度圖像更為豐富,有利于后續的研究。近年來由用戶參與控制、引導的交互式分割方法技術在醫學圖像分割中正受到越來越多的人關注。目前人們仍在繼續研究更先進的成像技術和更復雜的圖像處理算法。
[1]柯行斌,王汝傳.白細胞圖像分割的研究與實現[J].南京郵電學院學報,2003,23(3):53-57.
[2]王任揮.基于最大信息熵原理的顯微細胞圖像多閾值分割算法[J].內蒙古科技與經濟,2010,18(220):58-61.
[3]馬保國,喬玲玲.基于局部自適應閾值的細胞圖像分割方法[J].計算機應用研究,2009,26(2):755-756.
[4]謝文娟,段汕.基于改進分水嶺算法的細胞圖像分割[D].武昌:中南民族大學,2010,5.
[5]包振健,邸書靈.一種基于分水嶺變換的細胞圖像分割方法[J].計算機工程與應用,2008,7(4):230-232.
[6]S.Chinwaraphat,A.Sanpanich.A Modifed Fuzzy Clustering For White Blood Cell Segmentation[C].The 3rd International Symposium on Biomedical Engineering,2008,356-359.
[7]Nipon Theera-Umpon.Patch-Based White Blood Cell Nucleus Segmentation Using Fuzzy Clustering[J].Electrical Eng,Electronics,And Comm unications,2005,3(1):15-19.
[8]EunSang Bak,KayvanNajarian.Effcient Segmentation Frame work of cell Images In Noise Environments[J].IEEE,2005,1802-1805.
[9]楊誼.基于Snake模型的細胞圖像分割新方法研究[D].廣州同和:第一軍醫大學,2005,4.
[10]Farnoosh Sadeghian,Zainina Seman.A Framework for White Blood Cell Segmentation in Microscopic Blood Images Using Digital Image Proc[J].Biology and Life Sciences,2009,11(2):196-206.
[11]YayunZhou,YuanxinXu等.Cell Segmentation Using Level Set Method[J].Video Engineering,2005(6):36-38.
[12]候振杰,潘新等.一種基于遺傳算法的骨髓細胞圖像分割方法[J].計算機工程與科學,2006,28(10):63-66.
[13]孫萬蓉,俞卞章.基于數學形態金字塔分解和流域分割的骨髓細胞圖像分割[J].西北工業大學學報,2006,24(5):600-605.
[14]王瑞胡.基于多尺度曲面擬合的細胞圖像表面分割算法[J].2009,30(17):4041-4044.
[15]NingningGuo,LiboZeng.A method based on multispectral imaging technique for White Blood Cell segmentation.Computers in Biology and Medicine,2006(37):70-76.
[16]寧寧,吳瓊水等.一種細胞分割新方法[J].計算機應用研究,2006(3):141-144.
[17]Xuqing Wu,Shishir K.Shah.A bottom-up and top-down model for cell segmentation using multispectral data[J].IEEE,2010,592-595.
[18]蔡雋.彩色白細胞圖像自動分割方案研究[D].南京:東南大學,2006,3.
[19]J.Cheewatanon,T.Leauhatong.A New White Blood Cell Segmentation Using Mean Shif Filter And Region Growing Algorithm [J].International Journal Of Applied Biomedical Engineering,2011,4(1):30-35.