王 燕,何宏科
(蘭州理工大學計算機與通信學院,蘭州730050)
(?通信作者電子郵箱hk_smile@qq.com)
圖像分割就是根據人們的需要將圖像分為若干個具有相同性質區域的過程[1],分割后的區域具有區域內屬性相似度高、區域間相似度低等的特點。磁共振影像(Magnetic Resonance Image,MRI)是應用放射性磁場將人體的各種組織描繪成圖像的過程。腦MRI 圖像主要由灰質(Grey Matter,GM)、白質(White Matter,WM)和腦脊液(Cerebrospinal Fluid Rhinorrhea,CSF)三大組織組成[2],而MRI 技術是區分這些組織和結構必要手段,對于研究解剖結構的變化和腦量化是必不可少的途徑。同時,這三大組織也是模擬腫瘤生長的先決條件,腫瘤根據周圍組織以不同的速度擴散。由于MRI 技術簡單方便,經常被用于腦功能、腦部病變的診斷和研究。而腦MRI 圖像因為其在形狀上的復雜性和多樣性,現有的文獻中出現了許多方法應用MRI 技術來檢查身體的異常情況,如分水嶺技術、多級閾值技術、聚類技術和邊緣檢測技術等方法。
聚類是一種運用生物信息學的自動分割技術,在圖像中應用普遍,很多人對此進行了研究與應用。聚類可分為k 均值和c 均值兩大類。模糊c 均值(Fuzzy c-Means,FCM)聚類是最普遍的。它的原理是依照不同的標準將數據進行分類,按照均方逼近的理論,使目標函數達到最小,迭代計算出合乎設定閾值的聚類中心和隸屬度,而后依照計算出的聚類中心和隸屬度矩陣來對數據分類。該算法遵循模糊集理論[3],具有實現容易、花費時間少等優點;同時具有容易受到初始中心的影響、目標函數陷入局部極值、對噪聲敏感等缺點[4],導致分割后圖像并不令人滿意。
近年來,研究人員提出很多利用FCM 算法來分割腦圖像的方法。文獻[5]在目標函數中引進猶豫度優化聚類,提出了直覺FCM(Intuitionistic FCM,IFCM)聚類算法,十分適合于醫學圖像分割,但該算法對猶豫度的定義不夠清晰。文獻[6]將改進的遺傳算法與FCM 相結合,在彩色圖像中的分割結果很好,但未涉及醫學圖像分割。文獻[7]引入了FCM_S 算法,經過在目標函數中增加像素的灰度信息,分割效果較好,是一種很好的方法,但是計算量比較大。文獻[8]提出了一種直覺無中心的FCM(Intuitionistic Center-Free FCM,ICFFCM)聚類算法,用直覺模糊隸屬函數來定義像素到聚類的相似性,很好地解決了腦MRI 圖像的模糊性和聚類過程中的不確定性;抗噪性較好,但運行時間長。文獻[9]將像素的局部空間信息與灰度信息相結合,提出了一種抗噪聲性強的聚類算法——模糊局部信息c 均值(Fuzzy Local Information c-Means,FLICM)算法;但該算法對圖像的分割精度不高。文獻[10]提出了一種自適應正則化的基于內核的FCM(Adaptively Regularized Kernel-based FCM,ARKFCM)算法,用高斯徑向基核函數替換了FCM 聚類中的歐氏距離,以較低的計算成本達到更高的分割精度。但是算法抗噪性不高,對噪聲很大的圖像進行分割時容易造成圖像缺失。
本文結合像素的鄰域提出了改進的FCM 圖像分割方法。首先,通過計算馬爾可夫隨機場的最大化條件概率來表示周圍像素對該像素的影響。然后,將其引進到FCM 算法的目標函數中,在目標函數中增添修正項,改變目標函數的計算公式,改善算法的抗噪性。因為普通的FCM 算法易受初始值的影響,容易造成算法的不穩定性或部分圖像的缺失,因此,采取文獻[14]中提出的自適應遺傳算法對數據進行全局優化,確定初始聚類中心,從而提高分割的效率和精度。經過對比實驗驗證,該方法在對腦MRI 圖像進行分割時擁有更好的分割精度和抗噪性,同時耗費時間比較少,提升了現有FCM 算法的效率。
圖像分割領域中的馬爾可夫隨機場理論經常用于圖像處理技術中,常用此體現像素與像素間的關系。由于在圖像的像素劃分中,馬爾可夫隨機場使用了像素的鄰域信息,因此具有很強的抗噪性。在馬爾可夫隨機場模型中,像素的類別由像素的鄰域決定,馬爾可夫模型假設圖像具有馬爾可夫性,設有一像素點xik,則以像素xik為中心選擇一鄰域范圍ηik。那么定義在該像素點后的馬爾可夫模型為X={Cxik|Cxik∈{1,2,…,C}},Cxik是像素xik的類別標號[11],C為類別數,被判別為第c類的概率是Pci。如圖1 所示,像素xik的鄰域為ηik={t1,t2,…,t8},依據哈默斯利-克利福德定理可以得出,馬爾可夫隨機場等價于Gibbs 隨機場,由此可得馬爾可夫的空間信息服從吉布斯分布(聯合概率分布),計算公式如下:

依據式(2),等式左邊代表的是能量函數,右邊代表的是勢團Ω 的勢團函數,Ω 是所有勢團組成的集合。在馬爾可夫模型的圖像中,像素點的標記受周圍像素的影響,像素越遠受影響越小。為了提升計算效率,采取迭代條件模型,即整幅圖像在其標號域中的條件概率等于對應標號域中各點的條件概率密度的乘積。最后,利用極大似然法確定模型參數,通過最大化條件概率更新像素標簽。

圖1 xik的鄰域ηikFig. 1 Neighborhood ηik of xik
FCM 算法是利用目標函數來解決圖像分割問題,經過求目標函數的最小數,迭代出隸屬度矩陣和初始值,依據隸屬度矩陣和聚類中心對數據進行劃分,從而實現對圖像的分割。假設有一圖像像素集合X={xk|k=1,2,…,n},n 代表圖像中像素點的個數,c 為聚類數。改進的FCM 算法利用在目標函數中加入馬爾可夫模型表示的像素鄰域,來改變隸屬度矩陣的求解方法,從而提高算法的抗噪性能。因為馬爾可夫隨機場模型在圖像分割時聯系了像素的鄰域信息,因此具有良好的抗噪性能,從而提高了算法的抗噪性能。在目標函數中加一正則項引入馬爾可夫隨機場表示的鄰域信息,即用馬爾可夫的最大化條件概率代替隸屬度矩陣,改變后的FCM 算法目標函數的表達式為:

其中:uik為第k個像素對于第i類的從屬程度;dik表示第k個像素到第i 個聚類的標準的歐氏距離;Pik是用馬爾可夫隨機場代表的像素xik的空間鄰域信息;φ 是約束系數,用來調整目標函數的約束能力。依照拉格朗日乘數法計算出隸屬度矩陣和聚類中心的新計算式。新的表達式為:

其中:vi={v1,v2,…,vc}是c個初始的聚類中心;m∈[1,∞)為模糊指數,用來控制數據分類的模糊度[12]。在m=1 時,聚類是硬c均值聚類。Nikhil 等[13]研究發現m 的最優取值范圍為[1.5,2.5],通常m=2是比較理想的取值。
當算法收斂到一定閾值時,終止迭代,依照隸屬度矩陣和初始中心劃分數據,最后更新圖像的像素值,輸出分割后的圖像。
由于聚類算法對初始中心的敏感,因而不適當的初始值會使得聚類的結果較差并造成圖像的缺失。在傳統的FCM算法中,初始中心是隨機選定的,并且隨機的初始聚類中心可能會使數據離某些聚類太遠,從而增加了算法的迭代次數。
為了防止隨機初始值對分割效果的影響,采取文獻[14]中的自適應遺傳算法來優化初始值。因為遺傳算法能夠在全局內對數據尋優,是一種尋找最優解的方法,能夠提高算法的穩定性。自適應遺傳算法[14-16]主要組成如下:
Step1 初始化參數。每一個個體由c*s 的浮點數表示,其中c是聚類數,s是數據維度。
Step2 生成初始的種群。實驗中隨機選擇3個樣本作為一類,取均值作為初始值共c 次。種群的大小一般在30~75,實驗種群數為50。
Step3 計算適應度。為使得染色體的質量更高,利用適應度來評估染色體的質量。適應度一般選用優化后的FCM算法的目標函數(式(3))的倒數,計算公式如下:

Step4 計算遺傳算子。
1)選擇:依照生物進化論原則,采取非線性排序選擇方式,按適應度降序排序,按相應的編號計算非線性選擇概率。
2)交叉:計算交叉概率,增大種群的穩定性。
3)變異:計算突變概率,防止交叉形成局部收斂,增加種群的多樣性。
Step5 設置運行參數。為了保證結果最優,參數設置為:交叉概率0.6,變異概率0.1,最大迭代次數100,收斂精度為0.000 01。
Step6 解碼輸出聚類中心V(0)。
改進的FCM算法流程如圖2所示。

圖2 改進的FCM算法的流程Fig. 2 Flowchart of improved FCM algorithm
首先輸入待分割圖像,由自適應遺傳算法確定初始的值V(0),再依據式(4)~(5)計算隸屬度矩陣和聚類中心;當達到設定的閾值abs(Jt(U,V)-Jt-1(U,V))<? 或最大終止次數時,終止算法的迭代;然后,依據各類別的聚類中心和隸屬度矩陣進行像素的劃分,依據隸屬度的最大值將圖像的像素劃分類別;最后,更新像素的灰度值,并輸出分割后的圖像。
實驗中所用的數據集選用McGill 大學Montreal 神經所的Brain Web 腦MRI 圖像庫[17]。該數據庫仿真了腦MRI 圖像的各種組織和結構,包含了基于兩種解剖模型(正常和多發硬化)的腦MRI 數據,并且提供了三種合成方式(T1-,T2-,PD-)下的三維腦MRI 圖像。圖庫中含有不同的掃描厚度、噪聲和灰度灰度不均勻的大腦圖像。每組圖像數據的大小為181×217× 181,圖像像素值取值范圍為[0,255],數據庫提供了全部腦MRI 圖像的金標準圖像,按照這些圖像能夠比較算法劃分的準確性。
腦圖像主要由GM、WM、CSF組成。這三大組織是最為重要的組成部分,是腦腫瘤等疾病生長的前提,更加準確地分割出上述部分擁有很重要的實際意義。因此在實驗之前,為了更加準確地進行分割,事先剔除了腦圖像的其他部分,切片厚度為1 mm,取聚類數目c=4(即GM、WM、CSF和背景),模糊指數m = 2,迭代閾值ε=0.000 01,最大迭代次數T=100。圖像像素鄰域為3× 3 鄰域,實驗環境為Matlab2018a。在實驗中,將本文算法與FCM 算法、FLICM 算法、ARKFCM 算法進行了對比。
通過經驗得出當約束系數φ=0.6 時,實驗獲得的分割結果圖像較好。
為了檢測算法的抗噪性能,在實驗中選擇BrainWeb 圖像庫作為實驗數據庫,并以T1 加權,選取腦切片圖像第100 個MRI 圖像為例。圖3(a)是包含所有組織的原始大腦MRI 圖像,圖3(b)~(d)是去除了大腦其他組織后的圖像,依次顯示了不同噪聲的圖像。

圖3 實驗使用的圖像Fig.3 Images used in the experiment
對圖3(d)的圖像依照4 類分割來檢驗該方法的可靠性。表1 為FCM 分割過程當中隨機選取的聚類中心、用自適應遺傳算法確定的聚類中心和聚類后的聚類中心。從表1 可以看出:隨機選取的方式就是隨意取用c 個像素作為初始值,在某種程度上增加了算法的不可控性,具有一定的隨機性。采用自適應遺傳算法確定初始的聚類中心更加接近于聚類后的聚類中心,驗證了該方法的有效性,提高了算法的效率。

表1 MRI圖像FCM分割實驗聚類中心Tab. 1 Clustering centers of MRI image in FCM segmentation experiment
從圖4所示的實驗結果可看出:1)本文的PSNR 值高于對比算法,即抗噪效果較好,其他算法的實驗效果不明顯。經典的FCM 算法易受初始值的攪擾,需要進行多次實驗才能得到想要的分割圖像。2)FCM算法沒有很清楚地分割出腦脊液與腦灰質圖像,腦脊液與腦灰質交織在一起,抗噪性差。如實驗中對于在7%的噪聲與40%的灰度不均勻圖像的分割中,ARKFCM 算法對于白質的分割中含有噪聲,沒有完全分割出白質,造成了圖像的缺失。整體來看,本文的算法的抗噪性優于對比算法,具備較好的抗噪性能,實驗效果較好。
在對實驗結果的評價中,實驗效果的好壞容易受到個人情感因素的干擾。為更加準確地評價算法的抗噪強弱,實驗中選用峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)來評估算法的抗噪性,并對FCM、FLICM、ARKFCM 與本文算法進行比較和說明。PSNR是一種基于靈敏度的評價指標,用于客觀評價算法的抗噪性,它基于對應像素點間的誤差,并不受個人情感因素的影響[18]。PSNR的表達式如下所示:


表2 不同算法的圖像峰值信噪比對比 單位:dBTab. 2 Comparison of PSNR for different algorithms unit:dB
其中:MSE 為均方誤差(Mean Square Error)。PSNR 能夠很好地評估算法的抗噪聲能力,表示的是分割后圖像與原圖的像素之間的誤分率,數值越大,說明分割后的圖像質量越高,算法的抗噪性越好,像素的誤分越小。實驗后獲得的圖像如圖4 所示,分別代表了實驗使用的算法在不同噪聲下的分割結果。
以BrainWeb 的第100 個腦MRI 圖像作為實驗,為充分地檢測算法的抗噪性能及分割結果的精度,實驗選取7%的噪聲與40%的灰度不均勻圖像。圖5 為第100 幅腦MRI 圖像的腦白質金標準圖像、腦脊液金標準圖像和腦灰質的標準分割圖像。

圖4 抗噪性實驗結果Fig.4 Experimental results of noise immunity

圖5 標準分割圖像Fig.5 Standard segmentation images
為進一步檢測本文算法分割腦圖像的精確度,實驗選用以下5個指標進行評估:
1)JS(Jaccard Similarity)[19],是用來評價算法分割準確的指數,是醫學分割圖像中使用最為廣泛的指標之一。JS 的數值越大,代表聚類的性能越好,分割的精度越高,分割圖像越靠近金標準圖像。計算公式如下:

其中:S1為分割后的圖像像素集和;S2為分割圖像的標準圖像像素集和。
2)Dice[20],是一種使用很普遍的用于定量分析醫學圖像分割的精度的評價指標。Dice的值越大,分割后圖像越好,圖像分割越精確。計算公式如下:

其中:S1為分割后的圖像;S2為標準分割圖像。
3)Sensitivity[21],是評價算法劃分感興趣區域能力的指標,其數值越大,分割效果越好,分割精度越高,分割圖像越接近于標準分割圖像。計算公式如下:
4)迭代次數,是指算法的迭代運行數,迭代次數的多少在一定程度上決定了算法的復雜度和性能,可以很好地說明算法的效率。
5)運行時間。為了客觀地說明聚類運行時間的多少,選取FCM 迭代所用時間作為比較,盡管遺傳算法的迭代運算需要一些時間,但經過優化后的聚類中心使得FCM 算法的收斂速度加快,在分割腦圖像時所用時間并沒有增加很多,而且對于高維數據具有更好的效果,使得算法的普適性更高。
實驗后各腦組織圖像分割結果如表3 所示,各腦組織的分割圖像如圖6所示。
從圖6 可看出:本文算法的分割圖像擁有更少的噪聲點、更清楚的腦圖像邊界分割、更好的抗噪性能和更高的可靠性。從表3 可看出:本文算法相較于對比算法,在分割精度以及迭代次數上均有所提高。本文算法Jaccard 指數平均為82.76%,Dice 指數平均為90.45%,Sensitivity 指數平均為90.19%。與對比算法相比,本文Jaccard 指數分別提高了2.40 個百分點、2.10 個百分點、23.29 個百分點;Dice 指數分別提高了1.44 個百分點、1.26 個百分點、17.9 個百分點;Sensitivity 指數分別提高了1.86 個百分點、1.95 個百分點、16.95 個百分點。從表3 可以看出:本文算法在實驗精度、迭代次數和運行時間整體更優,整體上提高了FCM 算法的效能,使得應用范圍更廣,能較好地分割腦圖像,有效抵抗各種噪聲和異常值;并且對高維數據擁有更好的實驗結果,為更加精確地分割各腦組織提供了一種新的方法。

表3 腦組織圖像分割結果Tab. 3 Brain tissue image segmentation results
本文實驗的主要目的是更精確地識別出腦圖像中的WM、GM 和CSF 這三大組織,同時增強算法的抗噪性能,在整體上提升FCM 算法的效率,以及擴大其應用范圍。通過改進算法的目標函數,引入馬爾可夫隨機場表示像素點的鄰域信息以消除圖像中像素點錯誤分類的結果,提高算法的抗噪性。由于FCM 容易受到初始值的影響,用遺傳算法克服了這種缺陷,提高了聚類算法的分割的準確性,使得在圖像分割中得到了很好的運用,魯棒性高。實驗結果顯示,該算法擁有很強的抗噪聲性,圖像分割的準確性更高,能在一定的程度上減少了迭代次數,改善了FCM 算法的整體性能,為模糊聚類的劃分應用提供了一種新的實踐。下一步的研究方向是改善約束系數的自適應能力,將其應用于病灶圖像的分割,以及提高算法的通用性。