牛藝蓉,王士同
(江南大學(xué)數(shù)字媒體學(xué)院,江蘇 無錫 214122)
基于Student-t分布的混合模型圖像分割方法
牛藝蓉,王士同
(江南大學(xué)數(shù)字媒體學(xué)院,江蘇 無錫 214122)
傳統(tǒng)圖像分割方法在分割被重尾噪聲污染的圖像時的分割效果不理想。針對該問題,提出一種基于Student-t分布的圖像分割方法。該方法根據(jù)像素間的空間關(guān)系,計算出其先驗概率,使用梯度下降法優(yōu)化參數(shù),從而最小化誤差函數(shù),在參數(shù)優(yōu)化后得到像素點的后驗概率值,對像素進(jìn)行標(biāo)記以實現(xiàn)圖像分割。實驗結(jié)果表明,在處理被重尾噪聲腐蝕的圖像時,與傳統(tǒng)的K-均值、模糊C-均值等圖像分割方法相比,該方法的誤分率較低,分割效果較好。
Student-t分布;重尾噪聲;圖像分割;空間鄰域關(guān)系;高斯混合模型
DO I:10.3969/j.issn.1000-3428.2015.10.038
圖像分割作為計算機(jī)視覺和圖像處理中的一個基本并且重要的研究技術(shù),是圖像分析前經(jīng)常使用的一個重要步驟,為圖像理解、識別等高層圖像操作打下堅實基礎(chǔ)。圖像分割根據(jù)圖像的某些特性把圖像中有意義的事物從背景中分割出來。正確的分割結(jié)果能夠為信息判斷提供有力的依據(jù)。然而圖像很容易受到噪聲的影響,這就給圖像分割帶來一定的難度。
近年來,聚類方法已經(jīng)成為圖像分割研究中的一個熱點。有限混合模型(Finite Mixture Model,F(xiàn)MM)[1-3]作為一種聚類模型,它提供了一種靈活的方式對各種隨機(jī)現(xiàn)象進(jìn)行建模。當(dāng)它的成員函數(shù)是高斯分布時,該模型稱為高斯混合模型(Gaussian Mixture Model,GMM)[4-5]。當(dāng)用于圖像分割時,有限混合模型的一個缺點是該模型認(rèn)為像素之間的關(guān)系是獨(dú)立的,并沒有考慮像素的空間關(guān)系。為克服有限混合模型的缺點,文獻(xiàn)[6-7]隨后提出了一些基于馬爾科夫隨機(jī)場的模型,雖然考慮了像素的空間鄰域關(guān)系,但是標(biāo)簽概率比例(像素屬于某些類的概率)不能在期望最大化(Expectation Maximization,EM)方法的M步驟中得到封閉解。
基于空間鄰域關(guān)系的高斯混合模型(Gaussian
Mixture Model Based on Spatial Relationships,GMMS)[8]不僅考慮了像素間的關(guān)系,而且采用梯度下降法進(jìn)行參數(shù)優(yōu)化,減小了方法的復(fù)雜度。但是該方法只對高斯噪聲有明顯效果,然而,在工程應(yīng)用中,噪聲模型往往表現(xiàn)出非高斯性,即概率密度函數(shù)分布往往表現(xiàn)出較厚的尾部統(tǒng)計特性[9],此時的噪聲已不是高斯噪聲,而是重尾噪聲。而Student-t分布具有尖峰后尾的統(tǒng)計特性[10],因此,本文將采用基于Student-t分布的混合模型驗證其對含重尾噪聲圖像的處理效果。
2.1 有限混合模型
由于單個概率分布只有一個峰值,然而許多實際現(xiàn)象的分布都是由多個峰值組成。因此單個概率分布不能對現(xiàn)實中具有多個峰值的現(xiàn)象進(jìn)行有效地模擬。有限混合模型供了一種用簡單密度模擬復(fù)雜密度的有效方法。FMM是同一類型但不同參數(shù)的分布函數(shù)的線性疊加[11]。FMM的定義公式如下:

θ)可以是任意的概率分布函數(shù)。若 P(χθ)是高斯分布,則該FMM被稱為高斯混合模型。注意πk需要滿足0≤πk≤1和
2.2 基于空間鄰域關(guān)系的高斯混合模型
基于空間鄰域關(guān)系的高斯混合模型是在標(biāo)準(zhǔn)高斯混合模型的基礎(chǔ)上考慮像素的空間鄰域關(guān)系。
設(shè)χi表示圖像的第i個像素點,i=1,2,…,N,圖像分為K類,Ωj表示第j(j=1,2,…,K)類。第i個像素點χi的密度函數(shù)為:

在GMMS中,πij考慮像素的空間鄰域關(guān)系,每個像素點即使在同一類中也有不同的先驗概率,其中,πij需要滿足0≤πij≤1和每個高斯分布都是混合模型的一個部件,高斯分布為:其中,μj和σj分別為高斯分布的均值和協(xié)方差。根據(jù)式(2)得到對數(shù)似然函數(shù):


第i個像素點的后驗概率為:

由于對數(shù)似然函數(shù)是非負(fù)遞增函數(shù),根據(jù)經(jīng)驗求解負(fù)對數(shù)似然函數(shù)較為方便:

最大化對數(shù)似然函數(shù)相當(dāng)于最小化式(7),也就相當(dāng)于最小化下式:

其中,ε是誤差函數(shù),因此,最大化似然函數(shù) L相當(dāng)于最小化 ε。將優(yōu)化結(jié)果帶入式(5),再利用式(6)進(jìn)行像素標(biāo)記。
2.3 Student-t分布
在概率論和統(tǒng)計學(xué)中,Student-t分布經(jīng)常應(yīng)用在對呈正態(tài)分布的總體的均值進(jìn)行估計。它是對2個樣本均值差異進(jìn)行顯著性測試的學(xué)生t測定的基礎(chǔ)。t檢定改進(jìn)了Z檢定,不論樣本數(shù)量大或小皆可應(yīng)用。在樣本數(shù)量大(超過120等)時,可以應(yīng)用Z檢定,但Z檢定用在小的樣本會產(chǎn)生很大的誤差,因此,樣本很小的情況下得改用學(xué)生t檢定。在數(shù)據(jù)有3組以上時,因為誤差無法壓低,此時可以用變異數(shù)分析代替學(xué)生t檢定。
一元Student-t分布定義如下[12]:

其中,μ和λ分別表示Student-t分布的均值和精度,λ的值等于方差的逆;Γ(·)表示伽馬函數(shù);ν為Student-t分布的自由度,用于調(diào)整Student-t分布的尾部長度,它對Student-t分布的影響如圖1所示。

圖1 不同ν的Student-t分布
當(dāng)ν=1時,Student-t分布就成了柯西分布,當(dāng)ν>1時,μ就成為Student-t分布的均值,當(dāng)ν趨于無窮大時,Student-t分布就以相同的均值μ和精度λ趨近于高斯分布。
2.4 重尾噪聲模型
高斯噪聲、椒鹽噪聲、乘性噪聲、重尾噪聲[13]等是常見的噪聲模型,而本文研究含重尾噪聲的圖像分割,重尾噪聲分布模型主要有Erlang噪聲、Lap lace噪聲、Cauchy噪聲、負(fù)指數(shù)噪聲以及混合高斯噪聲等。其概率密度函數(shù)如下:
(1)Erlang分布:

其中,a>0,b是正整數(shù),均值為b/a,協(xié)方差為b/a2。
(2)Laplace分布:

其中,均值為 μ;協(xié)方差為2σ2。
(3)Cauchy分布:

其中,χ0是位置參數(shù);γ>0是尺度參數(shù);均值不存在。
(4)負(fù)指數(shù)分布:

其中,均值為 μ;方差為 μ2。
(5)混合高斯噪聲由高斯噪聲獲得,即:

其中:2

α為閃光頻率,一般情況下,α很小,μ1=μ2且
以一個基于標(biāo)準(zhǔn)高斯混合的新模型用于圖像分割,其優(yōu)點在于其先驗概率 πij考慮像素的領(lǐng)域關(guān)系,和基于馬氏隨機(jī)域的模型相比,該方法需要更少的參數(shù)而且更容易實現(xiàn)。
3.1 基于空間鄰域關(guān)系的先驗概率
首先,給定一幅由U×V個像素點構(gòu)成的灰度圖。用 χ(u,ν)表示圖像的第 i個像素點 χi,其中,i= U(u-1)+ν;u=1,2,…,U;ν=1,2,…,V。充分考慮像素間的關(guān)系,如圖2所示。

圖2 相鄰像素點3×3像素窗口
第i個窗口χ(u,ν)鄰域點的像素集定義為:



其中,cj和bj(j=1,2,…,k)是優(yōu)化后的參數(shù),優(yōu)化方法將在后續(xù)內(nèi)容中詳細(xì)介紹。

該方法將像素的空間鄰域關(guān)系和其先驗概率πij結(jié)合起來。因此:

先驗概率之所以考慮空間約束是因為圖像中相鄰像素在某種意義上是相似的?;谶@種關(guān)系,在圖像中用像素領(lǐng)域的均值替換每個像素值。注意πij需要滿足0≤πij≤1和它在圖像分割中起到了過濾器的作用,可以將被噪聲污染的圖像變得平滑。將式(13)得到的先驗分布結(jié)合式(4)得到對數(shù)似然函數(shù):

其誤差函數(shù)為:

前文主要討論像素χi屬于Ωj的概率估計問題。為了計算后驗概率需調(diào)整參數(shù) Θ=(μj,λj,cj,bj),j=1,2,…,K,最小化誤差函數(shù)。采用梯度下降法優(yōu)化參數(shù)從而最小化誤差函數(shù)。
3.2 參數(shù)優(yōu)化方法
(1)用K-均值(K-means)初始化參數(shù)μj和σj,且得到Θold。
(2)根據(jù)式(5)得到其后驗概率:

(3)更新參數(shù)Θ=(μj,λj,cj,bj),得到新的參數(shù)Θnew,通過梯度下降法[14]計算參數(shù):

其中,▽ε=(?ε/?μj,?ε/?λj,?ε/?cj,?ε/?bj);η是參數(shù)率,取η=10-7。下面給出ε對μj的偏導(dǎo)數(shù)為:

同理,ε對λj的偏導(dǎo)數(shù)為:

同理,ε對cj的偏導(dǎo)數(shù)為:

其中:


同理,ε對bj的偏導(dǎo)數(shù)為:

其中:

(4)如果負(fù)對數(shù)似然函數(shù)的值變化較大,或參數(shù)Θ變化較大,則令Θold=Θnew,同時返回步驟(2)。

其中,MMCR取值范圍為[0,1],其值越小圖像分割結(jié)果越好。當(dāng)MMCR的值為0時,表示錯誤分類的像素數(shù)目為0,即分割完全正確。當(dāng)MMCR的值為1時,表示錯誤分類的像素數(shù)目與整個圖像的像素數(shù)目相等,即分割完全錯誤。
4.2 圖像合成實驗對比
第1組實驗使用的是由128×128像素構(gòu)成的合成圖像,它有4種灰度值[0.25,0.5,0.75,1],圖片分為4類。圖3(a)為原始圖像,圖3(b)為被混合高斯噪聲腐蝕的圖像,其中,參數(shù)值alPhal=0.1,均值μ1= μ2=0.1,方差σ1=0.002,σ2=0.2,圖3(c)~圖3(e)分別為K-means,模糊C-均值(Fuzzy C-means,F(xiàn)CM)和GMMS的分割結(jié)果,其誤分率分別達(dá)到9.95%,10.28%,22.81%,本文方法的分割結(jié)果如圖3(f)所示,其誤分率降到3.31%,低于其他方法。從表1可以看出,K-means,F(xiàn)CM,GMMS 3種方法在處理被重尾噪聲腐蝕的圖像時誤分率很高,而本文方法的誤分率相對較低。由于重尾噪聲下圖像有嚴(yán)重的拖尾情況,K-means,F(xiàn)CM,GMMS不能有效處理重尾噪聲下圖像的拖尾情況。然而,Student-t分布可以有效處理圖像拖尾情況。因此,本文方法取得較好的分割效果。
4.1 評價指標(biāo)
目前對圖像分割的評價還沒有一個統(tǒng)一的標(biāo)準(zhǔn),圖像分割結(jié)果的評價帶有很大的主觀性。為了客觀、量化的評價圖像分割結(jié)果,本文采用誤分率(Misclassification Ratio,MCR)[15]進(jìn)行分割結(jié)果評價。
MCR主要用于合成圖像分割結(jié)果的量化評價。定義如下:

圖3 第1組實驗圖像分割結(jié)果

表1 第1組實驗圖像的混合高斯噪聲誤分率對比 %
第2組實驗是對添加Laplace噪聲的圖像進(jìn)行處理,使用的圖像由128×128像素構(gòu)成,圖像分為3類,其灰度值為[0,0.5,1]。圖4(a)為原始圖像,圖4(b)為被Laplace腐蝕的圖像,其中,均值μ=0.001,方差σ=0.06。圖4(c)~圖4(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到0.81%,0.69%,0.37%,本文方法的分割結(jié)果如圖4(f)所示,其誤分率降到0.12%,低于其他方法。因為Student-t分布相對而言處理重尾噪聲效果較好。第2組實驗圖像分割結(jié)果MCR對比如表2所示。

圖4 第2組實驗圖像分割結(jié)果

表2 第2組實驗圖像的Lap lace噪聲誤分率對比 %
第3組實驗比較的是各方法對添加高斯混合噪聲圖像的處理效果,圖像同樣是人工合成的,由128×128像素構(gòu)成,它有2種灰度值[0.47,0.07],圖片分為2類。圖5(a)為原始圖像,圖5(b)為被混合高斯噪聲腐蝕的圖像,其中,參數(shù)值alPhal=0.25,均值 μ1=μ2=0.1,方差 σ1=0.002,σ2=0.2。圖5(c)~圖5(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到50.27%,49.96%,4.66%,本文方法的分割結(jié)果如圖5(f)所示,其誤分率降到1.08%,低于其他方法。

圖5 第3組實驗圖像分割結(jié)果
4.3 真實圖像實驗對比第4組實驗使用的是由128×128像素構(gòu)成的真實圖像,圖像分為4類,分別是白質(zhì)、灰度、腦髓液和背景。圖6(a)是真實分割結(jié)果,圖6(b)為被混合高斯噪聲腐蝕的圖像,其中,alPhal=0.1,均值μ1= μ2=0.1,方差 σ1=0.002,σ2=0.2。圖 6(c)~圖6(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到37.46%,59.16%,11.33%,本文方法的分割結(jié)果如圖6(f)所示,其誤分率降到9.78%,低于其他方法。

圖6 第4組實驗圖像分割結(jié)果
第5組實驗比較的是各方法對真實圖像的處理效果,由 192×128像素構(gòu)成,圖像分為 2類。
圖7(a)是真實分割結(jié)果,圖7(b)為被混合高斯噪聲腐蝕的圖像,其中,alPhal=0.1,均值 μ1=μ2= 0.1,方差σ1=0.002,σ2=0.2。圖7(c)~圖7(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到37.20%,36.09%,21.74%,本文方法的分割結(jié)果如圖7(f)所示,其誤分率降到18.62%,同樣優(yōu)于其他方法。

圖7 第5組實驗圖像分割結(jié)果
第6組實驗是對添加Laplace噪聲的圖像進(jìn)行處理,使用的真實圖像由100×100像素構(gòu)成,圖像分為4類,圖8(a)為原始圖像,圖8(b)為被Lap lace腐蝕的圖像,其中,均值 μ=0.001,方差 σ=0.06。圖8(c)~圖8(e)分別為K-means,F(xiàn)CM和GMMS的分割結(jié)果,其誤分率分別達(dá)到20.58%,21.89%,32.66%,本文方法的分割結(jié)果如圖8(f)所示,其誤分率降到10.42%,低于其他方法。因為Student-t分布相對而言處理重尾噪聲效果較好。

圖8 第6組實驗圖像分割結(jié)果
實驗結(jié)果表明,本文方法在處理被重尾噪聲腐蝕的合成圖像和真實圖像時,其誤分率較低,分割效果較好。這是由于重尾噪聲尾部較長,而Student-t分布擁有相對于高斯分布較長的尾部,因此它成為高斯分布的健壯替代。這進(jìn)一步的說明了該方法的有效性和可行性。
本文提出一種基于Student-t分布的混合模型用于圖像分割,不僅考慮像素的空間鄰域關(guān)系,而且使用梯度下降法進(jìn)行參數(shù)估計。通過實驗結(jié)論驗證了基于Student-t分布的混合模型圖像分割方法的優(yōu)越性。然而,本文的參數(shù) k是用戶根據(jù)先驗知識自己設(shè)定的,主觀性影響較大,今后將針對該問題進(jìn)行研究,進(jìn)一步完善該方法。
[1] Mclachan G,Peel D.Finite Mixture Model[M]. New York,USA:John Wiley&Sons,2000.
[2] Bishop C M.Pattern Recognition and Machine Learning[M].Berlin,Germany:Springer,2006.
[3] Titterington D M,Smith A F,Makov U E.Statistical Analysis of Finite Mixture Distributions[M].New York,USA:John Wiley&Sons,1985.
[4] Jain A K,Duin R PW.Statistical Pattern Recognition:A Review[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(1):4-37.
[5] Redner R A,Walker H F.Mixture Densities,Maximum Likelihood and the EM Algorithm[J].SIAM Review,1984,26(2):195-239.
[6] Choi H S,Haynor D R,Kim Y.Partial Volume Tissue Classification of Multichannel Magnetic Resonance Images——A Mixel Model[J].IEEE Transactions on Medical Imaging,1991,10(3):395-407.
[7] Santago P,Gage H D.Quantification of MR Brain Im ages by Mixture Density and Partial Volume Modeling[J].IEEE Transactions on Medical Imaging,1993,12(3):566-574.
[8] Thanh M N,Jonathan Q M.Gaussian-mixture-model-based Spatial Neighborhood Relationships for Pixel Labeling Problem[J].IEEE Transactions on System s M an and Cybernetics Part B:Cybernetics,2012,42(1):193-202.
[9] Mukherjee A,Sengupta A.Estimating the Probability Density Function of a Nonstationary Non-Gaussian Noise[J].IEEE Transactions on Industrial Electronics,2010,57(4):1429-1435.
[10] Wang Zhimin,Song Qing.Robust Curve Clustering Based on a Multivariate t-distribution Model[J].IEEE Transactions on Neural Networks,2010,21(12):1976-1984.
[11] 熊太松,章 毅.基于統(tǒng)計混合模型的圖像分割方法研究[D].成都:電子科技大學(xué),2013.
[12] Bishop C M.Pattern Recognition and Machine Learning[M].Berlin,Germ any:Springer,2006.
[13] 王 橋.數(shù)字圖像處理[M].北京:科學(xué)出版社,2009.
[14] Lange K,F(xiàn)essler J A.Globally Convergent Algorithms for Maximum a Posteriori Transmission Tomography[J].IEEE Transactions on Image Processing,1995,4(10):1430-1438.
[15] Zhang Y,Brady M,Smith S.Segmentation of Brain MR Images Through a Hidden Markov Random Field Model and the Expectation-maximization Algorithm[J].IEEE Transactions on Medical Imaging,2001,20(1):45-57.
編輯 劉 冰
Mixture Model Image Segmentation Method Based on Student-t Distribution
NIU Yirong,WANG Shitong
(School of Digital Media,Jiangnan University,Wuxi214122,China)
Traditional image segmentation methods can not effectively adapt to the case of image smearing with heavytailed noise.And the result of segmentation is not satisfactory in dealing with the image contaminated by heavy-tailed noise.This paper presents an image segmentation method based on Student-t distribution.The method calculates the prior probability according to the spatial relationship between the pixels,uses gradient descent method to optimize parameters so as to minimize the error function.The posterior probability values of pixels are obtained based on the optimal parameters. Image segmentation is realized by marking the pixels.Experimental results show that the misclassification ratio is lower and the performance is better when using the proposed method to deal with the image contaminated by heavy-tailed noise,compared with the traditional K-means and Fuzzy C-means(FCM),etc.
Student-t distribution;heavy-tailed noise;image segmentation;spatial neighborhood relationship;Gaussian Mixture Model(GMM)
牛藝蓉,王士同.基于Student-t分布的混合模型圖像分割方法[J].計算機(jī)工程,2015,41(10):204-209.
英文引用格式:Niu Yirong,Wang Shitong.Mixture Model Image Segmentation Method Based on Student-t Distribution[J].Computer Engineering,2015,41(10):204-209.
1000-3428(2015)10-0204-06
A
TP391
牛藝蓉(1989-),女,碩士研究生,主研方向:人工智能,模式識別,數(shù)字圖像處理;王士同,教授。
2014-10-28
2014-12-02E-mail:yirong1027@126.com