周佳男,馮志林,朱向軍
(1.浙江商業職業技術學院 信息技術學院,浙江 杭州 310053;2.浙江工業大學 之江學院,浙江 杭州 310024)
噴墨印花紋理是一種細致型紋理,特點是微小、稠密,其紋理圖像的灰度級相對較集中。噴墨印花紋理的一項重要特征是其不規則性,它不是由統一固定的模式嚴格有序地排列而成,而是由隨機分布的花紋構成的[1]。噴墨印花紋理圖像分割是將紋理圖像分成各具特性的區域并提取出感興趣的紋理目標的技術和過程。
近年來在圖像分割領域不斷出現很多新的研究成果,其中將聚類算法應用到圖像分割領域中,可以有效地提高圖像分割的精度,是一種較新的研究方法。聚類算法又稱為無監督學習算法,目前被用于圖像分割的常見聚類算法主要有K均值[2-3]和譜聚類[4-5]等。聚類分割算法是將圖像區域劃分成若干個不相交的分塊集合,在聚類的過程中以及最終的輸出結果中均只將分塊模式劃分到隸屬度最大的聚類中。由于傳統聚類分割算法在聚類過程中對圖像噪聲敏感,且沒有考慮紋理圖像的空間特性,其對含噪噴墨印花紋理圖像的分割結果精度較差。
本研究提出一種基于分塊標定和期望最大化相結合的聚類分割算法。該算法首先對紋理圖像建立表征空間特性的自回歸模型,并對圖像數據進行分塊,使得交疊的分塊窗口集能夠覆蓋整個圖像;然后,利用自回歸模型滿足多元高斯分布的特性,設計出一種利用分塊標定策略的期望最大化算法來穩健估計自回歸模型中混合分布的參數;最后采用分塊聚類優化技術,通過聚類合并的迭代過程,獲得紋理類的個數和分塊集,最終得到紋理圖像的塊狀聚類分割圖。
近年來,國內外學者采用自回歸模型建立圖像的紋理分布模型[6-7],并通過鄰域系統建立相鄰像素間的相互作用關系。建立自回歸紋理圖像模型的目標是為了獲取紋理圖像在局部尺度上的特征集。由于二維自回歸模型可以實施最大似然參數的線性估計,本研究采用該模型對紋理圖像進行建模。
設圖像X包含K個紋理類,k是序標,第k個紋理類的自回歸模型表述為:

式中:Xs—M×M區域上點s=(x,y)處的灰度值,且1≤x,y≤M;Nr—點s的4鄰域,非對稱自回歸系數—區域灰度均值;零均值、協方差為Σk的獨立多元高斯隨機場。
由式(1)可知,圖像X的參數θ={θk|k=1,...,K},其中θk={μk,?k,Σk}是第k個紋理類的參數。
由于式(1)中的觀測數據X在獲取過程中受到噪聲污染,自回歸模型(1)的θ參數估計屬于“不完整數據”的參數估計問題。期望最大化(EM)算法可以從“不完整數據”中對參數進行極大似然估計(MLE),是解決包含非完整數據的統計估計問題的一個有效的工具,已在圖像處理、數據擬合、目標跟蹤等領域得到廣泛應用[8-9]。
EM算法是一種通用的最大似然參數估計方法,它的一個重要用途是實現混合概率密度函數的參數估計問題。因此,本研究采用EM算法進行紋理圖像自回歸模型的參數估計。
EM算法每一次迭代由兩步組成:E步和M步。E步就是在給定數據集和當前參數估計的情況下,求完整數據集似然函數對數變換的期望值;M步就是使E步得到的期望值最大化。EM算法通過E步和M步的不斷迭代,逐步改進模型的參數,直至滿足收斂條件為止,這樣就可以使模型的參數逐漸逼近真實參數,從而得到待求參數的最大似然估計值。
由于式(1)是建立在區域鄰域系統上的,很多學者采用分塊標定算法來對其進行參數估計。文獻[10]將分塊標定算法應用到不完整數據的參數估計中,有效提高了參數估計的效果。本研究采用分塊標定算法將整幅圖像等分成多個小塊,再在每個小塊中根據紋理特征進行標定,在鄰域內用匹配度最大分塊的類標號作為當前塊集類標號,然后采用偽采樣過程,對參數估計的過程進行更新,提高參數估計的精度。
具體地,本研究將分塊標定算法和EM算法相結合,在EM算法中加入分塊標定的步驟,提出一種改進的期望最大化算法(block-labeling EM,BLEM)。BLEM算法在E步后引入分塊標定L步,該步驟將根據當前后驗分布的值進行Gibbs采樣,進行標簽標定;同時根據采樣所得的先驗概率,對自回歸模型系數進行估計。在M步中則利用L步生成的先驗分布進行參數更新。
設Ak是屬于紋理類k的塊集,Wk=|Ak|是塊集的個數,本研究提出的BLEM算法設計如下:
STEP1 設置迭代序標l=0,迭代閾值L,收斂誤差閾值Mε,θj的初始后驗概率P(l)(Ak|θj)=1/K,j=1,..,W。
STEP2 E步
STEP2.1 對每一個θj,確定后驗概率值:


STEP2.2l←l+1,如果l<L-1,則轉至STEP3,否則轉至STEP4.2。
STEP3 L步
STEP3.1 計算E步所得后驗分布的期望值Q(P(l)(Ak|θj)),并利用其為θj設置聚類標簽k;
STEP3.2 利用Gibbs采樣技術,得到塊集Ak的先驗概率分布P(l)(Ak),并估計自回歸系數?k。
STEP4 M步
STEP4.1 利用L步產生聚類分塊Ak,更新聚類分塊的均值向量和協方差向量
STEP4.2 計算收斂誤差值ε,如果ε<Mε,則轉至STEP1,否則轉至STEP5。
STEP5 算法結束,并輸出θk。
本研究提出的分塊聚類分割算法(block cluster segmentation algorithm,BCSA)屬于無監督算法,因此,其對圖像X的分割過程主要包括:
(1)估計紋理模型的參數θ;
(2)估計紋理類的個數K;
(3)獲取紋理類的分塊集{Ak|k=1,..,K}。
BCSA算法的第一個過程由BLEM算法完成,因此,下面研究BCSA算法對后兩個過程的實現。
由于參數θk已由BLEM算法估計得到,圖像塊XAk關于θk的條件概率為:

由于Wk=|Ak|是滿足多項式分布的隨機變量(參數為ρk),則圖像X和Ak關于θ和ρ的條件概率為:

由式(3)可知,BCSA算法的后兩個過程可通過貝葉斯優化式(3)實現。由于式(3)同時包含了4個未知參數K、A、θ和ρ,本研究采取固定部分參數的策略進行求解。
綜上所述,本研究提出的分塊聚類分割算法BC?SA設計如下:
STEP1 輸入原始圖像,設置聚類類別數K,并將其作為紋理類個數的初始值;
STEP2K和{Ak}固定。采用BLEM算法求解θk,獲得塊集Ak的統計特征,計算ρk的似然估計值ρ^k=Wk/W;
STEP3K和{θk,ρk}固定。該步驟將對塊集Ak重新劃分,為此,本研究將圖像X的整個區域S劃分成若干分塊集Zw,即有S={Zw|w=1,...,W}。利用觀測數據為每個分塊選擇最匹配的紋理,并得到新的塊集估計值:

STEP4 減少聚類中心個數K的值,并通過最近鄰匹配策略,迭代合并相鄰聚類區域;
STEP5 檢測聚類中心個數是否無變化,如果變化,則轉至STEP2,否則轉至STEP6;
STEP6 算法結束,并輸出圖像聚類分割圖。
為了驗證本研究算法的有效性,筆者將其用于噴墨印花紋理圖像分割。本研究采用一幅大小為256×256的噴墨印花紋理圖像進行分割實驗。本研究算法的參數設置為:迭代閾值L=1 000,收斂誤差閾值Mε=0.001,紋理類個數初始值K=10。
采用本研究算法所得的圖像分割結果如圖1所示。原始圖像如圖 1(a)所示,迭代200,400,600和800次后所得聚類圖如圖1(b~e)所示,分割圖如圖1(f)所示,C1~C5是聚類分割所得的紋理類。由圖1(b~e)可以看出,本研究算法在迭代過程中,通過分塊標定和聚類合并的過程實現了對不同紋理類的區域聚類。隨著迭代次數的不斷增加,分割目標與背景的灰度重疊情況得到不斷改善,重疊部分的分塊區域會逐漸往各自的聚類中心合并,最終達到分塊區域隔離的目的。由圖1(f)可以看出,本研究算法不僅可以完成圖像前景和背景的分離,同時還可以實現前景區域中不同紋理類區域的邊界劃分,從而得到不同紋理類的圖像分割結果。

圖1 本研究算法所得分割結果
本研究算法在迭代800次時,紋理類C1~C5在進行自回歸模型求解時的參數值列表如表1所示。

表1 紋理類C1~C5迭代800次時的參數值列表
最后筆者對含噪圖像(噪聲尺度σ=30)的分割情況進行驗證,并將本研究算法(迭代800次)與文獻[2]中的經典K-Mean聚類分割算法(CHEN算法)進行比較。從圖2可以看出,本研究方法能準確地將前景目標和背景區域分離,且分割結果優于CHEN算法,尤其是在圖2(a)的方形區域,本研究方法能將該區域分割開來,而CHEN算法產生了嚴重的錯分,不能進行正確的分割。
實驗結果表明,本研究算法對于紋理圖像在噪聲環境下的區域一致性和分割準確性均好于CHEN算法,對噪聲具有更好的魯棒性。

圖2 本研究算法與CHEN算法比較
為了提升現有聚類算法對含噪噴墨印花紋理圖像分割效果不足的缺陷,本研究對聚類算法進行改進,提出一種基于分塊標定和期望最大化相結合的聚類分割算法。為了提高聚類分割算法對噪聲的魯棒性,本研究算法采用分塊標定策略的期望最大化算法來估計自回歸模型中混合分布的參數。同時,本研究算法采用分塊聚類優化技術,通過聚類合并的迭代過程,獲得紋理類的個數和分塊集,并得到最終的聚類分割結果。
實驗結果表明,本研究算法能夠有效克服現有聚類方法對噪聲敏感的缺點,具有較強的抗噪性。同時本研究算法能夠準確定位花紋形狀的聚類邊界,具有較高的分割精度,這些特點對噴墨印花紋理圖像的分割研究具有重要的意義。
(References):
[1]YANG X H,SUI J H,MENG B,et al.Auto-generating uni?form stochastic Web images for ink-jet printing textiles[J].Textile Research Journal,2010,80(18):1942-1948.
[2]CHEN C W,LUO J,PARKER K J.Image segmentation via adaptive k-mean clustering and knowledge-based morpho?logical operations with biomedical applications[J].IEEE Transactionson ImageProcessing,1998,7(12):1673-1683.
[3]王靜雷,厲小潤.基于Kmeans和圖像熵聚類的熱紅外目標檢測算法[J].機電工程,2012,29(12):1490-1493.
[4]周 林,平西建,徐 森,等.基于譜聚類的聚類集成算法[J].自動化學報,2012,38(8):1335-1342.
[5]賈建華,焦李成,柳炳祥.圖像分割的譜聚類集成算法[J].西安交通大學學報,2010,44(6):93-98.
[6]劉愛平,付 琨,尤紅建,等.基于MAR-MRF的SAR圖像分 割 方 法[J].電 子 與 信 息 學 報 ,2009,31(11):2556-2562.
[7]高佳城,林岳松,陳華杰.基于像素分類的自適應SAR圖像融合算法[J].機電工程,2009,26(3):16-19.
[8]李旭超.圖像統計模型參數估計中的期望最大值算法[J].中國圖象圖形學報,2012,17(6):619-629.
[9]吳 錫,周激流,何建新.采用非局部主成分分析的極大似然估計圖像去噪[J].光子學報,2011,40(12):1827-1831.
[10]唐 泉,樊曉平,黎 燕.基于分塊聚類的車牌圖像二值化方法[J].計算機仿真,2010,27(3):286-289.