彭家磊,黃成泉,覃小素,雷 歡,陳 陽,周麗華
(1.貴州民族大學(xué) 數(shù)據(jù)科學(xué)與信息工程學(xué)院,貴州 貴陽 550025;2.貴州民族大學(xué) 工程技術(shù)人才實踐訓(xùn)練中心,貴州 貴陽 550025)
苗族服飾圖像具有濃厚的文化底蘊,代表了一個民族的文化傳承。隨著流行文化的沖擊,苗族服飾圖像文化逐漸流失,一些研究者采用有效的分割方法對其進行保護和傳承,如基于主動輪廓[1]和深度學(xué)習(xí)[2]的苗族服飾圖案分割方法。然而,基于模糊C均值[3](Fuzzy C-Means,FCM)聚類算法的苗族服飾圖案分割方法幾乎沒有。
圖像分割是數(shù)字圖像領(lǐng)域中的一項關(guān)鍵技術(shù),其分割的質(zhì)量對后續(xù)的特征提取、圖像識別具有重要的作用,并廣泛應(yīng)用于交通[4]、醫(yī)學(xué)[5-6]和遙感圖像[7-8]等領(lǐng)域。聚類算法是實現(xiàn)無監(jiān)督模式識別的一種方法,目的是將一個數(shù)據(jù)集根據(jù)特定的規(guī)則劃分為多個子數(shù)據(jù)。近年來,FCM算法被廣泛運用于圖像分割領(lǐng)域,但傳統(tǒng)的FCM算法對圖像進行聚類時,沒有考慮圖像像素的空間位置關(guān)系,僅對像素點的灰度值進行聚類,致使該算法對噪聲點敏感,難以取得較好的分割效果,同時具有收斂速度慢等問題。為此,Zhu等[9]根據(jù)競爭學(xué)習(xí)的思想,在FCM的目標函數(shù)中引入隸屬度競爭懲罰項,提出廣義FCM(Generalized FCM,GFCM)聚類算法,有效提升了運行效率和聚類性能。隨著模糊聚類算法的逐漸成熟,隸屬度單一的局限性也漸漸浮現(xiàn)。
Zadeh[10]提出的模糊集理論是描述像素點歸屬哪一類的肯定程度,而事物發(fā)展不僅是支持或者反對,還有介于二者之間的不確定性。直覺模糊集是模糊集的拓展,其增加的猶豫度給不確定性的信息提供了新的思路。Chaira[11]將直覺模糊集與FCM結(jié)合提出直覺模糊(IFCM)聚類算法,該算法解決了傳統(tǒng)模糊集隸屬度單一的局限性問題,但IFCM算法同F(xiàn)CM算法一樣,過分依賴于樣本的數(shù)據(jù)結(jié)構(gòu),缺乏空間信息,對噪聲和圖像的偽斑點較為敏感。為了解決這個問題,Lei等[12]通過核函數(shù)的思想,提出核距離的直覺模糊(Kernel Intuitionistic FCM,KIFCM)聚類算法,核方法將輸入空間中的非線性問題轉(zhuǎn)化為高維特征空間中的線性問題,用核距離替代歐氏距離,提高了聚類性能,但由于未考慮空間信息,導(dǎo)致對噪聲圖像的分割質(zhì)量較差。Arora等[13]將空間信息納入直覺模糊集,提出增強空間直覺模糊(Spatial Intuitionistic FCM,SIFCM)聚類算法,該算法使用新的模糊補計算非隸屬度,克服了噪聲或異常值的影響。
綜上所述,與主流醫(yī)學(xué)和遙感圖像相比,苗族服飾圖案具有色彩鮮艷、紋理復(fù)雜、樣式多元化等特征,容易導(dǎo)致圖案的偽斑點增多。在噪聲的干擾下,現(xiàn)有的模糊聚類算法分割圖像會存在邊緣模糊和破損等問題。因此,本文結(jié)合直覺模糊集與空間信息,引入隸屬度約束懲罰項,同時采用核距離度量替代歐氏距離,提出一種隸屬度修正的空間核直覺模糊(Spatial Kernel Intuitionistic FCM,SKIFCM)聚類苗族服飾圖案分割算法。與經(jīng)典FCM、IFCM、SIFCM和KIFCM算法相對比,用于驗證本文算法的分割效果和聚類性能。
FCM算法是一種迭代算法,用模糊隸屬度為其類別分配像素。設(shè)X={x1,x2,…,xn},FCM最小化約束目標函數(shù)如下:
(1)
FCM算法應(yīng)滿足式(2)的約束條件:
(2)
式中:c表示聚類數(shù)目;n表示總像素數(shù)目;m是加權(quán)指數(shù),控制結(jié)果分區(qū)的模糊性,一般將m設(shè)置為2;μki表示第i個像素xi到第k個聚類中心的隸屬度值;‖xi-vk‖2表示像素xi到聚類中心vk的歐氏距離。
通過拉格朗日乘子法對目標函數(shù)式(1)求解,得到隸屬度和聚類中心的更新公式如下:
(3)
(4)
在模糊集的假設(shè)中,FCM算法只生成隸屬度。然而,單一的隸屬度并不能準確的描述事物所存在的不確定性。因此,Atanassov將模糊集推廣至直覺模糊集,在隸屬度的基礎(chǔ)上引入了非隸屬度和猶豫度。設(shè)X={x1,x2,…,xn}表示一個有限論域,則D在X中的直覺模糊集被定義為:
D={(x,μD(x),vD(x))|x∈X}
(5)
式中:μD(x)→[0,1]、vD(x)→[0,1]分別表示x到D的隸屬度函數(shù)和非隸屬度函數(shù),并且每一個x∈D都滿足0≤μD(x)+vD(x)≤1。對于集合D中的每一個x,當(dāng)μD(x)=1-vD(x)成立時,直覺模糊集就退化成傳統(tǒng)模糊集。
為了更好地描述數(shù)據(jù)之間的不確定性,Atanassov也指出了一個猶豫度:
FD(x)=1-μD(x)-vD(x),0≤FD(x)≤1
(6)
在現(xiàn)有的直覺模糊集中,Maheshan等[14]通過Yager生成函數(shù),得到非隸屬度如下:
vD(x)=[1-μD(x)β]1/β,β∈(0,+∞)
(7)
因此,將式(7)代入式(6),猶豫度變?yōu)?
FD(x)=1-μD(x)-[1-μD(x)β]1/β
(8)
直覺模糊熵是模糊集中模糊性的度量,許多學(xué)者以不同的方式來定義。其中,Pal等[15]分析了經(jīng)典的香農(nóng)信息論,引出了指數(shù)熵。對于一個概率分布:p=pi(i=1,2,…,n),指數(shù)形式的香農(nóng)熵可定義如下:
(9)
將指數(shù)香農(nóng)熵與直覺模糊集相結(jié)合,得到直覺模糊熵如下:
(10)
IFCM聚類算法在傳統(tǒng)FCM算法的基礎(chǔ)上引入了猶豫度函數(shù),其目標函數(shù)可表示為:
(11)

對目標函數(shù)式(11)進行最優(yōu)化求解,得到隸屬度函數(shù)和聚類中心的更新公式如下:
(12)
(13)
近年來,核方法被廣泛應(yīng)用于聚類算法中,其基本思想是將低維空間中的非線性問題轉(zhuǎn)變?yōu)楦呔S空間中的線性問題,使原來的非凸數(shù)據(jù)變得線性可分,從而讓數(shù)據(jù)點的分類更加合理。根據(jù)文獻[12],高維特征空間中的核距離被定義如下:
‖Φ(xi)-Φ(vk)‖2=
K(xi,xi)+K(vk,vk)-2K(xi,vk)=
2[1-K(xi,vk)]
(14)
式中:Φ表示數(shù)據(jù)空間到特征空間的非線性映射。
本文使用高斯核函數(shù)來計算核距離,其定義如下:
K(xi,vk)=exp(-‖xi-vk‖2/h2)
(15)
式中:h表示核寬度。而參數(shù)h的選擇往往能影響圖像分割質(zhì)量的好壞[16],并且需要大量的實驗。
本文為了解決h的取值問題,采用均方誤差來估計h2,具體形式如下:
(16)
為充分利用圖像的空間鄰域信息,本文從競爭學(xué)習(xí)的角度出發(fā),將直覺模糊集和空間鄰域信息相結(jié)合,并采用核距離替代歐式距離構(gòu)造出新的目標函數(shù)如下:
(17)

利用拉格朗日乘子法對目標函數(shù)式(17)求最優(yōu)解,得到隸屬度函數(shù)和聚類中心的更新公式如下:
(18)
(19)

由于圖像的相鄰像素具有高度相關(guān)的性質(zhì),且屬于同一類的概率較大,所以考慮周圍像素點的隸屬度有利于提高算法的聚類性能。本文利用局部像素特征來修改式(18)所得的隸屬度函數(shù)。定義空間函數(shù)如下:
(20)
式中:NB(xi)表示空間域中以xi為中心的l×l正方形窗口,本文實驗取5×5的窗口;hki與隸屬度一樣,表示像素xi到第k個類的概率。
在不改變目標函數(shù)式(17)的情況下,將式(20)與式(18)相結(jié)合,得到更新隸屬度函數(shù)和聚類中心如下:
(21)
(22)
式中:p和q是2個參數(shù),控制2個函數(shù)的貢獻程度。
在同質(zhì)區(qū)域內(nèi),空間函數(shù)對圖像的作用不大,僅僅簡單的加強初始隸屬度函數(shù)。然而,對于噪聲點,利用像素鄰域信息降低噪聲點的權(quán)重,從而達到消除噪聲的影響。因此,圖像的噪聲或偽斑點能夠被糾正。
SKIFCM算法的步驟如下:
①設(shè)置聚類數(shù)目c,加權(quán)指數(shù)m,最大迭代次數(shù)T和終止條件ε,鄰域大小w。
②隨機初始化聚類中心V,隨機初始化模糊隸屬度矩陣U。
③設(shè)置迭代計數(shù)i=0。
④根據(jù)式(21)更新模糊隸屬度。
⑤根據(jù)式(22)更新模糊聚類中心。
⑥當(dāng)‖Ji+1-Ji‖<ε或者i>T時,終止迭代過程,否則轉(zhuǎn)向④,直至迭代結(jié)束。
為了驗證本文算法對苗族服飾圖案分割的有效性,本文設(shè)計2組實驗進行驗證,即含噪聲的苗族服飾圖案分割和彩色苗族服飾圖案分割。為了進一步驗證本文算法的有效性,還設(shè)計了織物疵點圖像分割的實驗。苗族服飾圖案的數(shù)據(jù)集來源于北京服裝學(xué)院民族服飾博物館(http://www.biftmuseum.com/),選取博物館內(nèi)的苗族服飾局部圖像(蠟染、刺繡、混合與簡單繡線)作為本次實驗的數(shù)據(jù)集。
參數(shù)的選取往往能決定圖像分割質(zhì)量的好壞。為了獲得良好的分割效果,本文實驗選取的參數(shù)如下。固定參數(shù):加權(quán)指數(shù)m=2,終止條件ε=1e-5,最大迭代次數(shù)T=200,聚類數(shù)目c=2,鄰域窗口大小w=5,猶豫度指數(shù)β=0.85;可變參數(shù):模糊指數(shù)α,貢獻程度指數(shù)p和q都需要根據(jù)圖像的性質(zhì)進行相應(yīng)的調(diào)整,對比算法參考原文的參數(shù)設(shè)置。實驗環(huán)境為MatLab R2018a,Windows 10操作系統(tǒng),處理器為Intel(R) Core(TM) i5-7200U CPU @ 2.50 GHz 2.71,運行內(nèi)存為8 GB。
為了客觀評估本文算法的聚類性能,采用劃分系數(shù)(Partition Coefficient,VPC)、劃分熵(Partition Entropy,VPE)對5種分割算法進行定量評價[17],VPC和VPE反映劃分矩陣的模糊程度,VPC的值越接近1,VPE的值越接近0,聚類性能就越好,分割效果就越明顯。定義VPC和VPE如下:
(23)
(24)
為了進一步驗證本文算法相對于其他算法的有效性,采用有效性指數(shù)(Xie and Beni Index,VXB)作為評價指標[18],VXB測量特征域內(nèi)的緊致度,VXB越接近0,同類像素點之間的緊密性越強,聚類效果越好,表達式如下:
(25)
為了測試本文算法對噪聲的魯棒性,本節(jié)挑選樣式單一和樣式多元化的2類苗族服飾圖像作為實驗對象,分別對2類圖像添加10%的椒鹽噪聲、高斯噪聲和混合噪聲,其測試的噪聲圖像如圖1所示。分割結(jié)果如圖2、3所示,分割性能指標如表1、2所示。圖2、3中所有圖像的實驗參數(shù)α、p和q均分別設(shè)置為0.9、5和0。

表1 不同算法在圖像1~6中的VXBTab.1 VXB of different algorithms of image 1~image 6 %

圖1 測試圖像Fig.1 Test image. (a)10% Pepper Salt Noise image 1;(b)10% Gaussian Noise image 2;(c)10% Mixed Noise image 3;(d)10% Pepper Salt Noise image 4;(e)10% Gaussian Noise image 5;(f)10% Mixed Noise image 6

圖3 樣式多元化的苗族服飾圖案分割結(jié)果Fig.3 Segmentation results of Miao costume patterns with diversified styles
從圖2、3可以看出,FCM、IFCM和KIFCM算法分割的圖像中存在大量的噪聲點,圖像分割的質(zhì)量較差,達不到理想的分割效果,而SIFCM和SKIFCM算法利用空間鄰域信息對原隸屬度函數(shù)進行修正,消除了噪聲對圖像的影響,且SKIFCM算法的圖像細節(jié)信息更清晰。
從表1可以看出,當(dāng)對苗族服飾圖案添加不同類型的噪聲時,FCM、IFCM和KIFCM算法的VXB相對較低,而IFCM和KIFCM算法的VXB相對較高。原因是他們通過最小化特征域中的度量差來實現(xiàn)劃分,而SIFCM和SKIFCM算法在空間分布的基礎(chǔ)上修改了空間特征,從而致使特征域內(nèi)的緊致性惡化,造成VXB增大。與SIFCM算法相比,SKIFCM算法的VXB降低約4.18%。然而,從表2可以看出,SKIFCM算法的VPC最高、VPE最優(yōu),分別對應(yīng)為95.49%和7.44%,明顯優(yōu)于其他改進算法。實驗結(jié)果表明,本文算法不僅能平衡噪聲和邊緣細節(jié)信息之間的關(guān)系,而且還具有較好的聚類性能。

表2 不同算法在圖像1~6中的VPC和VPETab.2 VPC and VPE of different algorithms of image 1~image 6 %
苗族服飾圖案種類繁多,每種圖案所代表的意義都不相同,對于色彩鮮艷、紋理復(fù)雜、樣式多元化的圖案,通常難以取得較好的分割效果。為了驗證本文算法的優(yōu)越性,選取4幅不同類型的彩色苗族服飾圖案進行實驗。分割結(jié)果如圖4所示,其紅色方框表示圖像細節(jié)的差異,性能指標如表3所示。圖像7與圖像8的實驗參數(shù)α、p和q均分別設(shè)置為0.9、1和1。圖像9的實驗參數(shù)α、p和q分別設(shè)置為0.9、4和1,圖像10的實驗參數(shù)α、p和q分別設(shè)置為0.45、3和1。

表3 不同算法在圖像7~10中的VPC與VPETab.3 VPC and VPE of image 7~image 10 for the different algorithms %

圖4 彩色苗族服飾圖案分割結(jié)果Fig.4 Segmentation results of color Miao costume patterns
從圖4可以看出,對于圖像7,各算法都取得了不錯的分割結(jié)果。對于圖像8,FCM、IFCM、SIFCM算法的分割效果較差,且SIFCM出現(xiàn)了過分割的現(xiàn)象,而KIFCM和SKIFCM算法的分割效果較好。這是因為采用歐氏距離對圖像進行聚類時,要求每一類中的成員必須要靠近聚類中心,但事實上遠離聚類中心的點容易被錯誤分類。KIFCM和SKIFCM算法采用核距離替代歐式距離,重新計算像素點到聚類中心的距離,所以提高了聚類的準確性。對于圖像9和圖像10,FCM、IFCM和KIFCM算法的分割效果較差,這是由于未考慮空間信息所致,而SIFCM和SKIFCM算法考慮了空間信息,對原隸屬度進行修正,提高了聚類性能,視覺效果較好。
由表3可知,SKIFCM算法的VPC和VPE最優(yōu),約為97.91%和3.42%;SIFCM算法次之,約為96.56%和5.75%;FCM算法最差,約為89.96%和17.20%。實驗結(jié)果表明,本文算法整體上提高了其他改進算法的聚類性能,其分割所產(chǎn)生的區(qū)域具有更強的連續(xù)性,能得到清晰的圖像邊緣。
為了進一步說明本文算法的有效性,選擇帶有油污、竹節(jié)、漿斑和褶子等常見的織物疵點的4幅圖像,對其添加2%的椒鹽噪聲進行實驗,分割結(jié)果如圖5所示,分割指標如表4所示。其紅色方框表示該織物圖像的疵點,本節(jié)實驗中的參數(shù)α、p和q均分別設(shè)置為0.9、5和1。

表4 不同算法在圖5中的VPC與VPETab.4 VPC and VPE in Fig.5 for the different algorithms %

圖5 織物疵點圖像分割結(jié)果Fig.5 Segmentation results of fabric defect images
從圖5可知,對于4種類型的織物疵點圖像,SIFCM和本文算法的視覺效果較清晰,基本上不存在噪聲點,但SIFCM在分割褶子圖像時,產(chǎn)生了較為嚴重的誤分割,僅SKIFCM算法大致分割出了褶子圖像的疵點。從表4可看出,SIFCM在分割竹節(jié)圖像時的性能指標最好;其余3幅織物疵點圖像中,SKIFCM算法的性能指標最好,且VPC和VPE的平均值分別為99.76%和0.40%,這是由于SIFCM和SKIFCM算法引入了空間信息,從而增強了對噪聲的魯棒性。
核函數(shù)的引入有利于將低維空間中的非線性問題轉(zhuǎn)變?yōu)楦呔S空間中的線性問題,從而提高算法的聚類性能。然而,核函數(shù)的引入增加了計算復(fù)雜度,導(dǎo)致運行效率降低。由于FCM、IFCM和SIFCM算法均使用歐氏距離,故在此不做比較。
為了驗證本文算法的運行效率,選取圖像7~10對KIFCM和SKIFCM算法的運行效率做比較,結(jié)果如表5所示。可見,SKIFCM算法的迭代次數(shù)與運行時間都有所降低。這是由于本文在目標函數(shù)中引入隸屬度約束懲罰項,通過競爭學(xué)習(xí)的思想,即加強最大隸屬度,同時抑制其他隸屬度,從而達到快速收斂的結(jié)果。

表5 不同算法在圖4中分割時間與迭代次數(shù)Tab.5 Segmentation time and number of iterations in Fig.4 using different algorithms
本文提出一種隸屬度修正的空間核直覺模糊聚類苗族服飾圖案分割算法。該算法利用鄰域空間信息,對局部像素分配權(quán)值,以提高像素聚類的準確性;同時引入隸屬度約束懲罰項,加強最大隸屬度,抑制其他隸屬度,并使用核距離度量代替歐氏距離完成圖像分割。含噪聲的苗族服飾圖案、彩色苗族服飾圖案和織物疵點圖像的分割結(jié)果表明,對比SIFCM、KIFCM、IFCM和FCM算法,所提算法具有良好的聚類性能,能正確分類像素點,去除圖像的噪聲和偽斑點,還能保留圖像的邊緣,得到清晰的圖像;在色彩鮮艷、紋理復(fù)雜、樣式多元化的苗族服飾圖案分割中具有廣闊的應(yīng)用前景。與使用核距離的KIFCM算法相比,運行效率有一定提升,但所提算法分割彩色苗族服飾圖案的時間仍然較長,如何提高算法的運行效率仍需連續(xù)研究改進。