張濤
(武漢大學(xué)遙感信息工程學(xué)院,湖北武漢 430079)
一種利用K均值和SOM進(jìn)行遙感圖像分類的方法
張濤
(武漢大學(xué)遙感信息工程學(xué)院,湖北武漢 430079)

探討了一種將K均值算法和SOM神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的方法,并將其應(yīng)用于多光譜遙感圖像分類,通過與K均值算法、ISODATA算法和SOM算法的對(duì)比實(shí)驗(yàn),驗(yàn)證了該方法的有效性。
遙感圖像分類;神經(jīng)網(wǎng)絡(luò);自組織映射;K均值算法
遙感技術(shù)已經(jīng)廣泛應(yīng)用于很多領(lǐng)域,遙感影像分類是遙感技術(shù)應(yīng)用的關(guān)鍵問題。傳統(tǒng)的遙感圖像非監(jiān)督分類方法過于依賴圖像數(shù)據(jù)的分布,人工神經(jīng)網(wǎng)絡(luò)不基于數(shù)據(jù)分布的特性,作為一種智能信息處理的重要方法,為實(shí)現(xiàn)圖像自動(dòng)分類創(chuàng)造了條件[1]。具有非監(jiān)督學(xué)習(xí)能力的自組織映射網(wǎng)絡(luò),結(jié)構(gòu)簡(jiǎn)單、易于實(shí)現(xiàn),應(yīng)用于數(shù)據(jù)分類時(shí)能夠取得較好的效果。在SOM的眾多分類改進(jìn)算法中,通常是對(duì)其自身網(wǎng)絡(luò)參數(shù)如初始化權(quán)值進(jìn)行改進(jìn)[1,2],或?qū)?SOM 與常規(guī)的聚類算法相結(jié)合[3,4]。其中,將SOM和K均值進(jìn)行結(jié)合可以有兩種策略:一種是用SOM對(duì)K均值算法進(jìn)行改進(jìn),即用SOM神經(jīng)網(wǎng)絡(luò)改進(jìn)K均值聚類算法的初始化中心和確定聚類中心數(shù)目,并已應(yīng)用于圖像分割[5]、文檔聚類[6]、客戶分類[7]和聲波數(shù)據(jù)分割[8]等領(lǐng)域;另一種是用K均值改進(jìn)SOM算法,即先進(jìn)行K均值聚類,然后再進(jìn)行SOM聚類。該方法已被應(yīng)用于遙感圖像分類。Su和Chang用K均值算法改進(jìn)SOM網(wǎng)絡(luò)的初始權(quán)向量,即用K均值算法找到的N×N個(gè)聚類中心作為SOM網(wǎng)絡(luò)的初始化權(quán)值,但是遙感圖像的分類數(shù)目不一定能滿足N×N的條件[9]。Zhou等將小波分解出的不同尺度下的遙感圖像進(jìn)行分步處理,即先用K均值算法對(duì)粗尺度的遙感圖像進(jìn)行分類,再在此基礎(chǔ)上用SOM算法進(jìn)行細(xì)尺度的分類,抗噪性強(qiáng),提高了分類精度和速度;但該方法也存在分類類別數(shù)需要預(yù)先確定問題[10]。
本文在前人的研究基礎(chǔ)上,探討了一種將K均值和SOM相結(jié)合進(jìn)行多光譜遙感圖像分類的方法。首先用K均值算法對(duì)遙感影像進(jìn)行粗聚類,以減少SOM聚類模式的輸入量,然后將K均值的聚類結(jié)果作為SOM的網(wǎng)絡(luò)輸入值進(jìn)行自組織學(xué)習(xí)訓(xùn)練,每一個(gè)像素點(diǎn)對(duì)應(yīng)的獲勝神經(jīng)元作為它的判別類別,并在輸出層設(shè)置一個(gè)迭代閾值,將聚類數(shù)目小于該閾值的神經(jīng)元所分的類別劃分到最近的神經(jīng)元中,實(shí)現(xiàn)類別合并,最終實(shí)現(xiàn)遙感影像分類。將本文的分類方法與K均值算法和ISODATA算法以及SOM算法進(jìn)行遙感圖像分類的對(duì)比試驗(yàn),本文的分類方法取得了較好的分類效果,實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的有效性。
1.1 K均值算法
K均值算法屬于一種典型的劃分聚類方法[11],其基本思想是通過迭代把數(shù)據(jù)對(duì)象劃分到不同的簇中,使簇內(nèi)對(duì)象之間的相似度很大,而簇間對(duì)象的相似度很小。
K均值算法的具體過程如下:1)選取k個(gè)對(duì)象作為初始的聚類中心;2)根據(jù)聚類中心值,將每個(gè)對(duì)象(重新)賦給最相似的簇;3)重新計(jì)算每個(gè)簇中對(duì)象的平均值,用此平均值作為新的聚類中心;4)重復(fù)執(zhí)行步驟2和步驟3,直到聚類中心不再發(fā)生變化為止。
K均值算法聚類結(jié)果受初始聚類中心選擇的影響較大,如果初始聚類中心選取不當(dāng),聚類結(jié)果可能會(huì)陷入局部最優(yōu)解,從而得不到較好的聚類效果。
1.2 SOM算法
自組織映射網(wǎng)絡(luò)是一種模擬哺乳動(dòng)物大腦皮質(zhì)神經(jīng)元的側(cè)抑制、自組織等特性的神經(jīng)網(wǎng)絡(luò)模型。它是一種競(jìng)爭(zhēng)式學(xué)習(xí)網(wǎng)絡(luò),自適應(yīng)學(xué)習(xí)能力和魯棒性強(qiáng),能無監(jiān)督地進(jìn)行自組織學(xué)習(xí),且能夠把多維數(shù)據(jù)映射到低維空間,同時(shí)保持多維數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)和信息。
SOM 的拓?fù)浣Y(jié)構(gòu)一般為兩層:輸入層和競(jìng)爭(zhēng)層,如圖1所示。其神經(jīng)元的排列有多種形式:一維線陣、二維平面陣和三維柵格陣。最典型的結(jié)構(gòu)是二維形式,它更具有大腦皮層的形象[12]。

圖1 二維陣列SOM網(wǎng)絡(luò)模型 [13]
傳統(tǒng)的聚類方法,如K均值、ISODATA等算法在處理低維、小數(shù)據(jù)量時(shí)具有較高的效率,但對(duì)圖像的數(shù)據(jù)分布依賴性強(qiáng),抗噪能力弱,常常難以達(dá)到理想的分類效果;SOM算法擁有神經(jīng)網(wǎng)絡(luò)不基于數(shù)據(jù)分布的一般特性,分類過程中能夠?qū)崿F(xiàn)數(shù)據(jù)的降維。本文對(duì)將K均值與SOM相結(jié)合的方法進(jìn)行探討,首先采用K均值算法進(jìn)行粗聚類,K均值算法的聚類個(gè)數(shù)超過最終聚類個(gè)數(shù),將容易錯(cuò)分的數(shù)據(jù)先分到數(shù)目較小的類別中;然后將聚類中心值替換原有像素點(diǎn)的值,作為SOM網(wǎng)絡(luò)的輸入模式,進(jìn)行二次聚類。這樣可以保持K均值算法初始聚類中心的隨機(jī)選取和SOM初始權(quán)值的隨機(jī)選取的特性,避免K均值算法易陷入局部最小的缺陷,同時(shí)充分利用SOM算法抗噪性強(qiáng)的特點(diǎn)進(jìn)行處理,減少網(wǎng)絡(luò)訓(xùn)練次數(shù),達(dá)到提高SOM網(wǎng)絡(luò)分類效率的目的。算法步驟如下:1)進(jìn)行K均值聚類,得到超過目標(biāo)聚類數(shù)目的聚類類別數(shù);2)權(quán)值初始化。記wij為第j個(gè)輸入端與第i個(gè)神經(jīng)元的權(quán)值,j=1,2,...,n,n為輸入層神經(jīng)元數(shù)目,i=1,2,...,m,m為輸出層神經(jīng)元數(shù)目。權(quán)值初始化是指用較小的隨機(jī)數(shù)初始化輸入層到競(jìng)爭(zhēng)層的連接權(quán)值wij,記為wij(0)。建立初始優(yōu)勝鄰域Nc(0)和學(xué)習(xí)率a初值;3)輸入步驟1)中得到的聚類結(jié)果模式作為一個(gè)輸入模式。從訓(xùn)練集中取一個(gè)輸入模式x,令t=0。4)計(jì)算競(jìng)爭(zhēng)層的所有權(quán)值向量和輸入向量的歐式距離:

5)尋找距離最小的神經(jīng)元c,即為勝出神經(jīng)元:

6)定義優(yōu)勝鄰域Nc(t)。以c為中心確定t時(shí)刻的權(quán)值調(diào)整域,初始時(shí)t∈0。一般初始域Nc(0)較大(為總結(jié)點(diǎn)的50%~80%),訓(xùn)練過程中Nc(t)隨訓(xùn)練時(shí)間收縮。7)調(diào)整優(yōu)勝鄰域Nc(t)內(nèi)的所有節(jié)點(diǎn)的權(quán)值:

式中,a(t)是學(xué)習(xí)因子,一般隨時(shí)間而遞減,范圍0<a(t)<1;Nc(t)是c的鄰域,其中半徑隨t而減小[14]。
7)令t=t+1,轉(zhuǎn)步驟4);8)當(dāng)t=T0(T0為時(shí)間閾值),或a<amin(amin為學(xué)習(xí)率閾值)時(shí),停止對(duì)當(dāng)前樣本的學(xué)習(xí),轉(zhuǎn)步驟3);9)重復(fù)步驟3)~9),直至所有樣本參與聚類。
聚類閾值是實(shí)現(xiàn)確定最終聚類數(shù)目的關(guān)鍵步驟。本文的方法通過SOM輸出層設(shè)置的聚類閾值,實(shí)現(xiàn)最終聚類數(shù)目的確定。SOM網(wǎng)絡(luò)在學(xué)習(xí)訓(xùn)練結(jié)束后,其各個(gè)輸出層神經(jīng)元擁有的像素點(diǎn)數(shù)目可能存在極小的情況。設(shè)置一個(gè)聚類閾值,將聚類數(shù)目小于該閾值數(shù)目的神經(jīng)元消去,將屬于該神經(jīng)元的點(diǎn)分到最近的神經(jīng)元上,即實(shí)現(xiàn)類別自動(dòng)合并。聚類閾值的數(shù)值可以根據(jù)具體的圖像大小和目標(biāo)聚類類別數(shù)目進(jìn)行確定。
本文選取宜昌地區(qū)TM遙感影像進(jìn)行分類實(shí)驗(yàn),影像分辨率為 30 m,如圖2(a)所示。依據(jù)目視判讀,影像分為水體、植被、居民區(qū)、裸露地四類。對(duì)影像采用本文的方法進(jìn)行聚類試驗(yàn),聚類結(jié)果如圖 2(b)所示。采用傳統(tǒng)K均值方法和ISODATA方法對(duì)影像進(jìn)行分類,分類結(jié)果如圖2(c)、(d)所示。K均值分類結(jié)果中的居民地和植被、水體混淆嚴(yán)重;ISODATA分類結(jié)果中的居民地和植被、水體混淆現(xiàn)象稍微減弱;本文的方法將居民地和植被、水體準(zhǔn)確地提取出來,減少了它們之間的混淆程度。

圖2 聚類結(jié)果
對(duì)上述幾種分類方法進(jìn)行精度評(píng)定,分類精度及Kappa系數(shù)比較結(jié)果如表1所示。

表1 分類精度
對(duì)圖2(a)使用SOM算法進(jìn)行分類,迭代2 302次后收斂,本文的方法中先使用K均值69次迭代后收斂,然后使用SOM 102次迭代后收斂。相對(duì)于單獨(dú)使用K均值方法和SOM方法,本文探討的將二者相結(jié)合的聚類方法具有較高的分類精度和較快的速度,對(duì)比實(shí)驗(yàn)驗(yàn)證了本文方法的有效性。
本文探討了一種將K均值算法和SOM算法結(jié)合進(jìn)行遙感影像分類的方法。該方法既發(fā)揮了K均值算法在對(duì)相對(duì)較小數(shù)據(jù)量進(jìn)行聚類時(shí)效率較高的特點(diǎn),又保持了SOM算法自組織的特點(diǎn),并且將二者結(jié)合的方法在分類性能上也得到了提高。通過實(shí)驗(yàn)表明,該方法具有比傳統(tǒng)K均值算法和ISODATA算法更好的分類精度,比傳統(tǒng)的SOM算法更高的聚類效率和更好的聚類性能。進(jìn)一步的研究方向包括:對(duì)SOM聚類方法進(jìn)行改進(jìn),使其能夠處理高分辨率的多維數(shù)據(jù),從而研究出適合于高效處理大數(shù)據(jù)量的多維遙感圖像的分類方法。
[1] 諶德榮,陶鵬,宮久路,等.一種基于SOFM神經(jīng)網(wǎng)絡(luò)的高光譜圖像快速分類方法[J].兵工學(xué)報(bào),2009,30(2):165-169
[2] 吳柯,方強(qiáng),張俊玲,等.基于改進(jìn)Kohonen神經(jīng)網(wǎng)絡(luò)的遙感影像分類[J].測(cè)繪信息與工程,2007,32(2):47-49
[3] 張釗,王鎖柱,張雨.一種基于SOM和PAM的聚類算法[J].計(jì)算機(jī)應(yīng)用,2007,27(6):1400-1402
[4] GoncalvesML,Netto MLA,Costa JAF,et al.An Unsupervised Method of Classifying Remotely Sensed Images Using Kohonen Self-organizing Maps and Agglomerative Hierarchical Clustering Methods[J].International Journal of Remote Sensing,2008,29:3171-3207
[5] 許海洋,王萬森.基于SOM神經(jīng)網(wǎng)和K-均值算法的圖像分割[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(21):38-40,57
[6] 楊占華,楊燕.一種基于SOM和k-means的文檔聚類算法[J].計(jì)算機(jī)應(yīng)用研究,2006,23(5):73-79
[7] Kuo RJ,An YL,Wang HS,et al.Integration of Self-organizing Feature Maps Neural Network and Genetic K-means A lgorithm for Market Segmentation[J].Expert Systems with Applications, 2006,30:313-324
[8] Godin N,Huguet S,Gaertner R.Integration of the Kohonen's Self-organising Map and K-means A lgorithm for the Segmentation of the AEData Collected during Tensile Tests on Cross-ply Composites[J].NDT&International,2005,38:299-309
[9] Su MC,Chang HT.FastSelf-Organizing Feature Map A lgorithm [J].IEEETransactionson NeuralNet works,2000,11(3):721-733
[10]Zhou ZS,WeiSY,Zhang XW,etal.Remote Sensing Image Segmentation based on Self-organizing Mapat Multiple-scale[J].Geoinformatics 2007:Remotely Sensed Data and Information, 2007,6752:E7520-E7520
[11]Kanungo T,Mount DM,Netanyahu NS.An Efficient K-means Clustering Algorithm:Analysis and Implementaion[J].IEEE Transactionson Pattern Analysis and Machine Intelligence,2002, 24(7):881-892
[12]秦昆.智能空間信息處理[M].武漢:武漢大學(xué)出版社,2009
[13]陳泯融,鄧飛其.一種基于自組織特征映射網(wǎng)絡(luò)的聚類方法[J].系統(tǒng)工程與電子技術(shù),2004,26(12):1864-1866
[14]史忠植.神經(jīng)網(wǎng)絡(luò)[M].北京:高等教育業(yè)出版社,2009
Rem ote Sensing Image Classification Utilizing K-m eansand SOM
by Zhang Tao
Amethod ofm ultispectra l remote sensing im age classification was discussed in the paper,which utilized K-means and SOM neuralnetwork.The com parison experim ents w ith K-means,ISODATA and SOM verify the validity of themethod.
remote sensing image classification,neuralnetwork,selforganizingmap,K-means (Page:109)
P237
B
1672-4623(2011)01-0109-03
2010-07-09
項(xiàng)目來源:武漢大學(xué)2009年大學(xué)生科研基金資助項(xiàng)目(S2009291)。
張濤,本科,主要研究遙感影像分類。