閆匯聰 劉德山 陳 浪 馬斯宇
(遼寧師范大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院 遼寧 大連 116081)
高光譜圖像(HSI)分類的研究具有重要應(yīng)用意義。高光譜圖像具有豐富的地理信息量,能夠?qū)崿F(xiàn)對(duì)地表的清晰表達(dá)[1],其圖像屬性也使得人們能夠?qū)Σ煌镔|(zhì)進(jìn)行分類[2-3]。目前,研究人員利用豐富的光譜信息和光譜數(shù)據(jù)開發(fā)了多種分類算法,這些算法被廣泛應(yīng)用于軍事[4]、農(nóng)業(yè)[5]、礦業(yè)[6]、漁業(yè)[7]、林業(yè)[8]等領(lǐng)域。同時(shí),這些算法在環(huán)境污染監(jiān)測(cè)、農(nóng)業(yè)精耕細(xì)作、土地利用分析、礦產(chǎn)勘查等領(lǐng)域都有著廣泛的應(yīng)用[9]。對(duì)高光譜圖像而言,由于其成像的方式是多光譜,其像素的空間關(guān)系和光譜關(guān)系相互影響。此外,如果直接用高光譜數(shù)據(jù)對(duì)地物進(jìn)行分類應(yīng)用,一方面會(huì)導(dǎo)致訓(xùn)練樣本的數(shù)量有限、維度高、容易產(chǎn)生Hughes 現(xiàn)象;另一方面計(jì)算量大、耗時(shí)長,限制了HSI分類的表現(xiàn)[10]。高光譜圖像具有如下特點(diǎn):(1) 相同的物體可能具有不同的光譜表現(xiàn),相反,不同的物體也會(huì)反映出相同的光譜特點(diǎn)。這樣就對(duì)分類技術(shù)是一個(gè)考驗(yàn)。(2) 類別邊緣以及像素之間存在信號(hào)的影響。(3) 高光譜圖像的成像過程中存在外界多種因素的影響(如大氣、霧等),從而帶來噪聲數(shù)據(jù)。(4) 由于各種原因,高光譜圖像的學(xué)習(xí)樣本相對(duì)不足,增加學(xué)習(xí)算法的困難。
近年來有一些基于機(jī)器學(xué)習(xí)的常規(guī)分類方法提出,如基于 (KNN)[11]、 支持向量機(jī)(SVM)[12]、極端學(xué)習(xí)機(jī)(ELM)[13]以及稀疏表示(SR)[14]等技術(shù)的算法。在信息刻畫和提取策略上,空間和光譜的結(jié)合是一個(gè)重要的研究方面[15]。在稀疏表示分類的理論與算法框架[16]基礎(chǔ)上,Zhang等[17]提出了一種在高光譜圖像分類中的應(yīng)用方法。與上述方法相比,一些方法側(cè)重于有效的特征提取。Kalluri等[18]從HSI中提取光譜導(dǎo)數(shù)信息。Jolliffe等[19]利用了HSI的主成分分析特征。Li等[20]提取了線性和非線性特征,并開發(fā)了一種用于HSI分類的多特征學(xué)習(xí)機(jī)制。
以字典學(xué)習(xí)為基礎(chǔ)的SR理論憑借其良好的分類性能在信號(hào)處理、計(jì)算機(jī)視覺和模式識(shí)別等方面有很多成功應(yīng)用的模型,近年來對(duì)高光譜圖像處理領(lǐng)域產(chǎn)生了重要的影響[42-47]。基于SR理論方法,Zhang等[21,41]提出了協(xié)同表示(CR)方法。文獻(xiàn)[22]提出一種局部協(xié)同表示方法。文獻(xiàn)[23]根據(jù)不同約束項(xiàng)的作用給出加權(quán)正則的協(xié)同表示框架。基于協(xié)同表示和正則化技術(shù),文獻(xiàn)[24-25]分別提出最近鄰子空間與核映射正則化的方法。文獻(xiàn)[26]結(jié)合多任務(wù)學(xué)習(xí),同時(shí)利用鄰域信息給出聯(lián)合協(xié)同表示(JCR)的方法。Xiong等[27]研究了鄰域信息提取的作用,提出加權(quán)聯(lián)合協(xié)同表示 (WJCR)方法。以構(gòu)建局部自適應(yīng)字典為基礎(chǔ),Li等[28]提出一種非局部聯(lián)合協(xié)同表示 (NJCR)方法。文獻(xiàn)[29]提出基于核方法投影數(shù)據(jù)的稀疏表示分類算法(KSRC),通過使用核技術(shù)優(yōu)化算法獲得的稀疏表示向量,以此確定待測(cè)像素的類標(biāo)簽。高光譜圖像中數(shù)據(jù)的關(guān)聯(lián)具有非線性特性,為此,文獻(xiàn)[30]利用核映射技術(shù)提出了一種核協(xié)同表示(KCRC)分類算法。為加強(qiáng)空間信息的提取,Jiang等[31]在改進(jìn)協(xié)同表示算法的目標(biāo)函數(shù)提出一種具有空間感知的協(xié)同表示方法(JSACR)。
現(xiàn)有的算法從不同的角度研究的信息刻畫與提取的途徑和技術(shù),為我們的研究提供了重要啟發(fā)。在研究中我們發(fā)現(xiàn),協(xié)同表示的相關(guān)算法在高光譜圖像分類的學(xué)習(xí)過程中沒有很好地刻畫高光譜圖像的特性,如像素的局域性和標(biāo)簽信息等,因此其性能受到限制。為此,我們提出一種散度核協(xié)同表示技術(shù)并利用空譜融合獲取特征的分類方法(IKCRC)。所提出新方法以最大獲取像素的類信息與關(guān)聯(lián)信息為出發(fā)點(diǎn),強(qiáng)調(diào)分類的有效性,建立一種新的協(xié)同表示模型與計(jì)算框架。
本文提出算法的主要貢獻(xiàn):(1) 不僅考慮到空間和譜信息的刻畫,同時(shí)考慮到數(shù)據(jù)間的關(guān)聯(lián)信息,引入信息散度矩陣到優(yōu)化目標(biāo)函數(shù)的正則約束中,有利于特征的有效提取。(2) 引入核學(xué)習(xí),在CRC的基礎(chǔ)上提出了IKCRC算法模型。增強(qiáng)算法的分類能力。(3) 在學(xué)習(xí)樣本相對(duì)較少的情況下能夠展示出較好的信息提取能力并具有更高的分類精度。
空間與譜特征學(xué)習(xí)網(wǎng)絡(luò)(SSN)[33]可同時(shí)獲得空間和光譜的信息,其特點(diǎn)是以分層的形式學(xué)習(xí)圖像特征。SSN在學(xué)習(xí)階段的結(jié)構(gòu)由多個(gè)學(xué)習(xí)的單元(SSFLU)連接,構(gòu)成一個(gè)多層的深度學(xué)習(xí)網(wǎng)絡(luò)。每一層是一個(gè)SSFLU,一個(gè)SSFLU由兩部分組成:一部分是光譜特征的學(xué)習(xí)模塊;另一部分是空間特征的學(xué)習(xí)模塊。由線性判別分析(LDA)[32]實(shí)現(xiàn)光譜特征部分的學(xué)習(xí)。LDA同時(shí)具有分類和降維功能,利于信息的刻畫提取。空間特征的學(xué)習(xí)由多個(gè)具有不同尺度的空間濾波器(AWF)[33]實(shí)現(xiàn)。圖1是文獻(xiàn)[34]中所描述的SSFLU結(jié)構(gòu)。圖2為SSN空譜特征學(xué)習(xí)的原理結(jié)構(gòu)。

圖1 SSFLU結(jié)構(gòu)

圖2 SSN空譜特征學(xué)習(xí)的原理
LDA算法[32]能夠?qū)崿F(xiàn)最小化類內(nèi)散度和最大化類間散度。在SSN的空譜特征學(xué)習(xí)中使用 LDA將高光譜圖像在光譜維度上進(jìn)行降維,同時(shí)保證類間的最大區(qū)分性。
設(shè)數(shù)據(jù)集為X=[X1,X2,…,XN]∈RN×D,Xj∈RD(j=1,2,…,N)。數(shù)據(jù)一共分C類,假設(shè)過濾器數(shù)量為Kspe,則Wspe∈RD×Kspe。第c類樣本均值為:
(1)
式中:Nc是第c類像素的個(gè)數(shù),Xn,c是第c類中的像素。所以類內(nèi)散度Sw為:
(2)
式中:pc=Nc/N。然后求高光譜總的像素平均:
(3)
類間散度Sb計(jì)算為:
(4)
LDA使用一系列過濾器使類間散度和類內(nèi)散度的比例最大化:
(5)
選擇Kspe個(gè)最大的特征向量:
Sbwspe=λSwwspe
(6)
通過上述方法對(duì)HSI圖像像素進(jìn)行過濾,獲得過濾后的HSI像素為Kspe層。

協(xié)同表示(CRC)[21]和核協(xié)同表示算法(KCRC)[30]改進(jìn)了傳統(tǒng)字典的構(gòu)造:把字典中代表某類的一個(gè)原子(列向量)擴(kuò)展到該類的多個(gè)原子,以使得樣本信息具有協(xié)同作用。

(7)

(8)
式中:I表示單位矩陣。
當(dāng)解析地獲取得到表示系數(shù)向量XCR,可以計(jì)算像元y和其類依賴近似Dcδc(d)的最小逼近殘差:
(9)

高光譜圖像的不同特征通道通常是線性不可分離的,而典型的線性稀疏表示模型無法充分表示高光譜數(shù)據(jù)樣本的非線性結(jié)構(gòu)特征。為解決非線性問題,文獻(xiàn)[30]中給出了一種核協(xié)同表示算法(KCRC)。其中稀疏表示的計(jì)算為:
(10)
式中:k(D,y)=[k(d1,y),k(d2,y),…,k(dN,y)]T∈RN×1和G=φφT∈RN×N表示核Gram矩陣,其中每個(gè)元素G(i,j)=k(di,dj)。
在本節(jié)中我們提出空譜融合特征信息與散度核協(xié)同表示的分類方法(IKCRC)。利用LDA算法提取數(shù)據(jù)的散度矩陣作為判別信息的流行正則項(xiàng)引入到KCRC算法中,以提高KCRC在高光譜圖像分類中的準(zhǔn)確性。IKCRC算法基于優(yōu)化目標(biāo)函數(shù)的計(jì)算形式如下:
(11)
式(11)為流形正則項(xiàng),μ為修正參數(shù),β為正則化參數(shù),λ為懲罰參數(shù)。
本文算法采用高斯徑向基核函數(shù)(Gaussian Radial Basis Function Kernel),簡(jiǎn)稱Gaussian核,其定義為:
(12)
式中:σ為高斯核函數(shù)的頻帶寬度。
IKCRC的核協(xié)同表示優(yōu)化目標(biāo)函數(shù)計(jì)算式為:
(13)
式中:φ(y)和φ(D)與式(10)中的意義相同,表示變換為高維空間下的數(shù)據(jù)。求取式(13)于表示系數(shù)向量X的導(dǎo)數(shù),可以解析得到核特征空間H中表示系數(shù)向量的解:
λ(μSb-(1-μ)Sw)+βI]-1φT(D)φ(y)
(14)
式中向量的內(nèi)積由核函數(shù)計(jì)算。通過下式的計(jì)算可確定類別:
(15)
式中:Gc可視作誘導(dǎo)特征空間中與第c類相關(guān)聯(lián)的亞字典,Xc為與第c類相關(guān)聯(lián)的類依賴的表示系數(shù)。
關(guān)于IKCRC的算法的理論思想:目標(biāo)函數(shù)中引入散度矩陣體現(xiàn)出像素?cái)?shù)據(jù)之間的關(guān)聯(lián)與區(qū)分信息。目標(biāo)函數(shù)中包含著字典信息、稀疏表示信息以及協(xié)同表示息。這樣的信息構(gòu)成能更全面刻畫出數(shù)據(jù)的分類本質(zhì)。從機(jī)器學(xué)習(xí)角度來說,核映射的引入源于其具有對(duì)非線性分類的能力。對(duì)復(fù)雜背景下的數(shù)據(jù)更有意義,而高光譜圖像即是這樣類型的數(shù)據(jù)。由于高光譜圖像具有維度高,像素構(gòu)成影響因素多等特點(diǎn),挖掘其空譜融合特征對(duì)于高效分類具有重要作用。因此,這樣的算法結(jié)構(gòu)即形成一種分類模型。
IKCRC的算法步驟如下:
輸入:高光譜數(shù)據(jù)集。
步驟1使用SSN[33]的SSFLU特征提取得到新的據(jù)集(特征信息數(shù)據(jù))。
步驟2依據(jù)式(1)-式(6)局部嵌入類信息散度矩陣。
步驟3通過式(11)-式(14)稀疏表示向量X(訓(xùn)練學(xué)習(xí)階段)。
步驟4對(duì)待測(cè)的y,通過X尋找到y(tǒng)的最優(yōu)逼近,從而得到預(yù)測(cè)的標(biāo)簽(預(yù)測(cè)階段)。
輸出:測(cè)試數(shù)據(jù)集的預(yù)測(cè)標(biāo)簽。
我們把所提出的算法與相關(guān)算法做對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)所用的高光譜數(shù)據(jù)集分別為Indian Pines和Salinas。本文所有實(shí)驗(yàn)使用MATLAB R2016b,硬件環(huán)境為CPU 3.2 GHz;內(nèi)存8 GB。
Indian Pines數(shù)據(jù)集:該數(shù)據(jù)集是印第安納州西北部一個(gè)區(qū)域的高光譜遙感圖像。 圖像大小145×145 像素,每個(gè)像素的空間分辨率為2 000萬像素。AVIRIS傳感器在0.4~2.5 μm的光譜范圍內(nèi)產(chǎn)生220個(gè)波段,為降低實(shí)驗(yàn)誤差通常去除20個(gè)吸水帶將光譜帶的數(shù)量降至200[36]。如表 1 所示,該數(shù)據(jù)集包含 16 個(gè)真實(shí)類別,其中大多數(shù)為農(nóng)作物如玉米、大豆、小麥、燕麥等。本實(shí)驗(yàn)采用去除后保留的其余200個(gè)波段的數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象。圖3給出了波段50、27和17組成的三波段偽彩色圖和真實(shí)地面圖。

表1 Indiana Pines 數(shù)據(jù)集描述

(a) 實(shí)際地面圖 (b) 波段50、27和17組成的偽彩色圖圖3 Indian Pines
Salinass數(shù)據(jù)集:該數(shù)據(jù)集是美國加利福尼亞南部的Salinas山谷區(qū)域的高光譜圖像,圖像由AVIRIS傳感器獲取。該圖像大小為512×217像素。如表2所示,在該數(shù)據(jù)集中有16種地物的類別。該數(shù)據(jù)集在空間上具有224 個(gè)波段[37]。 按照常規(guī)做法,本實(shí)驗(yàn)中使用數(shù)據(jù)去除20個(gè)大氣水分吸收和低信噪比的波段,采用處理后保留的 204個(gè)波段的數(shù)據(jù)。圖4給出的是由波段 50、30和20組成的實(shí)際地面圖和偽彩色圖。

表2 Salinas 數(shù)據(jù)集描述

(a) 實(shí)際地面圖 (b) 由波段50、30和20組成的偽彩色圖圖4 Salinas
我們使用IKCRC與相關(guān)經(jīng)典算法做對(duì)比實(shí)驗(yàn)。這些算法分別是KCRC[30]、SRC[38]、KSRC[29]、SVM[12]、SVM-CK[39]、JSACR[31]。在Indiana Pines數(shù)據(jù)集上隨機(jī)選擇每個(gè)類別的10%的樣本用作訓(xùn)練;由于Salinas數(shù)據(jù)集相對(duì)量大,我們?cè)谠摂?shù)據(jù)集上隨機(jī)選擇每個(gè)類別的5%用作訓(xùn)練;剩余樣本用于測(cè)試。
IKCRC采用“Gaussian”核函數(shù)。IKCRC中有三個(gè)計(jì)算參數(shù),它們分別是:修正參數(shù)μ、懲罰參數(shù)λ、正則化參數(shù)β。為得到最佳的參數(shù)選取,實(shí)驗(yàn)采用交叉驗(yàn)證方法以及網(wǎng)格搜索方式。
我們采用通常的3個(gè)指標(biāo)來評(píng)估實(shí)驗(yàn)結(jié)果。這3個(gè)指標(biāo)分別是總體分類精度、平均分類精度和Kappa系數(shù)[40]。總體分類精度(OA)的計(jì)算方法由式(16)給出。其中,C為圖像中待分類樣本的類別數(shù)目,Ni代表第i類樣本中待分類樣本的數(shù)量,Ni代表第i類樣本中被準(zhǔn)確劃分的樣本個(gè)數(shù),1≤i≤C。
(16)
平均分類精度(AA)的計(jì)算由式(17)給出,該數(shù)值體現(xiàn)出算法對(duì)各種類別樣本的總體分類效果。
(17)
Kappa系數(shù)(kappa coefficient),計(jì)算過程如式(18)-式(19)所示,它可以用于一致性檢驗(yàn),也可以用于衡量分類精度。式中:OA指總體分類精度。
(18)
(19)
在Indian Pines數(shù)據(jù)集上將本文所提算法與KCRC、SRC、KSRC、SVM、SVM-CK、JSaRC進(jìn)行對(duì)比。幾種分類算法在Indian Pines數(shù)據(jù)上的分類結(jié)果如表3所示,不同分類算法的效果由圖5給出。

表3 Indian Pines數(shù)據(jù)分類中不同分類算法的比較(%)

圖5 不同算法在Indian Pines數(shù)據(jù)上的對(duì)比實(shí)驗(yàn)
表3給出了7種不同算法在Indian Pines數(shù)據(jù)上的分類精度,其中最好的結(jié)果由黑體標(biāo)出。可以看出,本文算法在Corn、OatsSoybean-notill、Soybean-mint等數(shù)據(jù)上的分類精度優(yōu)于其他6種算法,在Grass-pasture-mowed、Hay-windrowed等5類數(shù)據(jù)上精確度都達(dá)到了100%。從表3還可以看出,本文算法在OA、AA和Kappa系數(shù)上的指標(biāo)均優(yōu)于其他6種算法。圖5給出的是7種算法的分類結(jié)果圖,由此可以看到:由KCRC、SRC等4種算法產(chǎn)生的分類結(jié)果圖噪聲都比較多,SVM-CK和JSACR分類效果較好,本文算法IKCRC分類效果最準(zhǔn)確。
我們?cè)赟alinas數(shù)據(jù)集上將本文所提出的算法與KCRC、SRC、KSRC、SVM、SVM-CK、JSACR進(jìn)行對(duì)比。7種不同分類算法在的分類結(jié)果如表4所列,其分類結(jié)果如圖6所示。

表4 Salinas數(shù)據(jù)分類中不同分類算法的比較

圖6 不同算法在Salinas數(shù)據(jù)上的對(duì)比實(shí)驗(yàn)
可以看到,本文算法的分類精度總體優(yōu)于其他對(duì)比的6種算法。特別是在Brocoli_green_weeds_1、Fallow等12類數(shù)據(jù)上精確度都達(dá)到了100%。而且IKCRC在OA、AA和Kappa系數(shù)上均優(yōu)于其他6種算法。
由圖6可以觀察到,SRC、KCRC兩種算法的分類結(jié)果圖包含了較多的噪聲。
由以上實(shí)驗(yàn)結(jié)果與對(duì)比可見本文算法具有在高光譜圖像分類中顯示出良好的結(jié)果,從而驗(yàn)證了該算法對(duì)高光譜圖像分類的有效性。本文算法有效性的原因在于:在有限的高光譜圖像訓(xùn)練樣本下,運(yùn)用圖像數(shù)據(jù)訓(xùn)練樣本的幾何結(jié)構(gòu)散度信息,同時(shí)采用空譜融合的特征提取策略,構(gòu)造新的核協(xié)同模型。
本節(jié)給出CRC、SRC、KSRC、SVM、SVM-CK、JSACR以及本文算法在不同訓(xùn)練樣本個(gè)數(shù)情況下的分類性能實(shí)驗(yàn)。我們分別在Indiana Pines和Salinas兩個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),在Indian Pine數(shù)據(jù)集上分別隨機(jī)選取該類樣本數(shù)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%作為訓(xùn)練樣本,其余的作為測(cè)試樣本。在Salinas數(shù)據(jù)集上分別隨機(jī)選取該類樣本數(shù)的0.5%、0.1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5% 作為訓(xùn)練樣本,其余的作為測(cè)試樣本。將實(shí)驗(yàn)的總體分類準(zhǔn)確度(OA)作為評(píng)價(jià)指標(biāo)。實(shí)驗(yàn)結(jié)果如圖7所示。

(a) indian pines 數(shù)據(jù)集

(b) Salinas數(shù)據(jù)集圖7 不同訓(xùn)練樣本個(gè)數(shù)下各種算法的分類準(zhǔn)確率
由圖7(a)可知,在Indian Pine 數(shù)據(jù)集上,IKCRC、JSACR、SVM-CK等3類算法OA指標(biāo)識(shí)別曲線明顯優(yōu)于SRC、KSRC、KCRC、SVM算法,其中本文提出的IKCRC分類準(zhǔn)確率最高。由圖7(b)可以看出,在Salinas數(shù)據(jù)集上,幾種算法的準(zhǔn)確率都有所提高。IKCRC、JSACR、SVM-CK這3類算法依然在OA指標(biāo)識(shí)別曲線明顯優(yōu)于SRC、KSRC、KCRC、SVM算法,其中本文提出的算法IKCRC在訓(xùn)練樣本取5%的時(shí)候總體分類精度接近100%。
在本節(jié)中,我們分析主要修正參數(shù)μ影響IKCRC 性能,實(shí)驗(yàn)結(jié)果如圖8所示,其顯示了不同的參數(shù)值和相應(yīng)的分類精度。

(a) indian pines 數(shù)據(jù)集

(b) Salinas數(shù)據(jù)集圖8 不同修正參數(shù)取值在兩個(gè)數(shù)據(jù)集對(duì)分類準(zhǔn)確率的影響
由圖8可以看出,參數(shù)μ的不同值帶來不同的結(jié)果。對(duì)于Indian Pines的數(shù)據(jù)集,μ=0.2時(shí)分類精度最高;對(duì)于Salinas數(shù)據(jù)集,μ=0.1時(shí)分類精度最高。IKCRC的性能可以通過改變參數(shù)進(jìn)行調(diào)整。
本文給出散度核協(xié)同表示構(gòu)建新方法,采用空譜融合特征信息模塊構(gòu)造出新的高光譜圖像分類方法的框架模型(包括對(duì)應(yīng)算法的模塊構(gòu)造和目標(biāo)函數(shù)的設(shè)計(jì))。該研究旨在針對(duì)高光譜圖像樣本相對(duì)少的現(xiàn)實(shí)情況能夠更有效刻畫與提取分類所需要的數(shù)據(jù)信息。由對(duì)比實(shí)驗(yàn)表明,IKCRC在標(biāo)準(zhǔn)數(shù)據(jù)集上的分類效果優(yōu)于其他對(duì)比算法。同時(shí),在不同訓(xùn)練樣本的選擇下進(jìn)行了分析對(duì)比,由此進(jìn)一步驗(yàn)證了IKCRC具有更穩(wěn)定更好的分類性能。在進(jìn)一步的研究中,為更好地刻畫數(shù)據(jù)信息,引入流形學(xué)習(xí)的技術(shù)方法到算法的改進(jìn)中是一個(gè)值得探索的方面。