劉德山, 丁一民, 閆德勤, 黨 琦
(遼寧師范大學 計算機與信息技術(shù)學院,遼寧 大連 116029)
高光譜圖像(Hyperspectral Image,HSI)是一種由一維光譜特征和二維空間信息組成的三維數(shù)據(jù)立方體.相較于傳統(tǒng)二維圖像,高光譜圖像分類可以獲得更加詳細的光譜信息,可以有效提升地物識別能力,提高分類精度.學者們將極限學習機(Extreme Learning Machine,ELM)[1-4],支持向量機(Support Vector Machine,SVM)[5-9],多項式回歸(Multinomial Logistic Regression,MLR)[10-12]等機器學習方法應(yīng)用于高光譜圖像分類,并獲得良好性能體現(xiàn).
基于表示的分類方法根據(jù)優(yōu)化方式的不同,可分為稀疏表示[13]和協(xié)同表示[14],其共同思想是根據(jù)“表示誤差”最小原則,判定原子所屬類別.相較于傳統(tǒng)機器學習方法,稀疏表示基于光譜特性較為相似的像素點屬于同一類別這一假設(shè),通過少量訓(xùn)練樣本線性表示測試樣本,該算法忽略了空間信息對于稀疏重建字典的重要性.為充分挖掘空間信息,Chen等[15]提出聯(lián)合稀疏表示算法(Joint Sparse Representation Classification, JSRC),將局部窗口中的像素進行聯(lián)合表示,獲取像素的空間屬性.Tu等[16]提出引入皮爾森相關(guān)系數(shù)來計算光譜和空間相似性,以此來解決傳統(tǒng)JSRC算法中局部區(qū)域的像素可能不屬于同一類的問題.Zhang等[14]認為在基于表示的分類過程中真正起作用的是協(xié)同表示,并非稀疏表示.受此啟發(fā),Li和Du[17]提出了聯(lián)合協(xié)同表示(Joint Collaborative Representation,JCR)方法,充分利用相鄰像素點空間和光譜相似性,對原始數(shù)據(jù)平滑處理,進行聯(lián)合協(xié)同表示分類.由于像素點之間空間信息重合度較高,利用聯(lián)合協(xié)同表示方法很難對其進行區(qū)分.Jiang等[18]利用像素間的空間位置信息來構(gòu)建權(quán)重矩陣,并以此對協(xié)同系數(shù)進行約束,提出空間感知協(xié)同表示(Spatial-aware Collaborative Representation,SaCR)和聯(lián)合空間感知的協(xié)同表示(Joint Spatial-aware Collaborative Representation,JSaCR).
高光譜圖像光譜帶之間具有相似度高且樣本維度較高的特點,使用原始數(shù)據(jù)進行基于表示的分類會造成光譜信息難以挖掘甚至維數(shù)災(zāi)難的問題.在高光譜圖像中并不是所有的光譜帶都適合應(yīng)用于基于表示的分類,所以選取具有代表性的光譜帶并提取光譜信息顯得尤為重要.Yu等[19]認為在分類之前應(yīng)降維處理,充分提取光譜信息并降低高維樣本影響.學者們還提出了局部線性嵌入(Local Linear Embedding, LLE)、等距特征映射(Isometric Feature Mapping, LFM)、局部保持投影(Locality Preserving Projections, LPP)等降維算法來解決上述問題.降維方法可以使樣本數(shù)據(jù)選取更加充分、完善,但是降維方法只針對單層特征進行處理,存在以下兩個問題:一是同一光譜波段下的兩個樣本光譜距離較小,空間距離可能較大,存在“同譜異類”的問題,通過歐式距離來計算樣本光譜間相似性無法做出有效區(qū)分.二是圖像復(fù)雜,單層特征無法準確刻畫像素間關(guān)系,特征學習不充分,影響分類精度.深度層次模型可以提取數(shù)據(jù)的抽象和不變的特征,與傳統(tǒng)淺層分類器相比,具有更高的分類精度[20-24].Zhou等[25]根據(jù)高光譜圖像空間和光譜特征提出分層光譜-空間特征網(wǎng)絡(luò)(Hierarchical Spatial Spectral Feature Network),其目的是使用分層深度體系結(jié)構(gòu)學習判別特征,通過迭代抽象相鄰區(qū)域并重新計算新區(qū)域的表示來提取光譜空間特征.
研究表明,基于表示的分類方法在高光譜圖像分類應(yīng)用中,可以獲得良好的結(jié)果.高光譜圖像分類過程中,構(gòu)建分類模型固然重要,但是選取合適的方法構(gòu)建字典仍然必不可少.本文為充分利用空間和光譜信息,提出空譜融合與協(xié)同表示的高光譜圖像分類算法(Hyperspectral Image Based on Spatial Spectrum Fusion and Collaborative Representation,SS-CR).構(gòu)建特征字典通過交替進行空間特征學習和光譜特征學習實現(xiàn),從而降低原始數(shù)據(jù)波段間高相似度、維數(shù)過高對分類造成的影響.在使用聯(lián)合空間感知協(xié)同表示方法分類過程中,通過引入相關(guān)系數(shù)融合誤差進行決策.在Indian Pines和Pavia University兩個高光譜遙感數(shù)據(jù)集的實驗表明本文所提算法是有效的.
高光譜圖像存在帶間相關(guān)性強且維度高的問題,深度特征學習方法可有效提取圖像中抽象、不變的特征,使特征字典更具代表性.本文采用空譜特征提取模型(Spectral-spatial Feature Learning ,SSFL),交替進行空間和光譜特征學習獲得空譜特征,并將其堆疊成多個空譜特征學習單元,形成空譜特征網(wǎng)絡(luò)(Spatial Spectral Feature Network,SSN)[25].
SSFL單元由光譜特征學習部分和空譜特征學習部分構(gòu)成.光譜特征學習部分通過線性判別分析(Linear Discriminant Analysis,LDA)[26]實現(xiàn),該方法將字典中同類樣本內(nèi)的散度最大化,將不同樣本間的散度最小化,以此來從訓(xùn)練樣本中提取更具代表性的原子作為訓(xùn)練樣本.空間特征學習部分通過使用自適應(yīng)加權(quán)濾波器(Adaptive Weighting Filter,AWF)[25]對LDA處理過的數(shù)據(jù)進行濾波操作.空譜網(wǎng)絡(luò)的每一層輸出結(jié)果都是下一層的輸入結(jié)果,經(jīng)過多個SSFL單元迭代,獲得空譜特征構(gòu)造字典.通過空譜特征網(wǎng)絡(luò)構(gòu)造空譜特征字典如圖1所示.

圖1 SSN結(jié)構(gòu)
SSN網(wǎng)絡(luò)通過對原始高光譜數(shù)據(jù)進行特征提取,首先通過LDA對原始光譜提取光譜特征,降低原始樣本光譜相似度高的像素點所造成的影響.其次通過AWF對降維后的數(shù)據(jù)進行濾波操作,去除局部空間中邊界點的噪聲影響,提取空間特征.最后通過迭代的方式堆疊所提取的特征,得到空譜特征字典.具體的空譜特征字典構(gòu)造方法如表1所示.

表1 空譜特征字典的構(gòu)建
基于聯(lián)合表示的方法解決了空間信息未充分利用及像素點間相似度較高難以區(qū)分的問題,但特征學習不充分以及局部空間內(nèi)像素點異類并沒有得到有效解決.通過SSN[25]網(wǎng)絡(luò)構(gòu)建空譜特征字典可以使特征學習更加充分,使特征字典更具“代表性”.相關(guān)系數(shù)[13]是衡量像素點是否屬于同一類的重要衡量標準.引入相關(guān)系數(shù)在最終分類決策中,可有效排除異常像素點的影響.因此,本文提出空譜融合與協(xié)同表示的高光譜圖像分類算法(SS-CR).
聯(lián)合空間感知協(xié)同表示算法[16]通過歐式距離構(gòu)建空間和光譜正則化項,充分融合空間和光譜信息.空間感知協(xié)同表示目標函數(shù)為
(1)
其中,ytest是測試樣本,D是空譜特征字典,λ為光譜特征感知系數(shù),γ為空間特征感知系數(shù),Γ為光譜特征正則項,s為空間相似對角矩陣.最終解得協(xié)同系數(shù):
(2)

(3)

(4)
(5)
最后融合相關(guān)系數(shù)和聯(lián)合協(xié)同表示,確定測試樣本最終類別.其中,β為正則化參數(shù).
class(ytest)=argmin(r(ytest)+β(1-cor(ytest))).
(6)
綜上所述,本文所提出的算法步驟如下:
步驟1:輸入原始HSI圖像,并使用空譜特征網(wǎng)絡(luò)構(gòu)建特征字典;
步驟2:使用式(1)進行聯(lián)合協(xié)同表示,并用式(2)求解協(xié)同系數(shù)α;
步驟3:使用式(4)計算字典原子與測試樣本之間的相關(guān)系數(shù);
步驟4:使用式(6)確定測試樣本類別并分類.
本文所提算法流程如圖2所示.

圖2 SS-CR算法流程圖
本文算法選取Indian Pines、Pavia University兩個高光譜遙感數(shù)據(jù)集進行測試,驗證所提出算法的有效性.選取SVMCK[27]、SVM[28]、SRC[13]、CRC[14]、JSRC[15]、JCR[17]、JSaCR[18]作為對照實驗,選取4種分類指標作為高光譜圖像分類的評價指標,分別為類別準確率(Category Accuracy,CA),總體準確率(Overall Accuracy,OA),平均準確率(Average Accuracy,AA)和kappa系數(shù).
Indian Pines數(shù)據(jù)集通過Aviris傳感器于1992年的印第安納州西北部獲得.圖像的像素大小為145×145,空間分辨率為20 m.光譜范圍0.4~2.5 μm,去除20個吸水帶之后,其共有200個光譜反射帶,并提供16個地物類別.
Pavia University數(shù)據(jù)集通過Rosis傳感器在Pavia大學進行拍攝.該數(shù)據(jù)集有由波長范圍為0.43~0.86 μm的103個光譜帶組成,每個光譜帶像素大小為610×340,具有1.3 m的空間分辨率,共有9個地物類別.
本文所提算法涉及3個參數(shù),在Indian Pines和Pavia University數(shù)據(jù)集下,衡量光譜信息貢獻度λ設(shè)置成1×10-3,正則化參數(shù)β設(shè)置成1×10-10,衡量空間信息貢獻度γ分別設(shè)置成1×10-3和1.不同的算法在選取不同比例原子作為字典時,分類性能會受到影響.本文算法選取1%~5%訓(xùn)練樣本并將每類剩余樣本作為測試樣本,不同算法的總體準確率作為衡量指標.表2和表3分別代表在以上兩組數(shù)據(jù)集下不同算法的總體準確率.

表2 Indian數(shù)據(jù)集上不同算法的總體準確率

表3 Pavia University數(shù)據(jù)集上不同算法的總體準確率
由表2可以看出,隨著選取各類原子的比例增大,各類算法總體準確率逐漸上升.本文所提算法在Indian Pines數(shù)據(jù)集下,訓(xùn)練樣本選取比例未影響算法的分類性能,分類效果在不同選取比例下均優(yōu)于對照算法.其中,選取原子比例為1%時提高1.83%~22.49%,選取原子比例為5%時提高2.79%~21.30%.
由表3可以看出,各類算法的總體準確率因選取原子的比例增大而提高.本文所提算法在Pavia University數(shù)據(jù)集下,選取訓(xùn)練樣本的比例并未影響分類性能,在不同選取比例下的分類效果均優(yōu)于對照算法.其中,選取原子比例為1%時提高0.72%~11.84%,選取原子比例為5%時提高0.3%~6.85%.
3.3.1 Indian Pines 結(jié)果比對分析
在Indian Pines數(shù)據(jù)集下,隨機選取10%的樣本作為訓(xùn)練樣本,剩余樣本為測試樣本.從表4中可以看出,SS-CR算法在9種類別里分類效果最好,在Alfalfa、Grass-pasture等6種類別中達到100%.OA、AA、kappa三種分類指標分別為98.42%、99.12%、98.20%均優(yōu)于對照算法.圖3給出Indian Pines數(shù)據(jù)集下不同算法的分類圖,可以看出SS-CR算法分類效果最優(yōu).

表4 Indian Pines不同分類算法的準確率

圖3 Indian Pines不同算法的分類結(jié)果比較
3.3.2 Pavia University結(jié)果比對分析
在Pavia University數(shù)據(jù)集下,選取數(shù)量為30的樣本進行訓(xùn)練,剩余樣本為測試樣本.從表5中可以看出,SS-CR算法在8種類別里分類效果最好,在Sheets、Bare Soil等4種類別中達到100%.OA、AA、kappa三種分類指標分別為99.22%、99.29%、98.94%,均優(yōu)于對照算法.圖4給出Pavia University數(shù)據(jù)集下不同算法的分類圖,可以看出SS-CR算法分類效果最優(yōu).

表5 Pavia University不同分類算法的準確率

圖4 Pavia University不同算法的分類結(jié)果比較
本文所提算法相較于SVM、SVMCK、CRC、SRC的區(qū)別在于,上述算法均忽略了空間信息對于分類的重要性.空間信息可以對像素點之間的內(nèi)在屬性進行充分利用,從而降低同一波段下不同原子之間的影響,提高區(qū)分度.相較于JCR、JSaCR的區(qū)別在于本文首先使用空譜特征網(wǎng)絡(luò)構(gòu)建特征字典,提高字典判別性,在最終的分類過程中引入相關(guān)系數(shù)用于平衡誤差所帶來的影響,最終提升分類性能.空譜融合與協(xié)同表示的高光譜圖像分類算法(SS-CR)應(yīng)用于高光譜遙感圖像分類共分為兩個階段:第一階段通過SSN深度神經(jīng)網(wǎng)絡(luò),交替進行空間和光譜特征學習,構(gòu)造分層融合字典,并用于聯(lián)合協(xié)同表示.第二階段在分類過程中引入皮爾森相關(guān)系數(shù),最大程度地避免“同物異譜”和“同譜異物”帶來的影響,并使用聯(lián)合協(xié)同表示分類器進行分類,二者共同決策出最終結(jié)果.在Indian Pines和Pavia University數(shù)據(jù)集上總體準確率可以達到98.44%、99.22%.本文所提算法不足之處在于構(gòu)造字典和聯(lián)合協(xié)同表示分類過程中,由于兩個階段是分開進行的,未能把兩個階段的模型進行最優(yōu)化的處理,即并未發(fā)揮深度神經(jīng)網(wǎng)絡(luò)的最大優(yōu)勢,將在接下來的工作中繼續(xù)完善.