趙瑩瑩,潘兆杰,付航,張愛竹,姚延娟,孫根云
(1.長沙市規劃勘測設計研究院,長沙 410007;(2.海洋國家實驗室 海洋礦產資源評價與探測技術功能實驗室,山東 青島 266071;(3.中國石油大學(華東)海洋與空間信息學院,山東 青島 266580;(4.生態環境部衛星環境應用中心 國家環境保護衛星遙感重點實驗室,北京 100094)
高光譜圖像(hyperspectral image,HSI)包含數百個甚至上千個連續的光譜波段,可以有效地識別不同材料的細微變化。高光譜影像被廣泛應用于目標識別[1]、環境管理[2]和礦產測繪[3]等領域,其中,地物分類是當前的一個研究熱點[4]。然而,HSI分類還存在較多的問題,如“同物異譜、同譜異物”現象,巨大的維度造成分類中的“Hughes現象”,這給影像的解譯帶來了挑戰。因此,對HSI數據進行有效的特征提取是必要的[5]。
特征提取可以將高維數據投影到低維空間,保留原始數據基本結構信息的同時降低數據的維數。近些年來,研究人員提出了一系列特征提取方法,如廣泛應用的主成分分析(principal component analysis,PCA)[6]和線性判別分析(linear discriminant analysis,LDA)[7],一些基于流形學習的方法被提出,如局部保持投影(locality preserving projection,LPP)[8]、局部線性嵌入(locally linear embedding,LLE)[9]等,這些方法可以更好地挖掘高維數據中潛在的低維流形結構??紤]到上述方法均為無監督方法,分類性能有限,研究人員進一步提出監督的特征提取方法,如局部Fisher判別分析(local Fisher discriminant analysis,LFDA)[10],其主要思路是最大化類間分離的同時保留類內精細復雜的局部結構,有效提高了分類精度。
然而,上述特征提取方法主要作用于光譜域,仍然受到“同物異譜、同譜異物”的影響。高光譜影像包含的地物空間特征對點狀誤分類的現象具有潛在的幫助。為此,研究人員提出了一系列聯合光譜-空間的分類方法,這些方法可大致分為兩類:基于機器學習的方法和基于深度學習的方法[11]。基于機器學習的方法主要包括特征提取和分類器兩個階段,特征提取是通過一種或融合幾種不同的處理技術來共同挖掘影像的光譜-空間特征,并利用高效的分類器獲得分類結果。基于深度學習的方法主要利用多個非線性網絡,分層提取HSI的抽象特征和鑒別特征,近些年來逐漸成為研究的主流[12-16]。然而,深度學習方法存在樣本需求量大、計算耗時昂貴、難以解釋模型內的動態變化等[17]問題。機器學習方法側重于特征提取方式和分類器的選取,通常結構比較簡單、參數少,仍然是提高分類精度的重要突破。因此,本文主要關注基于機器學習的方法。
在基于機器學習的分類方法方面,研究人員提出了一系列高效的光譜-空間特征提取算法。如Zabalza等[18]將二維奇異譜分析(two-dimensional singular spectrum analysis,2DSSA)用于高光譜逐波段的特征提取,該方法通過分離不同的空間信息成分,來獲取單波段的主要空間上下文特征。Kang等[19]提出一種結合平均降維和本征圖像分解的特征提取方式,可以有效去除影像中的無用信息,如陰影和圖像噪聲,提高了影像的分類精度。Li等[20]結合分段主成分分析(segmented PCA)和高斯金字塔,提出了一種高效的多尺度空間融合分類框架,取得了優異的分類效果。
然而,這些光譜-空間特征提取方法大多數作用于規則形狀或固定大小的空間區域,忽略了影像地物形狀和尺度的復雜性,即用于空間特征提取的區域與圖像的空間結構不匹配[21]。圖像超像素分割能夠獲取不同大小和形狀的圖像局部均質區域,在一定程度上可以解決上述問題[22]。
為了充分挖掘高光譜影像豐富的地物尺度特征,本文提出了一種結合超像素和2DSSA的空間特征提取方法即超像素2DSSA(S2DSSA),將2DSSA的作用域從整幅圖像變換到超像素區域,可以自適應地挖掘不同形狀地物的空間上下文特征,能夠提高類內光譜的一致性并增強類間差異。為了進一步挖掘影像的光譜非線性結構,本文將提出的S2DSSA與LFDA相結合,在空間特征的基礎上提取光譜流形特征,進一步提升類間相似性,提高地物的區分性。選取支持向量機(support vector machine,SVM)對得到的光譜-空間特征進行分類,將本文的處理流程記為S2DSSA-LFDA-SVM方法。
本文提出的S2DSSA-LFDA-SVM方法主要包含4個步驟:1)對原始的HSI進行PCA分解,在得到的第一主成分圖上進行熵率分割(ERS)[23],得到分割圖;2)分割圖引導2DSSA對每個波段的超像素區域進行特征提取,得到空間特征;3)LFDA作用于空間特征的光譜域,得到降維后的光譜-空間特征;4)SVM對光譜-空間特征進行分類。具體過程如圖1所示。

圖1 提出的S2DSSA-LFDA-SVM方法的框架流程
熵率分割(entropy rate segmentation,ERS)是一種基于圖論的分割方法,在圖像處理中得到廣泛應用[24]。具體來講,ERS首先將PCA第一主成分圖像映射為一個圖G=(V,E),其中V是圖的頂點,E是圖的邊緣集合。在某一超像素數量下,選擇子邊緣集A使得圖G恰好包含S個離散的子圖,其中每個子圖代表一個超像素。然后,使用構造的熵率項函數H(·)和平衡項函數B(·)得到目標函數,通過最優化目標函數來獲得S個超像素,目標函數如式(1)所示。

(1)
式中:λ≥0是平衡項函數的權重調節參數。上式的優化問題一般通過貪心算法求解[25]。最后,通過基于稀疏表示的距離度量為每個超像素指定一個公共標簽。
S2DSSA作用于單個波段的每個超像素區域。對于某一超像素區域,首先為其構建一個規則的作用區,即根據超像素的行數和列數,結合鄰域像素來補充超像素區域,如圖2所示。

圖2 S2DSSA的處理方式
然后,對于每個規則的超像素區域,使用2DSSA對其進行特征提取,它旨在提取最大特征值分量所反映的空間信息。對于尺寸為Nx×Ny的規則超像素區域,定義一個大小為L=l×l(l∈min[Nx/2,Ny/2])的二維嵌入窗口。該窗口從圖像的左上角滑動到右下角,不同位置處窗口內所有像素按列拉伸為向量Vi,j∈L×1,將其作為軌跡矩陣P的列向量,可得式(2)。
P=(V1,1,V1,2,…,V1,Ny-Ly+1,V2,1,…,VNx-lx+1,Ny-ly+1)∈RL×(Nx-lx+1)(Ny-ly+1)
(2)
計算協方差矩陣PPT的特征值和相應的特征向量,軌跡矩陣可以寫成式(3)。

(3)
式中:Ui和Vi分別為軌跡矩陣的左奇異向量和右奇異向量。選擇P1成分作為P的近似值,通過兩步對角平均處理操作,可將矩陣P1再次轉換為Nx×Ny大小的規則區域。
經過每個超像素區域的2DSSA特征提取后,將原始超像素位置處的像素提取出來,作為特征提取后的超像素,如圖2所示。相比于原始超像素,該特征超像素有較好的區域均勻性,并且消除了噪聲的影像。
局部Fisher 判別分析(LFDA)用于空間特征的光譜流形結構降維,其基本思想是最大化類間分離的同時保留類內精細復雜的局部結構。假設xi∈B×1表示輸入空間特征的單個光譜向量,B為高光譜數據的維度,首先計算樣本xi和xj的相似度矩陣,如式(4)所示。
(4)

(5)
(6)
式中:Wlb和Wlw為用來保留數據局部信息的加權矩陣。它們的第(i,j)個元素可表示為式(7)、式(8)。
(7)
(8)
最后,通過計算局部Fisher 比率的最優值得到投影變換矩陣WLFDA,可表示為式(9)。
(9)

特征提取后,使用SVM分類器進行基于像素的HSI分類,主要是因為SVM對數據的維數問題有較高的魯棒性,核函數選取RBF核函數。
實驗主要使用了兩個包含地面真值圖的經典數據集,Indian pines和Pavia centre數據,其詳細信息如下。
Indian pines數據:由機載可見光/紅外成像光譜儀(AVIRIS)獲取的高光譜影像,空間分辨率為20 m,光譜范圍為400~2 500 nm,包含145像素×145像素的圖像尺寸和200個波段。
Pavia centre數據:由反射光學系統成像光譜儀(ROSIS-03)傳感器獲取的數據集,光譜覆蓋范圍從0.43~0.86 μm。該數據集包含103個波段,空間分辨率為1.3 m,使用了510像素×490像素大小的子場景,共有9個土地覆蓋類。
SVM分類器算法在LIBSVM library庫[26]中通過使用高斯RBF核函數來實現,10倍交叉驗證方法獲取最優核函數參數。在分類過程中,采用分層的隨機取樣方式獲取訓練和測試樣本,并且每類的采樣比率或數量相同。另外,為了定量地評價分類的結果,選取5個客觀質量指標:總體精度(OA)、平均精度(AA)、每類地物的精度、Kappa系數,以及運行時間。
本節對所提出算法的參數進行分析,主要包括3個參數:S2DSSA的超像素數量S、窗口大小L,以及LFDA的降維成分數。
在空間域,S2DSSA的超像素數量以及窗口大小的組合至關重要。為此,設計實驗來評估超像素數量和窗口大小的組合效果,其中超像素數量S的選取范圍為{10,25,50,100,150,200},窗口大小L范圍為{3×3,5×5,7×7,9×9},不同組合的分類精度如圖3所示。根據圖3可以看出,兩個數據集由于地物覆蓋的大小形狀不同,最優參數組合也存在差異。對于較小超像素區域,較小的S2DSSA窗口能夠很好地平滑超像素內部,提高區域一致性;而較大的窗口會因無法處理,只保留原始的區域特征,精度下降。在參數S和L分別為50和7的情況下,兩個數據集都能取得不錯的分類精度。

圖3 S2DSSA的參數(窗口大小及超像素數量)敏感性分析
在光譜域,LFDA的降維成分數能夠衡量光譜特征的利用程度。評估實驗的結果如圖4所示。根據結果可知,隨著維度的增加,兩個數據集的精度均有上升趨勢,在維度為15時取得最高精度;隨著降維成分的繼續增加,精度呈下降趨勢。為了保證所提出方法在不同數據集上的適用性,將上述3個參數分別固定為50、7和15,即針對一副給定的高光譜影像,提出方法的參數是可遷移的。

圖4 LFDA的降維數量分析
為了驗證所提出算法的有效性,本節選取了幾種先進的分類方法進行了精度對比。原始像素級SVM分類作為基準,記為SP-SVM。LFDA-SVM和2DSSA-SVM分別作為光譜、空間特征提取方法。光譜-空間分類算法上,選擇了本征圖像分解(IID)的融合、高斯金字塔的多尺度融合(SPCA-GPs),二者分別使用相應文獻中的默認參數。此外,2DSSA-LFDA-SVM、S2DSSA-SVM也分別作為特征提取方法與S2DSSA-LFDA-SVM進行對比,從而驗證S2DSSA的有效性。
首先,比較所有方法在不同比例訓練樣本數量下的分類結果。如圖5所示,隨著訓練樣本數量的增加,所有算法的分類精度都逐漸提高。此外,在所有的訓練樣本數量下,提出的S2DSSA-LFDA-SVM方法都取得了最高的分類精度,這證明了所提出算法的有效性。

圖5 不同訓練樣本數量下的精度對比
為了進一步定量化評估S2DSSA-LFDA-SVM的有效性,對比了所有算法的每類詳細精度以及運行效率,如表1~表4所示,相應的分類結果如圖6、圖7所示。

表1 Indian pines數據集的分類精度對比1(2%訓練樣本) %

續表

表2 Indian pines數據集的分類精度對比2(2%訓練樣本)
1)Indian pines數據。如表1、表2所示,在 OA、AA和Kappa 3個總體指標上,S2DSSA-LFDA-SVM都取得了最高的精度,并且在絕大多數的地物類別上都有不錯的分類效果,其中玉米、燕麥和石鐵堡3種地物的分類準確率達到100%。相比于基準方法SP-SVM,S2DSSA-LFDA-SVM的OA從64.86%提升到96.34%,比LFDA-SVM和2DSSA-SVM的OA分別高約27.83%和13.3%。S2DSSA相比于2DSSA,很好地考慮了地物的不同空間尺度特征,因而取得了優于后者的分類精度,OA提升了3.95%。與其他幾種光譜-空間分類算法IID-SVM、SPCA-GPs-SVM和2DSSA-LFDA-SVM相比,S2DSSA-LFDA-SVM仍然有4%~6%等不同程度的提升,主要是因為后者提取了有效的空間尺度特征和光譜流形結構,增強了地物的可區分性。

表3 Pavia centre數據集的分類精度對比1(0.3%訓練樣本) %

表4 Pavia centre數據集的分類精度對比2(0.3%訓練樣本)
根據圖6所示,S2DSSA-LFDA-SVM的分類圖也優于其他的對比算法。2DSSA-SVM利用空間信息減少了前者的點狀誤分類噪聲,但存在一些小塊或條狀誤分類,改進的S2DSSA-SVM利用了超像素的自適應能力,消除了條狀分類噪聲的現象。與其他3種光譜-空間方法相比,S2DSSA-LFDA-SVM在地物內部和邊緣處均有較好的分類結果,這也體現了所提取的地物鑒別特征的有效性。
處理效率上,提出的S2DSSA比傳統的2DSSA花費了更多的時間,主要原因在于2DSSA作用于每個波段的每個超像素區域,增加了運算量。此外,相比于其他光譜-空間方法,所提出的S2DSSA-LFDA-SVM的計算效率較低,低于SPCA-GPs-SVM和2DSSA-LFDA-SVM,僅優于IID-SVM,主要原因是IID通過優化能量函數,經多次迭代后才能獲取影像的反射率成分,會花費較高的時間。此外,IID逐波段進行全圖迭代,計算時間會隨著影像尺寸的增大而增加。

圖6 Indian pines數據分類圖

圖7 Pavia centre數據分類圖
2)Pavia centre數據。該數據集存在一些較小且不規則的地物類別,如樹木、沼澤、道路等,給分類帶來了一些困難。根據表3、表4的定量結果,提出的S2DSSA-LFDA-SVM依然延續了它的有效性,在OA、AA、Kappa和大部分的地類中均取得了最高的分類精度,包括瀝青和草地兩種地物分類準確率達到100%。S2DSSA-LFDA-SVM的OA比基準方法SP-SVM的OA提升12.98%,比傳統的LFDA-SVM和2DSSA-SVM分別提升12.08%和8.75%。S2DSSA-SVM仍然優于2DSSA-SVM方法,這也證明了前者的魯棒性。S2DSSA-LFDA-SVM仍然優于其他的光譜-空間分類方法,在OA上比IID-SVM、SPCA-GPs-SVM和2DSSA-LFDA-SVM分別提升4.43%,2.4%和2.78%。根據圖7的分類圖,S2DSSA-LFDA-SVM能夠有效消除大面積地物內部的分類噪聲,并且保留了不規則較小地物的形狀和邊緣,因而獲得了與地面真值圖最接近的分類結果圖。此外,由于該影像數據尺寸較大,所提出的S2DSSA-LFDA-SVM方法效率較低,主要因為在S=50的情況下,每個超像素區域相對較大,S2DSSA對于每個超像素的處理時間增加。
本文提出的S2DSSA-LFDA-SVM結合了改進的S2DSSA和LFDA,能夠有效地提取影像的光譜-空間特征,并且可以消除影像內部的諸多噪聲。
S2DSSA充分考慮了影像地物的形狀多樣性,在每個超像素內部進行2DSSA空間特征提取,可以進一步提升地物內部像素的差異,提高一致性,不同地物的邊緣處也得到增強,對于地物的區分有重要作用。LFDA作為一種流形學習方法,可以充分挖掘光譜維度的非線性結構,但是其單獨作用效果受光譜異質性的限制。將其作用于勻質的S2DSSA空間特征,可以充分發揮LFDA的效果。
該方法仍然會存在一些不足。首先,超像素的分割無法完全適用于地物的形狀結構,最優超像素個數因不同的影像而存在差異。此外,2DSSA使用了固定的窗口,這對于不同超像素區域的特征提取可能是不合適的。因而,未來我們將進一步開發自適應的S2DSSA來提取空間特征。
本文提出了一種結合改進的S2DSSA和LFDA的光譜-空間分類方法,用來表征高光譜影像的內在結構特征。二者的有效融合,可以有效地提取高光譜影像的空間和光譜特征,大幅提升后續的分類性能。相關結論主要如下。
1)本文提出的S2DSSA空間特征提取方法結合了超像素和2DSSA的優勢,可以自適應地提取復雜多樣的地物空間特征。實驗結果證明,S2DSSA取得了比2DSSA更高的分類精度。
2)S2DSSA用于空間特征提取,LFDA用于挖掘光譜流形結構,二者的結合可以消除高光譜分類中“同物異譜、同譜異物”和“Hughes現象”,并且克服了單一方法在特征提取方面的有限性,提升了特征提取效果。
3)在兩個經典高光譜數據集上的實驗結果表明,本文方法提取的特征要遠優于原始的高光譜數據,并且要好于其他先進的光譜-空間提取技術。此外,本文算法的參數較少,并且可以使用一套相同的參數處理不同的數據集,這使得該方法在實際的高光譜影像處理中有較大的應用潛力。
4)通過機器學習的方法可以提取高光譜數據的諸多特征,但是這些特征主要是淺層特征,蘊含的信息比較有限。深層的特征具有良好的不變性和抽象性,對于影像分類具有更大的意義。因此,下一步的工作主要是結合輕而小的深度學習模型,來挖掘高光譜內在結構的深層特征。