程志會,謝福鼎
(遼寧師范大學城市與環境學院,遼寧 大連 116029)
基于空間特征與紋理信息的高光譜圖像半監督分類
程志會,謝福鼎
(遼寧師范大學城市與環境學院,遼寧 大連 116029)
傳統高光譜圖像分類方法主要使用圖像的光譜特征信息,沒有充分利用高光譜圖像的空間特性及樣本的其他信息。本文提出了一種基于空間特征與紋理信息的高光譜圖像半監督分類方法。首先,將高光譜圖像每一像素的光譜特征與其鄰域范圍內的光譜特征進行結合,得到了這一像素的空-譜特征;然后用灰度共生矩陣提取了高光譜圖像的紋理特征,并與空-譜特征進行了融合;最后,用基于圖的半監督分類算法進行了分類。通過在Indian Pines數據集和PaviaU數據集上進行試驗,結果表明本文提出的方法能取得較高的分類結果。
高光譜圖像分類;灰度共生矩陣;半監督方法;空譜特征;紋理特征
20世紀末期興起的高光譜遙感技術是遙感科學技術領域的一項重大進展。由于高光譜遙感圖像具有較高的空間分辨率及豐富的光譜信息,為準確的地物識別提供了一種可能。目前已在地質勘探、精準農業和軍事用途等領域中取得了成功的應用[1]。許多學者對高光譜圖像的準確分類作了大量研究,如貝葉斯模型、特征提取和特征約減、隨機森林、神經網絡、模糊聚類和支持向量機[2-5]等方法。高光譜圖像分類主要分為監督和無監督兩種[3]。在監督分類方法中,基于核方法的支持向量機取得了巨大的成功,支持向量機能夠在樣本量受限制的方式下有效地處理大的輸入維度和抑制噪聲樣本[3]。在無監督分類方法中,模糊聚類因其無需使用標記樣本,在缺少大量標記的高光譜圖像分類中取得了巨大的成功。眾所周知,監督方法的主要缺點是分類模型和分類準確度主要依賴于標簽點的訓練數據集數量,而獲取大量的高光譜圖像類別標記是一項耗時和耗成本的工作。非監督方法雖然對帶標簽樣本不敏感,但是由于缺乏先驗知識,對聚類類別和真實類別之間的聯系是不確定的。
半監督學習由于其只需要少量的標記樣本在高光譜圖像分類中引起了研究者的高度關注[1]。半監督學習將標簽數據和無標簽數據結合,以提高分類的準確度。常用的半監督方法有自訓練[6]、直推式支持向量機[6]、生成式模型算法和基于圖的方法[7-8]。在高光譜圖像應用中,提出了許多基于圖的半監督方法,文獻[9]提出了一種基于流行學習構圖的LapSVM算法,改進了傳統的權值僅能反映數據點兩兩之間關系的問題,在典型的高光譜圖像數據集上提高了分類的準確度,但其僅僅考慮了高光譜圖像的光譜特征,沒有考慮其豐富的空間信息。文獻[1]將主動學習與圖的半監督相結合,改進了已有標記數據隨機選取的缺點,在一定程度上提高了分類的準確度。雖然基于圖的半監督在高光譜圖像應用中已取得很大成功,但仍有許多不足:現有的高光譜圖像分類模型大部分在分類中只考慮了光譜特征信息,很少關注其空間特征,導致分類準確率不高。
針對上述問題,本文提出一種融合空間信息與光譜信息的半監督高光譜圖像分類方法,流程如圖1所示。首先,將光譜特征與其鄰域內特征相結合,提出一種新的空-譜特征組合方法;然后利用灰度共生矩陣方法對圖像的空間紋理特征進行提取,并與提出的空-譜特征組合方法進行結合,作為基于圖的半監督分類器輸入。
1. 高光譜圖像特征提取
高光譜圖像具有維數高、波段間相關性大、非線性等特點,容易出現維數災難與數據冗余等問題。因此,在對高光譜圖像進行空-譜特征提取之前,需要對圖像進行降維處理。主成分分析(PCA)作為一種簡單、成熟的降維方法,在高光譜圖像降維中應用得最為廣泛,因此首先使用PCA對高光譜數據進行降維處理[10-11]。

圖1 本文算法流程
假設原始的高光譜圖像使用PCA降維后包含的波段數為b,則高光譜圖像中任意像素xi的空-譜特征為
zi={fi,fi+1,fi+2,…,f(i+n)×(i+n-1)}∈Rb×(k×k)
(1)
式中,fi為像素xi的光譜向量;fi+1,fi+2,…,f(i+n)×(i+n-1)為像素xi的k×k鄰域內各個像素的光譜向量;k為高光譜圖像窗口的大小。這種方法不僅考慮了高光譜圖像的光譜特征,而且簡單考慮了圖像每個像素周邊的空間信息,彌補了單獨利用光譜特征進行圖像分類的不足;將像素xi的k×k鄰域矩陣展開成一個1×k2的行向量,作為像素xi新的空-譜特征信息。
高光譜圖像不僅包含豐富的光譜和空間特征,而且含有豐富的紋理特征,紋理特征能夠有效地表示高光譜圖像中地物紋理分布信息,在一定程度上抑制了高光譜圖像分類中的同譜異物現象[9]。紋理特征提取方法可以分為基于統計特征、基于結構和基于空間頻率[10]等方法。由于高光譜圖像特有的性質,目前對于紋理特征的提取,一般都是基于統計的方法。統計方法中的灰度共生矩陣(GLCM)通過計算高光譜圖像中各像素點灰度之間的聯合概率表示紋理,反映了高光譜圖像中像元之間的空間依賴性[9]。
GLCM描述了高光譜圖像范圍內,兩個距離為d、方向為θ(0°,45°,90°,135°)的像素點在高光譜圖像中出現的概率,通過改變(d,θ)值,可以組合成不同的GLCM來分析圖像的灰度空間分布格局。GLCM提供了高光譜圖像方向和幅度變化的信息,但是不能直接提供區別圖像的紋理信息。為了有效地利用共生矩陣描述紋理,Haralick等在GLCM的基礎上,提出了14種特征對高光譜圖像的紋理進行量化[12],本文選擇文獻中學者常用的4個特征去描述和區分紋理信息,見表1。

表1 GLCM常用的4種紋理特征
根據表1提供的參數對降維后高光譜圖像提取常用的4種紋理特征,共得到4個方向的灰度共生矩陣,因此得到16個紋理特征,對4個矩陣相同參數的紋理特征取均值和方差,得到8個紋理特征。
高光譜圖像的光譜特征、空間特征和紋理特征提取后,還需進行融合,雖然已有文獻提出了各種融合方法[12-13],本文為了簡化處理,選擇最簡單的處理方式,即直接組合法。設高光譜圖像光譜特征為xspec,空-譜組合提取特征為xspec-spat,紋理特征為xtext,因此直接組合后的特征為
r=[xspec,xspec-spat,xtext]
(2)
2. 基于圖的半監督高光譜圖像分類
高光譜圖像的特征提取后,將利用基于圖的半監督方法對高光譜圖像進行分類。該部分將介紹基于圖的半監督中的局部和全局一致性(local and global consistency,LGC)方法[14-15]。假設有n=l+u個樣本xi(1≤i≤n)組成一個矩陣X=[x1x2…xlxl+1…xl+u],其中l為高光譜圖像中帶標簽樣本的數目;u為高光譜圖像中無標簽樣本的數目。yi∈RC為第i個樣本的標簽向量,如果樣本xi的標簽屬于第j類,則yij=1;否則yij=0。顯然,yi=0意味著樣本xi的標簽是未知的,本文的目標即預測u個未標記樣本的標簽。LGC的主要過程如下:
1) 通過kNN構建一個加權的圖G,設W=[wij]n×n是圖G的鄰接矩陣,wij表示為
(3)式中,σ為高斯核寬,控制xi和xj之間距離的衰變速度;Nk(xi)為樣本xi的k近鄰;wij確保兩個相近的樣本有大的相似性和兩個不相近的樣本有小的相似性。
2) 對權重進行標準化處理
S=D-1/2WD-1/2
(4)
式中,D為一個對角矩陣
3) 計算高光譜數據的樣本標簽預測函數
F=(1-α)(I-αS)-1Y
(5)

為了驗證本文方法的有效性,在兩組高光譜圖像數據集上進行試驗。這兩組高光譜圖像數據集為IndianPines數據集和PaviaU數據集。IndianPines數據集為1992年采用AVIRIS系統在美國印第安納州的一個農場拍攝的航空數據,空間分辨率為20m,圖像大小為145×145像素。去除水汽吸收波段,剩余200個光譜波段。此高光譜數據集中,由于有些作物標記樣本較少,因此選擇9種較多的地物類型進行分類處理,真實地物標記如圖2(a)所示。PaviaU數據集為ROSIS系統在意大利南部拍攝的PaviaUniversity,空間分辨率為1.3m,圖像大小為610×340像素,去除噪聲波段,剩余103個光譜波段,此地區共包含9種地物標記(946<每類中樣本點數<18 650),如圖3(a)所示。
首先對兩組高光譜數據集進行主成分分析,選取前3個主成分進行空間特征和紋理特征提取,并對提取的特征進行組合處理,然后使用基于圖的半監督方法預測未標記樣本的標簽。為了說明本文方法的性能,將其與SVM方法進行了比較。
為方便起見,在試驗中所用的重要參數統一列在表2中。

表2 試驗中用到的重要參數
在本文試驗中,每類隨機選取50個樣本進行標記,其余的作為未標記樣本,σ和α兩個參數分別取值1和0.4,試驗以總精度OA和Kappa系數兩個參數量化高光譜圖像的分類效果,為了減少隨機性,每個試驗均重復20次,并對20次的結果取平均值。
1. Indian Pines數據集試驗結果與結論分析
該數據集共分為16類,其中有7類樣本點數目較少(<400),因此選擇其余9類進行分類處理(482<每類中樣本點數<2456),每類隨機選取50個樣本標記(0.20%<標記樣本的比例精度<10.4%),分析比較了2種算法在不同的特征下的總精度OA和Kappa系數。分類結果見表3,融合特征后的高光譜圖像真實影像結果如圖2所示。

圖2 Indian Pines數據集分類影像
真實地物標記如圖2(a)所示,由表3和圖2可知,結合高光譜圖像光譜特征、空間特征和紋理特征的分類結果明顯優于單一使用光譜特征進行分類的效果;并且隨著紋理特征的加入,精度提升了3%~4%左右。隨著窗口的增加,分類精度得到顯著提升,說明本文提出的光譜特征和紋理特征的融合效果顯著。從表3最后一列也可以看出,基于圖的半監督方法是優于SVM方法的,精度都有約4%的提升,說明結合空間特征與紋理特征高光譜圖像,應用圖的半監督分類方法的分類精度較好。
2. PaviaU數據集試驗結果與結論分析
PaviaU數據集中,包含9種地物標記(946<每類中樣本點數<18 650),每類隨機選取50個樣本標記(0.027%<標記樣本的比例精度<0.52%),分析比較了3種算法的總精度OA和Kappa系數,分類結果見表4,融合特征后的高光譜圖像真實影像結果如圖3所示。

表4 PaviaU數據集分類結果

圖3 PaviaU數據集分類影像
由表4和圖3可知,本文提出的紋理特征和光譜特征的結合改善了高光譜圖像的分類結果,要優于單一使用光譜特征或空間特征進行分類。隨著窗口尺寸的增加,分類精度得到顯著提升,說明高光譜圖像具有包含空間信息的特性。從表4列向來看,本文提出的基于圖的半監督方法優于SVM方法,說明融合空間特征和紋理信息的高光譜圖像,使用圖的半監督分類方法的分類精度更高。
本文針對高光譜圖像分類提出了一種基于空間特征信息和光譜特征結合的混合圖半監督分類方法。首先對高光譜圖像進行降維處理,選取前3個主成分進行空-譜特征和紋理特征提取;然后將這些光譜特征、空間特征和紋理特征進行特征融合;最后將融合后的特征輸入到基于圖的半監督分類器中,進行高光譜圖像的分類。對兩個實際的高光譜圖像數據集進行試驗表明:①本文提出的空間特征和紋理特征結合的方法相較于傳統的只利用光譜特征和單一空間特征進行圖像分類,精度得到很大提升;②與傳統的方法相比,基于圖的半監督方法不僅在精度上得到提高,而且減少了輸入的參數。本文得到的空-譜特征僅僅是考慮像素周邊的鄰域信息,沒有進行進一步的研究,這是后期需要研究的方向;并且光譜特征、空間特征僅僅是進行簡單的融合,將來可對更多的融合方式進行探討。
[1] 田彥平,陶超,鄒崢嶸,等.主動學習與圖的半監督相結合的高光譜影像分類[J].測繪學報,2015,44(8):919-926.
[2] 李慧,王云鵬,李巖,等.基于SVM和PWC的遙感影像混合像元分解[J].測繪學報,2009,38(4):323-329.
[3] 金晶,鄒崢嶸,陶超.高分辨率遙感影像的壓縮紋理元分類[J].測繪學報,2014,43(5):493-499.
[4] 張偉,杜培軍,張華鵬.基于神經網絡的高光譜混合像元分解方法研究[J].測繪通報,2007(7):23-26.
[5] 杜培軍,林卉,孫敦新.基于支持向量機的高光譜遙感分類進展[J].測繪通報,2006(12):37-40.
[6] DOPIDO I, LI J,MARPU P R,et al.Semisupervised Self-Learning for Hyperspectral Image Classification[J].Geoscience & Remote Sensing IEEE Transactions on,2013,51(7):4032-4044.
[7] CAMPS-VALLS G,MARSHEVA T V B,ZHOU D.Semi-Supervised Graph-based Hyperspectral Image Classification[J].Geoscience & Remote Sensing IEEE Transactions on,2007,45(10):3044-3054.
[8] LIU X,PAN S,HAO Z,et al.Graph-based Semi-supervised Learning by Mixed Label Propagation with a Soft Constraint[J].Information Sciences, 2014,277:327-337.
[9] 王小攀.基于圖的高光譜遙感數據半監督分類算法研究[D].北京:中國地質大學,2014.
[10] 林曉峰.基于紋理特征的遙感圖像分類算法研究[D].大連:大連理工大學,2007.
[11] 倪國強,沈淵婷,徐大琦.一種基于小波PCA的高光譜圖像特征提取新方法[J].北京理工大學學報,2007,27(7):621-624.
[12] 王增茂,杜博,張良培,等.基于紋理特征和形態學特征融合的高光譜影像分類法[J].光子學報,2014(8):1-7.
[13] 樊利恒,呂俊偉,于振濤,等.基于核映射多光譜特征融合的高光譜遙感圖像分類法[J].光子學報,2014(6):93-98.
[14] KLAUS B,KLIJN F.Local and Global Consistency Properties for Student Placement [J].Journal of Mathematical Economics,2011,49(3):222-229.
[15] ZHOU D,BOUSQUET O,LAL T N,et al.Learning with Local and Global Consistency[J].Advances in Neural Information Processing Systems,2004,17(4):321-32.
Semi-supervised Classification for Hyperspectral Image Based on Spatial Features and Texture Information
CHENG Zhihui,XIE Fuding
2016-04-07;
程志會(1990—),男,碩士生,主要從事空間數據挖掘方面的研究。E-mail:811269090@qq.com
程志會,謝福鼎.基于空間特征與紋理信息的高光譜圖像半監督分類[J].測繪通報,2016(12):56-59.
10.13474/j.cnki.11-2246.2016.0401.
P237
B
0494-0911(2016)12-0056-04
修回日期:2016-07-15