朱江濤,黃睿
(上海大學(xué)通信與信息工程學(xué)院,上海 200072)
高光譜遙感技術(shù)起步于上世紀(jì)80年代,具有“圖譜合一”的特點(diǎn),能精確地描述地物光譜特性[1]。機(jī)載激光雷達(dá)(Light Detection and Ranging,LiDAR),是一種主動式對地觀測技術(shù),能實(shí)時獲取地形表面三維空間信息[2]。結(jié)合這兩種數(shù)據(jù)進(jìn)行地物信息判讀,提高地物的判別精度,已成為當(dāng)前遙感數(shù)據(jù)融合研究的熱點(diǎn)之一。
融合高光譜和LiDAR數(shù)據(jù)進(jìn)行目標(biāo)地物的分類,體現(xiàn)了兩種數(shù)據(jù)的優(yōu)勢互補(bǔ),能有效提高分類精度[3]。根據(jù)兩種數(shù)據(jù)結(jié)合方式的不同,大致可分為串行和并行兩種處理機(jī)制。串行機(jī)制中,可以先使用LiDAR數(shù)據(jù)提供的高程信息區(qū)分地面和非地面點(diǎn),再利用光譜信息以及植被指數(shù)等對感興趣目標(biāo)進(jìn)一步細(xì)分[4];或先進(jìn)行高光譜數(shù)據(jù)分類,再利用高程信息進(jìn)行后分類[5-6]。并行機(jī)制將多種特征串接形成新的特征矢量,在新的特征空間進(jìn)行分類[7]。Dalponte等[8]結(jié)合LiDAR多次回波的高程、強(qiáng)度數(shù)據(jù)與高光譜數(shù)據(jù),進(jìn)行樹種識別。文獻(xiàn)[6,9]還考慮像素空間關(guān)系,提取了灰度共生矩陣和形態(tài)學(xué)剖面紋理特征。此外,Rottensteiner等[10]在建筑物分類中采用證據(jù)理論實(shí)現(xiàn)兩種數(shù)據(jù)的決策級融合。
本文采用并行機(jī)制,考察了光譜、高程、紋理、植被指數(shù)等不同特征組合對分類性能的影響,提出了一種基于Adaboost的高光譜與LiDAR數(shù)據(jù)特征選擇與分類方法。首先對高光譜數(shù)據(jù)進(jìn)行降維以降低計算量,接著對歸一化植被指數(shù)(NDVI)圖、降維后的光譜影像以及LiDAR的高程圖進(jìn)行紋理提取,最后基于Adaboost算法對多種特征進(jìn)行選擇并實(shí)現(xiàn)分類。在甘肅省張掖市城區(qū)地物分類實(shí)驗(yàn)中,本文首先比較不同特征組合的性能,接著對所提方法產(chǎn)生的特征子集進(jìn)行性能評估,并與常用特征選擇方法進(jìn)行比較。
研究區(qū)位于甘肅省張掖市,實(shí)驗(yàn)數(shù)據(jù)包括:2008年6月獲得的高光譜數(shù)據(jù)(doi:10.3972/water973.0228.db)和LiDAR數(shù)據(jù)(doi:10.3972/water973.0223.db)。其中,高光譜數(shù)據(jù)是對OMIS-II圖像進(jìn)行分割得到大小為200×200的數(shù)據(jù),波段數(shù)為64維,波長從460nm到1100nm,光譜分辨率和空間分辨率分別為10nm和4m。LiDAR數(shù)據(jù)由LiteMapper 5600系統(tǒng)獲取,其采樣點(diǎn)數(shù)為每平方米3個。將該數(shù)據(jù)柵格化,并內(nèi)插到4m空間分辨率,獲得數(shù)字表面模型(Digital Surface Model,DSM)。在高光譜影像和DSM圖的配準(zhǔn)中,選取51個地面控制點(diǎn),均方根誤差為0.3434。高光譜偽彩色圖像和相應(yīng)的DSM影像如圖1、圖2所示。

圖1 OMIS數(shù)據(jù)偽彩色影像

圖2 DSM影像
圖3給出了所提方法的主要步驟。首先對高光譜影像與DSM高程圖進(jìn)行配準(zhǔn),提取NDVI植被指數(shù)并對高光譜數(shù)據(jù)實(shí)施降維;接著對NDVI圖、降維后的光譜影像以及高程圖進(jìn)行紋理提取;然后利用Adaboost算法在多種特征中進(jìn)行選擇,并基于該特征子集實(shí)現(xiàn)分類。接下來,本文主要對紋理提取和特征選擇步驟加以介紹。

圖3 所提方法流程框圖
基于形態(tài)學(xué)剖面(Morphological Profile,MP)的紋理提取方法能很好地反映影像空間特性,近年來出現(xiàn)了多種改進(jìn)方法[11-13]。
本文采用擴(kuò)展形態(tài)學(xué)剖面(Extended Morphological Profile,EMP)實(shí)現(xiàn)紋理提取。EMP由形態(tài)學(xué)開運(yùn)算和閉運(yùn)算組成。對圖像I,定義開、閉運(yùn)算[12]:
(1)
(2)

MP={CPn,…,I,…,OPn}
(3)
當(dāng)把MP應(yīng)用于m幅圖像時,EMP定義為m(2n+1)維矢量:
EMP={MP1,…,MPm}
(4)
Adaboost是一種基于在線分配思想的迭代算法[14]。其核心思想是針對同一個訓(xùn)練集訓(xùn)練多個弱分類器,然后將這些弱分類器集合起來,構(gòu)成一個強(qiáng)分類器。將Adaboost加以改進(jìn),可用于特征選擇。
給定L個訓(xùn)練樣本{(x1,y1),…,(xl,yl),…(xL,yL)},其中樣本點(diǎn)xl∈RD,對應(yīng)類別標(biāo)簽yl∈[1,…,C],C為類別數(shù)。基于Adaboost的特征選擇是對D個相同的弱分類器hd(1≤d≤D)進(jìn)行訓(xùn)練,其中,第d個分類器的輸入為樣本的第d維特征。設(shè)樣本的權(quán)值分布為P,T為迭代循環(huán)次數(shù)。具體步驟如下:
(1)初始化每個樣本的權(quán)重:P1(l)=1/L(1≤l≤L)。
(2)在第t次循環(huán)(1≤t≤T)中:


③更新樣本權(quán)重:
(5)
(3)輸出特征子集F={fd∶αd≥Thr,1≤d≤D},其中Thr為閾值。
通過甘肅省張掖市城區(qū)高光譜影像以及對應(yīng)DSM數(shù)據(jù)驗(yàn)證所提方法性能。選擇9類地物進(jìn)行研究,表1給出了具體的樣本描述。隨機(jī)選取10%、30%、50%的數(shù)據(jù)作為訓(xùn)練樣本,其余作為測試樣本。考慮到樣本選取的隨機(jī)性,實(shí)驗(yàn)結(jié)果為10次運(yùn)行平均值。采用PCA對高光譜數(shù)據(jù)降維,保留3個主成份分量,相應(yīng)特征值所占百分比為98%。EMP的結(jié)構(gòu)元素尺寸為5×5、9×9、13×13以及17×17。Adaboost采用K最近鄰算法作為分類器,迭代3次。

表1 實(shí)驗(yàn)數(shù)據(jù)描述
表2首先給出了不同特征組合方式對分類性能的影響。其中,S表示光譜,PCA表示經(jīng)PCA降維后的光譜特征,E為高程,T為紋理,N表示植被指數(shù);每種特征組合的特征維數(shù)在括號中給出。分類器均為Adaboost。性能指標(biāo)包括總體精度(OA)、平均精度(AA)以及Kappa系數(shù)。可以看到,多種特征的結(jié)合,特別是高程信息以及空間特征的引入,對分類精度的提高是顯著的。其中,PCA+E+T+N的性能最好,PCA+E+T、PCA+E的性能也優(yōu)于僅依靠光譜信息的PCA。在兩種光譜特征的分類性能比較中,PCA較差。這是由于PCA變換雖然簡單易實(shí)現(xiàn),但以方差最大化為準(zhǔn)則,在降維過程中損失了較多有用的類別信息。因此,有必要在后續(xù)研究中尋找更有效的降維方法。

表2 不同特征組合方式的分類性能比較
表3列出了利用Adaboost對PCA+E+T+N的特征組合進(jìn)行選擇得到的特征子集性能。其中Subset表示特征子集,Diff表示特征子集與全集的精度差,子集的規(guī)模在括號中給出。可以看到,特征子集的性能較全集有明顯地提高。表明特征組合中某些特征對分類的貢獻(xiàn)較大。因此,采用適當(dāng)?shù)奶卣鬟x擇方法生成子集,更有利于獲得較高的分類精度。

表3 所提方法在不同訓(xùn)練樣本數(shù)下產(chǎn)生特征子集的性能
圖4比較了Laplacian Score(LS)[15]、Fisher Score(FS)兩種特征選擇方法與所提方法的性能。LS采用5NN構(gòu)建相鄰矩陣。針對PCA+E+T+N特征組合,比較了3種方法產(chǎn)生的特征子集的OA、AA和Kappa系數(shù)。LS和FS在訓(xùn)練樣本取10%、30%和50%時子集規(guī)模與所提方法相當(dāng),分別為18、19、20。可以看到,所提方法選出的特征子集性能最好。圖5進(jìn)一步給出基于PCA+E+T+N特征全集以及經(jīng)Adaboost選擇后的特征子集的分類結(jié)果比較。

圖4 3種特征選擇方法的性能比較

圖5 基于特征全集與子集的分類結(jié)果比較
高光譜影像與LiDAR數(shù)據(jù)的結(jié)合體現(xiàn)了兩種數(shù)據(jù)的優(yōu)勢互補(bǔ),有利于多角度地描述地物特性。本文研究了基于兩種數(shù)據(jù)的地物分類問題,主要貢獻(xiàn)為:①考察了光譜、高程、紋理、植被指數(shù)等不同特征組合對分類性能的影響。實(shí)驗(yàn)表明,高程、紋理與NDVI信息的加入有利于地物的分類識別;②提出了一種基于Adaboost的多源數(shù)據(jù)特征選擇與分類方法,依據(jù)特征重要度評分,進(jìn)一步選出有利于分類的特征構(gòu)成子集。實(shí)驗(yàn)表明,所提方法產(chǎn)生的特征子集性能優(yōu)于特征全集,同時也優(yōu)于基于特征評分的Laplacian Score和Fisher Score兩種選擇方法。
致謝:感謝中國西部環(huán)境與生態(tài)科學(xué)數(shù)據(jù)中心提供OMIS高光譜影像和LiDAR數(shù)據(jù)。
參考文獻(xiàn):
[1] 浦瑞良,宮鵬.高光譜遙感及其應(yīng)用[M].北京:高等教育出版社,2000.
[2] 劉春,陳華云,吳杭彬.激光三維遙感的數(shù)據(jù)處理與特征提取[M].北京:科學(xué)出版社,2009.
[3] BROOK A,BEN-DORA E,RICHTER R.Fusion of hyperspectral images and LiDAR data for civil engineering structure monitoring[C].Proc.WHISPERS 2010,Reykjavik,Iceland:1-5,2010.
[4] NIEMANN K O,F(xiàn)RAZER G,LOOS R,et al.Integration of first and last return LiDAR with hyperspectral data to characterize forested environments[C].Proc.IGARSS 2007,Barcelona,Spain:1537-1540,2007.
[5] 李光輝,王成,習(xí)曉環(huán),等.機(jī)載LiDAR和高光譜數(shù)據(jù)融合提取冰川雪線[J].國土資源遙感,2013,25(3):79-84.
[6] ONOJEGHUO A O,BLACKBURN G A.Optimizing the use of hyperspectral and LiDAR data for mapping reedbed habitats[J].Remote Sensing of Environment,2011,115(8):2025-2034.
[7] MUNDF J T,STREUTKER D R,GLENN N F.Mapping sagebrush distribution using fusion of hyperspectral and LiDAR classifications[J].Photogrammetry and Remote Sensing,2006,72 (1):47-54.
[8] DALPONTE M,BRUZONE L,GIANELLE D.Fusion hyperspectral and LiDAR remote sensing data for classification of complex forest areas[J].IEEE Transaction on Geoscience and Remote Sensing,2008,46(5):1416-1427.
[9] PEDERGNANA M,MARPU P R,MURA M D,et al.Classification of remote sensing optical and LiDAR data using extended attribute profiles[J].IEEE Journal of Selected Topics in Signal Processing,2012,6(7):856-955.
[10] ROTTENSTEINER F,TRINDER J,CLOSE S,et al.Using the dempster-shafer method for fusion of LiDAR data and multispectral images for building detection[J].Information Fusion,2005,6 (4):283-300.
[11] PALMASON J A,BENEDIKTSSON J A,ARNASON K.Morphological transformations and feature extraction for urban data with high spectral and spatial resolution[C].Proc.IGARSS 2003,Toulouse,F(xiàn)rance,2003,(1):470-472.
[12] BENEDIKTSSON J A,PALMASON J A,SVEINSSON J R.Classification of hyperspectral data from urban areas based on extended morphological profiles[J].IEEE Transactions on Geoscience and Remote Sensing,2005,43(3):480-491.
[13] FAUVEL M,BENEDIKTSSON J,CHANUSSOT J,et al.Spectral and spatial classification of hyperspectral data using svms and morphological profiles[J].IEEE Transactions on Geoscience and Remote Sensing,2008,46(11):3804-3814.
[14] FREUND Y,SCHAPIRE R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.
[15] HE X,CAI D,NIYOGIL P.Laplacian score for feature selection[J].Advances in Neural Information Processing Systems,2006,18:507-514.