楊思睿, 薛朝輝, 張玲, 蘇紅軍, 周紹光
(1.河海大學(xué)地球科學(xué)與工程學(xué)院,南京 211100;2.江蘇海事職業(yè)技術(shù)學(xué)院船舶與海洋工程學(xué)院,南京 211170)
不同于一般遙感技術(shù)手段,高光譜遙感可獲取地物的上百個(gè)波段,波段間隔通常小于10 nm,且所有波段可形成一條連續(xù)的光譜曲線,覆蓋可見(jiàn)光至熱紅外的全部電磁輻射范圍,更精細(xì)地描述地物波譜特征[1]。因此,高光譜遙感能大大增強(qiáng)對(duì)地物的區(qū)分能力,提高對(duì)地觀測(cè)的效果,應(yīng)用領(lǐng)域也越來(lái)越廣。然而,高光譜遙感影像分類也面臨著新的難題:①數(shù)據(jù)高維;②訓(xùn)練樣本不足;③許多波段間有較大相關(guān)性;④空間同質(zhì)與異質(zhì)性明顯;⑤數(shù)據(jù)量大,計(jì)算復(fù)雜度高;⑥普遍存在同物異譜和異物同譜現(xiàn)象等[2]。這給遙感分類方法的有效性、穩(wěn)定性和計(jì)算效率提出了新要求,同時(shí)表明利用單一數(shù)據(jù)源進(jìn)行分類是不夠的。
激光雷達(dá)測(cè)量(light detection and ranging,LiDAR)能快速獲取地表三維數(shù)據(jù),生成數(shù)字高程模型,且抗干擾能力、穿透能力和時(shí)效性較強(qiáng),目前在地球空間信息科學(xué)領(lǐng)域得到了廣泛應(yīng)用[3-4]。針對(duì)高光譜影像(Hyperspectral image,HSI)無(wú)法區(qū)分物質(zhì)組分相同的對(duì)象,而激光雷達(dá)影像不能區(qū)分高度相近地物的不足,將HSI和LiDAR數(shù)據(jù)結(jié)合起來(lái),可以發(fā)揮其各自優(yōu)勢(shì),彌補(bǔ)不足,從而更好地應(yīng)用于地物識(shí)別。
HSI和LiDAR數(shù)據(jù)的融合研究主要集中在3個(gè)方面:①如何生成有效的特征;②如何確定有效的融合方法;③如何借助機(jī)器學(xué)習(xí)進(jìn)行分類。在特征生成方面,Pedergnana等[5]利用擴(kuò)展屬性剖面進(jìn)行特征提取,將LiDAR數(shù)據(jù)分別與多光譜和高光譜影像融合,并應(yīng)用于意大利特蘭托的土地覆蓋分類;Ni等[6]采用一種結(jié)合HSI與LiDAR數(shù)據(jù)的邊緣約束馬爾可夫隨機(jī)場(chǎng)對(duì)城市地區(qū)土地覆蓋進(jìn)行分類,該方法具有邊緣約束權(quán)重系數(shù)保護(hù)類邊界和控制平滑度的優(yōu)點(diǎn)。在特征融合方面,Zhang等[7]提出了基于最大分歧原則的集成多核主動(dòng)學(xué)習(xí)框架和基于復(fù)合核的特征提取方法,對(duì)多源數(shù)據(jù)中的不同特征進(jìn)行分類;Gu等[8]提出了一種新的集成多光譜影像和LiDAR數(shù)據(jù)的多核模型,把不同尺度上每個(gè)特征樣本的相似性用線性組合集成,得到異構(gòu)最佳組合內(nèi)核;Liao等[9]提出了一種基于廣義圖的特征融合方法,融合圖的邊緣通過(guò)疊加特征點(diǎn)之間的距離定權(quán),能更好地建立與連接點(diǎn)之間的實(shí)際相似性,有助于提高分類精度。在分類器設(shè)計(jì)方面,Bigdeli等[10]提出了能夠克服維數(shù)困難的基于特征分組的融合高光譜和LiDAR數(shù)據(jù)的多模糊分類器系統(tǒng),隨后又提出了一個(gè)基于決策模板的模糊多分類器系統(tǒng)[11],用于高光譜和LiDAR數(shù)據(jù)的融合,實(shí)驗(yàn)發(fā)現(xiàn)對(duì)有更多復(fù)雜關(guān)系的混合信息來(lái)說(shuō),模糊分類結(jié)果比常規(guī)分類方法更令人滿意,同時(shí)多分類器系統(tǒng)在融合領(lǐng)域比限制更多的單分類器表現(xiàn)出更好的性能;Castrodad等[12]提出了一種稀疏建模算法用于數(shù)據(jù)源的分離和分類,通過(guò)非監(jiān)督算法學(xué)習(xí)字典,該方法還能有效減輕部分遮擋所造成的海拔差異和陰影影響;Zhang等[13]提出了一個(gè)自適應(yīng)局部加權(quán)多源聯(lián)合稀疏表示的分類模型,基于多任務(wù)聯(lián)合稀疏表示的框架,解決了均勻權(quán)重和不穩(wěn)定系數(shù)估計(jì)等問(wèn)題。由此可見(jiàn),HSI與LiDAR 融合與分類研究越來(lái)越豐富和成熟,并逐漸應(yīng)用于各個(gè)領(lǐng)域,如樹(shù)種識(shí)別[14]、景觀視覺(jué)[15]和土地利用分類[16]等。李光輝等[17]以西藏那曲縣境內(nèi)的“中習(xí)一號(hào)”冰川為研究區(qū),發(fā)現(xiàn)融合機(jī)載LiDAR和HIS這2種數(shù)據(jù)的優(yōu)勢(shì),能更方便地提取出冰川雪線,更好地顯示雪線高度,從而應(yīng)用于冰川融化災(zāi)害的應(yīng)急反應(yīng)監(jiān)測(cè)。
本研究采用2012年獲取的黑河中游張掖綠洲農(nóng)業(yè)區(qū)CASI/SASI航空高光譜遙感影像和LiDAR數(shù)據(jù)作為研究數(shù)據(jù)源,采用多種方法對(duì)二者分別進(jìn)行特征提取后進(jìn)行融合分類,探索出分類精度最好的方法。
黑河流域發(fā)源于甘肅省南部的祁連山區(qū),北至中蒙邊境,東與石羊河流域相連,西與疏勒河流域毗鄰[18]。黑河中游地處河西走廊平原,由多個(gè)規(guī)模不等的人工綠洲組成,自東向西依次為山丹綠洲、張掖綠洲和酒泉綠洲,都是重要的農(nóng)業(yè)區(qū)。本文研究區(qū)黑河中游張掖綠洲農(nóng)業(yè)區(qū)位于E100.1°~100.9°和N38.5°~39.4°之間(圖1),農(nóng)業(yè)資源豐富,盛產(chǎn)小麥、玉米、水稻、油菜和胡麻等多種農(nóng)作物,是國(guó)家重要的商品糧基地,屬于典型的農(nóng)牧綠洲。區(qū)內(nèi)的灌溉、墾殖和放牧使地面景觀具有強(qiáng)烈的人為干擾特征,主要土地利用類型包括耕地、林地(喬木、灌木、疏林、園林等)、草地、水體、建設(shè)用地(城鎮(zhèn)用地、農(nóng)村居民點(diǎn)等)和未利用地(沙地、戈壁、裸巖石礫地、裸土、鹽堿地等)[19]。

圖1 研究區(qū)地理位置[20]
高光譜遙感影像數(shù)據(jù)(以下簡(jiǎn)稱“CASI/SASI數(shù)據(jù)”)由黑河計(jì)劃數(shù)據(jù)管理中心(http: //westdc.westgis.ac.cn/hiwater)提供,獲取于2012年6月9日,是“黑河生態(tài)水文遙感試驗(yàn):可見(jiàn)光近紅外高光譜航空遙感”試驗(yàn)項(xiàng)目的重要產(chǎn)品[21]。該數(shù)據(jù)已經(jīng)進(jìn)行了幾何定標(biāo)、輻射定標(biāo)和大氣校正,CASI和SASI傳感器的光譜范圍分別為0.38~1.05 μm和0.95~2.45 μm,波段數(shù)目分別為48和101,空間分辨率分別為1.0 m和2.4 m。利用核心觀測(cè)區(qū)122 642(CASI)和122 910(SASI)航帶,經(jīng)過(guò)裁剪獲得研究區(qū)數(shù)據(jù),CASI B40(R),B20(G),B10(B)假彩色合成影像如圖2 (a)所示,其空間大小為667像素×417像素。圖2 (b)為研究區(qū)地面參考數(shù)據(jù)。

(a)研究區(qū)高光譜遙感影像 (b)地面參考數(shù)據(jù)
在研究區(qū)土地覆蓋類型數(shù)據(jù)集的基礎(chǔ)上通過(guò)人工選取得到了地面參考數(shù)據(jù),主要包含玉米、韭菜、菜花、菜椒、土豆、青筍、西瓜和建設(shè)用地等8種地表覆蓋類型。同步拍攝的地類實(shí)地照片如圖3所示。對(duì)該數(shù)據(jù)分類的特點(diǎn)和難點(diǎn)在于精細(xì)的農(nóng)作物區(qū)分和不均衡地類的區(qū)分。

(a) 玉米 (b) 韭菜 (c) 菜花 (d) 菜椒

(e) 土豆 (f) 青筍 (g) 西瓜
LiDAR數(shù)據(jù)也由黑河計(jì)劃數(shù)據(jù)管理中心提供(圖4)。

圖4 研究區(qū)LiDAR數(shù)據(jù)
該數(shù)據(jù)獲取于2012年7月19日,在黑河中游核心觀測(cè)區(qū)域,先利用Leica公司ALS70的運(yùn)12飛機(jī)開(kāi)展LiDAR航空遙感飛行試驗(yàn)獲取原始數(shù)據(jù),再通過(guò)參數(shù)檢校、點(diǎn)云自動(dòng)分類和人工編輯等步驟,最終形成數(shù)字表面模型(digital surface model,DSM)數(shù)據(jù)產(chǎn)品。
本文提出的方法主要包括3個(gè)重要環(huán)節(jié):①對(duì)HSI進(jìn)行光譜維特征提取;②基于擴(kuò)展多屬性剖面(extended multi- attribute profile,EMAP)和基于擴(kuò)展屬性剖面(extended attribute profile,EAP)進(jìn)行空間維特征提取;③基于稀疏多項(xiàng)式邏輯回歸分類器(sparse multinomial logistic regression,SMLR)的分類。將LiDAR生成的DSM和航拍HSI作為初始的實(shí)驗(yàn)影像,首先對(duì)HSI做主成分分析(principal component analysis,PCA),實(shí)現(xiàn)影像降維;然后,采用EMAP/EAP對(duì)HSI和LiDAR數(shù)據(jù)進(jìn)行空間維特征提取;最后,將光譜信息、空間信息及高程信息進(jìn)行融合。根據(jù)實(shí)地測(cè)量數(shù)據(jù),選擇訓(xùn)練樣本,采用SMLR分類器分別對(duì)不同融合影像進(jìn)行分類。選取總體精度(overall accuracy,OA)、平均精度(average accuracy,AA)、單個(gè)類的精度(class-specific accuracy,CA)和Kappa 系數(shù)評(píng)價(jià)分類結(jié)果。技術(shù)流程如圖5所示。

圖5 技術(shù)流程路線
利用PCA對(duì)高光譜數(shù)據(jù)進(jìn)行特征提取,保留信息量超過(guò)99.4%的前7個(gè)主分量。采用EMAP對(duì)降維后的HSI和LiDAR數(shù)據(jù)提取空間特征。利用面積(50, 50, …, 500),轉(zhuǎn)動(dòng)慣量(0.1, 0.1, …, 1),標(biāo)準(zhǔn)偏差(2.5, 2.5, …, 25),邊界框的對(duì)角線長(zhǎng)度(50, 50, …, 500)這4種屬性,得到588維的EMAP。需特別指出的是,LiDAR數(shù)據(jù)因只包含一維的DSM高程信息,因此相應(yīng)得到EAP特征。
利用簡(jiǎn)單的堆疊特征級(jí)融合,形成一個(gè)擴(kuò)展的特征向量。特征級(jí)融合注重特征提取之后的融合,是將特征進(jìn)行有意義的組合,從而獲得對(duì)特征屬性的判斷具有更高的可信性和準(zhǔn)確性[15]。采用SMLR分類器進(jìn)行分類實(shí)驗(yàn),按照分類器輸入的不同,又分為線性分類器(linear)和徑向基函數(shù)(radial basis function,RBF)-馬爾可夫隨機(jī)場(chǎng)(markov random field,MRF)分類器。linear形式為線性輸入,即直接輸入特征;RBF-MRF形式是先把特征用RBF映射到核空間進(jìn)行分類,再用一種有效的圖割(graph cuts)模型MRF進(jìn)行分類后處理,以消除分類結(jié)果中的孤立點(diǎn)。在給定訓(xùn)練樣本的條件下,對(duì)不同特征組合進(jìn)行分類,對(duì)比各自的分類精度。
實(shí)驗(yàn)中,Xh為原始HSI特征、EMAP(Xh)為在HSI上提取的EMAP特征、EAP(XL)為在LiDAR DSM數(shù)據(jù)上獲取的EAP特征。將這些特征組合,分別得到Xh+EMAP(Xh),Xh+EAP(XL),EAP(XL)+EMAP(Xh)和Xh+EAP(XL)+EMAP(Xh)這4種不同的組合。另外,設(shè)定訓(xùn)練樣本為20個(gè)/類。
對(duì)不同單一類型特征Xh,EMAP(Xh)和EAP(XL)分別進(jìn)行分類。2種形式分類器相對(duì)應(yīng)的分類結(jié)果如圖6所示,各項(xiàng)分類精度如表1所示。

(a) Xh(linear) (b) EMAP(Xh)(linear) (c) EAP(XL)(linear)

(d) Xh(RBF-MRF) (e) EMAP(Xh)(RBF-MRF) (f) EAP(XL)(RBF-MRF)

表1 基于2種形式的SMLR對(duì)不同單一特征EMAP和EAP分類的精度與Kappa系數(shù)
從圖6和表1中可以看出,包含在HSI中的光譜信息對(duì)分類最有效,而在LiDAR DSM上獲取的EAP特征并不足以將許多類別區(qū)分,即便在表1中精度很高,但分類并不徹底,這是因?yàn)長(zhǎng)iDAR只考慮了高度信息。EMAP的分類效果大體上也沒(méi)有原始光譜信息的好,主要也是因?yàn)樗鼈兪腔趯?duì)象的空間特征,而研究的問(wèn)題只是基于空間屬性難以區(qū)分,光譜屬性也是非常重要的。因此,如果可以同時(shí)考慮多特征,可能會(huì)在較大程度上提高分類的準(zhǔn)確性。
對(duì)多源特征組合Xh+EMAP(Xh),Xh+EAP(XL),EAP(XL)+EMAP(Xh)和Xh+EAP(XL)+EMAP(Xh)分別進(jìn)行分類。2種形式分類器相對(duì)應(yīng)的分類結(jié)果如圖7所示,各項(xiàng)分類精度如表2所示。

圖7 基于EMAP和EAP的多源特征組合的分類結(jié)果

表2 基于2種形式的SMLR對(duì)多源特征組合(EMAP和EAP)分類的精度與Kappa系數(shù)
從圖7和表2中發(fā)現(xiàn),組合特征的分類結(jié)果比單一特征的分類結(jié)果有明顯改善,充分體現(xiàn)了多源特征融合的有效性,特別是在linear形式的SMLR分類器下,融合特征對(duì)分類效果的提升非常顯著。在多源特征中,Xh+EMAP(Xh)組合得到了最高的分類精度,與其各自單一特征分類效果較為出色有關(guān);X+EAP(XL)h+EMAP(Xh)組合次之,分類精度基本相當(dāng),但分類效果更為徹底,有效展現(xiàn)了3種特征組合方式的優(yōu)勢(shì)。此外,結(jié)合表1—2的結(jié)果不難發(fā)現(xiàn),通過(guò)RBF-MRF形式得到的分類結(jié)果優(yōu)于linear形式的分類結(jié)果,表明具有RBF核空間映射和MRF分類后處理的分類形式比簡(jiǎn)單的線性分類形式有效。
進(jìn)一步就每類訓(xùn)練樣本的個(gè)數(shù)與多源特征組合的分類結(jié)果精度關(guān)系展開(kāi)實(shí)驗(yàn)。不同形式的特征組合分類結(jié)果如圖8所示。

(a) linear (b) RBF-MRF
從圖8中可以發(fā)現(xiàn),不論是基于實(shí)驗(yàn)中的哪種特征組合及分類器,在一定范圍內(nèi),訓(xùn)練樣本個(gè)數(shù)的增加,分類結(jié)果的總體精度均呈波動(dòng)上升趨勢(shì)。但由于特征組合的不同和分類器的不同,增加的幅度各有不同。
本文提出了一種高光譜和激光雷達(dá)數(shù)據(jù)融合和分類的有效策略。主要結(jié)論如下:
1)該方法有效地集成了多種類型的特征提取,使不同的類型特征可以有效地被集成利用。研究中考慮了幾種類型來(lái)自原始高光譜影像的光譜空間特征和LiDAR的DSM,包括了完整的原始光譜信息、不同類型的基于EMAP的高光譜特征和基于EAP的LiDAR特征。實(shí)驗(yàn)結(jié)果表明LiDAR信息確實(shí)能起到有效補(bǔ)充的作用,提高分類精度。
2)研究發(fā)現(xiàn)Xh+EMAP(Xh)組合得到了最高的分類精度,而Xh+EAP(XL)+EMAP(Xh)組合同樣也得到了很好的分類精度,并能隨著訓(xùn)練樣本個(gè)數(shù)的增加,可以更有效地提高分類精度。
下一步將繼續(xù)圍繞高光譜與LiDAR數(shù)據(jù)融合分類進(jìn)行研究,注意將流形學(xué)習(xí)方法引入到光譜維特征提取,將集成學(xué)習(xí)方法引入對(duì)二者融合特征的分類中,進(jìn)一步研究提高分類精度的有效框架。