劉雅輝,張永彬,宋唐雷,李春雨,王興坤
(1.華北理工大學(xué)礦業(yè)工程學(xué)院,河北 唐山 063210;2..河北省第二測繪院,河北 石家莊 050030)
高光譜圖像廣泛應(yīng)用于目標(biāo)檢測[1]、土地利用制圖[2]、變化檢測[3]等領(lǐng)域,具有很強(qiáng)的地物識別能力和納米級光譜分辨率的分類能力。遙感影像分類結(jié)果是許多領(lǐng)域應(yīng)用的基礎(chǔ),因此以圖像分類為重點(diǎn)的遙感研究長期以來一直受到遙感界的關(guān)注。高光譜圖像除了提供豐富的光譜信息外,還存在信噪比低、數(shù)據(jù)冗余等問題。此外,在分類過程中可能會出現(xiàn)休斯現(xiàn)象(Hughes)即在訓(xùn)練樣本數(shù)量有限的情況下,分類精度隨著特征數(shù)量的增加而增加;但在達(dá)到某個(gè)極值后,分類精度隨著特征數(shù)量的增加而減少[4]。目前,普遍是通過數(shù)據(jù)降維的方法來避免Hughes現(xiàn)象的產(chǎn)生。
傳統(tǒng)的機(jī)器學(xué)習(xí)算法廣泛應(yīng)用于高光譜圖像分類,如多分類支持向量機(jī),構(gòu)建一個(gè)超平面作為決策面來實(shí)現(xiàn)分類。它的優(yōu)勢在于僅用有限的訓(xùn)練集,SVM就能表現(xiàn)出最好的泛化能力。如Wang等提出了一種結(jié)合光譜、空間和語義信息的高光譜圖像SVM分類方法,實(shí)驗(yàn)表明,即使只有非常有限的訓(xùn)練樣本也能得到很好的效果[5]。Dobrinic等人使用RF對Sentinel-1(S1)SAR和Sentinel-2(S2)時(shí)間序列數(shù)據(jù)進(jìn)行土地利用制圖,產(chǎn)生了最高的總體準(zhǔn)確度為91.78%[6]。主動(dòng)學(xué)習(xí)作為半監(jiān)督機(jī)器學(xué)習(xí)方法,在樣本集有限的情況下,通過迭代地將未標(biāo)記的樣本輸入到訓(xùn)練集中,可以獲得更好的高光譜分類結(jié)果[7]。其他機(jī)器學(xué)習(xí)算法如邏輯回歸、人工神經(jīng)網(wǎng)絡(luò)、核稀疏表示分類等,都取得了很好的分類效果[8]。
傳統(tǒng)的機(jī)器學(xué)習(xí)分類算法僅利用圖像的光譜信息進(jìn)行分類,而忽略了圖像中包含的豐富的空間信息。空間信息的加入使得遙感影像分類技術(shù)取得了較好的分類效果,特別是使分類器具有良好的抗噪性,可以有效地消除“椒鹽”噪聲[9]。傳統(tǒng)分類方法由于數(shù)據(jù)擬合能力和特征表示能力有限而導(dǎo)致分類精度不高,但深度學(xué)習(xí)方法的出現(xiàn)有效地改善了這種缺陷。如CNN可以通過提取圖像的高維信息以及空間信息,從而獲得良好的分類結(jié)果。如Yu等人提出了一種新的雙分支CNN架構(gòu),用于GF-5圖像的云分割。實(shí)驗(yàn)結(jié)果表明,與當(dāng)前主流的基于CNN的檢測網(wǎng)絡(luò)相比具有更高的F1分?jǐn)?shù)(0.94)和更少的參數(shù)[10]。Alou等人提出了一種新的3D2D卷積神經(jīng)網(wǎng)絡(luò)組合用于高光譜圖像分類。引入了一個(gè)3D快速學(xué)習(xí)塊,然后是一個(gè)2D卷積神經(jīng)網(wǎng)絡(luò)來提取光譜空間特征。實(shí)驗(yàn)使用了四個(gè)數(shù)據(jù)集,結(jié)果表明,與現(xiàn)有方法相比,所提出的方法在小型和大型訓(xùn)練數(shù)據(jù)上均取得了優(yōu)異的效果[11]。
因此,本文以高分五號高光譜影像為數(shù)據(jù)源,聯(lián)合主成分分析與卷積神經(jīng)網(wǎng)絡(luò)對河北省唐山市曹妃甸區(qū)進(jìn)行土地利用分類,并與隨機(jī)森林和支持向量機(jī)分類結(jié)果進(jìn)行對比。
研究區(qū)位于河北省曹妃甸區(qū)(38°54′N~39°26′N,118°59′E~118°54′E),地處環(huán)渤海中心地帶,南臨渤海,屬東部季風(fēng)區(qū)溫帶半濕潤地區(qū),大陸性季風(fēng)特征顯著,年均氣溫11℃,年降水量636毫米,四季分明,總面積為1943平方千米(圖1)。曹妃甸區(qū)水資源豐富,有大面積的水稻種植與養(yǎng)殖池,被譽(yù)為“中國生態(tài)稻米之鄉(xiāng)”“中國東方蝦之鄉(xiāng)”和“中國紅皮海蜇之鄉(xiāng)”等。

圖1 研究區(qū)地理位置與驗(yàn)證點(diǎn)分布
本研究以GF-5高光譜數(shù)據(jù)作為數(shù)據(jù)源。GF-5衛(wèi)星于2018年發(fā)射,在太陽同步軌道上運(yùn)行,平均軌道高度為705公里,傾角為98.2°,地面覆蓋寬度為60公里。GF-5衛(wèi)星上的可見光和短波紅外多光譜傳感器可以獲得光譜間隔為5nm(VNIR)和10nm(SWIR)的330個(gè)波段圖像,光譜范圍從0.4到2.5μm,空間分辨率為30m。在330個(gè)波段中,150個(gè)波段為可見光和近紅外(VNIR)部分,波長為0.39~1.03μm,180個(gè)波段為短波紅外(SWIR)部分,波長為1.0~2.5μm。本研究中采用的GF-5數(shù)據(jù)拍攝于2019年9月24日。該圖像沒有云層覆蓋,適合提取地表覆蓋信息。
高光譜影像具有超高的光譜分辨率,因而可以形成近似連續(xù)的地物光譜曲線,可以探測到更加精細(xì)的光譜信息以區(qū)分相似的地物類型,因此高光譜影像相較于多光譜和可見光影像在地物分類方面具有顯著的優(yōu)勢。結(jié)合輻射定標(biāo)、大氣校正和影像裁剪等數(shù)據(jù)預(yù)處理后的影像與Google Earth高清影像選取訓(xùn)練樣本和驗(yàn)證樣本,將研究區(qū)內(nèi)地物分為林地、草地、水田、旱田、人工表面、濕地、水體以及其他用地共八種(圖1)。
特征提取是指使用線性或非線性方程將原始高維特征變換到低維特征子空間的過程。本文使用PCA方法對GF-5號原始高光譜影像進(jìn)行特征提取。PCA是通過將相關(guān)特征以線性變換的形式變換成無相關(guān)性的特征,然后按照方差進(jìn)行排序。通常經(jīng)PCA變換后的前幾名主成分能含有原始影像的絕大部分特征信息。PCA可以通過以下步驟來實(shí)現(xiàn):(a)獲取原始影像數(shù)據(jù)集。(b)計(jì)算數(shù)據(jù)集每個(gè)維度的平均值。(c)求數(shù)據(jù)集的協(xié)方差矩陣。(d)計(jì)算協(xié)方差矩陣的特征向量和特征值。(e)保留前n維(本為中n為6)特征向量作為輸出主成分。
SVM算法作為一種機(jī)器學(xué)習(xí)算法,具有完善的理論性、稀疏性和魯棒性,使用少量樣本就可以得到較好的分類效果。它可以根據(jù)訓(xùn)練集中提供的標(biāo)記數(shù)據(jù),在兩個(gè)不同的類之間進(jìn)行泛化。實(shí)驗(yàn)中SVM算法采用徑向基函數(shù)(RBF)作為算法內(nèi)核,通過與RBF核的結(jié)合,SVM可以表達(dá)出非常復(fù)雜的分類界線,從而達(dá)成很好的分類效果。
隨機(jī)森林算法的原理是將Bagging集成學(xué)習(xí)思想與隨機(jī)子空間方法相結(jié)合。隨機(jī)森林(RF)分類器依賴于一組CART來預(yù)測和投票最有可能的類別。與其他機(jī)器學(xué)習(xí)技術(shù)相比,它的計(jì)算效率更高,處理時(shí)間更快。本實(shí)驗(yàn)中RF樹的顆數(shù)設(shè)置為300。RF算法核心過程主要是從訓(xùn)練集中抽取部分子集,然后構(gòu)造出CART決策樹,然后再其節(jié)點(diǎn)處采用有放回的抽取方式抽取特征變量并統(tǒng)計(jì)其包含的信息。
CNN具有稀疏交互、參數(shù)共享和等變映射的特點(diǎn),可以降低網(wǎng)絡(luò)的復(fù)雜度和訓(xùn)練參數(shù)大小,同時(shí)還具有很強(qiáng)的魯棒性和容錯(cuò)性,在圖像識別和影像分類任務(wù)中展現(xiàn)出了高效、準(zhǔn)確的優(yōu)勢[13,14]。
CNN模型中卷積層對特征提取起決定性作用。對于第i個(gè)卷積層,其輸出的特征圖yni生成過程可表示為:

式中,yni表示本次卷積的結(jié)果;wni表示第i個(gè)卷積層第n維卷積核的權(quán)重向量;bni表示第i個(gè)卷積層第n維卷積核的偏置項(xiàng);*表示卷積運(yùn)算;f表示非線性激活函數(shù)(ReLU)。
本文設(shè)計(jì)的CNN模型結(jié)構(gòu)由一個(gè)輸入層、兩個(gè)卷積層和兩個(gè)全連接層構(gòu)成(圖2)。首先是大小為9×9×d的輸入層,d為輸入的特征層數(shù)。然后經(jīng)過兩個(gè)卷積核大小為3×3卷積層,得到90個(gè)5×5大小的特征圖,然后經(jīng)過Dropout函數(shù)處理來避免模型過擬合,同時(shí)提高運(yùn)行效率。第四層和第五層為全連接層,分別含有315和30個(gè)神經(jīng)元,在兩層全連接層中間再次使用Dropout函數(shù)。最后經(jīng)過Softmax層,得到五類地物的概率并輸出分類結(jié)果。

圖2 CNN分類模型結(jié)構(gòu)圖
本實(shí)驗(yàn)使用主成分分析對高分五號原始高光譜影像330個(gè)波段進(jìn)行特征提取。結(jié)果顯示,主成分分析結(jié)果中前六個(gè)主成分包含了原始影像信息的98%以上。因此,選擇主成分分析的前六個(gè)主成分進(jìn)行后續(xù)的分類研究。
根據(jù)圖3可以看出,從總體上三種分類方法獲得的土地利用圖大體上呈現(xiàn)出一致性。從分類結(jié)果可以看出,曹妃甸區(qū)分布最廣泛的地物主要為水體、人工表面和水田。其中水體主要是以養(yǎng)殖池為主,養(yǎng)殖池主要分布在西南部和東部沿海地區(qū)。水田主要分布在北部以及東北部內(nèi)陸區(qū)域。人工表面主要分布在西北部以及南部的曹妃甸港。

圖3 三種分類方法分類結(jié)果圖
在SVM和RF分類結(jié)果中存在許多“椒鹽”噪聲,這是由于這兩種方法為基于像素的分類方法且不能很好的利用影像的空間信息導(dǎo)致的。在CNN分類結(jié)果中由于CNN的分類方法可以有效地提取影像的空譜特征從而很好地抑制了“椒鹽現(xiàn)象”的產(chǎn)生。
從三種分類模型的混淆矩陣表(表1-3)中可以看出基于SVM分類方法、RF分類方法以及CNN分類方法總體分類精度分別為78.67%、79.67%和87.67%,Kappa系數(shù)分別為0.72、0.74、0.84。從總體精度來看三種分類方法均高于75%。基于CNN的分類方法總體分類精度相較于基于SVM和RF分類方法的總體精度分別提高了9.00%和8.00%,說明基于CNN的分類方法的分類效果要顯著優(yōu)于基于SVM和RF的分類方法。

表1 基于SVM的分類結(jié)果混淆矩陣

表2 基于RF的分類結(jié)果混淆矩陣

表3 基于CNN的分類結(jié)果混淆矩陣
從各類地物的生產(chǎn)者精度和用戶精度來看,基于RF和SVM的分類結(jié)果的草地、其他用地和林地的用戶精度以及林地和濕地的生產(chǎn)者精度都比較低,這是由于RF和SVM分類方法分類時(shí)僅利用地物的光譜特征,對于易混淆的地物區(qū)分效果較差。且研究區(qū)內(nèi)其他用地主要為未建設(shè)完成的建設(shè)用地,部分區(qū)域分布著非常稀疏的雜草,容易與草地混淆。由于CNN可以提取到更高維的特征,因此在基于CNN的分類結(jié)果中草地和其他用地的用戶精度有了明顯的提升,取得了較好的結(jié)果。
本文基于高分五號高光譜影像,采用主成分分析的方法進(jìn)行特征提取,采用基于CNN的分類方法進(jìn)行分類,并與基于RF和SVM的分類方法作為對比。
基于主成分分析的特征提取方法可以有效地提取高光譜影像的特征,僅需前幾個(gè)主成分就可以包含高光譜影像的絕大部分信息。將主成分分析方法與CNN分類方法相結(jié)合可以取得很好的分類效果。
基于RF和SVM的分類方法對草地、林地以及其他用地等的分類精度較低,這是由于其他用地主要為未建設(shè)完成的建設(shè)用地,易與人工表面混淆,且部分區(qū)域分布著稀疏的雜草,容易與草地混淆。基于CNN的分類方法可以提取到高維的影像特征,從而有效的改善這種情況,受“同譜異物”與“同物異譜”的影響最小。
由于三種方法都是基于像素的分類方法,因此會不可避免地產(chǎn)生“椒鹽”噪聲,在RF和SVM的分類結(jié)果中,“椒鹽”噪聲比較明顯,而基于CNN的分類方法可有效地提取圖像的空譜特征從而抑制“椒鹽現(xiàn)象”的產(chǎn)生,并且CNN分類精度更高,分類效果也更好。這表明基于CNN的深度學(xué)習(xí)分類方法在高光譜影像土地利用制圖方面具有顯著的優(yōu)勢。