樊雪, 劉清旺, 譚炳香
(中國林業科學研究院資源信息研究所,北京 100091)
基于機載PHI高光譜數據的森林優勢樹種分類研究
樊雪, 劉清旺, 譚炳香
(中國林業科學研究院資源信息研究所,北京 100091)
近年來,高光譜遙感在林業方面的應用越來越廣泛,尤其在分類方面居多。但機載PHI高光譜數據通常用于農業病蟲害監測、海洋懸浮物顆粒監測等,在林業方面的應用較少。以湖北省荊門市東寶區為研究區,以機載PHI高光譜遙感數據為數據源,對森林優勢樹種進行了分類研究。首先采用獨立成分分析法(independent component analysis,ICA)對裁剪后的PHI數據進行降噪,并利用自適應波段選擇法(adaptive band selection,ABS)進行降維,再采用歸一化植被指數(normalized difference vegetation index,NDVI)區分林地與非林地,最后利用支持向量機法(support vector machine,SVM)進行森林優勢樹種監督分類。研究結果表明,分類精度可達80.70%,Kappa系數達到0.75; 分塊處理PHI數據以及采用NDVI區分林地與非林地,對于減弱“同物異譜”和“異物同譜”現象有較好的作用; ABS與SVM相結合的分類方法,較適用于PHI數據在樹種識別方面的應用探索,具有重要意義。
高光譜數據; PHI; 降維; 波段選擇法; SVM
高光譜遙感具有光譜分辨率高、波段范圍窄、圖譜合一、連續成像等特點,能夠區分出地物光譜的細微差別,探測到其他寬波段遙感無法探測的信息。因此,高光譜遙感在生態、大氣和海洋等諸多應用領域具有很大優勢。近年來,高光譜遙感在林業方面的一個重要應用是對森林樹種類型進行識別。森林樹種類型識別的主要目的是提取樹種的專題信息,為劃分森林類型、繪制林相圖和清查森林資源提供基礎和依據[1]。目前,國內外利用高光譜遙感進行樹種識別主要是從葉片、冠層和高光譜影像3個研究尺度開展。基于葉片的樹種識別主要是對葉片反射率及其變換形式運用統計方法、遺傳算法等進行分析,以樹種識別的可行性分析與識別潛力為主要研究內容; 基于冠層的樹種識別主要運用光譜信息散度法、光譜角填圖法等基于光譜信息的遙感圖像分類方法,并利用地物光譜儀獲取的林分冠層反射率曲線,進行樹種分類[2-3]; 基于高光譜影像的樹種識別主要通過對影像進行去噪降維等預處理后,運用監督或非監督分類的方法進行樹種識別。
國外已有很多學者對高光譜樹種識別進行了研究。Gong等[4]利用ANN分類法對光譜數據進行判別,區分出1種闊葉樹種和6種針葉樹種,分類精度大于90%; Martin等[5]利用AVIRIS高光譜數據與樹種葉片化學成分之間的關系,鑒別出11種樹種類型,可有效進行樹種分類; Petropoulos等[6]分別采用支持向量機和基于對象的分類方法,對Hyperion高光譜影像進行土地覆蓋類型分類,雖2種分類效果均較好,但基于對象的分類方法精度更高。國內也有越來越多的學者進行森林樹種識別探究。童慶禧等[7]利用光譜波形匹配算法對MAIS高光譜影像進行植被類型識別,獲得了潘陽湖典型濕地的植被分類圖,對高光譜的樹種識別提供了實用依據; 王圓圓等[8]采用隨機子空間法對OMIS高光譜遙感數據進行識別,并利用遺傳算法來提高分類精度; 劉秀英等[9]使用地物光譜儀測得的光譜數據,采用逐步判別分析方法、特征波段選擇等方法識別出4種樹種。綜上所述,國內外利用高光譜數據進行樹種識別的研究已取得階段性的進展,從研究方法看,主要基于不同樹種具有不同光譜特征的原理,通過特征波段的合理選擇,或者通過波段變換對高光譜數據進行降維來識別樹種。
高光譜影像波段數多,信息量大,為地物的精細識別提供優勢的同時,也帶來了數據量多,波段間相關性大,處理精度和效率下降的問題。本文以湖北省荊門市東寶區為研究區,利用PHI高光譜數據,運用自適應波段選擇法(adaptive band selection,ABS)與支持向量機法(support vector machine,SVM)相結合的方法,以及分層分類的策略進行樹種識別,有利于機載PHI高光譜數據分類精度的進一步提高。
1.1 研究區
研究區位于湖北省荊門市東寶區(圖1)。

圖1 研究區位置
該區地理位置為N30°58′~N31°07′,E112°01′~E112°13′,平均海拔為222 m,地勢西北高東南低,地形復雜多樣,具有明顯的亞熱帶季風氣候,年平均氣溫為16.1℃,年均降水量為949.4 mm。研究區內包含城市住宅區與森林。其中有森林覆蓋的地方林木茂密,樹種以馬尾松和栓皮櫟為主。
1.2 數據源獲取
2014年12月4日,運-5小型多用途飛機搭載PHI航空高光譜測量系統在湖北省荊門市東寶區上空進行數據采集。數據獲取當天天氣晴朗無(少)云,航高為700 m,飛行地速為180 km/h,航線數目為11條,航線長度為2 335 m,總長度為25.685 km。獲取的高光譜影像數據具體參數見表1。

表1 PHI高光譜影像參數
高光譜數據假彩色圖像見圖2,采用UTM-49帶投影。

(a) 假彩色合成圖像 (b) 局部放大圖
實地數據調查時間為2014年12月。調查樣地數64個,調查因子包括樣地中心點經緯度、樹種類型、樹高、胸徑、東西冠幅、南北冠幅、郁閉度和葉面積指數等。經調查,研究區內的優勢樹種為馬尾松、栓皮櫟和柏樹,此外,有少量的廣玉蘭和楊樹等樹種類型。樣地的主要樹種(組)類型見表2。

表2 主要樹種(組)類型樣地數
獲取的PHI數據已經做過輻射定標和幾何糾正,還需要進行影像拼接與裁剪、噪聲波段去除、大氣校正和數據降噪等預處理。
2.1 噪聲波段去除
研究區PHI數據包括117個可見光波段(416~758 nm)和93個近紅外波段(761~1 033 nm)。經分析,416~525 nm和850~1 033 nm 2組數據信息主要為噪聲,因此去除該波段范圍的數據。去除噪聲波段后,數據共剩余109個波段,其中79個可見光波段(528~758 nm),30個近紅外波段(761~847 nm)。
2.2 大氣校正
大氣校正的目的是消除成像時光照和大氣對地物反射率的影響,反演地物本身的真實反射率,從而有利于地表特征的提取。本研究中數據條帶窄且每條帶上成像質量略有不同,條帶間共用同一套校正參數會帶來明顯的“同物異譜”現象,因此根據數據的特點,選用黑暗像元法分別開展大氣校正。校正結果見圖3。

(a) 校正前 (b) 校正后
2.3 數據降噪
降噪的目的主要是為了突出圖像的特征信息,提高圖像的信噪比。本文采用獨立成分分析法(independent component analysis,ICA)進行數據降噪。ICA是一種自適應變換域方法,基于信號的高階統計量,研究信號間的獨立性。ICA不同于其他方法之處在于,求得的成分為非高斯分布,成分之間是統計獨立的,這樣不僅可以把獨立的噪聲數據從影像中去除,并且可以保持原有圖像特征不被改變和破壞。降噪前后的影像及光譜曲線見圖4—圖6。

(a) 馬尾松 (b) 栓皮櫟 (c) 柏樹

(a) 馬尾松 (b) 栓皮櫟 (c) 柏樹

(a) 馬尾松 (b) 栓皮櫟 (c) 柏樹
由圖4—圖6可以看出,降噪后的影像質量明顯優于降噪前,樹種的光譜曲線由于濾除了大量噪聲信息而更加平滑,減少了噪聲干擾信息。
本研究技術路線見圖7。

圖7 技術路線
3.1 ABS波段選擇
ABS是基于最優索引因子組合波段選擇法的降維方法。該方法充分考慮了高光譜圖像的空間和譜間相關性,通過計算各個波段的指數,選擇信息量大且與其他波段相關性小的波段; 通過計算波段指數,選擇波段指數比設定閾值大的波段或者選擇波段指數排在前n個的所有波段,從而達到波段降維的目的[10]。ABS依據的原則是盡量選擇信息量大且與其他波段相關性小的波段。根據上述原則構造的數學模型為:
(1)
(2)
(3)
式中:Indexi是第i個波段的波段指數;Ri-1,i和Ri,i+1分別是第i個波段與前一個和后一個波段的相關系數;σi為第i個波段的標準差; E{}為數學期望;M和N分別是圖像的行、列像元數;fi(x,y)是第i個波段x行y列的像元值;μi是第i個波段的像元平均值。運用該方法,選擇波段指數較大的波段用于后續運算。
3.2 非林地去除
由于研究區除林地外,還有大量的非林地區域,有些地物易與各樹種混淆,如栓皮櫟與灌草,楊樹與農田等。如果直接基于影像對每一類別逐一選取訓練樣本分類,則會大大增加分類工作量,且仍有一些類別區分度較差。因此,消除非林地干擾是本研究一個急需解決的重要問題。盡管光譜特征中有些地類容易混淆,但是利用非林地類別的植被指數(如歸一化植被指數(normalized difference vegetation index,NDVI))普遍較低這一信息,可以很好地將非林地區域與林地區域劃分出來。在本研究中,經過反復試錯,當NDVI<0.13時,像元基本為非林地,將其設為閾值進行林地識別。
3.2.1 落葉闊葉樹種的提取
對于落葉闊葉樹種,如栓皮櫟類,其NDVI值很低,與灌木的NDVI值近似,若僅利用NDVI閾值判別,往往直接就被劃分為非林地類而無法提取出有效信息。研究發現,大部分落葉闊葉林NDVI>0.1,灌木NDVI<0.1,本研究采用如下策略提取栓皮櫟類: ①在非林地類中,對NDVI設置閾值建立掩模圖層,提取主要包含栓皮櫟類及少量灌木的b1圖層,判別依據為: 0.1 3.2.2 林地層樹種訓練樣本選取 結合樣地調查數據,研究區的地物類型主要有常綠樹種(馬尾松、柏樹和廣玉蘭)、落葉樹種(栓皮櫟、楊樹和構樹)、林地陰影和非林地(灌草、農田、道路、房屋和水體等)。除栓皮櫟樹類外,其余樹種樣本均在林地層選取。 3.3 SVM分類 SVM的基本思想是尋找一個分類超平面,使得訓練樣本中的2類樣本能被分開,并且距離該平面盡可能地遠[11]。SVM具有算法簡單、抗噪性強、學習樣本小、效率高與推廣性好等優點,能不受傳統方法大樣本要求的約束,最終決策函數只由少數的支持向量確定,可以“剔除”大量冗余樣本,解決高光譜維數災難問題,加快運算效率[12]。 4.1 波段選擇 采用ABS最終選擇波段指數較大的前36個波段,其中7個綠光波段(528.4~557.9 nm),4個黃光波段(560.9~587.5 nm),6個橙光波段(596.3~617.0 nm),10個紅光波段(622.9~758.8 nm),9個近紅外波段(761.7~794.2 nm)。選擇的具體波段見表3。 表3 波段指數及其對應的中心波長 4.2 SVM分類結果 利用機載PHI高光譜數據,采用ABS對數據進行去噪降維處理,并運用SVM,提取訓練樣本對研究區進行分層分類,分類結果見圖8。 圖8 研究區樹種組分類結果 將優勢樹種馬尾松、栓皮櫟、柏樹以及其他樹和非林地分類結果與原始影像對比,各類別的分布區域和范圍比較準確,說明ABS與SVM分類法結合進行樹種識別是可靠的。 選取野外調查的18個馬尾松純林樣地、20個栓皮櫟純林樣地(除去研究區外的1個純林樣地)、5個柏樹純林樣地、2個其他樹樣地和12個非林地驗證樣本,共計57個驗證樣本,對分類結果進行精度驗證。不同地物分類精度驗證結果如表4。 表4 分類精度驗證 比較各樹種的分類精度以及錯分、漏分誤差可以看出,馬尾松和栓皮櫟分布比較集中,光譜曲線比較容易區分,錯分比較少; 而柏樹分布較少,且光譜曲線與未識別的“其他樹”類似,漏分誤差比較大,達到40%,降低了識別精度; 受地面調查數據的限制,一些樹種的參考樣本相對較少或缺失,如部分研究區內落葉闊葉樹種眾多。高光譜影像上不同條帶上光譜差異較大,沒有樣本數據很難確定其樹種類型,難以單獨設類,因此分類后統一歸并為其他樹類,這部分數據無法準確地參與精度驗證,一定程度上影響了分類精度的評估。后續研究中可以適當增加樹種樣本的地面調查數據,進一步改進分類方法,提高分類精度。總體而言,總體分類精度達到80.70%,Kappa系數為0.75,部分樹種精度可達90%以上,較好地實現了樹種識別。 本研究基于機載PHI高光譜遙感影像,通過輻射定標、幾何糾正、大氣校正、圖像裁剪和降噪等預處理,并采用ABS降維方法對高光譜影像進行數據處理,對生成的影像,選用SVM分類方法進行分類,得出如下結論: 1)該機載高光譜數據共210個波段,采用ABS進行降維,獲得36個信息量較大的波段,可以很好地刻畫區分各個類別,實現樹種級的識別; 2)采用的分層分類策略能夠有效識別常綠、落葉的針葉、闊葉及非林地類別; 3)經實地驗證,各類別范圍和分布區域較準確,總體分類精度達到80.70%,Kappa系數為0.75。 采用分航帶的方法進行分類,雖然可以有效避免錯分現象,提高分類精度,但是仍然存在一些問題: ①測試的高光譜數據波長范圍在416~1 033 nm,經試驗發現416~492 nm和850~1 033 nm波長范圍內數據噪聲影響較大,若將該范圍內的波段加入到分類特征變量中,不僅會增大參考樣本與影像像元的匹配難度,還會干擾分類精度,故本研究分類有效波長僅集中于495~ 850 nm的可見光-近紅外波段范圍。在后續的研究中,將利用一些更有效的降噪手段,提高這些波段的信噪比,以便增加對分類精度提升有益的待選變量; ②受地面調查數據的限制,一些樹種的參考樣本相對較少或缺失,后續研究中可以適當增加樹種樣本,如構樹和廣玉蘭等的地面調查數據,進一步改進分類方法,提高分類精度。 [1] 劉旭升,張曉麗.森林植被遙感分類研究進展與對策[J].林業資源管理,2004(1):61-64. Liu X S,Zhang X L.Research advances and countermeasures of remote sensing classification of forest vegetation[J].Forest Resources Management,2004(1):61-64. [2] Pengra B W,Johnston C A,Loveland T R.Mapping an invasive plant,Phragmites australis,in coastal wetlands using the EO-1 Hyperion hyperspectral sensor[J].Remote Sensing of Environment,2007,108(1):74-81. [3] Wang C,Menenti M,Stoll M P,et al.Mapping mixed vegetation communities in salt marshes using airborne spectral data[J].Remote Sensing of Environment,2007,107(4):559-570. [4] Gong P,Pu R L,Yu B.Conifer species recognition:An exploratory analysis of in situ hyperspectral data[J].Remote Sensing of Environment,1997,62(2):189-200. [5] Martin M E,Newman S D,Aber J D,et al.Determining forest species composition using high spectral resolution remote sensing data[J].Remote Sensing of Environment,1998,65(3):249-254. [6] Petropoulos G P,Kalaitzidis C,Vadrevu K P.Support vector machines and object-based classification for obtaining land-use/cover cartography from Hyperion hyperspectral imagery[J].Computers and Geosciences,2012,41:99-107. [7] 童慶禧,鄭蘭芬,王晉年,等.濕地植被成象光譜遙感研究[J].遙感學報,1997,1(1):50-57. Tong Q X,Zheng L F,Wang J N,et al.Study on imaging spectrometer remote sensing information for wetland vegetation[J].Journal of Remote Sensing,1997,1(1):50-57. [8] 王圓圓,陳云浩,李京.RSM組合方法用于高光譜遙感數據的分類研究[J].遙感信息,2008(1):16-21. Wang Y Y,Chen Y H,Li J.Study on RSM ensemble method for hyperspectral data classification[J].Remote Sensing Information,2008(1):16-21. [9] 劉秀英,林輝,熊建利,等.森林樹種高光譜波段的選擇[J].遙感信息,2005(4):41-44,64. Liu X Y,Lin H,Xiong J L,et al.Band selection from hyperspectral data of forestry species[J].Remote Sensing Information,2005(4):41-44,64. [10]劉春紅,趙春暉,張凌雁.一種新的高光譜遙感圖像降維方法[J].中國圖象圖形學報,2005,10(2):218-222. Liu C H,Zhao C H,Zhang L Y.A new method of hyperspectral remote sensing image dimensional reduction[J].Journal of Image and Graphics,2005,10(2):218-222. [11]閆超.基于SVM的中文文本自動分類系統的研究與實現[D].太原:太原理工大學,2010. Yan C.Research and Implementation of Chinese Automatic Text Classification System Based on SVM[D].Taiyuan:Taiyuan University of Technology,2010. [12]譚琨,杜培軍.基于支持向量機的高光譜遙感圖像分類[J].紅外與毫米波學報,2008,27(2):123-128. Tan K,Du P J.Hyperspectral remote sensing image classification based on support vector machine[J].Journal of Infrared and Millimeter Waves,2008,27(2):123-128. (責任編輯: 陳理) Classification of forest species using airborne PHI hyperspectral data FAN Xue, LIU Qingwang, TAN Bingxiang (ResearchInstituteofForestResourceInformationTechnique,ChineseAcademyofForestry,Beijing100091,China) Hyperspectral data are becoming more and more widely used in forestry, especially in terms of classification. Nevertheless, the application of PHI in forestry is much less than that in such fields as agricultural pest and disease monitoring and marine suspended particles monitoring. PHI is used in this paper, and the study area is Jingmen in Hubei Province. This paper proposes an independent component analysis (ICA) combined with adaptive band selection (ABS) algorithm to reduce dimensions, extract forest land and non-forest land using (normalized difference vegetation index,NDVI) based on the subset images, and finally classify the images by support vector machine (SVM), with the overall classification accuracy being 80.70%, and Kappa coefficient reaching 0.75. The results show that the chunk of PHI data and the use of the extraction of NDVI to distinguish between forest land and non-forest land to decrease the effect of “the same object with different spectra” and “the same spectrum with different objects” can yield a good effect. It is shown that the combination of ICA - ABS and SVM is suitable for PHI data. This study has an important significance for the application of hyperspectral in tree species recognition. hyperspectral data; PHI; dimensionality reduction; band selection method; SVM 10.6046/gtzyyg.2017.02.16 樊雪,劉清旺,譚炳香.基于機載PHI高光譜數據的森林優勢樹種分類研究[J].國土資源遙感,2017,29(2):110-116.(Fan X,Liu Q W,Tan B X.Classification of forest species using airborne PHI hyperspectral data[J].Remote Sensing for Land and Resources,2017,29(2):110-116.) 2015-12-14; 2016-01-16 高分辨率對地觀測系統重大專項項目(編號: 30-Y20A37-9003-15/17)、國家自然科學基金青年科學基金項目“機載激光雷達探測森林冠層高度的機理模型研究”(編號: 41201334)和國家高技術研究發展計劃(863 計劃)子課題“全球林業定量遙感專題產品生產體系(二)”(編號: 2013AA12A302)共同資助。 樊雪(1990-),女,碩士研究生,主要從事林業高光譜遙感方面研究。Email: fanxue0411@163.com。 劉清旺(1978- ),男,助理研究員,主要從事林業遙感等方面研究。Email: liuqw@caf.ac.cn。 TP 79; TP 751.1 A 1001-070X(2017)02-0110-074 結果與分析



5 結論