馬婷 劉思涵 郭瑞霞



摘要:如何有效提取落葉松人工林信息是落葉松人工林資源調查的關鍵。本文以黑龍江省佳木斯市樺南縣孟家崗林場為研究試驗區域,利用“高分一號”衛星影像(以下簡稱GF-1)并結合其他輔助數據,在分析落葉松人工林光譜信息的基礎上,基于灰度共生矩陣方法提取了8種紋理信息,并根據落葉松人工林季相特征,提取研究區內植被的NDVI、DVI、RVI和EVI時間序列特征,建立基于C5.0決策樹算法的落葉松人工林決策樹模型,通過10次分類試驗,篩選出最優的決策規則,用于落葉松人工林提取研究。結果表明,C5.0決策樹算法能綜合紋理信息、植被指數和光譜特征信息,自動尋找區分落葉松人工林的最佳特征組合及分割閾值,分類總體精度達到92.25%,Kappa系數為0.87,面積精度為92.79%,能有效地提取落葉松人工林信息。本研究可為森林資源調查提供理論基礎與技術支持。
關鍵詞 落葉松人工林;高分一號;C5.0決策樹算法;植被指數時間序列信息;紋理特征
落葉松是我國北方地區造林和森林更新的主要樹種之一,其木材結構細密,材質優良,抗腐蝕,抗壓能力強,具有顯著的社會和經濟效益[1-3]。隨著國家林業重點工程項目的穩步推進,落葉松人工林的造林面積逐年增加,針對落葉松人工林資源的調查也成為林業調查領域的一項新需求[4]。如何有效利用遙感影像獲取落葉松人工林空間位置分布,及時準確掌握落葉松人工林資源信息,已成為落葉松人工林栽培關注的熱點問題。目前,國內外學者針對落葉松人工林的研究多集中于撫育間伐、土壤特性、經營情況、病蟲害和苗圃培育等方面,應用遙感影像探索落葉松人工林空間位置分布的研究鮮有報道[5-9]。因此,利用遙感手段快速獲取落葉松人工林的空間位置分布,無論是理論研究和實際應用都有重要意義。
決策樹算法具有靈活、直觀、運算效率高等特點[10-12]。在林業遙感研究領域中,國內外學者利用決策樹算法在森林類型精細分類、不同林地類型提取識別等問題上已進行了大量研究。2012年Suchenwirth等人通過提取遙感影像的光譜信息、空間信息和地形因子等,建立基于專家知識的決策樹模型并進行決策樹分類,從中提取了蘆羊、硬木、白楊林和草地等植被[13]。2014年白秀蓮等人基于Landsat TM數據和C5.0決策樹算法,設計了一種基于多特征變量組合的數據集進行土地覆蓋分類,結果表明當特征變量合適時,分類結果能夠滿足用戶需求[14]。2015年梁守真等人嘗試將多時相的Landsat TM數據與MODIS-NDVI數據組合,進行基于面向對象的決策樹橡膠林信息提取實驗,結果表明,綜合考慮橡膠的季相特征,能有效獲取橡膠林分布信息[15]。2018年王懷警等人綜合多種特征變量,采用分層分類的策略,設計了一種基于星載高光譜Hyoerion數據的C5.0決策樹森林類型精細分類方法,該方法能夠有效提高森林類型分類精度[16]。2019年魯楠等人利用國產“高分二號”(GF-2)數據,綜合考慮植被季相和物候特征,設計了一種基于四季時相知識的CART決策樹方法,進行森林類型分類實驗,分類精度達到85.6%[17]。因闊葉林、針葉林和針闊混交林光譜信息相似,“同譜異物”和“異物同譜”現象嚴重,目前基于遙感影像進行闊葉林、針葉林和針闊混交林分類提取的精度較低,無法滿足實際生產需要[18-21]。本文以GF-1遙感影像為主要數據源,結合地面樣地和二類小班調查數據,提取遙感影像的光譜信息、紋理信息,并利用多時相Landsat 8 OLI遙感影像構建研究區的4種植被指數時間序列特征,獲取落葉松人工林的季相信息,建立基于C5.0決策樹算法的落葉松人工林決策樹模型,探究針對C5.0決策樹算法提取落葉松人工林信息的可行性,以期有效提取落葉松人工林信息。
1 ?研究區概況
本研究選取孟家崗林場作為研究區域,林場位于黑龍江省佳木斯市樺南縣東北部,地理坐標為東經130°32′42″—130°52′36″,北緯46°20′16″—46°30′50″,總面積約為14466.7hm2,屬東亞大陸性季風氣候[22]。林場地處完達山西麓,年平均氣溫2.7℃,海拔168—575m。該林場是以經營針葉樹種為主的人工林用材基地,其中人工造林面積約為11095.9hm2,占林場總面積的76.7%。主要樹種有落葉松(Larix gmelini)、樟子松(Pinus sylvestris)、紅松(Pinus koraiensis)和云杉(Picea asperata)等[23]。
2 ?數據與數據處理
2.1 ?遙感影像數據及預處理
GF-1衛星是由我國自行研制并發射的高分辨率對地觀測衛星,其上搭載的PMS相機成像幅寬60km[24,25]。利用2017年7月6日GF-1衛星影像進行研究,包括2m分辨率的全色影像和8m分辨率的多光譜影像。輔助數據包括多時相高質量Landsat 8 OLI遙感影像、無人機拍攝的0.5m分辨率CCD數據、2014年森林資源二類調查數據和孟家崗林場地面調查樣地數據。
Landsat 8 OLI遙感影像下載于中國科學院地理空間數據云平臺(http://www.gscloud.cn/),因冬季孟家崗林場植被幾乎被積雪覆蓋,本文選擇春季、夏季和秋季的遙感影像用于獲取落葉松人工林季相信息。影像詳細信息如表1所示。為降低植被反射率受到大氣、光照等因素的影響[26-28]。采用ENVI5.3軟件平臺進行輻射定標、FLAASH大氣校正、幾何校正、RPC正射校正、Gram-schmidt圖像融合和拼接裁剪等影像預處理操作。
2.2 ?樣本數據
參考森林資源二類調查數據提供的研究區植被分布信息,將林場內土地覆蓋劃分為6種類別,分別是落葉松、紅松、樟子松、云杉、闊葉樹及裸地。解譯空間分辨率為0.5m的CCD數據,并結合林場中各土地類別所占面積權重布設樣地,共布設了420塊28.28m28.28m的樣地作為訓練樣本。
采用地面調查樣點作為分類驗證樣本。2017年6月,以孟家崗林場為主要調查區域進行外業調查。利用手持GPS獲取樣地中心點地理坐標,記錄樹種組成、郁閉度和齡組等信息。經實地調查,共獲取了395個有效的土地覆蓋類型樣點。
3 ?研究方法
3.1 ?特征變量提取與分析
3.1.1 ?光譜信息
GF-1遙感影像包括藍光波段(450nm-520nm)、綠光波段(520nm-590nm)、紅光波段(630nm-690nm)和近紅外波段(770nm-890nm),能反映地物最基本的光譜信息[29]。研究選取預處理后影像的光譜信息作為特征變量。
3.1.2 ?紋理信息
灰度共生矩陣是一種基于像素灰度值統計的紋理信息提取方法,已成為最廣泛的紋理信息提取方法之一[30-32]。本文首先對預處理后2m分辨率的GF-1遙感影像進行主成分分析(PCA),采用灰度共生矩陣方法,基于第一主成分不同窗口大小進行紋理提取,考慮運算時間和窗口面積,共設置3×3、5×5、7×7、9×9和11×11五種窗口大小進行試驗。通過訓練樣本數據計算均方差值和J-M可分離度[33],最終選擇窗口大小為9×9的8個紋理測度,包括均值、方差、協同性、對比度、相異性、信息熵、二階矩和相關性。
3.1.3 ?季相信息
落葉松林獨特的季相信息是區別其他針葉林的重要特征。植被指數時間序列特征能直觀地反映植被基本的季相信息[34]。本次試驗利用預處理后的多時相Landsat 8 OLI遙感影像提取研究區內不同森林類型的歸一化植被指數(NDVI)、差值植被指數(DVI)、比值植被指數(RVI)和增強型植被指數(EVI),構建相應的植被指數時間序列特征。
3.2 ?C5.0決策樹算法
C5.0決策樹算法是在C4.5的基礎上通過對運行效率、內存大小和分類精度等方面進行改進得到的[35,36]。該算法將C4.5算法和Boosting算法相結合,通過計算比較每一個特征變量的信息增益率,選擇具有最大信息增益的特征變量進行拆分節點,不斷重復該過程,從而確定最佳特征變量組合和最優分割閾值[37]。該算法的核心是利用信息熵減少速度來選擇每一個分支上的特征變量。信息熵計算公式[35]如下:式中,表示信息,表示信息發生的概率。
C5.0算法在進行節點拆分過程中,通過十折交叉法不斷檢驗樣本數據,對節點進行自下而上的逐層修剪與合并,以提高分類精度[38-40]。當遇到樣本數據過多或者不足時,算法會自動進行剔除和權重調整,從而得到一個最佳的決策樹模型。C5.0算法具有運行速度快,占用內存小,容錯率高等優點[41]。
3.3 ?C5.0決策規則建立
本研究是基于IBM SPSS Moder18.0軟件平臺建立的C5.0決策樹分類規則。首先將光譜信息、紋理信息和4種植被指數時間序列特征進行特征變量組合,通過訓練樣本數據構建一組具有多特征信息的訓練樣本數據集。然后將該數據集導入IBM SPSS Moder18.0軟件中進行C5.0決策分析,采用專家模式進行全局修剪,剪枝程度為75%,子節點最小記錄數為2,Boosting試驗數為10,最終生成10組C5.0決策分類規則。根據決策分類規則,在ENVI 5.3軟件平臺建立相應的C5.0決策樹進行分類,最后將分類結果進行分類后合并。通過對10組分類圖進行目視解譯和精度評價,選擇最佳決策分類規則,并得到一個最優的分類決策樹。最優分類決策樹如圖1所示。
注:B13波段—6月16日NDVI,B18波段—4月28日NDVI,B19波段—6月16日DVI,B22波段—10月6日DVI,B25波段—6月16日RVI,B34波段—10月6日EVI,B35波段—10月22日EVI。
4 ?結果與分析
4.1 ?落葉松人工林提取結果與精度評價
為了準確提取落葉松人工林信息,防止其他植被因混交造成錯分、漏分等現象,影響落葉松人工林提取結果。本試驗將分類結果進行合并,紅松、樟子松、云杉和闊葉樹合并成一類,落葉松林為一類,裸地為一類。分類結果如圖2所示。分類結果與CCD數據表現出較好的一致性(圖3)。為驗證該模型的適用性和落葉松人工林提取精度,采用混淆矩陣法進行精度評價,分類總精度為92.25%,Kappa系數為0.87。混淆矩陣精度評價如表2所示。落葉松人工林用戶精度為97.06%,分類精度較高,說明其他類型錯分成落葉松人工林的像元較少。落葉松人工林制圖精度為83.73%,精度較差,說明落葉松人工林錯分到其他類型的像元較多。為了進一步驗證提取的落葉松人工林信息,利用ArcGIS 10.1軟件對提取的落葉松人工林進行面積計算。提取到的落葉松人工林面積為4888.57hm2,二類調查數據中落葉松人工林統計面積為5268.63hm2,面積精度為92.79%。說明基于C5.0決策樹算法的落葉人工林決策樹模型可以有效提取落葉松人工林信息。
4.2 ?錯分、漏分現象分析
參考二類調查數據和CCD數據,分析分類結果圖可得,落葉松人工林錯分點和漏分點主要分布在落葉松幼齡林區域和針葉林混交區域,如圖4所示,分析該圖可得:
(1)不同齡組提取效果不同,提取效果依次為:落葉松成熟林>落葉松中齡林>落葉松幼齡林。落葉松成熟林和中齡林提取效果較好,而落葉松幼齡林提取效果較差,出現錯分點、漏分點較多(圖4(a))。成熟林和中齡林冠形較大且相鄰樹冠間互相交織,光譜反射率穩定,季相信息明顯。落葉松幼齡林冠形小且相鄰樹冠間隙大,光譜反射率受土壤等因素影響較大,易出現錯分漏分現象。
(2)在針葉林混交地帶,不同植被間的界限較為模糊,所以不易區分。對比不同針葉林與落葉松人工林混交區域發現,提取效果依次為:紅松>樟子松>云杉。在與紅松或者樟子松混交區域,可以將落葉松人工林較好的提取出來,錯分、漏分現象較少。但在與云杉混交區域,錯分、漏分現象比較嚴重,落葉松人工林和云杉難以區分,見圖4b所示。為探究發生原因,本文計算了研究區域4種針葉林的NDVI均值,構建相應的NDVI時間序列曲線,如圖6所示。分析該圖可得,4月末期,落葉松人工林的NDVI低于0.4,說明春季落葉松人工林綠葉覆蓋度低,生物量小。隨著季節變化NDVI值逐漸增大,在6、7、8月份NDVI值均高于0.8,說明夏季綠葉覆蓋度和生物量高,落葉松人工林長勢好。而后逐漸衰減,10月下旬NDVI值降低至0.28。這與落葉松人工林的季相特征一致,落葉松屬落葉喬木,春季葉子逐漸發芽,綠葉覆蓋度逐漸升高;夏季葉子完全長出,綠葉覆蓋度和生物量達到最高;秋季葉子逐漸掉落,綠葉覆蓋度降低,NDVI值也逐漸減小。紅松和樟子松的NDVI時間序列曲線與落葉松人工林差異較大,因紅松和樟子松屬常綠喬木,葉子不會隨季節變化而掉落,所以NDVI指數全年在0.7-0.9附近波動。而云杉的NDVI時間序列曲線與落葉松人工林有些相似,春季NDVI值較低,而后逐漸增高;夏季NDVI值達到最高0.85,之后伴隨秋季到來逐漸降低。云杉雖然屬于常綠喬木,但隨著季節變化葉子會有部分脫落,所以春季和秋季云杉的綠葉覆蓋度和生物量減少。因相似的季相特征,導致落葉松人工林和云杉在混交區域難以區分。
5 ?結論
本研究利用GF-1遙感影像和Landsat 8 OLI影像,并結合多種特征信息,建立了一種基于C5.0決策樹算法的落葉松人工林決策樹模型,提取落葉松人工林信息。研究結論如下:
(1)C5.0決策樹算法可以充分利用遙感影像的光譜、紋理和季相等輔助信息進行落葉松人工林提取,分類總精度較高,提取效果良好。為快速獲取落葉松人工林空間位置分布提供了一種新的方法。
(2)C5.0決策樹算法可以自動進行特征變量選擇,并確定分割閾值,運行速度較快,占用內存較小等特點。
(3)不同齡組的落葉松,提取效果不同。提取效果依次為:落葉松成熟林>落葉松中齡林>落葉松幼齡林。出現這種情況原因是,齡組越小的落葉松,冠層小且相鄰樹冠間隙大,光譜反射率受土壤等因素影響越大。
(4)在針葉林混交地帶,落葉松人工林提取效果較差。尤其是云杉和落葉松人工林混交區域。出現該現象原因是,云杉屬于常綠針葉林,但隨著季節變化,葉子有部分脫落,導致與落葉松人工林NDVI時間序列曲線相似,使得混交區域難以區分。
今后需要進一步研究在針葉林混交地帶,如何提高落葉松人工林提取精度,以便有效地提取落葉松人工林信息。
參考文獻:
[1] 李艷霞, 張含國, 張磊,等. 長白落葉松紙漿材優良家系多性狀聯合選擇研究[J]. 林業科學研究, 2012, 25(6):712-718.
[2]趙國武. 日本落葉松(北海道種源)生長規律及生長優勢的調查分析[J]. 遼寧林業科技, 1993(3):25-27.
[3]金虎范. 林分密度對華北落葉松人工林凋落物分解影響的研究[D]. 北京林業大學, 2010.
[4] 任寶平. 興安落葉松人工林生長過程及林分密度的調查研究[J]. 內蒙古電大學刊, 2010(2):73-75.
[5]施雙林, 薛偉. 落葉松人工林撫育間伐技術的研究[J]. 森林工程, 2009, 25(3):53-56.
[6]王利東. 不同間伐撫育強度對華北落葉松人工林土壤物理性質變化影響的研究[J]. 河北林果研究, 2012, 27(1):6-9.
[7]唐偉東. 落葉松人工林撫育間伐技術的研究[J]. 林業勘查設計, 2016(2):61-63.
[8]陳洪明, 陳立新, 王殿文. 落葉松人工林土壤酸度質量與養分關系研究現狀及趨勢[J]. 防護林科技, 2004(5):46-49.
[9]日本落葉松人工林林分結構與生長量預測研究[D]. 北京林業大學, 2007.
[10]基于決策樹方法的遙感影像分類研究[D]. 內蒙古師范大學, 2012.
[11]基于決策樹技術的遙感影像分類研究[D]. 南京林業大學, 2006.
[12]張宇. 決策樹分類及剪枝算法研究[D]. 哈爾濱理工大學, 2009.
[13] Suchenwirth L, F?rster M, Cierjacks A, et al. Knowledge-based classification of remote sensing data for the estimation of below and above-ground organic carbon stocks in riparian forests[J]. Wetlands Ecology & Management, 2012, 20(2):151-163.
[14] 白秀蓮, 巴雅爾, 哈斯其其格. 基于C5.0的遙感影像決策樹分類實驗研究[J]. 遙感技術與應用, 2014, 29(2).
[15] 梁守真,陳勁松,吳炳方,陳工.應用面向對象的決策樹模型提取橡膠林信息[J].遙感學報,2015,19(03):485-494.
[16] 王懷警, 譚炳香, 房秀鳳, et al. C5.0決策樹Hyperion影像森林類型精細分類方法[J]. 浙江農林大學學報, 2018(4).
[17] 魯楠,王新杰,汪錦,傅峰.依據季相特征GF-2影像的植被分類[J].東北林業大學學報,2019,47(03):62-67.
[18] 于泉洲, 王紹強, 黃昆,等. 基于Hyperion高光譜數據的溫帶森林不同冠層結構的光譜特征分析[J]. 光譜學與光譜分析, 2015, 35(7):001980-1985.
[19]田靜, 邢艷秋, 姚松濤,等. 基于元胞自動機和BP神經網絡算法的Landsat-TM遙感影像森林類型分類比較[J]. 林業科學, 2017, 53(2):26-34.
[20]張智超, 范文義, 孫舒婷. 基于多種分類器組合的森林類型信息提取技術研究[J]. 森林工程, 2015, 31(3):75-80.
[21]魏云敏. 利用遙感影像估測塔河地區森林可燃物載量的研究[D]. 東北林業大學, 2007.
[22] 陳琛,李濤.淺談楊樹速生豐產林營造技術要點[J].農民致富之友,2015(17):99-99.
[23]黑龍江省孟家崗林場人工紅松枝條分布數量的研究[D]. 東北林業大學, 2016.
[24] 劉兆軍.“高分一號”遙感相機填補國內高分辨對地觀測空白[J].航天返回與遙感, 2013(2).
[25]王利民, 劉佳, 楊福剛,等. 基于GF-1衛星遙感的冬小麥面積早期識別[J]. 農業工程學報, 2015, 31(11):194-201.
[26]Wang P, Zhang J, Lan Y, et al. Radiometric calibration of low altitude multispectral remote sensing images[J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(19):199-206.
[27]Danaher T, Wu X, Campbell N. Bi-directional reflectance distribution function approaches to radiometric calibration of Landsat TM imagery[C]// IEEE International Geoscience & Remote Sensing Symposium. 2001.
[28] 馬東輝, 柯長青. 南京冬季典型植被光譜特征分析[J]. 遙感技術與應用, 2016, 31(4):702-708.
[29] 賈玉秋, 李冰, 程永政, et al. 基于GF-1與Landsat-8多光譜遙感影像的玉米LAI反演比較[J]. 農業工程學報, 2015, 31(9):173-179.
[30]Siqueira F R D, Schwartz W R, Pedrini H. Multi-scale gray level co-occurrence matrices for texture description[J]. Neurocomputing, 2013, 120(10):336-345.
[31]楊德坤, 侯德文, 步亞東. 灰度共生矩陣在紋理特征提取中的發展[J]. 信息系統工程, 2012(1):136-136.
[32]Metzler V, Palm C, Lehmann T, et al. Texture classification of gray-level images by multiscale cross co-occurrence matrices[C]// International Conference on Pattern Recognition. 2007.
[33] Dabboor M, Howell S, Shokr M, et al. The Jeffries–Matusita distance for the case of complex Wishart distribution as a separability criterion for fully polarimetric SAR data[J]. International Journal of Remote Sensing, 2014, 35(19):6859-6873.
[34] Zhang C S, Hui L I. Estimation of sub-pixel NDVI time series based on down-scaling technique[J]. Science of Surveying & Mapping, 2013, 8002(1):44.
[35] Liu D, Yang F, Wei H, et al. Vegetation Classification Method Based on C5.0 Decision Tree of Multiple Classifiers[J]. Journal of Graphics, 2017.
[36]Meng W, Gao K, Wang L, et al. A Novel Hyperspectral Classification Method Based on C5.0 Decision Tree of Multiple Combined Classifiers[C]// Fourth International Conference on Computational & Information Sciences. 2012.
[37]Meng W, Gao K, Wang L, et al. A Novel Hyperspectral Classification Method Based on C5.0 Decision Tree of Multiple Combined Classifiers[C]// Fourth International Conference on Computational & Information Sciences. 2012.
[38]Gao K, Liu Y. A hyperspectral classification method based on experimental model of vegetation parameters and C5.0 decision tree of multiple combined classifiers[C]// International Conference on Optical Instruments & Technology. 2015.
[39]Defries R S, Chan J C W. Multiple criteria for evaluating machine learning algorithms for land cover classification from satellite data.[J]. Remote Sensing of Environment, 2000, 74(3):503-515.
[40] Hong-Chao Q I, Yuan Q I, Zhen X U. The Study of the Northwest Arid Zone Land-Cover Classification Based on C5.0 Decision Tree Algorithm at Wuwei City,Gansu Province[J]. Remote Sensing Technology & Application, 2009.
[41] 劉丹, 楊風暴, 衛紅,等. 基于多分類器的C5.0決策樹植被分類方法[J]. 圖形學報, 2017, 38(05):96-102.