吳雪嬌 王威 王芳
摘要:從林業(yè)行業(yè)應(yīng)用出發(fā),針對(duì)國產(chǎn)GF-1衛(wèi)星數(shù)據(jù)的特點(diǎn),采用決策樹分類方法對(duì)影像采伐信息進(jìn)行提取,探索了國產(chǎn)GF~1衛(wèi)星數(shù)據(jù)在森林資源采伐信息提取方面的應(yīng)用關(guān)鍵技術(shù),為國產(chǎn)衛(wèi)星數(shù)據(jù)的行業(yè)推廣應(yīng)用奠定理論基礎(chǔ)。研究結(jié)果表明:決策樹分類方法能夠更有效地對(duì)伐區(qū)圖斑分類提取,經(jīng)過Kappa分析,測(cè)試區(qū)伐區(qū)影像提取精度從大到小分別為:水域分類精度96.71%,森林分類精度89.79%,伐區(qū)分類精度82.49%,公路分類精度75.30%,農(nóng)田分類精度71.18%,建筑分類精度56.26%,其他分類精度53.57%。總體分類精度為87.34%。
關(guān)鍵詞:決策樹分類;GF-1衛(wèi)星影像;森林采伐;信息提取
中圖分類號(hào):P237文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-9944(2019)14-0225-03
1引言
森林資源狀況和消長變化動(dòng)態(tài)數(shù)據(jù)是國家制定國民經(jīng)濟(jì)和社會(huì)發(fā)展規(guī)劃、社會(huì)可持續(xù)發(fā)展戰(zhàn)略、國家生態(tài)安全規(guī)劃及編制林業(yè)規(guī)劃計(jì)劃、指導(dǎo)林業(yè)生產(chǎn)建設(shè)的重要依據(jù),森林資源采伐信息是森林資源監(jiān)測(cè)的重要組成部分。由于森林采伐作業(yè)方式不同、不同區(qū)域采伐發(fā)生的時(shí)間節(jié)點(diǎn)不同、采伐的位置具有隨機(jī)性等特點(diǎn),給采伐信息的獲取帶來較大的困難,原有的地面踏查獲取采伐信息的方法,存在著工作量大、勞動(dòng)強(qiáng)度大、成本高、周期長、效率低、時(shí)效性差等問題,經(jīng)過多年的研究和實(shí)踐工作證明,利用現(xiàn)代遙感技術(shù),通過對(duì)衛(wèi)星遙感影像信息提取,能夠很好地解決這一問題。特別是近年來,隨著國產(chǎn)衛(wèi)星數(shù)據(jù)的不斷涌現(xiàn),如何利用國產(chǎn)高分辨率衛(wèi)星數(shù)據(jù)服務(wù)于林業(yè)行業(yè)是目前研究的熱點(diǎn)。
2研究方法
2.1算法原理
決策樹是由連接的節(jié)點(diǎn)所組成,存在2種類型的節(jié)點(diǎn):決策節(jié)點(diǎn)和葉子節(jié)點(diǎn)。決策節(jié)點(diǎn)存放被檢驗(yàn)的運(yùn)算表達(dá)式,子葉節(jié)點(diǎn)存貯的是父節(jié)點(diǎn)的運(yùn)算結(jié)果。通過一系列二叉決策分支,將像元?dú)w入到適當(dāng)?shù)念悇e,每條決策都通過特定表達(dá)式,將一系列影像中的像元?dú)w為2類。依此類推,決策的最終結(jié)果是獲取一系列處于子節(jié)點(diǎn)上的專題類別。其中,CART(Classification and Re-gression Tree)是一種監(jiān)督學(xué)習(xí)算法,充分體現(xiàn)決策樹算法理念。CART是Breiman于1984年提出的決策樹構(gòu)建算法,其基本原理是通過對(duì)由測(cè)試變量和目標(biāo)變量構(gòu)成的訓(xùn)練數(shù)據(jù)集的循環(huán)分析,而形成二叉樹形式的決策樹結(jié)構(gòu);CART決策樹采用二分遞歸劃分,在分支節(jié)點(diǎn)上進(jìn)行布爾測(cè)試,判斷條件為真時(shí)的劃歸右側(cè)分支,否則劃歸左側(cè)分支。
2.2訓(xùn)練樣本的確定
在決策樹分類過程中,訓(xùn)練區(qū)選擇對(duì)分類精度的高低有重要影響。選擇訓(xùn)練區(qū)的目的是為了估計(jì)每一地物類型的特征參數(shù),決策樹采伐信息提取時(shí),訓(xùn)練樣本的選取注意以下兩點(diǎn):第一,樣本點(diǎn)的選擇要具有典型性,能很好的代表該地物類型的光譜分布模式。這就要求在選擇訓(xùn)練樣本時(shí),應(yīng)該在中心位置選擇。第二,樣本點(diǎn)的選取要具備完備性,指對(duì)于圖像中待分類的每一個(gè)類型,如果其存在許多亞類,就必須從其所有的子集中選擇像,組成復(fù)雜的訓(xùn)練樣本作為其大類的訓(xùn)練區(qū),使得訓(xùn)練區(qū)的統(tǒng)計(jì)結(jié)果能反映每一類型。研究區(qū)地貌,高山地形突出,以林地為主,周邊存在部分裸地與道路建筑,河流較少。根據(jù)遙感資料的可判讀性、研究成果的實(shí)用性及研究區(qū)域的地域性等基本原則,結(jié)合土地分類的地域特點(diǎn),考慮該地區(qū)無明顯的河流,所以去掉這一地類;本研究的重點(diǎn)為森林采伐信息,故將林地分為采伐森林(伐區(qū))、森林農(nóng)田、水體、道路和建筑這6個(gè)主要地類,重點(diǎn)研究森林采伐信息的提取(表1,圖1)。
3研究結(jié)果
研究中決策樹的生成過程(圖2),在對(duì)每個(gè)節(jié)點(diǎn)進(jìn)行分支時(shí),首先要確定一個(gè)最佳的分支預(yù)測(cè)變量以及該預(yù)測(cè)變量的最佳分支閾值點(diǎn)。在每個(gè)節(jié)點(diǎn)上添加葉子節(jié)點(diǎn)并輸入運(yùn)算規(guī)則,對(duì)規(guī)則中所引用的變量需指定鏈接的波段代號(hào)。最后進(jìn)行類聚合、類統(tǒng)計(jì)等后處理。經(jīng)過分析,最終選取包括校正好的GF-1影像的3個(gè)波段,NDVI、PVI、GVI、紋理測(cè)度中的方差、對(duì)比度,共9個(gè)波段參與最終的分類(圖3)。
水域分類精度為96.71%,農(nóng)田分類精度為71.18%,其他分類精度為53.57%,森林分類精度為89.79%,伐區(qū)分類精度為82.49%,公路分類精度為75.30%,建筑分類精度為56.26%,總體分類精度為87.34%。
4結(jié)論與討論
研究結(jié)果表明,決策樹分類方法能夠更有效地對(duì)伐區(qū)圖斑分類提取,實(shí)驗(yàn)數(shù)據(jù)森林分類精度達(dá)到89.79%,伐區(qū)分類精度達(dá)到82.49%,能夠滿足一定精度要求下的森林資源管理工作。研究過程中也發(fā)現(xiàn),特征變量的選取和特征維數(shù)的確定對(duì)于決策樹分類精度有著重要的影響作用,因此,森林采伐信息相關(guān)的影像特征變量研究是進(jìn)一步研究的關(guān)鍵工作。