萬杰 楊勇 韓春峰 王訓宇
摘 要:該文章以云南省昆明市西山區為研究區域,利用WordView-2的4波段影像數據源,通過學習掌握ENVI軟件中的決策樹分類工具,以及利用不同地類的波譜信息的特征差異,分析了影像的各個地類的光譜特征,從中提取了4波段影像的NDVI(歸一化植被指數),以此確定了不同地類之間的波段均值閾,根據不同地類在不同波段以及NDVI上的變化建立對應的決策樹模型,最終得到其分類結果。本文最后采用已有的樣本感興趣區數據對其決策樹分類結果進行了精度評價,并且評價分析了其結果精度在遙感數據中的作用。
關鍵詞:決策樹 ENVI提取信息 WV-2
中圖分類號:S127 文獻標識碼:A 文章編號:1674-098X(2015)03(c)-0047-04
遙感影像信息提取是影像分析的一項重要內容。信息提取的方法由傳統的人工解譯,監督分類,非監督分類到后期的基于專家知識的決策樹分類。研究區域的不同,選擇研究方法也有所改變,尤其對于西南區域的丘陵地帶或多山地區采用傳統的方法不能很好的提取地類信息,因此,僅靠傳統的光譜特性提取地物,就容易造成地類提取的錯分或者漏分,分類結果不能滿足,后期的應用達不到精度需求[1]。為了實現自動、高效的影像分類方法,決策樹分類算法成為信息提取的關鍵技術之一,決策樹分類方法具有以下的優點:(1)速度快:計算量相對較小,且容易轉化成分類規則;(2)準確性高:挖掘出的分類規則準確性高,便于理解;(3)方法操作簡單,準確度高,已在遙感圖像特征提取和圖像分類中得到廣泛應用[6-7]。
1 研究區概況與研究資料
1.1 研究區概況
西山區位于昆明市區西部,地處東經102°21′~102°45′,北緯24°41′~25°26′。東西寬36.8千米,南北長72千米,形如靈芝狀。總面積1058平方千米[2] ,其中山區、半山區面積占92%,壩區面積占8%。
西山區地處滇池盆地西北邊沿,地勢西北高,東南低,西北、北部地形起伏較大,靠昆明主城區部分為壩區,其余為山區、半山區。最高海拔2622米(風擺山),最低海拔1731米[3] 。部分西山區地理位置如圖1所示。
1.2 數據源獲取
本研究采用的數據為云南省昆明市西山區的數據,根據不同中心波長波段的組合方案,本研究采用WV-2數據的4,3,2波段分別賦予紅、綠、藍,獲取近似自然的假彩色合成圖像(如圖2),方便后面的目視解譯以及結果查看。
2 決策樹分類研究
ENVIDecision Tree分類方法是一個多級分類器,它的基礎是一系列的二叉決策樹。每一個決策樹依據一個表達式將圖像中的像元分為兩類,每一個新生成的類別又可以根據其他的表達式繼續向下分為兩類。可以根據需求定義決策樹的節點,節點的個數是不受限制的。用戶可以使用來自不同來源或文件的數據共同生成一個決策樹分類器,也可以交互式編輯和“剪除”決策樹,保存后的決策樹可以用于其他數據。
ENVI的決策樹分類器有如下特征[4]:
決策樹的建立采用圖形拖放工具。
在單個決策樹中可以使用具有不同投影和不同像元尺寸的文件,使用過程中將動態對他們進行重新投影和重采樣。
可以動態計算特定的變量值(如NDVI、Aspect等),而不需要單獨準備,并將他們應用在表達式中。
基于知識的決策樹分類是基于遙感影像數據及其他空間數據,通過專家經驗總結、簡單的數學統計和歸納方法等,獲得分類規則并進行遙感分類。分類規則易于理解,分類過程也符合人的認知過程,最大的特點是利用多源數據。
專家知識決策樹分類的步驟大體上可分為四步:知識(規則)定義、規則輸入、決策樹運行和分類后處理。難點是規則的獲取,可以來自經驗總結,如坡度小于20度是緩坡等;也可以通過統計的方法從樣本中獲取規則,如C4.5算法、CART算法、S-PLUS算法等。
2.1 分類預處理
根據人工目視解譯的標準規范《中華人民共和國土地利用現狀分類國家標準》,根據實驗區的特點將其土地覆蓋信息分為:植被,人工建筑棚,建筑用地,水體,未利用地。
由于每一種地物之間都可能存在有同物異譜,同譜異物的特性,在進行地類樣本選擇以前,需要通過測定各個地類的光譜值進行各個地類的最值,均值和方差值統計,綜合運用閾值的方法,將不同的地物提取出來。
2.2 規則建立
2.2.1植被提取以及人工建筑棚提取
由于植被在近紅外波段的反射率最強,在紅光波段的吸收率最強,這兩個波段不僅是植物光譜、光合作用中的最重要的波段,而且它們對同一生物物理現象的光譜響應截然相反,形成的明顯反差,這種反差隨著植被覆蓋度的變化而變化,因此,可對它們用比值,差分等多種組合來增強現實植被或者揭示隱含的植被信息[5]。
提取的植被信息與人工建筑棚之間存在一定的聯系,通過一定的NDVI閾值設定可以看到,提取的植被信息中有被錯分的地物,主要是人造工棚以及屋頂顏色鮮艷的建筑物,通過ENVI下的統計分析可以看出,在藍色波段可以發現綠地區域的最大值與非綠地對應的最小值基本接近,可以通過設置此閾值區分植被與人間建筑棚。
2.2.2 未利用地以及建筑用地提取
未利用地域建筑用地有很大的相似性,但又有很大的區別,可以通過二者地物在綠波段以及NDVI的差值變化來進行區分。具體的區分閾值通過ENVI下的樣本選擇統計分析進行劃定。
2.2.3 水體信息提取
水體信息在近紅外波段以后出現強吸收階段,反射率幾乎為零,可以根據此特定從NDVI值的閾值設定來區分水體與非水體信息。
2.3 決策樹生成
2.3.1 決策樹生成
生成的決策樹見圖4所示。
2.3.2 ENVI下執行決策樹規則
第一步:規則獲取
根據上述三步對于不同地類的需求,ENVI下構建的決策樹規則描述如下:
Class1(植被):NDVI>0.3,
Class2(人工建筑棚):0.3Class3(未利用地):0.03