嘎力巴 臧淑英 李苗 吳長山



摘要:本研究以哈爾濱市為研究區,采用Landsat-8多光譜影像為數據源,計算出水體指數、植被指數、建筑指數和土壤指數等共20個地物光譜指數;基于指數的決策樹分類方法提取土地覆被類型,并對分類結果進行精度驗證,對比分析不同指數對分類精度的影響。經過精度對比、篩選五組數據作為變量用決策樹方法進行分類,并與于單純地物光譜的(普通)決策樹分類結果和最大似然法相比較。結果顯示:五組基于指數的決策樹分類結果都比普通決策樹分類和傳統的最大似然法分類精度高,分類精度最高的一組與以上兩種分類結果相比,總精度分別提高了2.59%和9.55%,Kappa系數分別提高了0.08和0.15。本研究呈現了基于指數的決策樹分類方法在土地利用信息提取中的優勢,為更好協調哈爾濱市土地利用與城市擴展提供研究依據。
關鍵詞:決策樹分類;指數;信息提取;土地利用
中圖分類號:X144 文獻標識碼:A 文章編號:2095-672X(2016)05-0043-06
DOI:10.16647/j.cnki.cn15-1369/X.2016.05.0010
Decision Tree classification of remote sensing images based on index
Galiba1,2, Zang Shuying2, Li Miao1,2, Wu Changshan1,2
(1.School of Geographical Science,Harbin normal university,Heilongjiang 150025;
2.Key Laboratory of remote sensing monitoring of geographic environment,College of Heilongjiang Province, Harbin 150025)
Abstract:In order to study the advantage of decision tree based on index in land use information extracted, taking Harbin as a resample,there are 20 spectral indexes was calculated,including water index,vegetation,construction and soil type index and so on,using Landsat-8 multispectral images. According to the validation sample verifies the accuracy of the result of the classification,and then comparison and analysis the influence of different index on classification accuracy.Based on this,the higher precision index was classified into 5 groups to extract the area land use type,the classification result compared with decision tree classification based on spectral and maximum likelihood method.The result indicates that five groups based on the index of decision tree classification precision were better than the decision tree classification based on spectral and the maximum likelihood classification,one group was highest among five groups,which total precision improved by 2.59% and 9.55%,the Kappa coefficient increased 0.08 and 0.15,respectively.This paper presents the advantage of the decision tree based on index in land use information extraction,which provide basic data for better coordination of Harbin city of land use and urban expansion.
Key words:Decision tree classification;Indexes;Information extraction;Land use
引言
社會和經濟的快速發展加劇了城市擴展與土地資源的矛盾。因此,準確提取城市土地覆被類型是研究城市擴張的基礎。遙感影像為土地信息提取提供了有利的數據支持。基于遙感技術最早并且研究最多的一項基礎性工作是土地利用現狀調查,為更好的研究土地分布狀況及數量提供基礎數據[1]。遙感影像分類方法從最初的目視判讀到現在的計算機自動分類,分類精度與速度不斷的在提高。由于判讀完全是人工操作,很容易受到工作人員的主觀隨意性的影響,大規模的、需要快速獲取分類結果的信息提取不適合使用此方法,且工作效率低。而計算機自動分類對遙感圖像地物屬性的分類和識別是模擬了人類的識別能力來分的計算機技術 [2]。但是傳統的分類方法只基于光譜特征差異識別地物,分類結果因“同物異譜”和“同譜異物”,易出現較多的誤分、漏分情況,從而影響分類精度。隨著遙感技術的發展,80年代以來新的方法和理論不斷的被引進到遙感技術當中[3]。其中決策樹是常用的遙感技術之一。決策樹有運算效率高、分類速度快、分類結果直觀且清晰等優點,與傳統的分類方法相比,決策樹彈性和魯棒性更好,能有效提高分類精度[4,5,6]。近些年,決策樹分類的研究成果較多:McCauley 等[7]利用決策樹分類法對美國Montgomery的土地利用進行分類制圖,結果表明:決策樹分類法在提取土地利用方面具有很大的潛力。Muchoney等[8]人基于MODIS數據,利用決策樹、神經網絡、最大似然法對美國中部進行土地覆蓋分類,結果顯示決策樹分類精度最高。趙萍等[9]以南方地區SPOT影像為數據源,用決策樹方法提取居民地,與傳統監督分類方法相比,用戶精度、生產精度和Kappa系數都有很大的提高。裴歡[10]等以吐魯番SPOT-5 1B級數據為數據源,利用多地表特征參數的決策樹分類法,總精度達到87.9%,與傳統分類方法進行對比,分類精度明顯提高。以上研究大多基于光譜特征差異識別地物,未考慮地物指數對提高分類精度的作用。何祺勝[11]等基于渭干河-庫車河三角洲的TM影像,結合歸一化植被指數(Normalized Differential Vegetation Index ,NDVI)、改進歸一化差異水體指數(Modified Normalized Difference Water Index , MNDWI )、K-L變換前三主成分特征,使用決策樹分類方法提取鹽漬地信息,總體精度達到94%。
近年來,使用決策樹獲取城市土地利用的方法已經成熟,但很少有研究將各類地物光譜指數應用到分類器中,并比較他們的優缺點。本研究以哈爾濱市為研究區,分析水體指數、植被指數、建筑指數和土壤指數對決策樹分類精度的影響。以總精度、耕地用戶精度、居民地用戶精度為指標;在各類指數中篩選出三類指標最高的三個指數,分別組成三組特征變量;在以各類指數中比較常用的指數組成一組特征變量以及全部指數共五組特征變量;并對比分類精度,挑選出的最佳分類變量是:各類指數中總精度最高的特征變量組,水體指數中的改進歸一化水體指數(MNDWI)、 植被指數中的修改土壤調整植被指數(Modified Soil Adjustment Vegetation Index ,MSAVI) 、建筑指數中的改進歸一化裸露指數(Modified Normalized Difference Barren Index ,MNDBI)和土壤指數中的裸土指數(Bare Soil Index ,BSI)組成。而且基于指數的決策樹分類方法成功的提高了分類精度,為城市土地合理利用、有效規劃和可持續發展提供參考數據。
1 研究區概況與數據
1.1 研究區概況
哈爾濱市是黑龍江省省會,也是黑龍江省政治、經濟、科技中心。它位于中國東北的北部,松嫩平原東部,松花江右岸,地域范圍為125°42′~130°10′E、44°04′~46°40′N之間,總面積為5.31萬km2。哈爾濱屬中溫帶大陸性季風,四季分明,冬季漫長寒冷,夏季短暫涼爽,年平均氣溫3.4℃,年平均無霜期130天,年均降水量569 mm,降水主要在夏季 [12,13]。松花江干流由西向東貫穿哈爾濱市中部,水源充足,土壤類型以黑土為主,地勢不高,為農業生產提供優良的條件。因此耕地和居民地成了哈爾濱主要土地利用/土地覆蓋類型,哈爾濱土地利用/土地覆蓋類型還有水田和河流以及少量的裸地、草地和林地等。
本研究選取哈爾濱市中心城區作為研究區,包括南崗區,道里區,道外區,香坊區,平房區,松北區和呼蘭區,如圖1所示。
1.2 數據源及預處理
本研究以Landsat-8遙感影像為數據源,軌道號為118/28。為了不影響提取土地利用信息時的精確度,在選擇影像時避免云霧,研究區范圍內云量為零;影像數據質量良好。原始影像在遙感軟件ENVI5.1下經過波段合成,在此基礎上行進行幾何糾正、輻射定標和裁剪等預處理獲得覆蓋研究區的OLI影像數據。
2 研究方法
2.1 決策樹分類方法
決策樹分類方法是目前比較常用的提取各種地類信息的分類方法之一,也是提取土地類型信息的常見的一種方法。決策樹是一種分層處理的結構,它的基本思想是以一些判斷條件來對原始數據逐步細化的過程[14]。決策樹有一個根節點,還有一些中間節點和葉子節點構成的樹狀數據。決策樹的每一個節點只有一個父節點和兩個或多個后代節點。決策樹每個分支點是一個決策判斷條件,每個分支點下兩個葉子節點,代表著不滿意和滿意的條件。該方法不需要任何先驗統計假設。因此很多遙感影像提取所需要的信息當中決策樹分類法被廣泛的使用。決策樹分類方法跟傳統的最大似然法方法比起來,準確度更高,計算量也不大,在學習過程中容易被使用者了解等優點。
2.2 光譜指數
指數模型是根據多光譜影像中各類地物對不同波段的不同反映,在波段間突出地物信息的算法。它能很好地解釋各類土地覆蓋類型的特點,計算容易實現,方便實用。以下為本研究共選擇的20個光譜指數,分別是水體類指數:歸一化水體指數(Normalized Difference Water Index,NDWI)和改進的歸一化水體指數(MNDWI);植被類指數:歸一化植被指數(NDVI)、土壤調整植被指數(Soil-Adjusted Vegetation Index,SAVI)、修改土壤調整植被指數(Modified Soil Adjustment Vegetation Index,MSAVI)、增強植被指數(Enhanced Vegetation Index,EVI)、差值植被指數(Difference Vegetation Index,DVI)、比值植被指數(Ratio Vegetation Index,RVI)和綠度植被指數(GVI);建筑類指數:歸一化建筑指數(Normalized Difference Barren Index,NDBI)、改進歸一化裸露指數(Modified Normalized Difference Barren Index,MNDBI)、歸一化三波段指數(Normalized Difference Three Bands Index NDTBI)、比值居民地指數(Ratio Resident-area Index,RRI)、比值不透水面指數(Ratio Impervious Surface Index,RISI)和生物物理組成指數(Biophysical Composition Index,BCI);土壤類指數:裸土指數(Bare Soil Index,BSI)、增強型裸土指數(Enhanced Bare Soil Index,EBSI)、歸一化差值裸土與建筑用地指數(Normalized Difference Bareness and Built - Up Index,NDBBI)、歸一化土壤指數(Normalized Difference Soil Index NDSI)和比值歸一化土壤指數(Ratio Normalized Difference Soil Index RNDSI)。
2.3 訓練樣本與驗證樣本的選取
為了減少人為因素對分類結果的影響。本研究在研究區中選了500個隨機點隨著隨機點使用ENVI的ROI采樣工具選擇訓練樣本。將70%的樣本作為訓練樣本,30%作為驗證樣本。
3 結果分析
3.1 精度評價
精度評價是對分類結果準確性的評估。本研究利用混淆矩陣以分類總體精度、Kappa系數和用戶精度為指標進行精度評價。當地物光譜分別與各類水體指數、植被指數、建筑指數和土壤指數結合做變量的決策樹分類的結果:不同遙感指數對決策樹分類精度的影響不同,不是每個遙感指數都能夠提高分類精度。如表1所示。
3.2 指數的選取
根據決策樹能融合不同來源和特征的數據,指數能突出各類土地覆蓋類型的優點,使用基于遙感指數的決策樹分類方法提取研究區土地類型信息。本研究依據不同指數對決策樹分類精度影響的不同,組成以下五組多變量決策樹數據,提取哈爾濱市土地類型信息:
第一組:選擇各類指數中總精度最高的指數,分別是水體指數中的NDWI和MNDWI的精度一樣高、植被指數中的DVI、建筑指數中的BCI和土壤指數中的EBSI與地物光譜結合進行決策樹分類。由于水體指數中的兩個遙感指數精度一樣高。這一組做了三組變量。
第二組:各類指數中選出耕地用戶精度最高的作為一組,水體指數中的NDWI、植被指數中的RVI、建筑指數中的NDBI和土壤指數中的EBSI與地物光譜結合進行決策樹分類。
第三組:各類指數當中選出居民地精度最高的作為一組,水體指數中的MNDWI、植被指數中的MSAVI、建筑指數中的RISI和土壤指數中的EBSI與地物光譜結合進行決策樹分類。
第四組:選擇各類指數中最常用的指數,水體指數中的MNDWI、植被指數中的NDVI、土壤指數中的NDSI和建筑指數中的NDBI與地物光譜結合進行決策樹分類。
第五組:文中提到的20個指數同時與地物光譜結合進行決策樹分類。
在基于多變量的決策樹分類中不同指數的組合對分類精度的影響不同(如表2所示)。基于指數的決策樹與于單純地物光譜的決策樹分類結果和最大似然法的分類結果對比(如圖2所示)。
4 結束語
本研究以哈爾濱市Landsat-8影像為研究對象,計算出研究區水體指數,植被指數,建筑指數,土壤指數四類指數共20個指數,并與地物光譜結合進行決策樹分類。對比分析各類指數對決策樹分類中的影響,組成五組特征變量。五組數據中分類準確度最高的一組是基于MNDWI、MSAVI、RISI和EBSI 的決策樹分類結果:總精度為85.68%,Kappa系數為0.80。與傳統最大似然分類方法總精度76.13%和Kappa指數0.65相比,總精度提高了9.55%,Kappa系數提高了0.15;與基于單純地物光譜決策樹分類的總精度83.09%和Kappa系數0.72相比,總精度提高了 2.59%,Kappa系數提高了0.08。
遙感土地類型信息提取中,基于指數的決策樹分類方法與普通決策樹和最大似然法相比分類精度都有所提高,并且不同的組合分類結果不同。在此方法中,不是光譜指數越多越好,也不是常用光譜指數組合的分類準確度最高,而是要選擇指數最為關鍵。該方法結合指數模型和決策樹,并保留了兩種方法的優點,分類速度快、魯棒性強,而且提高了分類準確度。
但本研究沒有考慮到DEM數據、地表溫度數據,忽略了地表高程,這些因子對分類精度都有一定的影響;只選取了較小研究范圍,在今后研究中可以嘗試將此方法用到更大研究區域范圍的土地利用信息提取。
參考文獻
[1]齊紅超,祁元,徐瑱.基于C5.0決策樹算法的西北干旱區土地覆蓋分類研究—以甘肅省武威市為例[J].遙感技術與應用,2009,24(5):648-653.
[2]李爽,丁圣元,許叔明.遙感影像分類方法比較研究[J].河南大學學報(自然科學版),2002,32(2):70-73.
[3]杜鳳蘭,慶久,夏學齊.遙感圖像分類方法評析與展望[J].遙感技術與應用,2004,9(6):521-525.
[4]POWELL S L,COHEN W B,YANG Z,et al. Quantification of impervious surface in the Snohomish Water Resources Inventory Area of Western Washington from 1972-2006[J].Remote Sensing of Environment,2008,112(4):1895-1 908.
[5]LU D,WENG Q.Spectral mixture analysis of the urban landscape in Indianapolis with Landsat ETM+imagery[J].Photogrammetric Engineering and Remote Sensing,2004,70(9):1 053-1 062
[6]李爽,張二勛.基于決策樹的遙感影像分類方法研究[J].地域研究與開發,2003,22(1):17-21.
[7]MCCAULEY S,G OETZ SJ.Mapping residential density patterns using multi-temporal Landsat data and a decision-tree classifier[J].International Journal of Remote Sensing,2004,25(6):1077-1094.
[8]Muchoney D,Borak J,Chi,H,et al.Application of the MODIS global supervised classification model to vegetation and land cover mapping of Central America[J].International Journal of Remote Sensing,2000,21(6):1115-1138.
[9]趙萍,馮學智,林廣發.SPOT衛星影像居民地信息自動提取的決策樹方法研究[J].遙感學報,2003,7(4):309-315.
[10]裴歡,房世峰.基于地物光譜特征和空間特征的干旱區綠洲土地分類[J].地理科學,2013,33(11):1395-1399.
[11]何祺勝,塔西甫拉提·特依拜,丁建麗.基于決策樹方法的干旱區鹽漬地信息提取—以渭干河-庫車河三角洲綠洲為例[J].資源科學,2006,28(6):134-140.
[12]宋戈,高楠.基于DEA方法的城市土地利用經濟效益分析—以哈爾濱市為例[J].地理科學,2008,28(2):185-188.
[13]黃輝玲,吳次芳.基于可拓學的生態市建設評價—以哈爾濱市為例[J].地理科學,2009,29(5):651-657.
[14]潘琛等.決策樹分類法及其在遙感圖像處理中的應用[J].測繪科學,2008,33(1):208-211.