李旭++程濤++曹衛星++朱艷



摘要:以南京市為研究對象,獲取研究區域Landsat8 OLI遙感影像,利用QUEST決策樹的分類方法對影像進行分類。將植被覆蓋指數(NDVI)、迭代自組織數據分析技術(ISODATA)非監督分類作為地學輔助數據因子添加到分類波段中,構建多源數據集進行不同特征的融合,處理目標類別之間的非線性關系。該方法靈活性大,總精度達91.045%,Kappa系數為0.851,取得了比普通方法更好的精度。精度的提高有助于解決南京市復雜的規劃、決策和管理等問題。
關鍵詞:遙感;QUEST決策樹;土地利用分類;南京市
中圖分類號:TP751 文獻標識碼:A 文章編號:0439-8114(2017)01-0035-04
DOI:10.14088/j.cnki.issn0439-8114.2017.01.010
Research on Land-use Classification of Nanjing City with New Type Landsat 8 Remote Sensing Images Based on QUEST Decision Tree
LI Xu1,2,CHENG Tao2,CAO Wei-xing2,ZHU Yan2
(1.Information Engineering school of Tarim University,Alaer 843300,Xinjiang,China;
2.National Engineering and Technology Center for Information Agriculture,Nanjing Agriculture University,Nanjing 210095,China)
Abstract: Taking Nanjing city as the research object, Landsat 8 OLI remote sensing image of the study area was acquired and classified using the QUEST decision tree classification method. The NDVI(Normalized difference vegetation index), ISODATA(Iterative self-organizing date analysis technique) unsupervised classification of vegetation were added to the classification band as the geoscience auxiliary data factors. Multi-source data was constructed to fuse different feature, and nonlinear relationship among the target categories was analyzed. This method had great flexibility and better accuracy than conventional methods, with accuracy was 91.045% of the total and Kappa coefficient was 0.851. The improvement of the accuracy could help to solve complex planning, decision-making and management issues of Nanjing city.
Key words: remote sensing; quest decision tree; land use classification; Nanjing city
及時有效地獲取土地利用信息對指導社會、經濟、土地資源的合理利用和環境發展及科學管理土地資源有著重要的現實意義[1]。利用遙感和地理信息系統獲取土地利用信息具有獲取信息更新周期短、信息速度快、信息現勢性強等特點。遙感圖像分類是指根據遙感圖像中地物的光譜特征、空間特征、時相特征等對地物進行識別的過程[2]。
遙感影像分類的研究方法大體分為兩類[3]。一是基于像素遙感影像的分類方法[4],如傳統的監督、非監督分類方法,這些方法利用像元的亮度特征對影像進行分割,分類的精度低,從而不能滿足實際應用的需要。隨著人們對遙感認識的不斷深入,新的分類方法不斷被提出,如多重濾波、波段組合法、基于主成分分析光譜角度制圖的分類法、紋理分析法、模糊分類法、植被指數法、神經網絡法等[5]。這些分類方法雖然大大提高了分類精度,但是在分類結果中仍然存在“椒鹽效應”[6],且分類后需要大量的處理工作以修正結果。二是采用面向對象的分類方法,處理的最小單元是含有更多語義信息的多個相鄰像元組成的影像對象,在分類時利用的是對象的幾何信息以及影像對象之間的語義對象、紋理信息、拓撲關系等[7]。但此類方法多應用在高分辨率遙感影像上,在山地丘陵地區大范圍資源遙感調查中,分類結果精度尚需提高[8]。
決策樹分類方法(Decision tree classifier)是以各像元的特征值為設定的基準位置,按照一定知識規則進行分層并逐次進行比較,繼而從影像分離出目標地物的分類法[9]。在決策樹的劃分過程中,可以融合影像以外的各種信息,且不需要任何先驗假設條件,能使漏分和錯分誤差最小化,因此在遙感信息提取以及影像分類中有著廣泛的應用,例如農業資源調查、耕地變化遙感監測、城鎮土地規劃以及土地開發綜合評價[10-12]等。基于QUEST算法的決策樹分類方法是依靠多維遙感信息復合技術,提高遙感影像在復雜地形中對不同土地類型的區分度的一種快速、無偏、高效的方法[13],此方法用于復雜多變地貌的分類比普通決策樹分類法精度更為提高。
南京市位于長江下游沿岸,是全國重要的產業城市和經濟中心,也是華東地區重要的交通樞紐,由低山、崗地、河谷平原、濱湖平原和沿江河地等地形單元構成的地貌綜合體,是江南典型土地[14]。因此本研究采用基于QUEST決策樹影像的分類方法,將南京市各種地物的光譜知識以及其他相關知識融入決策樹,進行土地利用類型計算機自動分類。結果與采用普通決策樹分類法進行精度對比,以檢驗該方法在地形復雜地區的多光譜遙感影像精度。
1 研究區概況及數據處理
1.1 研究區概況
南京市位于江蘇省西南部,地理坐標為北緯31°14′-32°37′、東經118°22′-119°14′。行政區域總面積6 582 km2。南京市橫跨長江,鎮江市、揚州市、常州市以及滁州市、馬鞍山市、宣州市與其接壤。南京市區東倚鐘山,海拔448.9 m;西傍長江天塹,流經南京段約為95 km,距長江入海口347 km。南京市地貌特征屬于寧鎮揚丘陵地區,其以低山緩崗為主,丘陵占土地總面積的4.3%,低山占3.5%,崗地占53%,平原及河流湖泊占39.2%。在北部和中部廣大地區的土壤為黃棕壤(地帶性土壤),南部與安徽省接壤處有少量的紅壤,全市森林覆蓋率為13%[15]。
1.2 數據準備和預處理
2013年2月11號,NASA成功發射了Landsat 8衛星,OLI陸地成像儀包括9個波段,空間分辨率為30 m,其中包括一個15 m的全色波段,成像寬幅為185 km×185 km。根據南京市地理特征,研究采用的數據源為2013年10月5日Landsat 8兩景影像,在研究區域范圍內影像沒有云層覆蓋,圖像清晰,質量良好,所在時期研究區域植被生長茂盛,利于地物識別與分類工作。
使用ENVI5.1軟件對原始遙感影像進行圖像鑲嵌、幾何校正與配準,誤差控制在一個像元以內,同時利用南京市的行政邊界矢量數據進行影像的掩膜裁剪,從而得出南京市遙感影像的范圍。根據Landsat 8影像的各波段特征以及研究內容需要,對影像的7、6、4波段分別賦予紅、綠、藍顏色,獲得近似自然彩色的合成圖像,有利于提高圖像最佳目視解譯的效果。
2 影像決策樹分類
2.1 土地類型及訓練樣本選取
南京市平面位置南北長、東西窄,呈正南北向;南北直線距離150 km,中部東西寬50~70 km,南北兩端東西寬約30 km。根據野外遙感調查以及結合實際的土地利用現狀,得出土地利用類型主要分為建設用地、耕地、林地、草地、水體五大類,其中林地與草地大多為建設用地內部以及附近的綠化用地,分布比較零散,所以將林地與草地合并為林地一種類型,綜合以上考慮,將研究區土地劃分為耕地、林地、建設用地、水體4種土地利用類型。
訓練樣本的選取是影響遙感影像分類的關鍵因素,參考南京市1∶10 000比例尺及2009年土地利用圖,在遙感影像上均勻地選取各樣本訓練區,如表1所示。
2.2 QUEST算法
QUEST(Quick unbiased efficient statistical tree)是Loh和Shih[15]在1997年提出的建立決策樹的一種二元分類構建方法。其基本思想主要涉及分支變量和分割值的確定問題,但它將分支變量選擇和分割點選擇以不同的策略進行處理。一方面既要適用連續型變量又要適用離散型變量,另一方面還要考慮其他一般決策樹算法更傾向選擇那些具有更多潛在分割值的預測變量。QUEST在構建決策樹變量選擇上基本無偏差,同時還可以在特征空間中通過多個變量構成的超平面區別類別成員以及非類別成員。它的運算速度和分類精度優于其他決策樹方法[9,10]。
算法構建流程如下:
1)首先進行預測變量的選擇,依次對所有的預測變量X和目標變量Y的相關性進行分析,若X為離散變量,使用卡方檢驗計算X與Y的關聯強度,并且求出歸入該類的概率P值;若X是有序的或者連續的變量,則利用方差分析計算P值。
2)通過將所有變量的P值與預先設定的界值α/M進行比較,α為用戶指定的顯著性水平,在(0,1)之間,M為預測變量總數。如果均小于界值,就選擇最小的一個P值作為分支變量;如果均大于界值,則當X為連續的或者有序的變量時,利用Levene方差的齊性檢驗計算P值,并且在P值小于界值的時刻,選擇最小的一個P值作為分支變量。若方差的齊性檢驗P值均大于閾值,就選擇在第一步中的P值最小變量來作為分支變量。
3)如果選出的分支變量為離散型分類變量,需經過變換,使不同X取值的目標變量Y取值的差異最大化,并且計算其最大判別坐標。
4)如果Y為多分類,就為每一Y取值計算X的均數,使用聚類分析方法,將這些類別最終合并為兩大類,因此將多類類別簡化為二類判別問題。
5)利用二次判別分析方法最終明確分割點的位置,獲得所選預測變量X原始取值,從而構建分類規則。
2.3 決策樹的建立
選擇Landsat8 OLI影像,利用選取的訓練樣本提取各種光譜和輔助地學特征構建多源數據集,包括深藍、青、綠、紅、近紅外、2個短波紅外等7個多光譜波段以及植被覆蓋指數(Normalized difference vegetation index,NDVI)、迭代自組織數據分析技術(Iterative self-organizing data analysis technique,ISODATA)非監督分類結果,組成一個9波段數據來進行分類和精度分析。
NDVI是反映植被覆蓋度的重要指標,它是植物生長狀態以及植被空間分布密度最佳的指示因子,并且和植被分布密度呈線性相關關系,被廣泛地應用于景觀生態、農作物估產、環境監測等領域。ISODATA非監督分類是基于集群理論基礎上,依據不同影像地物在空間中的特征差別,收集由計算機集聚統計分析所得圖像,是一種無先驗類別標準的圖像分類法,可以為QUEST決策樹分類提供參考。
3 結果與分析
3.1 訓練區樣本分析
分離度是影響分類精度的重要指標,在影像中的訓練區樣本的分離度如表2所示。計算結果表明不同土地利用類型之間的分離度均大于1.9,樣本的分離度符合分類的要求。
總共有2 078個像元作為測試變量和目標變量,通過利用ENVI5.1軟件,建立基于QUEST的決策樹,在訓練過程中,決策樹的深度為12層,結點數為145個,從而比較方便地產生了IF-Then形式規則。根據南京市土地利用類型的實際情況以及調查數據,適當地修正決策樹的劃分條件,并且利用此類方法對多維影像進行分類,南京市土地分類結果如圖1所示。生產的決策樹結構比較復雜,分類生成的決策樹結構如圖2所示。
3.2 精度檢驗
參考南京市的土地利用數據、遙感影像圖、地形圖、野外調查資料等,研究區基于地物類型分布面積的比例大小,確定分層隨機采樣的1 982個像元樣本地物類型,驗證基于普通決策樹分類結果和基于QUEST決策樹分類結果。QUEST決策樹分類方法總精度為91.045%,比普通決策樹分類方法高3.895個百分點;Kappa系數為0.851,比普通決策樹分類方法高0.052。
4 結論
本研究利用基于QUEST的決策樹分類方法分析了地形條件較為復雜的南京市Landsat8 OLI遙感影像,將NDVI和ISODATA非監督分類結果等因子納入分類規則相對單一的利用光譜信息遙感影像分類中,從分類結果可以得出,基于QUEST決策樹的遙感影像分類提高了林地、建設用地的分類精度,從而提高了研究區影像的總體精度,而且能快速地利用選定的訓練樣本獲得集成遙感影像中比較精確的分類規則。此分類法可為區域土地利用開發、保護以及政府相關部門制定政策提供較為可靠的科學依據。
今后需要將多維地學信息,如光譜特征、紋理特征與地學輔助信息進行有機的結合,以期發現新的分類規則,從而構建決策樹專家分類模型,以進一步提高遙感影像分類的精度。
參考文獻:
[1] 劉曉娜,封志明,姜魯光.基于決策樹分類的橡膠林地遙感識別[J].農業工程學報,2013,29(24):163-172.
[2] 杜麗英.決策樹ID3算法的應用研究[J].輕工科技,2014(9):67-68.
[3] 周美琴,徐章艷,陳詩旭,等.新型偏好敏感決策樹算法[J].計算機應用研究,2016,33(10):3001-3006.
[4] 張 熙,鹿琳琳,王 萍,等.基于決策樹的漓江上游土地覆蓋分類[J].測繪科學,2016,41(3):100-104.
[5] 張 森,陳健飛,龔建周.運用C5.0決策樹進行面向對象分類——以landsat-8 OLI為例[J].測繪科學,2016,41(6):1-8.
[6] 梅卓華,金 焰,張哲海,等.基于TM影像的南京市土地利用變化遙感監測與評價[J].地球與環境,2010,38(1):63-67.
[7] 張 娟,黨耀國,李雪梅.基于前景理論的灰色多指標風險型決策方法[J].計算機工程與應用,2014,50(22):7-10.
[8] 王 軍,溫興平,張麗娟,等.基于遙感技術的滇池水域面積變化監測研究[J].河南科學,2014,32(8):1589-1593.
[9] JIANG Y N,WANG Y,LIAO M S. Study of coastal wetland classification based on decision rules using ALOS AVNIR-2 images and ancillary geospatial data[J].Geocarto International, 2015,19(3):1172-1188.
[10] L?魻W F,CONRAD C,MICHEL U.Decision fusion and non-parametric classifiers for land use mapping using multi-temporal RapidEye data[J].Isprs Journal of Photogrammetry and Remote Sensing,2015,108:191-204.
[11] 袁林山,杜培軍,張華鵬,等.基于決策樹的CBERS遙感影像分類及分析評價[J].國土資源遙感,2008(2):91-98.
[12] 巴 桑,劉志紅,張正健,等.決策樹在遙感影像分類中的應用[J].高原山地氣象研究,2011,31(2):31-34.
[13] 白秀蓮,巴雅爾,哈斯其其格.基于C5.0的遙感影像決策樹分類實驗研究[J].遙感技術與應用,2014,29(2):338-343.
[14] 王 茜,張增祥,易 玲,等.南京城市擴展的遙感研究[J].長江流域資源與環境,2007,16(5):554-559.
[15] LOH W Y,SHIH Y S.Split selection methods for classification trees[J].Statistica Sinica,1997,7:815-840.