于文婧,劉曉娜,孫丹峰※,姜宛貝,曲 葳(.中國農業大學資源與環境管理學院,北京 0093; .北京市農林科學院農業綜合發展研究所,北京 00097)
?
基于HJ-CCD數據和決策樹法的干旱半干旱灌區土地利用分類
于文婧1,劉曉娜2,孫丹峰1※,姜宛貝1,曲葳1
(1.中國農業大學資源與環境管理學院,北京 100193;2.北京市農林科學院農業綜合發展研究所,北京 100097)
摘要:為了實現干旱半干旱灌區地表信息低成本、高效率的動態監測,利用HJ-CCD數據的多時相和多光譜信息,探討了平羅縣土地利用遙感分類方法。首先建立研究區內典型地物的NDVI時間序列曲線,提取反映該區物候模式的時序特征參數;然后對土壤信息豐富的3月份多光譜影像進行主成分變換,選取第1主成分(PC1)作為光譜特征參數,最后基于分類回歸樹(classification and regression tree,CART)算法進行決策樹監督分類。總體分類精度達到92.26%,Kappa系數為0.91,比最大似然法分類結果精度提高了2.58%。研究表明:構建的NDVI時間序列曲線對研究區內的地類具有較強的代表性,提取的時間維和光譜維的分類參數對各地類均有很好地區分性,CART決策樹算法分類結果清晰準確且精度較高。該方法為HJ小衛星在干旱半干旱區等區域的深入應用提供科學依據和實證基礎。
關鍵詞:土地利用;決策樹;分類;HJ-CCD;歸一化植被指數(NDVI);時間序列;干旱半干旱灌區
于文婧,劉曉娜,孫丹峰,姜宛貝,曲葳. 基于HJ-CCD數據和決策樹法的干旱半干旱灌區土地利用分類[J]. 農業工程學報,2016,32(2):212-219.doi:10.11975/j.issn.1002-6819.2016.02.031http://www.tcsae.org
Yu Wenjing, Liu Xiaona, Sun Danfeng, Jiang Wanbei, Qu Wei. Land use classification in arid and semi-arid irrigated area based on HJ-CCD data and decision tree method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(2): 212-219. (in Chinese with English abstract)doi:10.11975/j.issn.1002-6819.2016.02.031 http://www.tcsae.org
Email:yuwenjing1215@163.com
土地利用/覆被信息是研究全球及區域變化的前提和基礎,遙感技術具有宏觀、時效、綜合、連續等特點,成為獲取土地信息變化的重要手段。多數研究利用MODIS的植被指數時間序列和光譜信息進行大范圍的土地利用分類[1-7],但是MODIS數據的空間分辨率較低,增加了選取樣本工作的復雜程度[8],大量混合像元的存在也限制了其在區域和高分辨尺度上的應用[9]。TM和SPOT等中高分辨率數據受到重訪周期和經濟成本等條件的限制,難以構建完整的時間序列植被指數曲線[10],因此以中高分辨率數據輔助MODIS數據進行多源遙感影像的土地利用分類的方法得到了一定的發展[11-14]。我國的HJ1-A衛星和HJ1-B衛星均搭載了2臺組合幅寬達到720 km的寬覆蓋多光譜CCD相機,其空間分辨率為30 m,4個譜段的設置與TM傳感器基本一致,A、B雙星同軌道面形成2 d重訪的高時間分辨率,可實現多時相、大范圍的區域遙感監測,已成為國內具有廣闊應用前景的中高時空分辨率數據之一。國內已有的基于環境小衛星數據進行土地利用分類與驗證的相關研究中,大多數沒有利用HJ-CCD數據的時間分辨率優勢,只將其空間和光譜特征與MODIS時間序列相結合,部分基于HJ-CCD多時相數據的研究也沒有綜合考慮植被生長周期而構建合理的時間序列,并提取有意義的時間特征參數[15-20]。因此如何將環境小衛星作為主要數據源,充分利用其時間、空間和光譜維信息,采用有效的方法進行土地利用分類需要更深入的研究,尤其是在農業景觀與自然景觀相對復雜多樣的干旱半干旱灌區。平羅縣是寧夏干旱區北部的農業大縣和中國重要的商品糧基地縣,長期大量引用黃河水的農業灌溉方式導致土壤次生鹽漬化較嚴重,該區的自然景觀和土地利用方式也較為復雜。
決策樹歸納法是數據挖掘中獲取分類規則的主要方法之一。分類回歸樹(classification and regression tree,CART)是一種結構清晰、實現簡單、運行快速和準確性高的決策樹構建算法。國內外許多學者基于不同數據源的特征參數探討了CART決策樹算法在區域土地利用分類中的優勢[21-25],證明其適合不同尺度、類型的分類特征融合。
本文以平羅縣為研究區,獲取2010年3月-11月共12景HJ-CCD影像,通過構建NDVI時間序列,提取反映該區自然植被和作物等物候特征的時序特征參數,并結合多光譜信息,進行CART決策樹分類研究。旨在為環境小衛星數據今后在干旱半干旱區范圍內的土地利用和生態環境質量監測等方面的深入應用提供方法和實證基礎。
平羅縣是石嘴山市唯一的建制縣,地處銀北平原中心,東臨黃河,西靠賀蘭山,位于105°58′~106°58′E,38°36′~39°51′N,地勢西南高東北低,自西向東分別為賀蘭山區、洪積扇區、碟形洼地、沖積平原、靈鹽臺地和河灘區。西部山區陡峭,植被稀疏,海拔在1 250~3 400 m;中部溝渠縱橫,湖泊繁多;東部黃河以東有部分沖積平原和沙漠,土壤主要以灌淤土、鹽土、堿土為主。該區屬于溫帶大陸性干旱氣候,春旱多風,夏熱多雨,秋季短暫,冬季干冷,年平均溫度8.8℃,年平均降水量173 mm,降水主要集中在7-9月,年平均蒸發量1 755 mm,蒸發量最多的是5月份。該縣的糧食作物種植面積占農作物面積的80%左右,主要糧食作物為小麥、水稻和玉米,主要的種植模式是一年一熟,也有小麥套玉米等具有一定特點的套種模式。圖1為平羅縣2009年1:100 000土地利用現狀圖(無山區和沙地),由寧夏農林科學院農業科技信息研究所提供。

圖1 平羅縣土地利用現狀圖Fig.1 Land use map of Pingluo county
2.1HJ小衛星CCD數據及預處理
遙感影像為2010年HJ-1A/1B CCD 數據2級產品,通過中國資源衛星應用中心查詢并免費下載。研究區范圍內的植被生長期主要集中在3月-11月,因此本文主要下載該時期內包含研究區的成像清晰、無云覆蓋的影像。由于植被的最短生長周期至少為3周,所以影像的時間間隔均為20 d左右,共12景(表1)。

表1 HJ-CCD影像數據列表Table 1 HJ-CCD images data list
本文將所有影像裁剪為包含研究區的矩形區域,以1:100 000地形圖為基準,采用二次多項式變換和雙線性內插方法對5月10日的影像做幾何精校正,在ENVI/IDL軟件平臺中通過編寫程序對其他時相的影像進行自動幾何配準,RMS控制在0.5個像元以內;通過元數據文件中的定標系數和公式對數據進行輻射定標,利用ENVI4.8軟件中的FLAASH大氣校正模塊進行大氣校正,基本參數從原始影像頭文件中獲取,波譜響應函數從資源衛星應用中心下載;最后利用DEM數據將西部山區掩膜。
2.2NDVI的計算與時間序列的生成
根據NDVI的計算公式

式中ρNIR為近紅外波段反射率;ρR為紅光波段反射率。在ENVI軟件中利用band math功能計算12景影像的NDVI值,并進行波段疊加,得到研究區的NDVI時間序列數據集。
本文通過分析研究區典型地類的NDVI時間序列曲線,提取能夠反映地類間差異的物候參數,結合包含豐富土壤信息的光譜參數,利用基于CART的決策樹法進行土地利用分類,最后比較并分析該方法與傳統的監督分類最大似然法(MLC,maximum likelihood classification)的精度和優勢,研究流程見圖2。
3.1分類體系和樣本的選取
本文根據研究區的自然環境和土地利用特點,綜合考慮土地利用圖的分類體系和遙感數據的分辨率,對研究區建立一級和二級結合的分類體系,將土地利用類型分為水澆地、水田、沙地、鹽堿地、林地、建設用地和水域,水澆地根據作物熟制又分為一年一熟和一年兩熟(表2)。

圖2 技術流程圖Fig.2 Technology flow cart

表2 土地利用分類體系Table 2 Classification system of land use
樣本的選擇對分類信息的獲取和分類規則的建立起關鍵作用,為確保樣本的準確性,綜合以下方法均勻選取一定數量的樣本:1)分析歷史土地利用圖,確定各地類樣本的分布及比例;2)目視解譯HJ-1/CCD影像和Google Earth高分辨率影像,進一步確認樣本類型和區域;3)檢驗HJ小衛星NDVI時間序列曲線,對目視解譯仍無法確認的樣本,通過地表的動態變化信息判定其最終的類別。樣本的采集遵循代表性和完備性的基本原則,樣本單元個數約占像元總數的2%,最后將樣本隨機分為2部分,比例為3:1,分別作為訓練樣本和驗證樣本。
各地類的典型NDVI時間序列曲線(圖3)表明,水域的NDVI值在0附近有較大波動,其他地類各時相的NDVI值均大于0;耕地的NDVI曲線在生長季有明顯的1或2個波峰,林地的生長季較長且NDVI曲線波峰幅度較小,各植被的生長周期、NDVI最大值、最小值和變化速率各不相同;除水域外,未利用地和建設用地等非植被的NDVI曲線都較平穩,沙地的NDVI均值和變化最小,鹽堿地和建設用地的曲線較相似。基于Jeffries-Matusita距離和轉換分離度(transformed divergence)計算所選樣本的可分離度,一般認為樣本之間的最小距離大于1.8表示其可分離性好。各地類樣本在NDVI時間序列上的J-M距離除建設用地和鹽堿地只有1.44,其他均大于1.8,說明利用NDVI時間序列可以很好地區分大部分地類,但是其對于建設用地和鹽堿地的區分還有一定的難度。

圖3 各地類樣本的NDVI時間序列曲線Fig.3 NDVI time series curve of each land type
3.2時間序列特征參數提取
1)NDVI最大值(NDVImax):植被與非植被的NDVI最大值差別較大,植被均大于0.5,非植被均小于0.3。
2)NDVI最小值(NDVImin):水域的NDVI最小值小于0,其他地類均大于0。
3)NDVI極差值(NDVIrange):非植被的NDVI曲線無明顯波峰,極差值相比植被較小,沙地幾乎無植被覆蓋,極差值最小。
4)7月29日(第7時相)與5月10日(第3時相)的NDVI差值(NDVI7-3):5月10日,研究區的水稻秧田為水體和稻種的混合,水稻大田為翻耕后的裸土,兩者的NDVI值都接近于0,水田的生長速率最快,NDVI值在7月29日達到峰值,利用該參數可以將水田與其他地類區分開。林地與一年一熟制水澆地的NDVI值在第3時相均達到0.2以上,且兩者增長速率較慢,該參數值較小;一年兩熟制水澆地的NDVI曲線在第7時相為2個生長周期之間的波谷,該參數值為負值。
5)10月4日(第10時相)與7月29日(第7時相)的NDVI差值(NDVI10-7):一年兩熟制水澆地的NDVI值在第7~第10時相從波谷到達第2個峰值,該參數值為正;其他作物在該時段處于成熟期至收獲期,NDVI曲線呈將下降趨勢,該參數值為負;林地一直處于生長旺盛期,NDVI值變化不大,該參數值接近于0。
6)10月4日~11月8日(第10~12時相)的NDVI均值(NDVI10~12mean):林地由于生長周期長,NDVI曲線下降緩慢,該參數值最大;一年兩熟制水澆地在該時期處于第2個生長周期,與收獲期已結束的其他作物相比,該參數值較大。
3.3多光譜特征參數提取
NDVI主要反映地是植被信息,對非植被和低植被覆蓋區的區分性不強,雖然建設用地和鹽堿地的NDVI特征參數都很相似,它們的土壤信息卻有很大差異,如鹽堿地在可見光近紅外波段的光譜反射率比建設用地高。在3月份,研究區地表幾乎無植被覆蓋,且正值返鹽高峰期,土壤信息較豐富,所以對3月份的多光譜影像進行主成分變換,實現數據壓縮和信息增強,變換后第1主成分PC1的貢獻率達到95.07%,說明其包含了絕大部分的地表信息。計算NDVI時間序列和PC1波段組合后各類樣本的J-M距離,建設用地和鹽堿地的可分離度達到1.73,其他地類之間的分離度也有不同程度的提高,說明多光譜特征參數PC1對地類的區分有重要作用,所以將其作為一個波段參與分類。
3.4CART決策樹分類
CART是由Breiman于1984年提出的一種決策樹算法,此后又得到了不斷地改進。該算法的基本原理是通過對由測試變量和目標變量構成的訓練數據集的循環二分形成二叉樹形式的決策樹結構。CART決策樹在生長過程中,采用經濟學中的基尼(Gini)系數作為選擇最佳測試變量和分割閾值的準則,并采用交叉驗證的方法進行樹的修剪,最終生成一棵兼顧復雜度和錯誤率的最優二叉樹[26-27]。基尼系數的數學定義如下

式中p(j/h)為從訓練樣本集中隨機抽取一個樣本,當某一測試變量值為h時屬于第j類的概率;nj(h)為訓練樣本中該測試變量值為h時屬于第j類的樣本個數;j為類別個數。本文以訓練樣本作為目標變量,用時序參數和PC1作為測試變量進行學習,得到的決策樹共102個葉節點,該決策樹可以表示為“If-Then”形式的產生式規則(表3)。

表3 CART決策樹分類規則Table 3 CART decision tree classification rules
4.1分類結果
最終的分類結果如圖4所示(無山區)。研究區內的主要耕地類型為一年一熟制水澆地,集中分布在北部和中部;一年兩熟制水澆地數量較少,主要分散在研究區北部和南部;建設用地主要為農村居民點和西北部的城區、工礦用地;水域以黃河、湖泊和養殖水面為主;鹽堿地和沙地主要分布在研究區東部、北部以及水域周圍;水田主要分布在研究區西部和南部,黃河沿岸的部分水田對應土地利用圖中的不穩定耕地和鹽堿地,說明該區域的耕地土壤鹽漬化程度較高;林地主要分布在黃河西側,與土地利用圖中的鹽堿地相對應,說明平羅縣為治理鹽堿地已開展了植樹造林的生態措施。從整體上看,分類結果圖與土地利用圖中相應地類的分布區域和范圍基本一致,說明利用該方法對研究區進行土地利用分類效果較好。

圖4 平羅縣土地利用分類圖Fig.4 Land use classification map of Pingluo county
4.2分類精度檢驗
利用驗證樣本建立混淆矩陣,對分類結果進行精度驗證(表4),總體分類精度達到92.26%,Kappa系數為0.91,水田的分類精度最高,達到98.23%,沙地、一年一熟制水澆地和水體的分類精度均在90%以上,一年兩熟制水澆地、林地、鹽堿地和建設用地的精度均大于80%。
混淆矩陣表明,林地被錯分為耕地的情況比較明顯,這是由于林地主要種植在黃河沿岸土壤鹽漬化程度嚴重的區域,多數為灌木林和疏林地,受土壤、氣候等自然條件及種植密度的影響,生長季后期NDVI值較小,易與收割后的耕地相混淆;鹽堿地與建設用地的混分現象也較嚴重,由于兩者的NDVI時間序列曲線相似,且鹽堿地多分布在城市和工礦用地的附近,部分與農村居民點相互交錯,形成大量混合像元,導致兩者之間容易被錯分。部分耕地由于土壤質量和灌溉條件等原因,也存在與其他地類的混分現象。

土地利用類型Land use types林地Forest land水田Paddy沙地Sand鹽堿地Saline-alkali soil水域Water一年兩熟制水澆地Double crops irrigated land建設用地Construction land一年一熟制水澆地One crop irrigated land樣本Samples精度Accuracy/%林地 609 0 0 3 0 16 4 77 709 85.90水田 0 3500 0 0 0 0 2 61 3563 98.23沙地 0 0 1491 49 0 0 0 0 1540 96.82鹽堿地 0 0 53 1376 0 0 232 11 1672 82.30水體 0 0 0 91 1390 0 0 0 1481 93.86一年兩熟制水澆地 10 0 0 0 0 383 15 32 440 87.05建設用地 0 0 0 237 1 0 1011 4 1253 80.69一年一熟制水澆地 3 72 0 42 0 23 79 3552 3771 94.19
4.3與其他方法的比較
相比僅利用NDVI時間序列參數,加入PC1波段后的分類精度有顯著提高,總體分類精度提高6.05%,建設用地和鹽堿地的精度分別提高26.34%和12.14%。CART方法相比最大似然法(MLC),總體分類精度提高2.58%(表5)。最大似然法分類結果中的建設用地和水域均有一定程度的“擴張”現象,CART方法的分類結果比最大似然法更精確,有效改善了最大似然法中的錯分現象,兩種方法的局部對比如圖5。

表5 不同波段/方法分類精度比較Table 5 Classification accuracy comparison of different bands/method %

圖5 CART決策樹法與最大似然法分類結果局部對比Fig.5 Local contrast of CART and MLC classification results
本研究綜合利用HJ-CCD數據多時相和多光譜信息,利用決策樹方法,實現了對平羅縣快速、有效、經濟的區域土地利用遙感分類,主要結論如下:
1)構建的NDVI時間序列能夠準確表達地表動態信息,通過橫向、縱向分析不同類型NDVI時序曲線的差異,提取反映區域物候信息的時間維特征參數,對研究區地類具有很強的分異性。
2)研究區土壤鹽漬化程度嚴重,地表組成復雜交錯,3月份多光譜影像的第1主成分PC1包含豐富的土壤信息,引入該光譜維特征參數可以改善僅利用NDVI對低植被覆蓋區分類的不足。
3)CART算法能夠快速、有效地獲取特征參數的分類規則,生成樹的結構合理清晰。決策樹方法比最大似然法的分類精度更高,結果表達更準確。
HJ-CCD數據的處理、典型地類NDVI時間序列曲線的建立、時間維及光譜維分類參數的提取與CART方法的利用,都具有良好的適用性及穩定性,可為HJ小衛星數據在區域地表信息提取中的應用提供一定的基礎與參考。本研究還存在一些不足之處,有待在今后的工作中加以完善。首先,NDVI易受土壤背景噪聲干擾,而增強型植被指數EVI能同時校正土壤和大氣影響,對植被的分辨能力更強,所以本研究將進一步探討2種植被指數的綜合應用。其次,研究區地類復雜交錯,易形成混合像元,對分類結果的精度造成一定影響,所以利用光譜混合模型對混合像元進行分解將成為本文今后研究的重點。
[參考文獻]
[1] 劉勇洪,牛錚,徐永明,等. 基于MODIS數據設計的中國土地覆蓋分類系統與應用研究[J]. 農業工程學報,2006,22(5):99-104. Liu Yonghong, Niu Zheng, Xu Yongming, et al. Design of land cover classification system for China and its application based on MODIS data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2006, 22(5): 99-104. (in Chinese with English abstract)
[2] Brian D Wardlow, Stephen L Egbert, Jude H Kastens. Analysis of time-series MODIS 250m vegetation index data for crop classification in the U.S. Central Great Plains[J]. Remote Sensing of Environment, 2007, 108(3): 290-310.
[3] 孫艷玲,楊小喚,王新生,等. 基于決策樹和MODIS數據的土地利用分類[J]. 資源科學,2007,29(5):169-174. Sun Yanling, Yang Xiaohuan, Wang Xinsheng, et al. Landuse classification based on decision tree using MODIS data[J]. Resources Science, 2007, 29(5): 169-174. (in Chinese with English abstract)
[4] 馬俊飛,呂昌河,王茜. 基于MODIS NDVI時序數列的柴達木盆地土地覆蓋分類研究[J]. 干旱區地理,2008,31(3):442-448. Ma Junfei, Lü Changhe, Wang Qian. Land-cover classification of the Qaidam Basin based on MODIS NDVI time series data[J]. Arid Land Geography, 2008, 31(3): 442-448. (in Chinese with English abstract)
[5] 鄭長春,王秀珍,黃敬峰. 多時相MODIS影像的浙江省水稻種植面積信息提取方法研究[J]. 浙江大學學報:農業與生命科學版,2009,35(1):98-104. Zheng Changchun, Wang Xiuzhen, Huang Jingfeng. Mapping paddy rice planting area in Zhejiang Province using multi-temporal MODIS images[J]. Journal of Zhejiang University: Agric & Life Sci, 2009, 35(1): 98-104. (in Chinese with English abstract)
[6] 劉慶鳳,劉吉平,宋開山. 基于MODIS/NDVI時序數據的土地覆蓋分類[J]. 中國科學院研究生院學報,2010,27(2):163-169. Liu Qingfeng, Liu Jiping, Song Kaishan. Land cover classification based on MODIS/NDVI times series data[J]. Journal of the Graduate School of the Chinese Academy of Sciences, 2010, 27(2): 163-169. (in Chinese with English abstract)
[7] 王志慧,李世明,劉良云,等. 基于MODIS NDVI時間序列的土地覆蓋分層分類方法研究[J]. 遙感技術與應用,2013,28(5):910-919. Wang Zhihui, Li Shiming, Liu Liangyun, et al. Hierarchical land cover classification based on MODIS NDVI time-series[J]. Remote Sensing Technology and Application,2013, 28(5): 910-919. (in Chinese with English abstract)
[8] 陳思寧,趙艷霞,申雙和. 基于波譜分析技術的遙感作物分類方法[J]. 農業工程學報,2012,28(5):154-160. Chen Sining, Zhao Yanxia, Shen Shuanghe. Crop classification by remote sensing based on spectral analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(5): 154-160. (in Chinese with English abstract)
[9] 劉睿,馮敏,孫九林,等. 基于環境減災衛星CCD數據與決策樹技術的植被分類研究[J]. 地理科學,2012,32(12):1488-1495. Liu Rui, Feng Min, Sun Jiulin, et al. The vegetation classification based on HJ-CCD data and decision tree[J]. Scientia Geographica Sinica, 2012, 32(12): 1488-1495. (in Chinese with English abstract)
[10] 郝鵬宇,牛錚,王力,等. 基于歷史時序植被指數庫的多源數據作物面積自動提取方法[J]. 農業工程學報,2012,28(23):123-131. Hao Pengyu, Niu Zheng, Wang Li, et al. Multi-source automatic crop pattern mapping based on historical vegetation index profiles[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(23): 123-131. (in Chinese with English abstract)
[11] 王莉雯,牛錚,衛亞星. 基于MODIS NDVI的新疆土地覆蓋類型劃分與潛在荒漠化區域探測[J]. 干旱區地理,2007,30(4):573-578. Wang Liwen, Niu Zheng, Wei Yaxing. Land cover type classification and potential desertification area detecting in Xinjiang based on MODIS NDVI imagery[J]. Arid Land Geography, 2007, 30(4): 573-578. (in Chinese with English abstract)
[12] 郝衛平,梅旭榮,蔡學良,等. 基于多時相遙感影像的東北三省作物分布信息提取[J]. 農業工程學報,2011,27(1):201-207. Hao Weiping, Mei Xurong, Cai Xueliang, et al. Crop planting extraction based on multi-temporal remote sensing data in Northeast China [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2011, 27(1): 201-207. (in Chinese with English abstract)
[13] 潘耀忠,李樂,張錦水,等. 基于典型物候特征的MODIS-EVI時間序列數據農作物種植面積提取方法:小區域冬小麥實驗研究[J]. 遙感學報,2011,15(3):578-594. Pan Yaozhong, Li Le, Zhang Jinshui, et al. Crop area estimation based on MODIS-EVI time series according todistinct characteristics of key phenology phases: A case study of winter wheat area estimation in small-scale area. Journal of Remote Sensing, 2011, 15(3): 578-594. (in Chinese with English abstract)
[14] 許青云,楊貴軍,龍慧靈,等. 基于MODIS NDVI多年時序數據的農作物種植識別[J]. 農業工程學報,2014,30(11):134-144. Xu Qingyun, Yang Guijun, Long Huiling, et al. Crop information identification based on MODIS NDVI time-series data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014,30(11): 134-144. (in Chinese with English abstract)
[15] 鄔明權,王長耀,牛錚. 利用多源時序遙感數據提取大范圍水稻種植面積[J]. 農業工程學報,2010,26(7):240-244. Wu Mingquan, Wang Changyao, Niu Zheng. Mapping paddy fields inlarge areas, based on time series multi-sensors data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(7): 240-244. (in Chinese with English abstract)
[16] 王琳,景元書,楊沈斌. 基于多時相遙感數據提取水稻種植面積的研究[J]. 中國農業資源與區劃,2013,34(2):20-25. Wang Lin, Jing Yuanshu, Yang Shenbin. Study on extraction of rice cropping area using multi-temporal remote sensing data[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2013, 34(2): 20-25. (in Chinese with English abstract)
[17] 賈明明,宗明,張柏,等. 綜合環境衛星與MODIS數據的面向對象土地覆蓋分類方法[J]. 武漢大學學報?信息科學版,2014,39(3):305-310. Jia Mingming, Zong Ming, Zhang Bai, et al. Land cover classification of compositing HJ-1 and MODIS data base on object-based method[J]. Geomatics and Information Science of Wuhan University, 2014, 39(3): 305-310. (in Chinese with English abstract)
[18] 杜娟,楊國范,翟光耀. 基于環境小衛星的半干旱區土地利用信息提取[J]. 國土資源科技管理,2014,31(4):61-67. Du Juan, Yang Guofan, Zhai Guangyao. Land use information extraction of semi-arid region based on HJ satellites[J]. Scientific and Technological Management of Land and Resources, 2014, 31(4): 61-67. (in Chinese with English abstract)
[19] 仲波,馬鵬,聶愛華,等. 基于時間序列HJ-1/CCD數據的土地覆蓋分類方法[J]. 中國科學:地球科學,2014,44(5):967-977. Zhong Bo, Ma Peng, Nie Aihua, et al. Land cover mapping using time series HJ-1/CCD data[J]. Science China: Earth Sciences, 2014, 44(5): 967-977. (in Chinese with English abstract)
[20] 李鑫川,徐新剛,王紀華,等. 基于時間序列環境衛星影像的作物分類識別[J]. 農業工程學報,2013,29(2):169-176. Li Xinchuan, Xu Xingang, Wang Jihua, et al. Crop classification recognition based on time-series images from HJ satellite[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013,29(2): 169-176. (in Chinese with English abstract)
[21] 趙萍,傅云飛,鄭劉根,等. 基于分類回歸樹分析的遙感影像土地利用/覆被分類研究[J]. 遙感學報,2005,9(6):708-716. Zhao Ping, Fu Yunfei, Zheng Liugen, et al. Cart-based land use /cover classification of remote sensing images[J]. Journal of Remote Sensing, 2005, 9(6): 708-716. (in Chinese with English abstract)
[22] 王大鵬,王周龍,李德一,等. 綜合非光譜信息的荒漠化土地CART分類[J]. 遙感學報,2007,11(4):487-492. Wang Dapeng, Wang Zhoulong, Li Deyi, et al. The extraction of desertification information using CART under Knowledge Guide[J]. Journal of Remote Sensing, 2007,11(4): 487-492. (in Chinese with English abstract)
[23] 劉建光,李紅,孫丹峰,等. MODIS土地利用/覆被多時相多光譜決策樹分類[J]. 農業工程學報,2010,26(10):312-318. Liu Jianguang, Li Hong, Sun Danfeng, et al. Land use/cover decision tree classification fusing multi-temporal and multi-spectral of MODIS[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(10): 312-318. (in Chinese with English abstract)
[24] 齊樂,岳彩榮. 基于CART決策樹方法的遙感影像分類[J].林業調查規劃,2011,36(2):62-66. Qi Le, Yue Cairong. Remote sensing image classification based on CART decision tree method[J]. Forest Inventory and Planning, 2011, 36(2): 62-66. (in Chinese with English abstract)
[25] 左玉珊,王衛,郝彥莉,等. 基于MODIS影像的土地覆被分類研究:以京津冀地區為例[J]. 地理科學進展,2014,33(11):1556-1565. Zuo Yushan, Wang Wei, Hao Yanli, et al. Land cover classification based on MODIS images: Taking the Beijing-Tianjin-Hebei region as an example[J]. Progress in Geography, 2014, 33(11): 1556-1565. (in Chinese with English abstract)
[26] Breiman L, Friedman J H, Olshen R A, et al. Classification and Regression Trees[M]. California: Wadsworth International Group, 1984: 1-358.
[27] Yohannes Y, Hoddinott J. Classification and Regression Trees: An Introduction[M]. Washington D C: International Food Policy Research Institute, 1999.
Land use classification in arid and semi-arid irrigated area based on HJ-CCD data and decision tree method
Yu Wenjing1, Liu Xiaona2, Sun Danfeng1※, Jiang Wanbei1, Qu Wei1
(1. College of Resources ɑnd Environmentɑl Sciences, Chinɑ Agriculturɑl University, Beijing 100193, Chinɑ;
2. Institute of System Comprehensive Development, Beijing Acɑdemy of Agriculture ɑnd Forest Sciences, Beijing 100097, Chinɑ)
Abstract:HJ satellites with the characteristics of high temporal resolution, high spatial resolution and large coverage, can provide the regional land use/cover classification with high accuracy. Pingluo county is in the arid and semi-arid area of northwest China, the climate and human irrigation activities caused complicated land use/cover type and serious soil salinization in the study area. In order to achieve the dynamic monitoring of land surface information with low cost and high precision, a regional land use supervised classification based on the classification and regression tree (CART) algorithm was developed and discussed in Pingluo county using the multi-temporal and multi-spectral information of HJ satellite CCD data. Firstly, high quality HJ-1 CCD data (the interval was about 20 d) were selected, and preprocessed including geometric correction, radiometric calibration and atmospheric correction. The normalized difference vegetation index (NDVI) were calculated and overlapped together. Secondly, the land use types including double crops irrigated land, one crop irrigated land,paddy, sand, saline-alkali soil, forest land, construction land and water were adopted for the two-level classification system,and the training samples were selected to obtain the typical NDVI time-series curve of each land type. Then, the characteristic parameters (including maximum, minimum, range, the difference between the value of the July 29 and the May 10 phases, the difference between the value of the October 10 and the July 29 phases, the mean value of the October 4 to the November 8 phases) which could reflect the phonological pattern in the area were extracted through the analysis of the NDVI time-series curves. Thirdly, the principle component transform of a multi-spectral image in March with ample soil information was performed for improving the separation between the construction land and saline-alkali land when the first principal component (PC1) was chosen for a parameter band for classification. Finally, a CART decision tree classification was implemented by combining the multi-temporal and multi-spectral parameter bands in the area. The decision tree had a total of 102 leaf nodes and could be expressed as “If…Then…” forms. The results showed that the overall precision of this classification method was 92.26%. The Kappa coefficient was 0.91. The accuracy of the paddy field was the highest which reached 98.23%. The accuracies of sand, one crop irrigated land and water were all greater than 90%. Double crops irrigated land, forest land, saline-alkali land, construction land were all greater than 80%. The participation of PC1 had made great contributions in improving the classification accuracy, especially for construction land and saline-alkali land, their accuracy increased 26.34% and 12.14%, respectively. The overall accuracy of CART decision tree classification was increased 2.58% than maximum likelihood classification. The classification accuracy of vegetation improved the most. The results of CART decision tree classification were more accurate and meticulous than maximum likelihood classification (MLC), and it effectively correct the obvious wrong classification results in MLC. The study indicated that the established typical NDVI time series curves based on HJ-CCD data had strong representativeness for each land use type in this region. The extracted time and spectrum dimensional parameters could distinguish between most of the land categories well. The results of CART decision tree classification were more clear and accurate than MLC. The proposed methods in this study had certain feasibility and applicability, and could provide empirical basis for the further application of HJ-1 CCD data in land use/cover and environment monitoring in different scale area, and also give informational and technical supports for the multilevel and comprehensive land resources and environment management by using HJ satellite as the main data source.
Keywords:land use; decision trees; classification; HJ-CCD; NDVI; time series; arid and semi-arid irrigated area
通信作者:※孫丹峰,男,山東海陽人,博士,教授,主要從事資源環境信息技術與土地利用/覆被研究。北京中國農業大學資源與環境學院,100193。Email:sundf@cau.edu.cn
作者簡介:于文婧,女,內蒙古呼倫貝爾人,博士生,主要從事土地利用/覆被遙感應用研究。北京中國農業大學資源與環境學院,100193。
基金項目:國家自然科學基金資助面上項目(40871103,41071146)
收稿日期:2015-06-02
修訂日期:2015-11-10
中圖分類號:TP79;S127
文獻標志碼:A
文章編號:1002-6819(2016)-02-0212-08
doi:10.11975/j.issn.1002-6819.2016.02.031