余超,李明陽,何隆華
(1.南京林業大學,南京210037;2.中國科學院南京地理與湖泊研究所,南京210008)
利用決策樹分類方法的南京江寧水稻面積變化研究
余超1,李明陽1,何隆華2
(1.南京林業大學,南京210037;2.中國科學院南京地理與湖泊研究所,南京210008)
自從2000年12月江寧撤縣設為南京市江寧區以來,2002年~2010年期間許多農田現在變成了高樓大廈。該文以南京市江寧區水稻田為研究對象,以江寧區2002年、2006年以及2010年的遙感影像為主要信息源,利用決策樹分類的方法,通過坡度、濕度、NDVI等決策因子,根據野外實地勘測調查數據對比,提取出江寧區的水稻田,再通過驅動因子分析,用地理加權回歸方法找出主要影響因子,加上空間分布格局的動態分析,從而比較出在這段時間內南京江寧區水稻田的變化情況。研究表明:①江寧區在2002年~2010年內水稻田面積減少了約690km2,約70%的稻田變為其他用地,變化非常明顯;②主要影響面積變化的驅動因子是人類居住活動范圍的變化;③水稻田的空間格局在2002年~2010年間聚集性減弱,破碎化趨勢加強。
水稻;決策樹;地理加權回歸;空間格局;面積變化;地理國情監測
水稻主要生長在我國多云雨、溫度適宜的中部和南部地區,該區域是我國的主要產糧區,對該區域水稻進行種植面積的提取、長勢的監測和產量的估算等研究是具有重要意義的[1]。水稻的面積提取有很多種方法,從數據的角度看,水稻信息提取的方法可分為兩大類型:以TM為代表的中高分辨率數據和以MODIS為代表的低分辨率數據[2]。其中,前一類型是靜態地通過單一時相的影像分類,這類數據自身具有較高空間分辨率分類精度較高;后一類型則主要通過時序歸一化植被指數(Normalized Difference Vegetation Index,NDVI)的差異結合知識的手段從而提高分類精度。王福民等[3]曾以水稻生長前期和后期2景TM影像進行穗帽變換并合成多時相影像,通過最小距離法來提取水稻信息;朱良等[4]通過TM影像的NDVI和陸地表水指數(Land Surface Water Index,LSWI)不同變化進行小尺度水稻面積提取;彭代亮[5]在2009年基于統計與MODIS數據來進行水稻遙感估產;馬孟莉等[6]利用混合像元分解的方法也做過水稻面積的提取。
不過單一的通過某種因子來進行水稻田的提取,會造成誤差,比如僅僅通過NDVI來進行提取會誤將一部分覆滿水草的池塘也分類成稻田。決策樹分類的方法可以將多個分類因子同時進行判定篩選,更加嚴格地根據輸入的篩選條件進行面積提取,從而提高了分類精度。因此,本文以南京江寧區作為研究區域,利用決策樹的分類方法,提取出水稻田的面積,加上驅動因子分析以及空間動態分布格局,更加全面地比較出江寧2002年~2010年間的稻田面積變化,為江寧區農業的進一步規劃發展提供重要參考。
江蘇省南京市江寧區(118°31′E~119°04′E,30° 38′N~32°13′N),位于江蘇省西南部,東與句容市接壤,南至東南與安徽省當涂縣、溧水區毗連,西南與馬鞍山市相鄰,西與安徽省和縣及南京市浦口區隔江相望。常態地貌有低山、丘陵、崗地、平原和盆地,其中丘陵崗地面積最大,境內有大小山丘400多個。境內河道主要有秦淮河和長江兩大水系,面積1577.75km2,全年總降水量959.6mm,其中2月、4月、7月~9月和11月份偏多,其余各月偏少,年無霜期225天。2008年統計年鑒統計的水稻稻田面積為210.8km2,約占總面積的13%,最大高程是363m。南京市江寧區農業以油菜、小麥、水稻、大豆、紅薯和芝麻等為主要作物,冬小麥和油菜與水稻輪作為主。2000年12月,經國務院批準,撤縣設立南京市江寧區,現已呈功能效益多元顯現的都市型農業格局。2004年,江寧區累計引進農業外資項目238個,實際利用外資2.5億美元。到2012年已有近60個國家和地區的2400個項目落戶,集聚了40家世界500強企業,累計實際使用外資超過60億美元,使電力自動化產業成為江寧的特色的產業。
3.1 數據來源與預處理
Landsat TM影像時間分辨率是16天,空間分辨率是30m,主要特點為具較高空間分辨率、波譜分辨率、極為豐富的信息量和較高定位精度。本次實驗選取2002年8月24日、2006年8月30日以及2010年8月15日三期遙感數據作為數據源。同時,利用GPS到江寧地區獲取研究區域內各個地物位置詳細信息,用于幾何校正以及精度驗證。
TM數據的預處理包括:(1)幾何精校正。在ERDAS IMAGINE 9.2中利用實地測量的GPS定點來進行幾何校正處理。(2)大氣校正和輻射定標。利用ENVI的spectral工具欄下的preprocessing進行輻射定標和大氣校正。(3)研究區域的裁剪。利用江寧區行政邊界矢量圖形通過ENVI軟件下的subset data via ROIs工具裁剪出研究區。
3.2 決策樹模型的特征指數選取
決策樹是通過對訓練樣本進行歸納學習而生成決策規則,而后使用決策規則對數據進行分類的一種數學方法[7]。決策樹的每個內部結點都是一系列類別屬性的集合。決策樹的葉結點對應一個類別屬性值。決策樹通過決策規則把根節點逐步劃分成內部節點,也是通過決策規則把內部節點劃分為葉節點。近年來,決策樹因其具有較高的魯棒性、計算效率高、分類精度高、分類規則直觀、易于理解等優點,故被廣泛地運用于地物識別提取[8-9]。
TM影像常用的特征指數主要有NDVI,紅光波段能增強植被與非植被之間的差異,通過反映不同植物葉綠素含量的不同來區分植被種類。綠色植被在0.7μm~0.8μm之間有一個高反射峰,近紅外波段對植物類別差異敏感,是監測植被的通用波段。水稻除了自身生物量與其他地物不同之外,其特殊的生長環境也為信息提取提供了有利條件[10]。根據對南京江寧區水稻田的實地定位調查,發現水稻多生長在海拔小于50m且坡度小于12°的區域,并且在對江寧區的水稻田監測中發現其濕度一般在100%~400%之間。因此本文選擇作為決策樹分類的因子為NDVI、濕度、海拔以及坡度。
4.1 水稻田面積變化分析
對實驗區域樣本定量分析是建立決策樹的基礎和依據。根據南京市江寧區的NDVI數據,研究從典型地物的NDVI時間序列曲線中將與其他類存在明顯差異的水體和建筑設定閾值加以區分,再根據水稻的生活習性依據海拔,坡度,濕度來進行進一步分類篩選。具體步驟為:(1)區分水體,閾值設為NDVI<0.15,水體與其他地類的NDVI曲線有明顯差別,故先將其進行剔除;(2)區分出居民點,閾值設為0.15<NDVI<0.35,居民地的NDVI明顯高于水體并且低于植被,采用多個時間的數據對該節點的規則在訓練區中進行訓練,最終得出該區間97.8%的像元都屬于居民點;(3)區分林地,根據對江寧區所有種植水稻地方的調查,發現水稻基本生長在海拔小于50m且坡度小于12°的區域,因此可以將此作為閾值進行分類。(4)區分旱田和水稻田,旱田和水稻田的濕度有明顯區別。水稻具有好濕喜溫的特性,通過ENVI軟件的纓帽變換得到江寧區的濕度圖,根據對江寧區200個水稻樣地點的測量,得出水稻田濕度值在100%~400%之間。
根據所設定的條件,用ENVI決策樹功能建立好決策樹如圖1所示。

圖1 決策樹模型
根據編輯的決策樹分類規則,用ENVI執行決策樹進行分類。得到如圖2~圖4的分類結果。

圖2 2002年江寧區水稻分類結果

圖3 2006年江寧區水稻分類結果

圖4 2010年江寧區水稻分類結果
驗證分類精度時,根據在江寧區實地測量的200組樣地點GPS數據,如圖5所示,利用ENVI軟件的混淆矩陣精度驗證法來進行精度驗證,得到水稻的識別精度結果如下表1所示。
通過3個不同的年代的水稻田分布對比,可以非常明顯地看出隨著城市化的發展,江寧區的水稻田面積在不斷變小。這是由于自1985年起整個江寧區的產業結構發生了重大變化,其工業總產值首次超過農、林、牧、副、漁的總產值。從1990年往后,隨著開發區的四處興起,大量的農業用地首先被工業用地所占用,在早期所征用的農地中,幾乎有60%的農業用地變為了工業用地。另外,自從20世紀90年代中期以后,江寧區政府一方面大力引進外資工業對江寧進行開發;另一方面,房地產開發,帶來居住型用地的增長;同時,根據生態型新城區的定位,又占用了一部分的農業用地,來進行生態新城區的規劃設計。此外,興建公共活動空間,基礎設施用地,這些項目的開展,也占用了大量的農業用地[11]。

圖5 GPS樣地點分布圖

表1 江寧區水稻面積分類結果表
4.2 地理加權回歸分析
本文將水稻田斑塊距離道路距離,距離居民點距離,距離水體距離這3個因子作為自變量,將水稻田斑塊面積作為因變量,采用ArcGIS空間統計分析工具箱中的Graphically Weighted Regression模塊進行地理加權回歸。
在地理加權回歸模型輸出的評價系數中,Cond表示局部的共線性情況,當大于30時,表示實驗結果不理想,Predicted給出其預測結果,Residuals表明真實值與預測值的差。在本文中,Cond的最小值為3.701,最大值為25.451,平均值為11.624,表示實驗結果比較理想,模型的局部相關系數R2為0.7239,表明模型可以解釋72.39%差異。因變量距離居民點距離,距離道路距離,距離水體距離的平均相關系數分別為:0.0068,0.0041,-0.0025,表示與距離居民點以及道路距離成正相關,與距離水體距離成負相關,也就是說離居民點以及道路越遠越水田越多,離水越近水田越多。由此可以證明出水田面積變化的與人類居住地的變化有著密切的關系。
4.3 水稻田空間格局分析
將三期的水稻分類結果圖導入到景觀空間分析軟件Fragstats 3.3進行分析,在這里本文選取幾個結果指標來進行比較:斑塊類型面積(Total Class Area,CA),斑塊數量(Number of Patches,NP),斑塊密度(Patch Density,PD),最大斑塊指數(Largest Patch Index,LPI),結果如表2所示。

表2 水稻面積空間格局分析表
從表2可以看出,2002年~2010年間,江寧水稻的斑塊面積在不斷下降,斑塊的數量在增加,最大斑塊指數與斑塊密度也一同下滑,稻田不斷變小變碎變散,由原來的聚集密集型不斷破碎,變成又小又散的分布在各個區域。這與三期水稻田面積提取的結果吻合,可以看出由于人為因素的干擾,水稻田空間聚集性減弱,破碎化趨勢增強,同時面積也在急劇減少。
這是由于江寧從2000年開始成為南京市的一個新區,發展政策發生了變化,由單一的縣城變為了大城市的邊緣區,城市規劃政策的變化,導致了江寧的水稻田變得更加破碎以及消減。20世紀90年代中期以來,興起的“開發區熱”導致耕地大量被占,如自1992年江寧在東山鎮創辦經濟技術開發區,至1997年2月被批準為國家高新技術產業開發區以后,在縣城附近又建設了國家級民營科技園和江寧商城。同時,在縣城內其他地區建立了13個鄉鎮工業小區,8個專業市場,3大貿易市場。在5個重點鎮:秣陵、祿口(機場建設)、麒麟、江寧、湖熟等地設立了開發區或工業園。除了開發區建設外,祿口機場的建設也是改變江寧土地利用的重要因素之一。另一方面,由于地處大城市的邊緣區,隨著城市的不斷擴張,城市的發展必然需要尋求與其相鄰的邊緣區來解決大城市的壓力,如房地產開發,新開工業基地的增加。從20世紀90年代以后,在東山鎮除開發區的建設外,還新建了百家湖住宅小區及其配套設施,也占用了大量耕地。以上江寧區眾多的區劃建設改變,導致其水稻田總體面積急劇下降,空間分布越來越零散破碎。
單一的通過某種因子來進行水稻田的提取,會造成誤差。決策樹分類的方法可以將多個分類因子同時進行判定篩選,更加嚴格地根據輸入的篩選條件進行面積提取,從而提高了分類精度。
本文利用決策樹的方法,根據坡度、濕度、NDVI等因子進行面積提取,有效地解決了以往一些單一方法的不足。
研究表明,2002年~2010年間,江寧區水稻田面積減少了約690km2,約70%的稻田變為其他用地,主要影響面積變化的驅動因子是人類居住活動范圍的變化,水稻田的空間格局在此期間聚集性減弱,破碎化趨勢加強。
在進行實地水稻田GPS定點的過程中,還發現了一些影響面積提取精度的因素,例如有個別農戶種植水稻的時間與大部分農戶不一樣,導致了這一部分的水稻田在遙感影像上所反映出來的情況有所差異,江寧區水稻田面積較小且分布破碎也影響了一定的實驗精度,如何進一步提高這種小范圍破碎化的水稻田面積提取精度還需要更深入的研究。
[1] 趙銳,湯君友,何隆華.江蘇省水稻長勢遙感監測與估產[J].國土資源遙感,2002,53(3):9-11.
[2] 朱良,平博.多時相TM影像決策樹模型的水稻識別提取[J].地球信息科學學報,2013,15(3):447-451.
[3] 王福民,黃敬峰,王秀珍.基于穗帽變換的TM影像水稻面積提取[J].中國水稻科學,2008,22(3):297-301.
[4] 朱良,平博.多時相TM影像決策樹模型的水稻識別提取[J].地球信息科學學報,2013,15(3):447-451.
[5] 彭代亮.基于統計與MODIS數據的水稻遙感估產方法研究[D].浙江:浙江大學環境與資源學院,2009.
[6] 馬孟莉,朱艷.基于分層多端元混合像元分解的水稻面積信息提取[J].農業工程學報,2012,28(2):154-159.
[7] FREID M A,BRODLEY C E.Decision tree classification of land cover from remotely sensed data[J].Remote Sensing of Environment,1997(61):399-409.
[8] 李爽,張二勛.基于決策樹的遙感影像分類方法研究[J].地域研究與開發,2003,2(1):17-21.
[9] CONRAD C,COLDITZ R R,DECH S,et al.Temporal segmentation of MODIS times series for impro-veing crop classification in Central Asian irrigation systems[J].International Journal of Remote Sensing,2011,32(23):8763-8778.
[10] 林文鵬,王長耀,儲德平,等.基于光譜特征分析的主要秋季作物類型提取研究[J].農業工程學報,2006,22(9):128-132.
[11] 王周龍,馮學智,張安定,等.基于空間分析的江寧土地利用變化特征的研究[J].農機化研究,2007,(7):80-85.
Changing of Paddy Area in Jiangning District Based on Decision Tree Classification
YU Chao1,LI Ming-yang1,HE Long-hua2
(1.Nanjing Forestry University,Nanjing210037;2.Nanjing Institute of Geography&Limnology,Chinese Academy of Sciences,Nanjing210008)
Significant change has taken place in Jiangning from 2002to 2010.Since Jiangning became one of the districts of Nanjing in December 2000,much farmland has turned into high-rise buildings.This paper takes the paddy rice in Jiangning district as the research topic.It uses the remote sensing images of Jiangning district in 2002,2005and 2011as the main source of information.Adopting a decision tree classification method with slope,humidity,NDVI and other decision-making as factors,this paper extracts the rice fields in Jiangning district according to survey data compared with field surveys.The change area of rice fields in Jiangning in the past decade is obtained by driving factor analysis,using geographically weighted regression to identify the main factor,coupled with the dynamic analysis of spatial distribution pattern.Studies have shown that:(1)The area of rice fields in Jiangning district during 2002to 2010reduced by about 690km2.With about 70%of the paddy fields turned into other uses,change is very obvious.(2)The main driving factor is the change in the scope of human habitation activities.(3)The aggregation of spatial pattern in the rice fields between 2002and 2010has decreased,and the fragmentation trend has strengthened.
paddy;decision tree;geographically weighted regression;spatial pattern;area change;national geographical conditions monitoring
10.3969/j.issn.1000-3177.2015.02.014
TP79
A
1000-3177(2015)138-0080-05
2014-01-13
2014-04-23
國家自然科學基金項目(41271418)。
余超(1990~),男,碩士,現從事森林經理、林業遙感和地理信息系統研究等工作。
E-mail:wsyc23@gmail.com
何隆華(1966~),男,博士,主要從事作物遙感監測與醫學地理研究。
E-mail:lhhe@niglas.ac.cn