李家寶,王賀封,張安兵,李紅紅
(河北工程大學 礦業與測繪工程學院,河北 邯鄲 056038)
作物的種植結構是反映作物類型、空間分布、種植面積和輪作模式的綜合農業信息,其時空變化信息是農業可持續發展的重要研究內容[1]。逐層統計匯總是獲得農作物種植結構信息的傳統方式,但存在實地大面積調查測量誤差大、耗時耗力和時間滯后的問題[2]。遙感技術因其高時效、寬范圍和低成本的優勢,近年來在農業、水資源管理方面的應用越來越普及,為大區域準確和快速獲取農作物種植結構提供了新的技術手段[3]。
作物在遙感影像上呈現的不同光譜特征、時相特征和空間特征是種植結構遙感解譯的理論依據[4]。單一影像的解譯方法主要是根據作物光譜差異并結合作物生長的關鍵期,找到識別作物的最佳時相,操作簡單;但由于受“異物同譜”現象影響,為確保作物識別精度,要求影像具有較高空間分辨率和較好的影像質量[5-6]。而時間序列影像的解譯方法充分利用作物整個生長生育階段的信息,一定程度上解決了單一影像方法的混合像元問題。歸一化植被指數NDVI (normalized difference vegetation index)反映了植被生長狀態及植被覆蓋度,NDVI 的時序變化對應了植被的生長和衰落等活動過程[7],并反映出農作物各自的生長差異,因此NDVI被廣泛應用于植被信息提取和地物識別[8-9]。但應注意到,由于數據源的限制,目前能夠構成完整作物生長周期的時間序列數據大多集中在中低空間分辨率,難以獲得較好的提取精度。為此,本文探討運用GF-1監督分類結果和MODIS NDVI時間序列共同參與決策樹構建來提取區域作物種植結構的方法,克服單一數據源或單一提取方法缺點的同時獲得更好解譯精度。
本文選取石津灌區為試驗區域,占地面積4 174.48 km2,其中耕地面積29萬hm2,主要農作物為冬小麥、夏玉米及蘋果、梨、桃等,為國家大II型灌區,位于河北省中南部,太行山東麓,滹沱河下游以南、滏陽河以北、以西,覆蓋石家莊、衡水、邢臺3個市的14個縣(市、區)。
基于物候特征,冬小麥三月返青、四月拔節,此時影像中冬小麥與其他地物的光譜差異最為明顯,因此選擇三月底、四月初的高分影像初步識別冬小麥;夏玉米九月底全部收獲,十月上旬開始播種冬小麥,夏玉米收獲后其用地光譜特征在影像中表現為裸地,十月果樹還未完全步入落葉期,依然表現為植被的光譜特征,故選擇九月底或十月中上旬影像初步識別夏玉米和果樹。為確保達到最佳解譯結果,對比2014年3至4月、9至10月所有可獲取高分數據的質量后,選擇使用4月3日和10月16日兩期高分影像。為保證時相匹配,從NASA網站下載2014年6月至2015年6月一整年MOD13Q1植被指數產品,共23幅影像,并對23幅影像進行編號,見表1。
高分一號影像的數據預處理主要包括:輻射定標、大氣校正、正射校正、影像拼接、研究區裁剪和幾何校正。為使MOD13Q1數據與高分數據在地理位置上統一,下載2014年任意一期覆蓋研究區的Landsat8影像,以15 m空間分辨率的Landsat8全色波段為基準,對高分一號影像進行幾何校正。MODIS影像數據預處理主要包括:投影變換、影像裁剪、數據重采樣。MOD13Q1產品NDVI的原始數據值范圍是[-10 000,10 000],需要將所有影像的DN值均乘以0.000 1變換為NDVI正常值范圍[-1,1]。最后將變換值域后的23幅影像進行疊加,形成MODIS NDVI時間序列數據。
通過目視解譯方法,在Google earth中選取研究區范圍內建筑、冬小麥、夏玉米及果樹4類樣本,并保證樣本均勻分布和隨機性,最終選取建筑樣本150個,冬小麥樣本530個,夏玉米樣本350個,果樹樣本130個。其中,150個建筑樣本,400個冬小麥樣本,250個夏玉米樣本,80個果樹樣本作為監督分類和構建時間序列的訓練樣本;130個冬小麥樣本,100個夏玉米樣本,50個果樹樣本用來檢驗總體解譯效果。
首先使用最大似然法對預處理后的高分影像進行監督分類,以獲取初步識別結果;然后根據訓練樣本統計繪制各作物MODIS NDVI變化曲線,分析NDVI的時間序列,選擇區分作物的最佳時相并確定識別閾值;最后構建監督分類結果與NDVI時序共同約束下的決策樹分類模型,識別出研究區主要作物的空間分布。
對4月3日和10月16日高分數據使用最大似然法進行監督分類,分類后結果中存在大量的細小圖斑,需要對結果進行包括Majority分析、聚類處理及過濾處理在內的分類后處理。分類后處理可以去除監督分類初步結果中的細小圖斑,并能夠在一定程度上簡化分類影像。
使用目視解譯出的各作物訓練區裁剪MODIS NDVI時間序列影像,結合ENVI軟件統計工具,統計得到冬小麥、夏玉米、果樹、建筑訓練區的NDVI時間序列特征值,見表1,由NDVI均值得出作物的生長趨勢線,見圖1。
高分數據具有受氣候因素影響,如云雨的覆蓋影響較為嚴重的數據特性,導致監督分類中對作物的錯分、漏分,從而造成總體解譯結果的精度損失。以監督分類結果為約束的決策樹構建能對錯分、漏分像元進行篩選和剔除。影像分類閾值的確定對決策樹的精準實施起決定性作用,本文的閾值指標對應NDVI的特征值。通過觀察作物生長趨勢線,找出區分不同作物的最佳識別點,使用不同時相NDVI最大或最小值作為閾值限制作物提取范圍,爭取達到某種作物的完整提取。
2.3.1 冬小麥決策樹識別模型
由圖1中冬小麥MODIS NDVI值隨時間變化的曲線可以看出,序列號為11的時相是區分冬小麥的最佳時相,此時NDVI值處于主要作物中的最小值,針對該特征的約束條件為:第11時相的NDVI小于冬小麥第11時相的最大值。從序號為9的時相到第12時相,冬小麥NDVI值有一個明顯的下降,是冬小麥生長周期中一個可與其他地物區分的明顯特征,針對該特征的約束條件為:第9時相與第10時相NDVI之和大于第11時相與第12時相NDVI之和。由于GF影像較高的空間分辨率,觀察4月3日的GF-1原始影像發現,此時是區分冬小麥與其他地物的最佳時相,可以保證監督分類冬小麥的最佳分類精度,故將監督分類結果作為首要約束,針對該特征的約束條件為:提取4月3日高分影像監督分類等于冬小麥的部分。本文綜合約束下的冬小麥決策樹識別模型為:
GF(4.3)=冬小麥
NDVI(11)<0.458 2
NDVI(9)+NDVI(10)>NDVI(11)+NDVI(12)
其中GF(4.3)為4月3日高分影像監督分類結果NDVI(A)中A為第A時相。
2.3.2 果林決策樹識別模型
結合監督分類結果觀察原始高分影像發現,4月3日的監督分類結果中出現了果林和建筑的大面積錯分,故在高分監督分類結果提取果樹和建筑兩類地物。根據NDVI變化曲線,第11時相的果樹NDVI的最小值大于建筑NDVI的最大值,因此對于MODIS影像使用第11時相區分果樹與建筑,針對該特征的約束條件為:第11時相的NDVI大于建筑NDVI的最大值。本文綜合約束下的果樹決策樹識別模型為:
GF(4.3)=建筑+果樹
NDVI(11)>0.617 8
2.3.3 夏玉米決策樹識別模型
果樹和夏玉米生長周期存在重疊期,所以首先在10月16日高分監督分類結果中將已確定的果樹結果剔除。因為影像質量問題,在10月16日高分影像監督分類結果中,建筑和夏玉米出現嚴重的錯分現象,故將夏玉米和建筑一同提取,再使用其他約束條件單獨提取夏玉米。從MODIS NDVI時間序列曲線可以看出,夏玉米在第15時相NDVI達到最大,因為此時相正值夏季,是所有植物生長最旺盛的季節,使NDVI值大于夏玉米NDVI在第15時相的最小值,能提取出夏玉米及大部分同期生長植物并排除居民區;第12、13時相是夏玉米播種生長階段,NDVI值較小,其他植物生長旺盛,NDVI值維持在較高水平,使用12、13時相的最大值共同約束,區分夏玉米于其他茂盛植物,針對該特征的約束條件為:第12、13時相的NDVI值小于該時相夏玉米NDVI最大值。高分數據和MODIS數據綜合約束下的夏玉米識別模型為:
GF(10.16)≠果樹
GF(10.16)=建筑+玉米
NDVI(15)>0.622 4
NDVI(12)<0.614 4
NDVI(13)<0.712 8
其中GF(10.16)為10月16日高分影像監督分類結果。
基于GF-1監督分類的結果如圖2所示。根據Google Earth選取的驗證樣本檢驗GF數據監督分類結果中的正確分類點,對4月3日和10月16日GF影像主要作物的分類結果進行精度評價,見表2。

日期作物類型驗證樣本個數正確分類個數分類精度/%4月3日冬小麥13011991.58果林50438610月16日夏玉米1006565果林504488
理想狀況下,高空間分辨率影像與監督分類的結合可以獲得較高的解譯精度[10],但通常受到所獲取到的GF數據質量的影響,解譯精度會有所降低。從表2中可以看出,4月3日影像上冬小麥和果林的分類精度相對較高,是因為該時相冬小麥和果林都有其獨特的具有可分性的光譜特征;再結合GF原始影像,發現分類結果中存在部分將建設用地劃分為果林的多分現象。從表中可以看出,10月16日影像對夏玉米的解譯效果較差,觀察GF原始影像發現,氣象條件對該時相作物光譜特征的影響較大,云霧、日照條件等使地物間可分性降低,最終導致夏玉米分類精度較其他地物的大幅度下降;又因該時相果林的光譜特征明顯區別于其他地物,果林的分類精度仍保持在較高水平。
基于GF-1監督分類與NDVI時間序列共同約束的決策樹產生的解譯結果如圖3所示。

圖3 多種約束決策樹作物解譯結果Fig.3 Crop interpretation results of multiple constraint decision trees
3.2.1 基于訓練驗證點的分類精度驗證
根據Google Earth選取的驗證樣本檢驗綜合解譯結果,分類精度見表3。

表3 基于Google Earth樣本點的精度驗證表
3.2.2 基于隨機點的分類精度驗證
使用Arcgis的隨機點生成工具,在研究區內隨機生成200個隨機點,在綜合解譯方法的冬小麥、果林和夏玉米結果中分別進行統計,200個點中共有132個點對應冬小麥,54個對應果林,113個對應夏玉米;再將這些點分別投映到Google Earth中,統計各類別點的正確分類個數,對綜合方法的分類精度做出評價,分類精度見表4。

表4 基于隨機點的精度驗證表
由表3和表4可見,兩種驗證方法的結果基本一致,都能觀察到分類精度的顯著提高。基于監督分類與決策樹的綜合分類方法的總解譯精度達93%以上,相比較于單純的監督分類,冬小麥分類解譯提高3%以上,果樹解譯精度提高8%以上,夏玉米解譯精度提高26%,總體精度提高了10%以上。
1)MODIS NDVI時間序列和GF影像監督分類結合的決策樹綜合分類方法的精度較高,總體分類精度達到93.13%,較4月3日的GF影像監督分類,精度提高了4%以上,較10月16日的GF影像監督分類,精度提高了10%以上,說明該方法具有較高的識別精度,能更好地反映區域主要作物的種植分布,適合作物的分類和提取。
2)本研究綜合方法的夏玉米的解譯精度較單純的監督分類有了很大的提升,因為10月16日的GF影像質量不利于區分夏玉米,導致直接監督分類夏玉米的可行性降低,只關注夏玉米識別精度的提升,并不能體現出該方法在解譯精度方面的優越性。高分影像監督分類的冬小麥和果林的解譯已經取得較好效果,在使用綜合解譯方法后精度依舊有4%以上的提高,證明該方法可一定程度克服GF數據質量的影響,并對GF影像的監督分類結果有一定的改善、修正效果。
3)GF影像和MODIS數據的綜合使用,使數據更好地發揮各自的優勢并在時空分辨率上相互補充,提高了數據的可用性和應用潛力。
本文在選取樣本時,采用了目視解譯的方法,這會對遙感解譯結果造成一些人為的誤差。由于本文研究區域跨多個市縣,尚缺少對該區域的完整的作物種植信息的統計數據,故精度上未采用統計數據進行驗證,對于其他區域,可增加統計數據驗證分類精度,對本方法進行更加全面的精度評價。