王冬利,張安兵,趙安周,李 靜
(1. 河北工程大學礦業與測繪工程學院,河北 邯鄲 056038; 2. 河北工程大學河北省煤炭資源綜合開發與利用協同創新中心,河北 邯鄲 056038)
冬小麥是全球各國重要的糧食作物,掌握其時空分布可為農業監測、水資源調控、糧食安全等提供基礎信息[1- 2]。衛星遙感技術具有大區域、多源、多時空尺度的數據獲取能力[3],能夠相對精確地提取冬小麥。因此,高中低空間分辨率衛星影像數據在冬小麥種植信息提取方面得到了廣泛應用,如基于MODIS、陸地衛星數據、Aster、環境與災害監測小衛星、WorldView- 3等衛星影像[4- 8],采用監督分類、決策樹分類、支持向量機、面向對象分類、波譜庫匹配等方法[9- 11],結合線性混合像元模型、模糊數學、抽樣方法和時間序列等技術[12- 15],能夠提取不同區域內的冬小麥種植信息[16]。
綜上所述,冬小麥種植信息遙感提取方法主要集中在應用監督學習的算法,該系列方法顧及農作物的物候特征、光譜特征及紋理特征等,在農作物精細化分類上取得了一定效果,但是也存在一些問題,如較嚴重地依賴地面采樣數據、人為干擾因素大、自動化程度低、普適性差等。本文對應用非監督分類技術提取冬小麥種植信息的方法進行深入研究,提出一種新的非監督分類冬小麥種植信息提取模型,并以河北省辛集市為例進行試驗研究。
研究區域選取河北省辛集市,該區域位于華北平原,地勢平坦,總面積約為950 km2,其中耕地面積約650 km2。主要農作物為冬小麥、玉米及果樹。
本文以空間分辨率為16 m的國產衛星高分一號(GF- 1)多光譜數據為數據源;辛集市行政邊界來自于全國1∶400萬縣矢量邊界數據。驗證樣本點數據通過隨機撒點方法,結合Google Earth地圖和多期高分一號影像數據獲取。
本文提出的模型原理是以歸一化植被指數(NDVI)作為冬小麥信息提取的判別指標,以非監督分類為核心,結合多尺度技術,即空間尺度由大到小、分辨率由粗到細,逐層剔除非冬小麥地物,從而達到由概略到具體、逐步精細、準確提取冬小麥種植信息的目的。
1.2.1 多尺度表達
多尺度影像處理技術是指對同一區域采用多個尺度的影像來表達,并且在不同尺度影像上分別進行處理。在不同尺度上,遙感影像的某些特征信息不同,這樣某些影像處理的效果也會不同。多尺度技術中的尺度可以是空間分辨率,也可以是時間分辨率。本文采用的是基于空間分辨率的多尺度技術,并通過重采樣方法實現對同一區域多空間尺度的表達,如圖1所示。
1.2.2 非監督分類
非監督分類是一種聚類統計分析方法。本文采用經典聚類方法——K- means算法進行試驗。K- means算法需要提前輸入類別數目(聚類中心個數),并且類別數目對分類精度影響非常大,而一個區域的類別數通常情況下是很難準確獲得的。例如,本文的研究區辛集市內地物具體種類不確定,但是本文提取的目標地物為冬小麥,若將研究區內的地物粗略地劃分為兩種類別:一種是冬小麥,另一種是非冬小麥。試驗發現,這樣粗略劃分類別并應用K- means算法提取冬小麥的效果不好,分類結果偏大。經分析,主要原因在于:根據NDVI原理,研究區中道路、水體、裸地及建筑物等主要非冬小麥地物位于NDVI低值區域,冬小麥處于NDVI高值區域,NDVI值中間部分同時包含冬小麥和非冬小麥信息(如圖1中左數第一個方框所示)。當應用K- means算法時,無論輸入類別為2類還是3類,NDVI值中間范圍內的地物分類誤差較大,從而影響了整體分類精度。
1.2.3 非監督分類與多尺度結合
針對上述問題,本文結合多空間尺度分析技術,提出試驗改進流程(如圖2所示),試驗結果證實該方法可以解決由于類別數目不能準確確定所帶來的非監督分類精度不理想的問題。具體流程如下:①基于原始影像數據,通過重采樣技術,獲取更大尺度(更低分辨率)數據,構建多尺度表達。②由于在大尺度(低空間分辨率)遙感影像上地物綜合特征更明顯,同時研究區內冬小麥主要呈大面積或細長狀分布形態,因此當研究區遙感影像通過重采樣方法生成大尺度影像數據時,絕大部分冬小麥能夠被綜合為NDVI高值區域的冬小麥,當然其中很少部分冬小麥會被誤綜合為NDVI中值區域的干擾地物。此時,當輸入類別數目為兩類(冬小麥和非冬小麥)時,基于升尺度后的NDVI數據,K- means算法提取的冬小麥信息包括NDVI高值區域和部分中值區域。③應用大尺度下提取的冬小麥種植范圍掩膜下一個較小尺度NDVI數據,掩膜后利用非監督分類進行分類,類別數目依然設為兩類(冬小麥和非冬小麥)。④重復以上步驟,直到最小的尺度數據(原始數據)為止,當最小尺度NDVI數據經過掩膜后,NDVI數據只剩下兩類地物:冬小麥和干擾地物。其中,絕大部分冬小麥位于NDVI高值區域,少量冬小麥位于中值區域,絕大部分的干擾地物位于NDVI低值區域。此時,當輸入類別數目為2,應用K- means算法提取冬小麥時,類別數目不準確對提取結果的影響會很小,從而使得提取精度得到極大提高。
1.2.4 流程步驟
首先選取3月初至4月上旬的遙感數據,因為該時期正處于冬小麥返青和拔節期,其他綠色植被正處于枯黃狀態,冬小麥的NDVI值相對較大,而其他非冬小麥地物的NDVI值較小。然后,結合圖2流程提取冬小麥種植信息。具體而言:①先將所選擇的GF- 1 NDVI數據升尺度為原始數據尺度的2倍、3倍,即升尺度后數據的空間分辨率分別為32和48 m;②基于最大尺度、最粗分辨率的遙感數據(空間分辨率為48 m的NDVI遙感數據),應用非監督分類將研究區分為兩大類,一類為冬小麥候選區域,另一類為非冬小麥區域;③以②提取結果中的冬小麥候選區域掩膜下一級尺度遙感數據(空間分辨率為32 m的NDVI數據),然后進行非監督分類。同樣輸入類別數目為兩類:一類為冬小麥候選區域,另一類為非冬小麥區域。同理,最后再對空間分辨率為16 m的原始NDVI數據進行掩膜和非監督分類,從而得到最終冬小麥種植區域,并對提取結果進行精度驗證。
由于研究區內野草、樹木等其他綠色干擾地物在4月初時基本還處于枯黃狀態,因此本次試驗采用2014年4月3日GF- 1遙感影像數據,以NDVI作為冬小麥信息提取判別指標,應用本文提出的非監督分類模型提取2014年辛集市冬小麥種植信息,提取的結果如圖3和表1所示。

表1 辛集市冬小麥面積
基于驗證樣本點數據,應用混淆矩陣方法對非監督分類模型進行精度驗證,驗證精度見表2。

表2 冬小麥非監督分類模型精度驗證
基于2014年4月3日GF- 1影像,應用最大似然監督分類法提取冬小麥358.00 km2(見表1),其空間分布如圖3(b)所示。將非監督分類模型和監督分類兩種提取結果作混淆矩陣,Kappa系數為0.87,整體精度為95.04%。這證明:對于研究區內的冬小麥,本文提出的非監督分類模型的提取結果與監督分類方法高度相似。此外,表1和表2證明:該模型是一種逐層剔除非冬小麥地物信息、逐層精確冬小麥種植面積的過程,即由419.09 km2到373.24 km2,再到最終的352.44 km2,結果符合該模型中逐層精細、準確地提取冬小麥種植信息的原理和目的;同時該模型的制圖精度和用戶精度都在92%以上,具有較高的精度。
該模型也存在需要進一步完善的地方:①該模型只對GF- 1數據進行了試驗,后續有待開展其他數據源的試驗;②該模型在數據預處理中未考慮去除地物干擾和增強目標地物信息,后續工作中會開展相關工作研究;③該模型的研究區域范圍是縣域尺度,后續可以嘗試更多尺度的應用。
本文以河北省辛集市為研究區,應用本文提出的非監督分類模型提取了2014年辛集市冬小麥種植信息,主要研究結果為:①分析了由于非監督分類初始輸入的分類數目難以準確確定,從而導致冬小麥種植信息提取精度不高的問題,并通過多尺度技術對其加以改進,最終構建了一種新的冬小麥非監督分類提取模型,該模型的提取精度較高,是一種新的、行之有效的冬小麥種植信息提取方法。②對于研究區內的冬小麥,與監督分類相比,本文提出的非監督分類模型具有與監督分類相似的精度,同時又具有無需訓練樣本、人為主觀因素少、自動化程度高等特點。