李佳雨,王華斌,王光輝,翟浩然,韓 旻,程 前
(1. 遼寧工程技術大學,遼寧 阜新 123000; 2. 國家測繪地理信息局衛星測繪應用中心,北京 100048)
20世紀中葉,地膜覆蓋技術最先由西方發達國家使用,其對農作物具有增溫、保墑、抑制雜草等功能。地膜覆蓋技術在20世紀80年代傳入中國,在高寒、干旱及半干旱地區的農作物種植中得到廣泛使用。地膜覆蓋技術的使用改變了原有的農業生產方式,在大范圍內將糧食單產提高20%~30%,為保障我國糧食安全做出了重大貢獻[1]。目前,地膜覆蓋技術已在40多種農作物的種植上成功推廣應用,并呈現出逐漸增長的趨勢。1982—2016年的《中國農業統計年鑒》數據顯示,1982年中國農作物地膜覆蓋面積僅為1.5萬hm2,2001年上升到1096萬hm2,2015年已達到1 831.8 hm2,33年間擴大了1000余倍。大規模的地膜覆蓋面積變化,對于地表生物多樣性及土壤能量平衡都有一定影響,而且在耕作過程中,由于原有地膜回收方式的局限性及環保意識的缺乏,農田中存在較高比例的地膜殘留。這些地膜殘留不僅會對農田造成面源污染、破壞土壤結構,而且阻礙水肥輸導,影響土壤通透性和作物生長發育,對農業環境構成重大威脅[2]。傳統方法采用實地調查、逐級上報的方式獲取地膜覆蓋信息,該方法受主觀因素影響大,且耗費大量的人力物力,仍然難以得到準確的監測結果。而衛星遙感技術可以克服現場調查的不足,具有覆蓋面積廣、重訪周期短、監測成本低等特點,可以實現大面積同步觀測,實時準確地獲取地膜覆蓋面積及地理分布等信息,該信息對于國家農業規劃、資源管理、環境保護等方面具有重要的意義[3]。
近年來,一些學者開始研究利用遙感手段對農用地膜進行監測與信息提取。Eufemia Tarantino等[4]采用面向對象最近鄰分類的方法從航拍影像中提取地面地膜信息。Lu等[5]通過分析典型地物的波譜特征建立決策樹分類器,對Landsat 5時間序列影像進行地膜信息提取。之后,Lu等[6]又通過對MODIS時間序列影像建立閾值模型的方式來提取地膜信息,并與Landsat提取結果對比以驗證方法的可行性。Hasituya等[7]通過光譜特征與紋理特征相結合的方式,分別使用MLC、MDC和SVM分類器進行地膜提取,試驗結果證明了SVM分類器的優勢性。Hasituya等[8]又采用RF和SVM分類器對多時相Landsat衛星數據進行地膜提取,通過試驗得出最佳的地膜提取時間為4月,并得出光譜、NDVI、GI等特征在提取過程中更具重要性的結論。從上述相關研究可以看出,目前學術界對于地膜提取的研究相對較少,已有的研究多采用Landsat衛星等對地觀測數據,分辨率相對較低,提取結果的誤差相對較大。
本文采用資源三號與Landsat衛星融合數據作為數據源,采用多特征優選面向對象隨機森林分類的方式,對甘肅省張掖市臨澤縣部分地區進行地膜提取。該方法計算特征少、實現簡便,在保證地膜提取能力的同時,有效降低了數據處理量,對于高分辨率影像農用地膜提取具有良好的適用性。
本文研究區位于甘肅省張掖市臨澤縣。臨澤縣地處甘肅省河西走廊中部,東經99°51′—100°30′,北緯38°57′—39°42′之間。該地區屬于大陸性荒漠草原氣候,氣候干燥,降水稀少,日照時間長,蒸發量大,多風,農作物種植多采用地膜覆蓋的方式進行增溫保墑。研究區位置如圖1所示。
2017年6月23日、24日對研究區進行了實地調研。本次調研共涉及200個樣本地塊,在保證樣本地塊均勻分布的前提下,對典型區域進行了重點判讀。調查過程包括記錄地塊的作物類型、作物高度、是否覆蓋地膜、地膜顏色與材質、地塊面積與經緯度信息并拍攝地塊照片。調查結果顯示,該地區除河流附近部分玉米田未覆蓋地膜外,其余耕地中的大部分均被地膜覆蓋。實地調研數據為目視解譯提供了可靠的先驗知識,并能為地膜提取結果提供可靠的精度驗證參考。依據實地調研數據獲得的解譯標準見表1。在后續識別過程中,將二者視為同一種類進行識別。
在我國西北地區,春季覆膜一般在3月上旬開始鋪設,4月中旬基本鋪設完畢。因此選取的資源三號數據的影像獲取時間為2017年4月22日,Landsat影像獲取時間為2017年4月27日。該組數據既保證了地膜提取的時效性,又兼顧了地膜的覆蓋率,使提取結果更為準確。
在進行預處理時,首先對資源三號衛星2.1 m 分辨率全色影像與Landsat衛星30 m分辨率多光譜影像依次進行正射校正、輻射校正與大氣校正;而后對兩幅影像進行空間配準,使得同名點像元一一對應;然后對Landsat 8 OLI 30 m多光譜數據進行重采樣至資源三號影像的多光譜分辨率,在ArcGIS軟件中對重采樣后的多光譜數據進行投影變換,使之與全色影像投影一致;最后在ENVI軟件中使用Gram-Schmidt Pan Sharpening方法進行圖像融合,融合后影像大小為3800×3500。
本文將Landsat衛星的光譜分辨率優勢與資源三號衛星的空間分辨率優勢相結合,首先通過改進Mean-Shift分割算法將處理基元轉化為小對象;再提取融合影像的光譜、指數與紋理等特征,以OFS特征選擇算法對所有特征構成的特征空間進行優選;最后將優選特征子空間導入隨機森林分類器內進行訓練并分類,以達到高精度快速識別地膜的目的。具體技術路線如圖2所示。

圖2 技術路線
影像分割是面向對象分類技術的基礎,影像分割的好壞直接決定遙感影像分類的精度[9]。本文以 Mean-Shift 初始分割結果為基礎,通過圖像的同等組濾波和顏色量化[10]得到類圖,將類圖視為顏色-紋理模型并融合到均值漂移算法中。以顏色-紋理模型的相似性評價準則和分割對象輪廓信息評估相鄰區域合并條件,并進行區域合并,最終得到有效分割結果。將顏色-紋理模型融合到Mean-Shift 分割算法中,有效地克服了傳統Mean-Shift 算法易造成過分割的缺點,實現遙感影像的高準確度分割。該方法在文獻[11]中已詳細論述。
本文選取的特征包括4類,分別是光譜特征(7波段)、指數特征、幾何特征與各波段紋理特征,總計87個特征參數(見表2)。

表2 特征空間
特征提取與優化對遙感影像分類的精度有重要的影響。在遙感影像自動分類中,特征越多所表達的影像信息越全面,但并非數量越多越好。首先,由于不同特征對影像分類的貢獻率不同,且部分特征之間存在較大的相關性,過多的重復使用可能導致分類精度的降低;其次,特征維數過高會造成“維數災難”,將大量的特征參數應用于分類器,會使計算量增大、分類效率降低。因此,選擇合適的特征空間對分類模型性能的提升具有重要作用。
為更好地確定合適的特征進行分類,本文采用特征空間優化(FSO)算法進行特征優選。FSO算法依據訓練樣本的特征值,通過特征組合計算出不同類別訓練樣本間的最大、平均、最小距離,得到優化特征子空間,最后將特征子空間應用于隨機森林分類器中。
隨機森林的概念最早由Breiman在2001年提出[12]。通過Bootstrap重抽樣方法從訓練樣本集中抽取樣本,對抽取到的每個樣本進行決策樹分類。在生成決策樹時,每個節點都是從隨機選出的幾個變量中最優分裂產生的。生成所有決策樹之后,用投票的方法對所有決策樹的分類結果進行整合,歸納匯總形成最終分類結果[13]。
應用隨機森林分類時,在訓練樣本數量一定的情況下,影響分類精度的兩個主要參數分別是最大特征數和最大決策樹數。①最大特征數即生成一棵決策樹所使用特征數的最大值。最大特征數的最優參數可根據袋外數(out of bag, OOB)誤差率進行調整,以達到更高的精度[14]。②最大決策樹數即分類完成時所生成的決策樹數量。Breiman在文獻[15]中證明了,依據大數定理,當最大決策樹數增加時模型泛化誤差收斂,不用擔心過訓練的情況。因此在內存允許的前提下,可選取盡量大的數量。本文分類時最大決策樹數設為100。
本文采用eCognition軟件中的FSO特征選擇工具,依據樣本選擇結果對提取的80多個特征進行特征優選。通過測試結果可知,當特征數量達到23時,類別間分離度達到最大值2.48,分離度曲線如圖3所示。FSO選取的特征包括光譜特征11個、指數特征1個、幾何特征4個、紋理特征7個。
為了驗證該方法的有效性,本文共設計了4組試驗方案,試驗A采用光譜特征,試驗B采用光譜指數特征,試驗C采用光譜特征+指數特征+紋理特
征+幾何特征,試驗D采用多特征優選(如圖4所示)。將4組提取結果在與原始圖進行目視對比可以發現:試驗B、C將部分河流錯分為地膜,在研究區右下角部分試驗A、B、C均有部分地膜被錯分為裸地等類型,而采用特征優選的試驗D則具有較好的分類結果,錯分和漏分明顯少于其他3組試驗。

圖3 分離度曲線

圖4 各試驗分類結果
本文采用選取隨機點的方式,將研究區調研結果與同時期高分二號衛星數據對試驗結果進行對照以驗證試驗精度,獲取試驗區分類結果的混淆矩陣;再通過混淆矩陣計算得到用戶精度、制圖精度、總體精度、Kappa系數等評價指標。精度評價結果如圖5所示。
總體精度是分類對象與對應地區真實地物類型的一致性概率,Kappa系數綜合了用戶精度和制圖精度兩個參數,是一個檢驗分類正確度的指標,值越高說明分類結果越準確。通過表2中4組試驗的精度分析結果可知,在研究區內,總體區分能力由高到低依次為試驗D>試驗C>試驗B>試驗A,其中試驗D總體精度高于92%,Kappa系數高于0.90,其余3個試驗總體精度均低于86%,Kappa系數均低于0.83。
通過4組試驗分類結果與原始影像的對比可以發現,在引入指數特征與紋理特征后,總體分類精度與Kappa系數均有了不同程度的提升,這說明在分類過程中,不同類型特征之間存在著優勢互補;而在進行特征優選之后分類精度進一步提升,則說明特征優選過程消除了部分特征之間的信息冗余。
針對目前農用地膜遙感識別中存在的問題,本文提出了一種結合資源三號與Landsat 8 OLI衛星影像數據的面向對象地膜自動提取方法。該方法綜合多源衛星數據特點,采用改進的Mean-Shift算法完成影像的準確分割,以調研數據為基準采集樣本,通過FSO方法對光譜、指數、紋理等特征進行優選,利用隨機森林分類器實現了地表地膜的自動識別。本文所提出的方法在有效識別地膜精度的同時,降低了訓練特征維度,提升了地膜的識別效率,方法簡便,普適性強,具有一定的實際應用價值。

圖5 精度對比