孟啟鳳,盧小平,張向軍,于海坤,李國清,朱夢豪
(1.河南理工大學 自然資源部礦山時空信息與生態修復實驗室,河南 焦作454150;2.河南省遙感測繪院,河南 鄭州 454003)
遙感技術由于具備觀測范圍大、時效性高等優勢,可作為研究農作物分類和提取農業種植結構的重要手段[1]。
目前,使用遙感技術進行地物分類的研究較多,常用的影像分類方法按照處理單元分為2類:基于像素分類(Pixel-based Image Classification,PBIC)與面向對象分類(Object-based Image Classification,OBIC)[2]。其中PBIC方法應用廣泛,Toll[3]和Martin等[4]于20世紀80年代使用多光譜掃描儀(Multi-spectral Scanner,MSS)、專題制圖儀(Thematic Mapper,TM)和Spot衛星獲取同一研究區的影像并使用PBIC進行信息提取,結果表明隨著影像空間分辨率的提高,PBIC方法并不能得到更高的分類精度。除此之外,該方法只能利用像素信息,無法獲取鄰近像元信息,在分類后會導致“椒鹽現象”。OBIC方法則可以克服以上缺點,通過彌補PBIC導致的語義信息損耗,實現較高層次的遙感影像分類和地物提取。類似研究也表明,OBIC方法在中、高空間分辨率影像分析上有更好的效果[5]。隨著高分辨率影像的普及,OBIC方法的相關研究增加,自20世紀70年代以來,國內外利用OBIC方法進行了大量的研究,已將其應用于土地利用分類、道路提取和樹種識別等[6-9],但在農作物精細分類方面的研究較少。
影像分割是OBIC的基礎,主要包括3種模式:單時相影像分割、多時相影像組合分割和多時相影像分別分割[10]。分別分割會造成影像子對象邊界不對應的現象,從而無法建立空間聯系,應用范圍受限,這里不再介紹。單時相影像分割是使用最多的分割模式,在該分割模式基礎上已進行甘蔗識別、水稻提取和作物分類等研究[11-12],但應用場景有限,僅適用于地物變化緩慢、地物類型單一的場景。多時相組合分割則可以彌補單時相影像分割的不足,該分割模式的問題主要集中在參與分割波段的選取上,一般多時相組合分割是機械地將多時相影像的光譜波段疊合后分割,沒有考慮到多個波段之間的相關性與互補性。為充分利用遙感影像中的隱藏信息,可以通過多個波段的運算和組合,挖掘新的特征波段參與分割,同時也可對參與分割的波段進行選擇,避免高度相關的波段同時參與分割導致算力消耗。自1999年以來,國內關于多特征參與影像分析的研究逐漸增多,駱劍承等[13]和陳秋曉等[14]通過研究表明基于多特征的遙感影像能夠引入除光譜特征之外的時相特征與空間特征,特征選擇和特征組合意味著更多領域知識和規則融入分類過程,可以提高影像分析的智能化程度。但PBIC方法的作用對象是像素,無法通過空間特征進行影像分析,與之相比,OBIC方法可憑借影像對象充分利用各類特征,在影像分析上更具優勢。
本研究以開封市通許縣為研究區,以哨兵2號影像作為數據源,基于隨機森林算法對多個時相的影像特征進行優選,利用多尺度分割算法將優選特征在對象層面進行融合,進行多時相影像組合分割優化,并統一不同時相影像的分割尺度,在此基礎上使用OBIC方法進行農作物識別,探究多時相影像組合分割優化后的表現,以及OBIC方法在農作物種植結構監測方面的可行性。
本文選擇開封市通許縣作為研究區,以 2020年2月22日的哨兵2號真彩色影像描述概況,如圖1所示。該地年平均氣溫14.6 ℃,年平均降水量658.4 mm,年平均風速1.8 m/s,主導風向為東北風。地勢平坦,種植結構復雜,除了連片種植冬小麥、花生、棉花、玉米和紅薯等農作物,大蒜、西瓜、辣椒和胡蘿卜等經濟作物,還存在大量間作套種,其中通許縣中南部為優質專用小麥優勢區,西北部以種植胡蘿卜和反季蔬菜為主,東北部以種植大蒜為主。

圖1 研究區位及其哨兵2號影像
1.2.1 衛星遙感數據
從歐洲航天局官網獲取哨兵2號影像的L2A級產品作為數據源,并剔除云量高于5%遙感影像,成像時間分別為2019年12月4日,2020年2月22日,2020年3月23日,2020年4月22日以及2020年5月22日。
1.2.2 野外調查數據
2019年12月21日到研究區展開實地調查,使用手持GPS采集樣本。采集時遵循空間上均勻分布的原則,后期根據實際采樣成果,利用高分影像進行目視解譯,補充樣本數量,最終的樣本狀況如表1所示。

表1 研究區樣本詳情
以哨兵2號影像為數據源,從多時相影像中提取光譜、紋理和植被指數等特征波段;使用隨機森林算法進行特征選擇,將優選波段合成多特征影像后分割,并應用OBIC;最后與最佳單時相影像分割、多時相影像組合分割后的OBIC結果進行比較,驗證本文提出方法的有效性。技術路線如圖2所示。

圖2 技術路線
本文通過對研究區不同時相哨兵2號影像的原始光譜波段進行組合運算獲取特征波段。其中歸一化植被指數(Normalized Difference Vegetation Index,NDVI)是描述生物量主要參量,但其對植被茂密區敏感度較低,而增強植被指數(Enhanced Vegetation Index,EVI)可彌補其不足,于是從各時相影像中分別提取NDVI,EVI,裸土指數(Bare Soil Index,BSI)共15個指數。紋理信息是對影像局部信息的描述,對地物識別起重要作用。本文使用灰度共生矩陣對各時相影像經主成分變換后的第一主成分進行運算,提取各時相影像包括均值、方差、同質性、對比度、非相似性、相似熵、角二階矩和相關性等共40個紋理特征作為初始波段,再引入各時相影像的原始光譜波段,共獲取115個波段。初始波段之間的相關性如圖3(a)所示。

(a)初始波段相關性
由圖3(a)可以看出,波段之間存在相關性和互補性,如果影像某些波段之間存在高度相關,分析所有波段是不必要的。這就需要對參與組合分割的所有波段進行優選,使優選出的波段既能保留多時相遙感影像的主要信息,又能使參與分割的波段數量得到有效精簡,提高分割效率[15]。這里使用隨機森林算法對所有波段進行選擇[16],詳細步驟如下:
假設有N個訓練樣本:
① 當n=1,創建決策樹Tn,記袋外數據(Out of Bag,OOB)為LOOBn。


④ 對于n=2,3,…,N,重復步驟①~③,計算所有波段。

(1)
由上可知,波段Xf變化引起的袋外誤差越大,表明波段Xf具有越高的重要性,最后將特征波段重要性與分類精度結合確定優選波段的數量。
圖像分割效果是OBIC關鍵,利用單一尺度分割影像可能會造成分割過?;蚯贩指畹那闆r,很難完整反映對象特征。佃袁勇等[17]的研究表明多尺度分割效果更好,可以更全面、更完整地描述地理對象。這里采用分形網絡演化算法(Fractal Net Evolution Approach,FNEA)進行多尺度分割,在分類之前,需要根據研究區域地物塊狀特征調整圖像分割尺度,本文借助ESP尺度評價工具選取最佳分割尺度。除了分割尺度之外,多尺度分割時,形狀因子與緊致度因子對分割效果的影響是不可忽略的[18]。但緊致度因子與形狀因子無法通過具體公式選定,只可通過多次實驗比較分割結果發現二者之間的規律性。
JM(Jeffries-Matusita)距離是一種基于條件概率之差的光譜可分性度量標準。本文使用JM距離通過判斷樣本點在各時相影像中的分離性選取最佳單時相影像。當樣本之間的JM值大于1.9,小于等于2.0時,認為樣本之間可分離性高,該影像為最佳單時相影像。JM距離求解方法為:
JM=[2(1-e-B)]1/2,
(2)
式中,B表示巴氏距離,計算公式為:
(3)
式中,m1和m2為2個類別的某特征均值;σ1和σ2為2個類別的某特征標準差。
隨機森林算法不僅用于對高維數據進行特征重要性排序,還可用于影像分類。該算法通過在數據樣本上集成多個決策樹,然后從少量樣本中學習投票規則,最后通過投票決定地物的最終歸屬類型,并且集成決策樹思想使隨機森林分類算法具有很高的穩定性,不易出現過擬合現象。
通過隨機森林法求得各特征波段重要性并進行排序,結果如圖4所示。

圖4 特征波段重要性
后續將特征波段重要性與分類精度結合確定優選波段數量。經多次實驗表明,當特征波段數量達到一定程度之后,分類精度隨波段數量少量增加變化不明顯,以10個特征波段為單位遞增,不僅可以明顯觀察到總體分類精度隨波段數量增加時的變化趨勢,決定優選波段數量,還可以避免不必要的算力消耗。
本研究從特征波段重要性排序結果中選取重要性靠前的10個波段為基礎,按重要性依次增加10個波段進行合成,并分別對具有不同波段數量所合成的多特征影像進行分類,把總體分類精度與Kappa系數作為選取多特征影像的重要參考,進而以該多特征影像所包含的波段作為優選波段。分類精度詳情如圖5所示。

圖5 多特征影像分類精度隨特征波段數量變化情況
就分類精度來看,前10個波段合成的多特征影像分類精度較由更多波段合成的多特征影像低,前30,40,50個波段合成的多特征影像,分類總體精度與Kappa系數較高且相近,綜合考慮運算效率與后續分類精度,最終從115個波段中選取重要性靠前的30個波段作為優選波段參與多時相影像組合分割,優選波段詳情如表2所示。優選后波段相關性如圖3(b)所示,可以看出,與初始波段相關性相比優選波段相關性明顯降低。
由表2可以看出,從波段類型來看,光譜波段在優選波段組合所占比重最大,貢獻個數為22個,植被指數次之,貢獻個數為7個,紋理特征最少,該結果與文獻[19]的研究成果相符,即研究所使用的影像空間分辨率相對于亞米級遙感影像來說,紋理信息不夠豐富,其擾動對分類精度影響較小,對優選出來的波段組合貢獻薄弱。從時間維度來看,4月份獲取的影像貢獻的波段數量最多,3月份次之,其他月份最少且貢獻度相似。

表2 優選波段詳情
借助ESP插件所得受試者工作特征(Receiver Operating Characteristic,ROC)曲線去分析最佳分割尺度。采用控制變量法,以步長為0.1進行多次實驗,確定緊致度因子與形狀因子。最終得到的多尺度分割參數如表3所示。

表3 影像分割參數詳情
由JM距離計算出各地物之間的可分離性狀況如表4所示。由表4分析可以看出,冬小麥與大蒜的光譜信息在多數時期都相互干擾,可分離性較弱,與菜地及其他地物的可分離性在2—4月則較好,綜合考慮各時相影像中地物樣本的可分離性以及對特征優選子集的貢獻程度,選取4月份影像為最佳時相影像。

表4 樣本光譜可分性狀況
實驗將樣本按照3∶7的比例隨機分為訓練樣本和驗證樣本,將訓練樣本輸入隨機森林分類器中學習,再將學習過的隨機森林分類器分別應用于經統一分割尺度分割后的最佳單時相影像、多時相影像和優選波段合成的多特征影像,并基于樣本分類結果的混淆矩陣進行精度評價,評價結果如表5所示。經混淆矩陣驗證得,本文提出的方法分類總體精度為86.02%,Kappa系數為0.792,較單時相影像分割后的OBIC分別提高6.36%和8.37%,整體精度得到了提升,較多時相影像組合分割模式下的OBIC分別提高了0.25%,0.47%??傮w而言,本方法優于單時相影像分割模式下的OBIC和多時相影像組合分割模式下的OBIC。

表5 基于樣本分類結果的混淆矩陣
3種分割模式下的分類結果如圖6所示。由圖6對比結果可以看出,單時相影像分割模式下的OBIC結果存在大蒜與菜地混分現象,種植結構邊界模糊,按照本文方法得到分類結果不僅精度高,而且與通許縣的農業種植結構更相符。

(a)最佳時相影像分類結果
與單時相影像相比,多特征影像更豐富的地物信息使得最終的分類精度高于單時相影像。雖然多時相影像分類效果與多特征影像差距甚小,但是多特征影像僅用30個特征波段參與分類就可以達到多時相影像60個波段參與分類的效果,證明該優化方法兼具效率與精度。本文所用波段是根據研究區地物特點選取,受地域及地物覆蓋類型限制,后續研究將增加其他種植結構或其他地區的分類實驗以進一步驗證該方法的適用性。