徐曉臣,任江龍
(中水北方勘測設計研究有限責任公司,天津 300222)
糧食安全一直是世界各國關注的焦點,水稻作為世界上主要糧食作物之一,其在全球經濟、糧食安全等方面發揮著重要作用。全球氣候變化、環境污染和人口增長等因素,對水稻生產產生較大影響,部分地區的水稻耕種面積不斷減少。因此,及時準確地獲取水稻種植信息對于區域水稻種植監測、糧食安全等具有重要意義。
傳統獲取水稻種植信息的方式多為人工實測,隨著衛星遙感技術的發展,遙感技術已成為獲取作物種植信息的主要手段,其能夠穩定準確地提供大尺度觀測結果[1]。現有水稻種植信息的提取研究中主要是基于光學數據和微波數據。其中,基于光學影像水稻提取多以單景或多時序影像,主要采用機器學習或物候學原理方法。由于單景影像難以避免異物同譜的現象,使得水稻提取結果與選取影像時間關系密切。采用多時相光學數據進行水稻提取,雖然能有效避免異物同譜現象,但易受云雨天氣影響,難以獲得高質量多時序光學數據。合成孔徑雷達(SAR)數據能夠穿云透霧,全天候全天時對地表進行監測,為水稻種植信息的提取提供了新的途徑[2]。通過分析水稻生長季不同極化特征曲線,構建決策樹或其他機器學習方法進行水稻種植信息提取。Google earth engine(GEE)云平臺的快速發展[3],使得基于Sentinel-1 時間序列數據的水稻種植信息提取研究更加便捷。本研究基于GEE 云平臺構建Sentinel-1 時序數據,采用支持向量機和隨機森林方法,實現肥西縣水稻種植信息提取。
由于肥西縣水稻生長期主要在5—9月,因此選擇2021年全年Sentinel-1A 影像分析水稻物候特征,并加載4—10月影像構建時序特征進行分類。本文選擇干涉寬幅(IW)模式地距影像(GRD)雙極化Sentinel-1A 影像,空間分辨率重采樣為10 m,影像寬幅為250 km,時間分辨率為12天。GEE 平臺中Sentinel-1 影像均已使用歐洲航天局(ESA)Sentinel-1 工具箱(S1TBX)進行了預處理,包括軌道校正、熱噪聲消除、地形校正和輻射校正。
由于SAR 數據特殊的成像機制,導致圖像受噪聲影像,頻繁出現椒鹽噪聲現象,影響地物分類精度。而散斑濾波器根據圖像的局部變化進行調整,采取適當的方法對圖像進行平滑處理,從而減少散斑帶來的影響,增強邊緣信息以保持圖像的清晰度。Ref ined Lee 濾波在農作物分類提取中應用較多[4]。因此,在GEE 平臺上對Sentinel-1 影像使用Ref ined Lee 濾波進行散斑濾波處理,以減少椒鹽噪聲對分類結果的影響。同時,采用Savitzky-Golay(SG)濾波方法對散斑濾波后的SAR 時序數據進行時間濾波處理,進而減少時序噪聲,其中SG 濾波中滑動窗口設置為5。
本文樣本數據來源于谷歌歷史影像以及通過野外考察獲取,其中水稻樣本數量為152 個,非水稻樣本125 個。隨機抽取70%的樣本作為訓練樣本(194 個),其余30%的樣本作為驗證樣本(83 個)。
水稻生長初期需要移栽到有水的土壤中,移栽前耕地呈現水體特征,導致后向散射系數較低。水稻被移栽后,植株開始露出水面,微波雙重反射和多重反射機制導致后向散射系數不斷增大。隨著水稻植株不斷增高,后向散射系數也不斷增大,直至水稻抽穗時達到最大值,隨后其后向散射不斷減少。在野外調查過程中發現肥西縣多為單季稻,移栽主要集中在5月份左右,9月底或10月中上旬進行收割,生長周期多為100~120天。
根據野外考察獲得的水稻樣本加載2021年全年Sentinel-1數據進行時序分析,結果如圖1 所示,包括散斑濾波處理后的VV、VH 極化和時間濾波處理后的VV_SG 和VH_SG 極化曲線。從圖中可以看出水稻在兩種原始極化曲線中均呈現出相似的波動,但VH 極化比VV 極化幅度更大(即,最大和最小峰值之差約為10 dB)。經過SG 濾波處理后的VV和VH 極化能夠較好地體現水稻生長的物候特征,其中VH_SG 在水稻稻田灌水期間,VH 后向散射明顯下降,水稻移栽后VH 后向散射明顯上升,直至成熟期達到最大值。而VV_SG 時序曲線在水稻生長期內沒有明顯的波動,振幅較小,僅當水稻成熟期時VV_SG 后向散射有明顯提升。VH_SG 時序曲線相較于VV_SG 具有更明顯的物候特征。

圖1 水稻生長SAR 時序物候特征曲線
支持向量機(SVM)是一種用于解決回歸和分類問題的監督學習算法,支持向量機分類器在訓練階段創建一個理想的超平面,以最少的錯誤分類像素分隔多個類[5]。用于選擇有助于創建超平面的極值點/向量,這些極值點被稱為支持向量。GEE 平臺通過加載ee.Classif ier.libsvm 函數,可實現SVM 分類方法調用。
隨機森林(RF)是一種基于生成大量決策樹的分類學習方法,其中每個決策樹都是由使用訓練集的不同子集構建的[6]。這些子集通常是通過隨機抽樣和替換原始數據集獲取的。通過決策樹選擇最常見的輸出來識別分類共識。通過GEE 平臺中的smileRandomForest 函數調用隨機森林分類方法,并將時序指標特征引入函數,實現水稻和非水稻地塊的分類。根據前人的研究成果,將RF 分類器參數ntree 和mtry 分別設為100 和輸入變量的平方根。
本文利用GEE 平臺構建了三種時序特征組合,分別為VV 時序數據集、VH 時序數據集以及VV 與VH 時序數據集。采用SVM 和RF 兩種分類器對三種時序特征組合進行分類,分類精度如表1 所示。從表中可以看出,VV+VH組合分類精度最高,SVM 與RF 兩種分類器中均獲得最高精度,總體精度分別為89.98%和91.32%。其中RF 水稻種植信息提取的生產者精度與用戶精度均大于SVM 的提取結果,說明RF 分類方法優于支持向量機。在所有對比實驗中,VV 時序特征組合的精度最低,其中SVM 分類方法下總體精度僅為56.32%,而RF 分類總體精度僅增加6.11%,生產者精度與用戶者精度均小于60%。而VH 時序特征組合下兩種分類方法的水稻分類總體精度有明顯提升,接近VV+VH 組合分類精度,說明VH 極化信息對于水稻種植信息的提取尤為重要。

表1 不同特征組合分類精度
總體來看,SVM 水稻種植信息提取精度均小于RF 結果,這與前人的研究成果較為相似,RF 在傳統的機器學習方法中適用性較高。雖然VV 極化特征在兩種分類方法實驗中均取得較低的分類精度,但是在VV+VH 特征組合中,兩種分類器相較于VH 時序特征組合的精度均有一定的提升,其中水稻的生產者精度和用戶精度均提高0 ~2%,說明VV 極化對水稻種植信息提取具有一定的貢獻。
從圖2 中可以看出,兩種分類器在VV+VH 時序特征下均獲得較好的水稻分類效果,整體上并無明顯差異。在空間細節放大圖中,兩種分類器結果也并無明顯差異,但卻在空間細節上存在一定的差異。從圖中可以看出,SVM 分類結果相較于RF 分類結果存在部分漏提現象,水稻提取結果中連通性較差,有明顯的碎斑現象。而RF 方法的提取結果整體表現較為完整,很少出現水稻碎斑現象,提取結果較為完整。

圖2 SVM 與RF 分類結果(左SVM,右RF)
從圖3 中可以看出,肥西縣水稻種植主要集中在高店鄉、官廳鎮、山南鎮、柿樹崗鄉、花崗鎮、豐樂鎮,種植面積占比較多的為山南鎮、柿樹崗鄉和高店鄉。從整體來看,肥西縣水稻種植多集中在西南部,這主要是因為肥西中東部地區與合肥市相連,受城市化與工業化發展的影響,中東部耕地多為建設用地或用于種植經濟作物的土地。

圖3 基于VV+VH 時序特征的RF 水稻提取結果
本文基于GEE 云計算平臺,分析了肥西縣水稻SAR 后向散射時間序列特征,構建不同極化組合特征,采用SVM和RF 兩種分類方法進行水稻種植信息提取。結果表明,水稻VH 極化時序曲線在水稻移栽前后具有明顯波動,VV 極化后向散射波動較小。僅采用VV 極化時序特征獲得的分類精度最低,僅采用VH 極化時序特征,兩種分類器的水稻分類精度獲得明顯提升。而基于VV+VH 極化時序特征下兩種分類器均獲得了非常高的整體準確度。其中,RF(91.32%)水稻提取結果優于SVM(89.98%)。
后續工作將充分考慮Sentinel-1 不同極化間的信息,構建極化特征指數,進一步提升水稻種植信息提取精度。同時由于SAR 數據受噪聲影響,使得水稻提取結果存在大量碎斑現象,難以保證水稻提取結果的精度。因此,在以后的研究工作中,將引入高分辨率影像,實現地塊信息的提取,進而創建基于地塊的水稻種植信息提取方法,進一步提升水稻種植信息的提取精度。