董秀春,蔣 怡,王 思,李宗南,王 昕
(四川省農業科學院遙感應用研究所,成都610066)
近年來,隨著空間信息技術的發展和遙感平臺的不斷更新,不同成像方式、不同波段和分辨率的遙感數據并存,形成了多源、海量、多時相的遙感大數據[1]。為充分利用遙感大數據,需要更高的遙感影像分析、海量數據處理和信息提取能力[2-3]。傳統的遙感影像處理和分析技術難以滿足多源異構海量大數據的處理精度和效率需求。以支持向量機[4]、隨機森林[5]、Softmax[6]等為代表的淺層機器學習方法可有效改善傳統監督分類方法目標識別的準確度和分類精度,但其學習能力和泛化能力有限,難以滿足海量遙感影像分類的需求。深度學習是機器學習的重要分支,是一種模擬人腦神經結構處理信息的方法,能有效地進行特征選擇與特征提取,已在圖像識別分類、語音識別、自然語言處理等多應用領域取得較大突破[7-8],為遙感大數據信息提取提供了新方法[9]。研究人員通過使用高分辨率真彩色影像進行圖像分類[10]和目標識別[11-12],在土地覆蓋分類、地籍邊界線提取等方面取得較好的應用效果。
甘蔗是云南邊疆地區農民脫貧致富的重要產業[13]。掌握甘蔗空間分布及時空變化可為地方政府、農業部門進行作物種植結構調整提供重要參考[14]。目前,甘蔗遙感分類提取方法包括監督分類[15]、面向對象分類[16]和決策樹[17-18]等,研究人員通過EOS/MODIS、HJ衛星遙感數據,實現了甘蔗種植信息提取、面積估算以及動態監測。U-Net具有較強的語義分割功能,可對圖像上的每個像素點實現語義標注,目前在高分辨率遙感影像分類中得到較好的應用[19-20]。為探索基于深度學習的甘蔗種植空間信息提取方法,文章以云南省隴川縣甘蔗種植園為研究對象,采用基于U-Net的神經網絡模型提取甘蔗種植空間信息,利用地面樣方數據評價模型精度,為基于深度學習方法的甘蔗空間信息提取提供技術參考。
研究區隸屬于云南省德宏州隴川縣,位于云南省德宏州西南部(圖1)。該區域屬于南亞熱帶季風氣候,以河谷盆地、丘陵為主,平均海拔930~1 100 m,年均氣溫18.4~20.3℃,年降雨量1 400~1 700 mm,年日照時間2 281~2 453 h,晝夜溫差大,霜期短少,充足的氣候資源和土地資源適宜甘蔗生長。

圖1 研究區位置及影像示意圖Fig.1 Location and Google Earth imagery of study area
1.2.1 Google Earth數據
Google Earth影像是Google公司自2005年推出的高空間分辨率RGB合成影像,用戶可通過Google Earth(GE)虛擬地球軟件實時瀏覽和下載。云南秋冬季節可獲取清晰無云遙感影像,10—11月為甘蔗伸長期,是甘蔗最佳遙感監測時期。下載2018年11月28日空間分辨率為0.26 m、19級的RGB合成影像為數據源,經重采樣、裁剪等預處理,形成空間分辨率為0.5 m、影像幅寬為8 km×8 km的待分類影像,覆蓋區域地形分為典型的平壩和丘陵地區,如圖1所示。
1.2.2 樣方數據
結合農業農村部大宗作物遙感監測地面調查數據,確定甘蔗解譯標志。將研究區分為甘蔗和非甘蔗兩類。選取甘蔗感興趣區建立樣本數據集,其中用于訓練的樣本200個,用于驗證的樣本40個(圖1)。在研究區隨機建立4個大小為500 m×500 m的樣方,隨機分布于平壩區和丘陵區,如圖1黑色方框標注范圍所示,目視解譯獲取樣方內甘蔗種植面積和空間分布,作為分類精度驗證數據。
使用ENVI5.5中的深度學習模塊進行甘蔗空間信息提取。該模塊是基于TensorFlow深度學習框架的遙感圖像分類工具,采用基于U-Net神經網絡模型進行影像分類處理,該模型是典型的全卷積神經網絡模型,由壓縮通道和擴張通道組成。壓縮通道是卷積神經網絡結構,重復采用2個卷積核大小均為3×3的卷積層和1個2×2步長為2的最大池化層,逐層完成影像特征提取,在每次下采樣過程中,特征通道的數量會加倍;擴展通道中每個步驟首先通過2×2的反卷積對特征圖進行上采樣,減半特征通道數量,然后再拼接對應壓縮通道特征圖,同時進行2次3×3的卷積進行特征提取,重復該步驟,在最后的輸出層,通過卷積核大小為1×1的卷積層將特征圖映射到1個灰度圖像,其像素代表屬于感興趣特征的概率。具體步驟為:首先構建U-Net網絡模型,然后加入訓練樣本和驗證數據進行模型訓練;最后使用模型進行影像分類,根據驗證數據計算混淆矩陣,評價模型分類結果。
該文采用2018年11月28日空間分辨率為0.5 m的Google Earth影像數據,基于U-Net模型對云南省德宏州甘蔗種植區8 km×8 km的范圍進行種植空間信息提取,結果如圖2所示。U-Net模型精度驗證結果表明,基于Google Earth影像的深度學習分類總精度為92.76%,Kappa系數為0.848 0,面積總精度為94.41%。根據圖2,基于Google Earth開放數據的甘蔗深度學習分類效果良好,大部分甘蔗均能被較好識別。部分地物存在錯分,如部分河流區域草地、操場人工草坪、湖泊錯分為甘蔗,如圖2中矩形和橢圓形圈出部分。與典型的平壩、丘陵區域的分類精度比較結果見表1。平壩區、丘陵區分類精度存在明顯差異。其中,平壩區的分類總精度比丘陵區高約9%,Kappa系數較丘陵區域高約0.16;甘蔗的錯分、漏分誤差顯示平壩區較低,尤其是漏分誤差顯著低于丘陵 區。
不同區域分類精度存在明顯差異的主要原因是平壩區域地塊形狀規則、界線清晰,便于特征對象分割提取;平壩區域水肥條件好,大部分甘蔗長勢整齊,整體紋理特征一致,有利于特征識別。丘陵區域受地形、水肥條件、管理水平等影響,甘蔗長勢參差不齊,呈現出較大的紋理特征差異,部分長勢較差的甘蔗漏分較多;部分地塊受其他作物或植被干擾,地塊界線模糊,出現錯分現象,影響了整體分類結果。部分地物RGB影像特征與甘蔗相似,導致部分地物存在錯分現象。

圖2 基于U-Net的甘蔗提取結果Fig.2 Classification results of Sugarcane based on U-Net in study area

表1 不同區域分類精度驗證結果Table 1 Classification accuracy in different regions
U-Net網絡模型具有結構清晰的優點,能夠在小樣本數據集下獲得較好的訓練效果[21],可在一定程度上解決深度學習在作物空間信息提取中受限于作物樣本數據集缺乏的問題。研究以云南隴川縣甘蔗種植區0.5 m的Google Earth影像進行U-Net模型訓練和甘蔗分類提取,經地面樣方數據驗證,基于U-Net模型的甘蔗分類總體精度和Kappa系數分別為92.76%和0.848 0,結果表明該方法可行,可為基于深度學習方法的甘蔗空間信息提取提供技術參考。
研究使用Google Earth開源高分辨率影像進行基于U-Net的甘蔗深度學習分類方法探索,結合研究結果,未來仍需進一步嘗試使用多光譜(尤其是帶有紅邊波段)影像數據進行作物深度學習分類方法研究。開放的Google Earth影像數據是研究人員常用空間參考數據,被應用在農作物面積地面樣方調查[22]、遙感影像分類[23-24]等多項研究中。但分類結果顯示,受部分地物RGB影像特征與甘蔗相似的影響,使用Google Earth開放的RGB合成影像存在部分較明顯的錯分現象。相關研究表明,更廣的光譜范圍有利于地物識別[25],因此,需進一步研究多光譜影像作物空間信息提取方法,以減少作物錯分、漏分現象,提高作物分類提取精度。