董秀春,蔣怡,楊玉婷,郭濤,李宗南,李章成
(四川省農業科學院遙感與數字農業研究所,成都市,610066)
柑橘是全球重要的經濟作物,在中國種植面積廣、產量大,已成為農村經濟發展、農民脫貧致富的支柱產業[1-3]。近年來,我國柑橘生產擴張明顯,種植集中化、規模化趨勢加強,形成以江西、湖南、湖北、廣東、廣西、浙江、福建、四川、重慶等省市為主要產區的空間分布格局[4-6]。柑橘的快速擴增導致柑橘價格下滑、耕地減少、景觀格局改變、果園面源污染等問題[1, 7-8],及時獲取準確的柑橘種植空間分布信息,有助于地方農業部門進行柑橘產業的合理規劃、信息化管理、產量預測、果園環境風險評價等[9]。傳統人工調查方法費時耗力,獲取的柑橘數據對空間信息表達不足,遙感方法具有及時、客觀優勢,在作物種植信息提取中應用廣泛。相關研究人員基于Landsat TM/OLI[10]、Sentinel-2[11]、無人機影像[12]、GF-1 PMS[13]等遙感數據,采用隨機森林、可見光植被指數法、面向對象等方法,開展了柑橘果園種植信息提取方法研究。由于柑橘果園受地形、樹齡以及管理水平差異等因素影響,導致其具有較復雜的景觀特征,同物異譜現象明顯,尤其是在種植結構復雜地區,常用分類方法獲取的結果存在較大不確定性。
高分辨率遙感影像具有豐富的空間信息,可清晰反映果園的紋理特征。深度學習語義分割模型通過構建深度卷積神經網絡,從大量、復雜特征樣本數據集中經多個卷積和池化操作,進行由低層到高層的圖像特征提取;再根據標注信息學習、推理圖像中像素的類別,實現端到端圖像分類[14],在高分辨率遙感影像分類及地物信息提取中表現出色[15-16],較傳統分類方法具有較高的精度和效率優勢,為復雜特征的果園信息提取帶來新的機遇。研究人員基于無人機、Worldview系列等高分辨率遙感影像和深度學習方法,開展了柑橘[17]、核桃[18]和橄欖園[19]等果園空間信息提取研究。隨著國內外高分辨率遙感影像和開源深度學習框架平臺增加,地方農業部門、農戶使用開放的數據源和便捷的處理工具獲取區縣級的柑橘空間信息成為可能。研究以四川柑橘重點產區的蒲江縣為研究區,使用開源人工智能平臺,通過收集高分辨率Google earth圖像和地面果園調查數據,訓練柑橘園語義分割模型,實現柑橘種植空間信息提取,以期為地方農業部門使用高分辨率遙感和開源的深度學習分類模型快速提取果園空間信息提供參考。
蒲江縣(圖1)屬四川省成都市,位于成都平原西南邊;地勢為西南高、東北低,地貌以淺丘為主,兼有平壩、深丘和山地;屬亞熱帶濕潤季風氣候,年平均氣溫16.4 ℃,降水1 280 mm,氣候溫和,雨量充沛;土壤肥沃,農業資源豐富,適合柑橘種植。近年來,該縣通過農業產業生態化發展,建設國家級特色水果現代農業產業園,建成全國優質晚熟柑橘基地,形成以不知火、春見等雜柑為主要類型的種植規模和區域品牌效應,已成為四川省柑橘重點產區,對促進地區經濟的發展、農民增收具有重大作用。

數據包括實地調查數據和影像數據。經實地調查,采集各類典型地物標志點位置信息約120個。研究區內主要作物為柑橘、獼猴桃、茶,其余地物為道路、居民點、林地、耕地等。根據標志點和高分辨率影像,繪制調查樣方地物分布圖,為樣本數據集建立和精度驗證提供支持。
高分辨率的Google earth圖像在農作物地面樣方調查和種植信息提取等多項研究中均有應用[20-21]。柑橘屬闊葉常綠樹種,對影像獲取時相要求較低。通過Google earth獲取研究區清晰無云、空間分辨率為0.5 m 的RGB合成影像為數據源。其中,影像拍攝時間為2020年5月17日和2018年4月3日;矩形區域(圖1)為訓練區,用于樣本生產和模型訓練,某鄉鎮為測試區,用于模型預測和精度評價。經重投影、影像鑲嵌等預處理,形成覆蓋研究區的高分辨率圖像。
圖像語義分割即圖像標注,是將圖像進行自動分割并識別出圖像內容,為圖像上各像素點分配語義標簽,由此應用到遙感領域可解決影像分類問題[22-23]。常用深度學習語義分割模型包括U-net[24]和DeepLabv3+[25],是全卷積神經網絡(Fully Convolutional Network,FCN)的改進和延伸,均利用下采樣提取特征、上采樣還原圖像尺寸的語義分割的思想,實現圖像的語義標注,在遙感影像的地物信息提取和影像分類應用廣泛[26-27]。
U-net模型的結構如圖2所示,因網絡整體結構類似于大寫的英文字母U而得名。該網絡是標準的編碼器—解碼器網絡,上邊是由4個含有2個卷積層和1個最大池化層的模塊構成的編碼器,逐層進行影像特征提取、減少特征圖的分辨率;同樣,下邊是由4個含有1個反卷積和2個卷積層的模塊構成的解碼器,通過上采樣操作減少特征圖維數、依次還原圖像尺寸;同時通過跳躍連接,以拼接的方式將解碼器和編碼器中相同分辨率的特征圖進行特征融合,幫助解碼器更好地恢復目標細節。該網絡參數少、計算快,一般場景適應性強[17]。

圖2 U-net模型結構圖
DeepLabv3+總體結構如圖3所示,是1個帶空洞的空間金字塔池化的編碼—解碼結構。編碼器包括深度卷積神經網絡DCNN(Deep convolution neural network)和空洞卷積空間金字塔池化ASPP(Atrous spatial pyramid pooling)兩個模塊,前者是通過改進的Xception作為骨架網絡對原始圖像進行特征提取,以提高模型語義分割的健壯性和運行速率;后者是在不改變特征圖大小的同時控制感受野,提取多尺度信息,對DCNN提取特征的信息進一步優化。解碼器利用跳級結構將DCNN提取的低層特征圖與經過4倍雙線性內插上采樣的高層特征圖進行融合,細化對象分割邊界,再經上采樣操作恢復至原始圖像的分辨率,實現圖像的語義分割和像素預測,在對圖像信息的深層次挖掘方面具有較強優勢。

圖3 DeepLabv3+網絡結構圖
1.4.1 環境依賴搭建
模型訓練環境為Ubuntu 18.04,采用GPU為NVIDIA RTX 3090,顯存為24 G,CUDA版本為11.0;使用開源深度學習框架PaddlePaddle平臺下的圖像分割套件PaddleSeg,搭建U-net和DeepLabv3+柑橘園空間信息提取模型。
1.4.2 建立柑橘語義分割數據集
采用規則格網裁減研究區影像,形成空間分辨率為0.5 m、尺寸大小為256×256的影像數據集,并轉換成jpg格式,用于模型訓練和評估。結合研究區地面調查結果,根據果樹新種到成林的過程將柑橘園按樹齡分為1~2年生、3~4年生、5年以上三類,其圖像特征分別為點狀、大點狀、條狀或成林狀,典型柑橘園樣本見圖4。在訓練區選取有代表性的影像數據進行柑橘地塊人工標記,生成png格式的柑橘園地塊標注數據,由此建立柑橘訓練樣本數據集,共計400個影像—標簽對,其中,350個樣本參與模型訓練,50個樣本用于模型評估。
1.4.3 語義分割模型訓練和保存
加入樣本數據集分別進行U-net和DeepLabv3+模型訓練、精度評估和保存。在訓練過程中,主要參數設置包括網絡優化函數為adam,學習率下降方法為poly,初始學習率為0.001,批處理大小為4,迭代次數為300,訓練的損失函數為Softmax,DeepLabv3+的模型骨架網絡選取Xception_65;訓練完成后導出模型及參數配置文件。
1.4.4 基于語義分割模型的柑橘園空間信息提取
基于Python端的模型預測腳本,使用訓練后效果最優的U-net和DeepLabv3+模型對測試區影像進行預測,然后為分割預測結果添加空間坐標信息,經拼接、柵格轉矢量、刪除細小圖斑等后處理,得到研究區柑橘園空間分布信息。
1.4.5 面積精度評價
在測試區建立地面樣方,目視解譯獲取樣方內柑橘園的面積和空間分布,作為模型分類精度驗證真值,計算模型預測結果中柑橘園的總體精度和Kappa系數,評價語義分割方法提取柑橘園的性能;對樣方內各柑橘園地塊面積排序,分區間統計面積精度,評價準確識別的最小斑塊面積。
基于驗證樣本數據,U-net和DeepLabv3+模型的總體精度、Kappa系數、IOU等精度評估指標及訓練耗時等結果見表1。U-net和DeepLabv3+模型的總體精度在87%~89%之間,Kappa系數和IOU差異較小,模型精度接近,表明兩種語義分割模型在少量樣本和復雜應用場景下具有較強的圖像處理能力,對柑橘園信息提取表現出較好的分類效果,可滿足柑橘園遙感監測需要;對比U-net和DeepLabv3+模型訓練所需時間,DeepLabv3+耗時較多,在少量訓練樣本條件下,結構較為簡單的U-net模型的訓練效率和精度略優于DeepLabv3+。

表1 U-net和DeepLabv3+模型的評價指標Tab. 1 Evaluation indicators between U-net and DeepLabv3+
基于U-net和DeepLabv3+模型預測測試區影像柑橘園圖斑,計算驗證樣方的混淆矩陣,結果見表2。測試區柑橘園分類提取的總體精度約87%左右,Kappa系數高于0.72,驗證結果接近模型評估結果,表明訓練的模型適應性良好,可用于柑橘園的空間信息提取。對比分析錯分、漏分誤差等指標,兩種模型的錯分誤差相當,但DeepLabv3+漏分誤差略高于U-net。分析測試區柑橘園的漏分、錯分原因,主要是公路兩旁的綠化植被、少量林地以及極少量獼猴桃園的遙感特征與成林的柑橘園相似,因而被錯分為柑橘園;新種的柑橘樹因樹苗較小,遙感特征接近裸地,紋理特征不明顯,不能被準確識別和提取;少量坡地的柑橘園呈梯坎狀分布,其遙感特征與平地果園有差異,漏分現象明顯。

表2 基于語義分割模型的柑橘園提取精度Tab. 2 Precision analysis of citrus extraction between U-net and DeepLabv3+
測試區U-net模型預測結果及局部區域見圖5,小地塊果園面積遙感識別精度分析見圖6。

圖5 測試區U-net預測結果

圖6 地塊面積與識別精度
該區域柑橘種植分布密集,除靠城區附近平壩及海拔較高的區域種植較少之外,其余區域均以柑橘為主,種植區域在空間上呈現規模化、集中化的分布特征。局部區域放大圖顯示:測試區內不同特征的柑橘園地塊分割準確,能較好地將柑橘園與其他地物進行區分。根據圖6,地塊面積在120 m2以下的果園遙感識別精度不穩定,各區間均低于80%;當面積大于120 m2時,各個區間的果園遙感面積精度高于85%,且隨著地塊面積增加,果園的遙感識別精度整體呈上升趨勢,表明該研究基于U-net訓練的柑橘園空間信息提取模型在0.5 m 高分辨率遙感圖像能準確識別的最小圖斑約為120 m2。
本文通過高分辨率Google earth圖像和U-net、DeepLabv3+模型初步實現柑橘園空間信息精準提取。構建的柑橘園語義分割模型是基于開源平臺,用戶僅需下載開放使用的高分辨率影像,通過云平臺服務即可便捷實現信息提取,對比傳統人工調查效率更高。經統計,測試區柑橘種植面積約0.45 khm2,與該地區的農業調查統計數據(0.42 khm2)比較,模型預測的面積估算精度約為92%,綜上,U-net模型適合在小樣本數據集下獲得較好的分類精度,能滿足地方農業部門快速、自動獲取區縣范圍柑橘園種植信息的需求。
Google earth圖像通過開放獲取,便于數據收集和模型訓練驗證,但該圖像數據僅有RGB三通道,在區分紋理特征相似的成林柑橘園、部分綠化植被、少量林地等地物時,因缺少光譜特征導致不能取得較好的分割效果,從而影響柑橘園分類提取精度。隨著國產高分辨率光學遙感衛星數量增加和性能提升,各地農業部門可采用含藍、綠、紅、紅邊、近紅外等多波段的國產高分辨率影像開展基于高分遙感和深度學習分類模型的果園空間信息調查工作。
本文僅使用小區域的樣本進行模型訓練,在研究區內取得較好的預測結果。由于國內小農經濟模式的果園較多,品種、種植密度、樹齡、管理方式等存在差異,導致柑橘園遙感特征較為復雜,因而不同區域或大范圍的柑橘園空間信息提取,需要考慮加入更多地區及類型的訓練樣本,以提高模型穩健性和預測的效率和精度。
1) 使用0.5 m分辨率的RGB遙感圖像建立柑橘園樣本數據,訓練開源的語義分割模型U-net和DeepLabv3+,建立柑橘園空間信息遙感模型,提取研究區柑橘園空間信息。
2) U-net和DeepLabv3+模型的柑橘園分類總精度分別為88.30%和86.79%,Kappa系數為0.75和0.72,建議區縣范圍的果園信息提取工作采用模型結構更為精簡的U-net模型。
3) 使用高分辨率遙感影像和深度學習語義分割方法可準確提取區域的柑橘園空間信息,最小識別圖斑面積可達120 m2。該研究對地方農業部門應用開放遙感數據快速調查本地果園空間信息具有參考作用。