王晶晶 蘭仕浩 邱琳 汪曙 單捷 黃曉軍 李牧









王晶晶,蘭仕浩,邱? 琳,等. 基于哨兵二號的大豆、玉米遙感識別——以江蘇徐淮地區為例[J]. 江蘇農業學報,2023,39(8):1698-1706.
doi:10.3969/j.issn.1000-4440.2023.08.009
收稿日期:2022-11-07
基金項目:江蘇省農業科技自主創新基金項目[CX(22)2001]
作者簡介:王晶晶(1981-) , 女 , 江蘇揚州人, 博士, 副研究員 , 主要從事農業遙感應用研究。 (E-mail)immi103@163.com
摘要:本研究以哨兵二號影像為數據源,以江蘇徐淮地區邳州市西南部作為研究區,開展大豆、玉米遙感識別研究。采用覆蓋玉米和大豆主要生長期的多時相哨兵二號影像構建遙感特征參數數據集,包括12個光譜波段的反射率和47個植被指數,采用遞歸特征消除與隨機森林、支持向量機相結合的算法開展特征參數優選,明確最優識別時相-特征參數組合,在此基礎上,采用隨機森林和支持向量機分類器進行分類,并比較分類精度。研究結果表明,利用特征參數優選方法提取最優特征參數組合,在保證總體精度的前提下能夠減少特征參數數量;陸地水指數和倒數差值等植被指數是2種優選算法所提取出的共性特征參數;9月8日是研究區玉米和大豆遙感識別的最佳時相,總體精度和Kappa系數均為0.99。
關鍵詞:玉米;大豆;哨兵二號影像;特征選擇;遙感識別
中圖分類號:TP79????? 文獻標識碼:A????? 文章編號:1000-4440(2023)08-1698-09
Recognition of corn and soybean based on Sentinel-2 imagery: a case study in Xuhuai area, Jiangsu province
WANG Jing-jing1 LAN Shi-hao2 QIU Lin1 WANG Shu1 SHAN Jie1 HUANG Xiao-jun1 LI Mu1
(1.Institute of Agricultural Information, Jiangsu Academy of Agricultural Sciences, Nanjing 210014, China;2.School of Remote Sensing and Geomatics Engineering, Nanjing University of Information Science and Technology, Nanjing 210044, China)
Abstract:In this study, the southwest of Pizhou City of Xuhuai area, Jiangsu province, China, was taken as the study area, and multi-temporal Sentinel-2 images covering the main growing period of the corn and soybean were adopted to build the multi-temporal candidate features data set including the reflectance of 12 spectral bands and 47 vegetation indices. Two machine-learning algorithms, i.e., random forest and support vector machine combined with the recursive feature elimination process were employed and their respective performance in crop identification was evaluated to determine the optimal characteristic parameters of remote sensing identification with the best recognition time phases of corn and soybean. Results indicated that feature parameter selection method could be used to extract the optimal feature parameter combination and reduce the number of feature parameters under the premise of ensuring the overall accuracy. The combination of features of multiple time phases obtained by the two algorithms had some of the same preferred feature parameters including land surface water index and derivative difference vegetation index. The classification accuracy analysis showed that September 8 was the best phase for corn and soybean recognition in this study with the overall accuracy and kappa coefficient of 0.99.
Key words:corn;soybean;Sentinel-2 imagery;feature selection;remote sensing identification
玉米是目前世界上種植最廣泛的谷類作物之一,其總產量位居三大谷類作物(玉米、水稻和小麥)之首。近幾十年來,玉米是全球單位面積產量和種植面積增長最快的大田作物[1],在解決未來糧食需求方面發揮著重要作用。中國是世界主要大豆生產國之一,但大豆的產量遠遠不能滿足畜牧業生產和人們生活的需要,近年來大豆種植面積不斷增加。隨著玉米和大豆種植規模的不斷擴大,快速準確地了解玉米、大豆種植的空間分布和動態變化等一系列問題顯得日益緊迫。識別農作物,掌握農作物種植面積及其變化,是當前農業遙感監測研究的重要目標,引導和調節農業結構對規劃國家和區域經濟社會發展戰略,制定農產品進出口計劃具有重要意義[2-3],同時作物空間分布情況是作物長勢監測、產量預測、災害預警等農情遙感監測的基礎信息[4-5]。傳統方法通過人工實地調查獲取耕地種植情況,存在費時費力的局限性,不能大范圍使用。遙感技術具有宏觀、實時、動態等優點,已成為獲取耕地和農作物信息的有效手段[6-7]。
在農作物分類識別研究中,原始遙感影像的光譜特征使用最多,利用線性或非線性變換得到的植被指數能有效提高玉米和大豆識別的效率,成為農作物識別最重要的遙感特征[8-9]。紅邊、近紅外波段和短波紅外已被學者證明對玉米和大豆的識別至關重要[10-12]。由于作物具有明顯的季節生長規律和物候特征,時相的選擇成為影響精度的重要因素[13-14]。目前,對玉米和大豆的種植分布研究主要集中在機械化程度高、種植連片的產區,例如美國、巴西、阿根廷以及中國東北地區[15]。玉米和大豆遙感識別研究以中低空間分辨率、大尺度、高時間分辨率的遙感數據源為主[8-10],對于以散戶種植為主、種植結構較為復雜的地區,例如地處中國黃淮海大豆、玉米種植區的江蘇省徐淮地區,由于農田景觀破碎、作物插花種植程度較高,中低分辨率衛星數據難以滿足種植田塊較小的玉米、大豆等作物種植分布精細識別的空間分辨率的要求。
本研究以江蘇省徐淮地區邳州市南部地區為研究區,以歐洲航天局(European Space Agency,ESA)哨兵二號(Sentinel-2)高分辨率影像為遙感數據源,開展農田景觀破碎地區玉米和大豆遙感識別特征選擇研究,通過地面實地調查獲得了玉米、大豆、水稻等主要作物樣本,提取樣本對應遙感影像的波段反射率并計算多個植被指數作為遙感識別特征數據集,采用2種機器學習算法,即隨機森林 (Random forest, RF) 和支持向量機 (Support vector machines, SVM) 結合遞歸特征消除(Recursive feature elimination, RFE) 算法,分析多個時相的遙感特征數據集中各個遙感特征對識別精度的重要性,探求玉米、大豆和其他作物分類最優遙感特征參數及適宜時相,最后利用時相-遙感參數的最優特征組合提取研究區玉米和大豆的種植分布信息,并驗證精度。
1? 材料與方法
1.1? 研究區概況
江蘇徐淮地區是中國典型的玉米、大豆種植區。研究區位于江蘇省邳州市西南部( 34°07′~34°21′N,117°37′~117°57′E)。邳州市位于江蘇省西北部,黃河與淮河之間,屬于暖溫帶濕潤半濕潤季風氣候區,年平均氣溫14.4 ℃,年平均日照時數2219.7 h,年平均降水量853.2 mm,玉米和大豆種植面積分別為36 710 hm2和5 490 hm2,主要分布在邳州西南部地區(圖1)。
本圖為哨兵二號(Sentinel-2)MSI 4.3.2,4、3、2波段真彩色合成影像。
1.2? 數據獲取與預處理
本研究涉及的數據主要包括Sentinel-2影像和不同類型農作物的田間樣本。本研究采用的衛星影像包括2020年7月至2020年10月五景Sentinel-2影像,影像數據從歐洲航天局數據中心(https:∥scihub.Copernicus.eu/dhus/#/home)下載,五景影像的成像時間和清晰度如表1所示。Sentinel-2是1顆高分辨率多光譜成像衛星,它搭載多光譜成像儀(MSI),覆蓋了從可見光以及近紅外到短波紅外的13個光譜波段,是唯一具有紅邊范圍3個波段光學影像數據的高分辨率多光譜成像衛星,對作物監測具有重要意義。本研究使用的Sentinel-2數據為LEVEL-2A級,產品進行了輻射校正、大氣校正、正射校正和幾何校正。在大氣校正過程中,卷云波段(中心波長1 375 nm)被自動去除,將其余12個波段疊加重采樣至10 m分辨率。最后,根據研究區域的位置對圖像進行裁剪。
2020年7月至2020年10月,在研究區進行了3次實地調查,收集了地面不同類型作物樣本的信息。研究區中與玉米、大豆同一生長季節的主要農作物是水稻。采用亞米級全球定位系統獲取作物樣本位置,測量獲得樣本369個,其中玉米樣本123個,大豆樣本120個,水稻樣本126個(圖2)。
1.3? 遙感識別特征參數
本研究選用并建立的遙感識別特征主要有兩大類。第一類是Sentinel-2影像12個波段的反射率,第二類是利用藍光、綠光、紅光、紅邊、近紅外和短波紅外波段構建的植被指數。根據Sentinel-2數據的波段設置,本研究選取ρ1、ρ2、ρ3、ρ4、ρ5、ρ6、ρ7、ρ8、ρ8A、ρ9、ρ11、ρ12、NDVI、NDVIGreen、RVI、RVIGreen、SRNIR/RE、SRRed/RE、SRRed/Green、TVI、SAVI、DVI、DDVI、EVI、LSWI、TDVI、OSAVI、VARIGreen、NLI、MNLI作為玉米、大豆遙感識別特征參數(表2),建模特征參數共計59個。Sentinel-2影像的第5、第6、第7波段是3個紅邊波段,第8和第8A波段是2個近紅外波段,第11和第12波段是2個短波紅外波段,后續用于分析建模的遙感特征數據集中的各個因子,以Sentinel-2波段名稱命名。
1.4? 特征參數優選算法
本研究分別將遞歸特征消除算法與隨機森林、支持向量機相結合,構建了RF-RFE及SVM-RFE特征參數優選與分類算法,開展玉米和大豆所對應的農作物遙感識別特征參數優選研究。從樣本中隨機抽取2/3,用于建模,以另外1/3未被抽中的樣本用于模型的精度評價。
RF-RFE算法首先將某一時相建模使用的所有特征參數集代入RF分類器,得到分類總體精度,再利用隨機森林特征重要性估計,得到各個特征參數的重要程度,利用后向迭代特征遞歸消除方法,刪除重要性最小的特征,再次將新的特征參數集代入RF分類器,得到總體精度,循環評價完所有特征,篩選出總體精度達到相對穩定的峰值時的特征參數組合,確定為該時相玉米和大豆的最佳遙感特征參數組合。
SVM-RFE算法輸入的原始特征數據集與RF-RFE算法輸入的相同,首先將某一時相建模使用的所有特征因子集代入SVM高斯徑向基核函數分類器,得到分類總體精度,再利用支持向量機線性核函數訓練得到每個特征參數的重要性,同樣利用后向迭代特征參數遞歸消除方法,刪除重要性最小的特征,再次將新的特征參數集代入SVM分類器,得到總體精度,循環評價完所有的特征參數,篩選出總體精度達到相對穩定的峰值時的特征參數組合,確定為該時相玉米和大豆的最佳遙感特征參數組合。
1.5? 玉米和大豆種植分布信息提取
通過比較RF-RFE和SVM-FRE特征選擇結果,選擇最適宜時相的Sentinel-2圖像,計算該時相玉米和大豆最佳遙感特征參數組合所需要的各個植被指數及波段反射率,將所有參數所在波段進行組合,然后根據研究區已有農田矢量邊界,提取出農田范圍信息,選擇最適宜分類算法,將實地樣本作為訓練樣本輸入分類器,提取研究區玉米和大豆的空間分布信息。
ρBlue、ρGreen、ρRed、ρRE、ρNIR、ρSWIR分別表示藍波段反射率、綠波段反射率、紅波段反射率、紅邊反射率、近紅外波段反射率、短波紅外波段反射率;SAVI計算中的L值為0.5;WDRVI中a值為0.1。
2? 結果與分析
2.1? 最優特征參數組合選擇
分別利用RF和SVM特征參數重要性評價方法,對5個時相59個特征參數依次刪除得分最低的遙感特征參數,然后得到分類的總體精度,參與分類的特征參數數量與總體精度的變化情況如圖3所示。
7月8日的結果顯示,使用RF-RFE算法,前4個特征參數的分類總體精度達到0.81,使用SVM-RFE算法,前7個特征參數的分類總體精度達到0.81,達到總體精度的穩定值之后,2種算法隨著特征參數數量進一步增加,總體分類精度變化幅度較小,59個特征參數的總體精度分別為0.77和0.82。8月17日的結果顯示,使用RF-RFE算法,前9個特征參數的分類總體精度達到0.92,之后隨著特征參數數量增加,總體精度呈現小幅度波動,59個特征參數的總體精度為0.88;使用SVM-RFE算法,前3個特征參數的分類總體精度達到0.89,之后隨著特征參數數量增加,總體分類精度呈現降低的趨勢,59個特征參數的總體精度為0.82。9月8日的結果顯示,使用RF-RFE算法,前5個特征參數的分類總體精度達到0.99,之后隨著特征參數數量增加,總體精度呈現穩定狀況,59個特征參數的總體精度為0.99;使用SVM-RFE算法,前4個特征參數的分類總體精度達到0.99,之后隨著特征參數數量增加,總體分類精度呈現降低的趨勢,59個特征參數的總體精度為0.87。9月18日的結果顯示,使用RF-RFE算法,前3個特征參數的分類總體精度達到0.96,之后隨著特征參數數量增加,總體精度呈現小幅度波動,59個特征參數的總體精度為0.94;使用SVM-RFE算法,前9個特征參數的分類總體精度達到0.98,之后隨著特征參數數量增加,總體分類精度呈現降低的趨勢,59個特征參數的總體精度為0.84。10月1日的結果顯示,使用RF-RFE算法,前28個特征參數的分類總體精度達到0.86,之后隨著特征參數數量增加,總體精度呈現小幅度波動,59個特征參數的總體精度為0.83;使用SVM-RFE算法,前10個特征參數的分類總體精度達到0.90,之后隨著特征參數數量增加,總體分類精度呈現先降低再趨于穩定的趨勢,59個特征參數的總體精度為0.89。
通過比較分類總體精度,選擇5個時相分類總體精度達到穩定峰值時所對應的特征參數集為最優特征集,使用RF-RFE和SVM-RFE算法優選出來的不同時相最優特征參數子集,如表3及表4所示。
5個時相的最優特征參數組合中,短波紅外波段、近紅外以及紅邊波段構建的DDVI和LSWI是2種特征優選算法提取出的共性特征參數,對研究區的大豆、玉米和水稻有較好的區分性。
2.2? 分類精度評價
選擇5個時相優選后的遙感特征參數組合作為變量輸入到RF和SVM分類器,以1/3樣本驗證分類精度。根據混淆矩陣計算出總體精度、Kappa系數、用戶精度、制圖精度4個評價指標,對2種分類方法的精度進行評價。
RF和SVM 2種分類方法的總體精度和Kappa系數在不同時相上的變化趨勢較為一致(圖4、圖5),7月8日的分類精度最低,RF算法的總體精度和Kappa系數分別為0.81和0.71,SVM方法的總體精度和Kappa系數分別是0.82和0.74,9月8日的分類精度最高,RF和SVM算法的總體精度和Kappa系數均為0.99,同時2種算法在9月8日的玉米與大豆的用戶精度及制圖精度均為5個時相中的最高值(圖6、圖7),利用RF分類方法獲得的玉米制圖精度為1.00,用戶精度為0.98,大豆制圖精度為0.97,用戶精度為1.00,總體分類精度為0.99,Kappa系數為0.99,利用SVM方法獲得的玉米制圖精度為0.98,用戶精度為1.00,大豆制圖精度為1.00,用戶精度為0.97。由此可知,9月8日是研究區大豆和玉米遙感識別的最佳時相。
2.3? 玉米和大豆種植分布信息提取
綜合比較RF-RFE和SVM-RFE 2種算法的精度和輸入參數數量,本研究選取2020年9月8日Sentinel-2影像,以研究區LSWI(ρ8,ρ11)、LSWI(ρ8A,ρ11)、LSWI(ρ8,ρ12)、LSWI(ρ6,ρ8A)作為遙感特征參數輸入數據集,采用SVM分類器,提取研究區玉米和大豆的空間分布(圖8)。
3? 結? 論
本研究基于典型研究區玉米和大豆生長過程中5個時相的Sentinel-2影像,構建以波段反射率和植被指數為主要識別特征的遙感特征參數集,并通過RF-RFE和SVM-RFE算法確定玉米和大豆識別的優選特征參數與最佳識別時相,進一步利用實測樣本對識別進行驗證和比較,得出如下結論。
第一,多時相Sentinel-2影像在農田景觀破碎、作物插花種植程度較高的徐淮地區表現出較好的作物識別能力,在9月8日及9月18日2個時相,玉米、大豆和水稻的總體分類精度和Kappa系數均超過0.90,9月8日是本研究玉米、大豆識別提取的最佳時相,總體分類精度可達0.99。
第二,通過構建遞歸特征消除與隨機森林及支持向量機相結合的特征優選算法,在獲得穩定的總體分類精度的同時,可以減少特征參數的輸入數量。除了10月1日之外的4個時相,2種特征優選算法獲得最大分類精度對應的特征參數數量均少于10個。
第三,RF-RFE和SVM-RFE 2種特征優選算法獲得的研究區多個時相的優選特征參數組合擁有一些相同的特征參數。使用Sentinel-2 近紅外和短波紅外波段構建的LSWI指數以及利用紅邊和近紅外波段構建的DDVI指數在研究區8月至10月多個時相的玉米、大豆遙感識別特征篩選中顯示出重要作用。
參考文獻:
[1]? 郭? 偉,趙春江,顧曉鶴,等. 鄉鎮尺度的玉米種植面積遙感監測 [J]. 農業工程學報,2011,27(9):69-74.
[2]MATHUR A, FOODY G. Crop classification by support vector machine with intelligently selected training data for an operational application [J]. International Journal of Remote Sensing,2008,29:2227-2240.
[3]陳仲新,任建強,唐華俊,等. 農業遙感研究應用進展與展望 [J]. 遙感學報,2016,20(5):748-767.
[4]楊邦杰. 農情遙感監測[M]. 1版.北京:中國農業出版社,2005.
[5]許青云,楊貴軍,龍慧靈,等. 基于MODIS-NDVI多年時序數據的農作物種植識別 [J]. 農業工程學報,2014,30(11):134-144.
[6]唐華俊. 農業遙感研究進展與展望 [J]. 農學學報,2018,8(1):167-171.
[7]董金瑋,吳文斌,黃健熙,等. 農業土地利用遙感信息提取的研究進展與展望 [J]. 地球信息科學學報,2020,22(4):772-783.
[8]DE SOUZA C H W, MERCANTE E, JOHANN J A, et al. Mapping and discrimination of soya bean and corn crops using spectro-temporal profiles of vegetation indices [J]. International Journal of Remote Sensing,2015,36:1809-1824.
[9]DA SILVA JUNIOR C A, NANNI M R, TEODORO P E, et al. Vegetation indices for discrimination of soybean areas: a new approach [J]. Agronomy Journal,2017,109:1331-1343.
[10]ZHONG L H, HU L N, YU L, et al. Automated mapping of soybean and corn using phenology [J]. ISPRS Journal of Photogrammetry and Remote Sensing,2016,119:151-164.
[11]劉? 佳,王利民,滕? 飛,等. RapidEye衛星紅邊波段對農作物面積提取精度的影響 [J]. 農業工程學報,2016,32(13):140-148.
[12]YIN L K, YOU N S, ZHANG G L, et al. Optimizing feature selection of individual crop types for improved crop mapping[J]. Remote Sensing,2020,12(1):1-20.
[13]FOERSTER S, KADEN K, OERSTER M, et al. Crop type mapping using spectral-temporal profiles and phenological information [J]. Computers and Electronics in Agriculture,2012,89:30-40.
[14]HU Q, SULLA D, XU B D, et al. A phenology-based spectral and temporal feature selection method for crop mapping from satellite time series [J]. International Journal of Applied Earth Observation and Geoinformation,2019,80:218-229.
[15]黃健熙,侯矞焯,蘇? 偉,等. 基于GF-1 WFV數據的玉米與大豆種植面積提取方法 [J]. 農業工程學報,2017,33(7):164-170.
[16]DEFRIES R, TOWNSHEND J. NDVI-derived land classifications at a global scale [J]. Journal of Remote Sensing,1994,17:3567-3586.
[17]GITELSON A A, KAUFMAN Y J, MERZLYAK M N. Use of a green channel in remote sensing of global vegetation from EOS-MODIS [J]. Remote Sensing of Environment,1996,58:289-298.
[18]JORDAN C F. Derivation of leaf-area index from quality of light on the forest floor [J]. Ecology,1969,50:663-666.
[19]GITELSON A A, MERALYAK M N. Spectral reflectance changes associated with autumn senescence of Aesculus hippocastanum L. and Acer platanoides L. leaves. Spectral features and relation to chlorophyll estimation [J]. Journal of Plant Physiology,1994,143:286-292.
[20]CHAPPELLE E W, KIM M S, MC MURTREY J E. Ratio analysis of reflectance spectra (RARS): an algorithm for the remote estimation of the concentrations of chlorophyll A, chlorophyll B, and carotenoids in soybean leaves [J]. Remote Sensing of Environment,1992,39:239-247.
[21]SIMS D A, GAMON J A. Relationships between leaf pigment content and spectral reflectance across a wide range of species, leaf structures and developmental stages [J]. Remote Sensing of Environment,2002,81:337-354.
[22]HUETE A R. A soil-adjusted vegetation index(SAVI) [J]. Remote Sensing of Environment,1988,25:295-309.
[23]RICHARDSON A J, EVERITT J H. Using spectral vegetation indices to estimate rangeland productivity [J]. Geocarto International,1992,7:63-69.
[24]GITELSON A, SOLOVCHENKO A. Non-invasive quantification of foliar pigments: Possibilities and limitations of reflectance- and absorbance-based approaches [J]. Journal of Photochemistry and Photobiology? B-Biology,2018,178:537-544.
[25]HUETE A, JUSTICE C, LIU H. Development of vegetation and soil indices for MODIS-EOS [J]. Remote Sensing of Environment,1994,49:224-234.
[26]XIAO X, BOLES S, LIU J, et al. Characterization of forest types in Northeastern China, using multi-temporal SPOT-4 VEGETATION sensor data [J]. Remote Sensing of Environment,2002,82:335-348.
[27]BANNARI A, ASALHI H, TEILLET P M. Transformed difference vegetation index(TDVI) for vegetation cover mapping [C]. Toronto, Canada: IGARSS,2002:3053-3055.
[28]RONDEAUX G, STEVEN M, BARET F. Optimization of soil-adjusted vegetation indices [J]. Remote Sensing of Environment,1996,55:95-107.
[29]GITELSON A A. Wide dynamic range vegetation index for remote quantification of biophysical characteristics of vegetation [J]. Journal of Plant Physiology,2004,161:165-173.
[30]GITELSON A A, KAUFMAN Y J, STARK R, et al. Novel algorithms for remote estimation of vegetation fraction [J]. Remote Sensing,2002,80:76-87.
[31]GOEL N S, QIN W. Influences of canopy architecture on relationships between various vegetation indices and LAI and FPAR: a computer simulation [J]. Remote Sensing Reviews,1994,10:309-347.
[32]GONG P, PU R, BIGING G S, et al. Estimation of forest leaf area index using vegetation indices derived from Hyperion hyperspectral data [J]. IEEE Transactions on Geoscience and Remote Sensing,2003,41:1355-1362.
(責任編輯:陳海霞)