















摘要:衛星遙感技術是目前較為常用的農作物監測與分類技術。為實現區域冬小麥精確分類和面積提取,以江蘇省揚州市為例,以哨兵2號衛星數據及航天飛機雷達地形測量(SRTM)高程數據為數據源,利用分類與回歸決策樹(CART)、梯度提升決策樹(GBDT)、支持向量機(SVM)和隨機森林(RF)4種機器學習算法建立分類模型。同時下載并調用2021年3月22日研究區的MSI多光譜影像,提取光譜、紋理、地形特征等參數,對研究區冬小麥進行分類提取,并分析4種模型的分類效果和精度。結果表明,RF和GBDT分類方法效果最好,總體精度最高,均為0.967,Kappa系數達0.960;SVM分類方法總體精度最低,為0.514,但用戶精度最高,為0.972。上述方法可以實現區域農作物的精確分類和提取。
關鍵詞:冬小麥;機器學習;單時相;面積提取;遙感分類
中圖分類號:TP79; S512" " " 文獻標志碼:A" " " 文章編號:2095?5553 (2024) 08?0154?09
Remote sensing classification and extraction of winter wheat in Yangzhou"based on machine learning algorithm
Chen Yuxin1, 2, Liu Zhangxin1, 2, Liu Xinyi1, 2, Liu Tao1, 2, Sun Chengming1, 2, 3
(1. Jiangsu Key Laboratory of Crop Genetics and Physiology/Jiangsu Key Laboratory of Crop Cultivation and Physiology,"College of Agriculture, Yangzhou University, Yangzhou, 225009, China; 2. Jiangsu Co?Innovation Center for Modern Production Technology of Grain Crops, Yangzhou University, Yangzhou, 225009, China; 3. Research Institute of Smart Agriculture, Yangzhou University, Yangzhou, 225009, China)
Abstract: Satellite remote sensing technology is a commonly used monitoring and classification technology in crops at present. In order to achieve accurate classification and area extraction of regional winter wheat, Yangzhou City, Jiangsu Province had been taken as an example in this study. The Sentinel-2 satellite data and Shuttle Radar Topography Mission (SRTM) elevation data were used as data sources. Four machine learning algorithms, including classification and regression decision tree (CART), Gradient Boosted Decision Tree (GBDT), support vector machine (SVM) and Random forests (RF), were used to establish the classification model. At the same time, the MSI multispectral image of March 22, 2021 in the study area was called and downloaded to extract parameters such as spectrum, texture and terrain features, and the winter wheat in the study area was classified and extracted, and the classification effect and accuracy of the four models were analyzed. The results showed that RF and GBDT classification methods had the best effect and the highest overall accuracy (OA), and both of the OA values were 0.967 and Kappa coefficient was 0.960. The OA of SVM classification method was the lowest (0.514), but the user accuracy (UA) was the highest (0.972). The method mentioned above could realize accurate classification and extraction of regional crops.
Keywords: winter wheat; machine learning; single temporal; area extraction; remote sensing classification
0 引言
冬小麥是我國重要的糧食作物之一,其分布范圍廣,播種面積與產量皆位居前列。因此冬小麥種植監測和面積提取不僅對我國小麥產業發展具有重要意義,更是保障國家糧食安全的關鍵環節[1]。傳統的作物種植面積監測是依靠人工地面調查方法進行,在抽樣調查的基礎上通過統計部門逐級上報,該方法人力成本高,受主觀因素影響較大,且在大范圍的面積監測時效率低、速度慢,難以滿足當前政府決策部門的宏觀指導和科學決策需求。因此,要充分利用現代信息技術以達到低成本、高效率進行大范圍監測作物種植面積變化的目的,而遙感(RS)技術就具備連續獲取大范圍的地表植被覆蓋信息的能力,被廣泛應用于現代農業領域。
基于遙感影像的地物識別是土地類型變化、耕地面積變化等大范圍遙感監測的基礎和前提。隨著遙感技術的快速發展,衛星遙感影像逐漸呈現高時間、空間分辨率的趨勢,利用多波段高分辨率衛星影像進行地物識別與提取已成為遙感研究的熱點。如何提取影像的不同特征或多種特征,采取何種適合的分類器或聚類方法對研究區域進行分類是國內外學者一直探索的問題。針對不同類型的遙感數據,常用的分類方法有專家目視解譯、面向像素及面向對象分類、監督分類和非監督分類、機器學習分類算法、深度學習分類算法等。隨著機器學習算法的發展,監督分類也逐漸融入現代方法,使用范圍最廣的主要有決策樹(DT)算法、隨機森林(RF)算法、貝葉斯(Bayes)算法、支持向量機(SVM)算法和神經網絡(NN)等。Zeyada等[2]利用2013年8月埃及尼羅河三角洲的一個農業場景的Radarsat-2全極化數據,評估了支持向量機(SVM)、多層感知器(MLP)和決策樹(DT)三種監督分類方法在區分四種不同作物(水稻、玉米、葡萄和棉花)以及城市土地覆蓋方面的準確性。為減少標注樣本使用數量的同時提高分類器效率,楊偉等[3]提出一種基于樸素貝葉斯的半監督學習方法,當標注樣本與非標注樣本比例在1∶21∶9時,試驗結果最好。針對傳統方法難以提升高分辨率影像分類精度問題,蔣治浩等[4]提出一種建立一維卷積神經網絡結合面向對象的方法,得到的影像分類結果與傳統模型相比整體精度提高了20%以上。
本研究以江蘇省揚州市為例,該地區冬季以冬小麥為主,油料作物以油菜為主。小麥生長發育期主要分為出苗期、越冬期、返青期、拔節期、孕穗期、抽穗期和成熟期等7個階段。每年3月至4月是該地區種植油菜盛花期,而冬小麥處于拔節分蘗至孕穗期,從光譜特征上來看,該時間段有利于兩種作物區分;而基于植被指數構建時間序列能夠很好反應植被類別變化及季節變化信息,是獲取地面關鍵物候期的重要研究方法。
本研究選取3月下旬的單時相多波段衛星遙感影像,使用多種機器學習算法構建分類模型,比較分類結果精度,并進行冬小麥面積提取,分析其時空變化特征。為市級尺度的小麥監測和面積提取提供較為可靠的依據。
1 材料與方法
1.1 研究區概況
1.1.1 地理區位
揚州市地處江蘇省中部,位于長江北岸、江淮平原南端。現轄區域在北緯32°15′~33°25′、東經119°01′~119°54′。東部與鹽城市、泰州市毗鄰;南部瀕臨長江,與鎮江市隔江相望;西南部與南京市相連;西部與安徽省滁州市交界;西北部與淮安市接壤。全市東西最大距離85 km,南北最大距離125 km,總面積6 591.21 km2,其中陸地面積4 908.00 km2,占74.46%;水域面積1 683.21 km2,占25.54%。
1.1.2 主要農作物概況
揚州市主要糧食作物包括水稻、小麥、玉米,其中水稻和小麥占多數,油料作物主要有油菜和花生。據揚州市統計局發布,2019年,揚州市農作物總播種面積為471.07 khm2,占陸地總面積的9.60%。市內糧食作物主要分布在揚州北部,分別是高郵市(29.37%)、寶應縣(29.19%)、江都區(23.32%),這三個地區的糧食作物播種總面積分別為113.42 khm2、112.74 khm2和90.06 khm2。揚州市主要糧食作物水稻和小麥播種面積分別為172.97 khm2和192.85 khm2,各占全市農作物總播種面積的36.72%和40.94%,各占夏糧和秋糧總播種面積的98.12%和91.87%。
1.2 數據準備
1.2.1 Sentinel-2單時相數據
哨兵2號衛星(Sentinel-2)是高分辨率多光譜成像衛星,搭載一枚多光譜成像儀(Multi-Spectral Instrument,MSI),高度為786 km,可覆蓋13個光譜波段,幅寬達290 km,地面分辨率分別為10 m、20 m和60 m。Sentinel-2包括兩顆衛星,A、B兩顆衛星為一組共軌運行[5],每顆衛星的重訪周期為10 d,兩顆互補,重訪周期縮短至5 d,對于緯度較高的歐洲地區,重訪周期僅需3 d。
本研究選取2021年3月22日研究區對應的3幅Sentinel-2影像進行拼接處理,并通過行政區矢量邊界進行裁剪。GEE云平臺中的Sentinel-2大氣表觀反射率產品已經過正射校正和亞像元級幾何精校正的預處理,不存在幾何畸變的問題,只需使用歐洲航空局ESA提供的Sen2cor插件對Sentine1-2A影像進行大氣校正。由于需要使用的6個波段空間分辨率不同,所以使用resample(mode)命令將20 m空間分辨率處的B8A、B11波段重采樣到與B2、B3、B4、B8波段具有同樣10 m空間分辨率,共得到6個10 m空間分辨率的波段。波段參數如表1所示。
采用的Sentinel-2衛星單時相數據為2021年3月22日凌晨2:45:51獲得的Level-2A(大氣底層反射率數據)產品,在相對軌道132期間分別通過Tile50SQA、SQB和SPA獲得的,并且用PDGS處理基線02.14處理。
1.2.2 Google Earth高清衛星影像數據
谷歌地球(Google Earth,GE)是一個面向大眾的免費衛星數據平臺,用戶可以使用谷歌地球軟件自由地瀏覽全球的衛星影像,通過對影像進行縮放可以看到地圖的相關細節,通過拖動時間進度條可以看到該地區不同時間段的衛星影像。為保證樣本精確度的同時增加各類別樣本量,本研究將GE數據庫中歷史影像作為實地調查的輔助數據使用。具體參數如表2所示。
1.2.3 實地調查數據
為提高訓練集和測試集樣本的準確性和純凈度,于2020年3月1日至2021年5月20日之間先后數次對揚州市寶應縣、儀征市、高郵市、邗江區的地物類型進行實地調查。通過實地走訪得知,研究區內有少量林苗種植,主要作物有冬小麥、中稻、油菜、夏玉米、豆類、薯類等,還有部分蔬菜。為確保分類精確度,本研究采集的樣本數據均為30 m×30 m及以上的純凈地塊,利用手持GPS定位裝置記錄地塊經緯度信息,并保證實地調查點分布較為均勻。
本研究主要目的在于提取研究區內冬小麥,為了減少各樣本之間數量懸殊造成的分類誤差,將豆類、薯類、蔬菜、林木等劃分為“其他植被”。在研究區內隨機取點共682處,其中冬小麥—中稻312處,油菜150處,其他植被85處,水體45處,建筑與城鎮用地45處,裸土45處。訓練集與驗證集樣本數量按照3∶1的比例進行隨機劃分。
1.2.4 構建樣本點
以2021年3月22日Sentinel-2的RGB真彩色影像為圖層(Layer),根據2021年3月—2021年5月的對研究區內的實地調查數據、谷歌高清地圖和目視解譯法在GEE云平臺以多邊形(polygon)的形式直接勾選樣本點建立對應的感興趣區(ROI)。研究區內地物類別除冬小麥之外,其他地物類型主要有油菜、其他植被(灌木、蔬菜、林木等)、建筑及城鎮、裸土和水體,共構建樣本點1 300個。如圖1所示。
1.3 機器學習算法選擇
1.3.1 支持向量機分類算法
支持向量機(SVM),作為傳統機器學習的一個非常重要的分類算法,它是一種通用的前饋網絡類型。該方法的核心思想是尋找一個“超平面”作為兩類訓練樣本點的分割界限,通過計算每個樣本點到該平面的距離確定其類別,以保證最高的分類精確度。
SVM分類器是當前運用建委廣泛的分類器之一,具有出色的分類能力,但在實際應用中,很多情況是線性不可分的,因此,引入核函數將其映射至高維空間中變為線性可分來解決這個問題[6]。很明顯,本文面對的不是簡單的二分類問題,所想要提取的冬小麥這類地物與其他幾類地物之間是線性不可分的,所以必須引入核函數,常用的核函數有多項式核函數、Sigmoid核函數和徑向基函數(RBF)也叫高斯核函數。
1.3.2 決策樹分類算法
決策樹(DT)算法基于20世紀60年代至70年代的推理系統和概念學習系統所建立的一種基本的分類與回歸方法,可以將其認為是一種if?then規則的集合。一棵決策樹一般由一個根節點(Root nodes)、一系列內部節點(Internal nodes)和分支以及若干個葉節點(Terminal nodes)組成,每個內部節點只有一個父節點和兩個或多個子節點,節點和子節點之間形成分支。根節點代表決策樹的開始;內部節點代表了一個決策過程所檢測的特征屬性;分支代表測試結果,不同特征屬性形成不同分支;外部節點(葉節點)代表了類別,即分類結果。一個完整的決策樹學習算法包含有三大步驟,分別為:特征的選擇、決策樹的生成和決策樹的剪枝。
常用的決策樹算法包括ID3、基于ID3優化而來的C4.5和C5.0、分類與回歸決策樹、提升決策樹(BDT)和梯度提升決策樹。分類與回歸決策樹(CART)算法即分類和回歸算法,是由Breiman于1984年提出的,它是一種應用廣泛的決策樹學習方法,針對傳統決策樹算法的不足(如模型是用較為復雜的熵來度量、使用了相對較為復雜的多叉樹、只能處理分類問題不能處理回歸問題等)進行了改進和優化[7]。梯度提升決策樹(GBDT)又叫 MART,是一種迭代的決策樹算法,由多棵決策樹組成,所有樹的結論累加起來做最終答案。該算法使用的是集成學習中的Boosting的思想,Boosting方法訓練基分類器時采用串行的方式,各個分類器之間有依賴,基本思路是將基分類器層層疊加,每一層在訓練的時候,對前一層基分類器分錯的樣本,給予更高的權重,測試時,根據各層分類器的結果加權得到最終結果[8]。與CART相比,GBDT泛化能力更強,預測精度較高,但由于決策樹之間存在依賴關系,在訓練模型時難以并行訓練數據。
1.3.3 隨即森林分類算法
隨機森林(RF)分類算法是2001年由Brciman等提出的一種有效的基于CART決策樹機器學習方法,是一種集成學習與決策樹融合的分類器,利用集成學習的思想將多棵決策樹進行綜合,本質其實是決策樹分類算法的改進。RF算法采用的是機器學習中的Bagging思想,即通過有放回均勻抽樣法從訓練集中抽取樣本訓練分類器,每個分類器的訓練集都是相互獨立的。以決策樹為單位,每棵“樹”是獨立且相互聯系的分類器,它將輸入的樣本傳輸到多個單元進行分類,輸出類別最多的將會作為該樣本的最終分類結果。由于RF分類算法靈活性和實用性較為良好,相對于單棵決策樹而言泛化能力更強、穩定性更高,運算速度較快且魯棒性較好,能夠避免因單棵決策樹引起的過擬合現象,小樣本容量情況下依舊能夠保持較好的穩定性,具備良好的抗噪能力,容易實現,分類效果較好,在農作物種植信息提取應用中優勢明顯。
1.4 光譜特征指數選擇
從哨兵2號衛星MSI傳感器獲取的13個波段中選取了B2、B3、B4、B8、B8A和B11等6個波段,提取波段信息。根據以上波段計算了14種植被指數,分別為NDVI、NDWI、NDBI、LSWI、EVI、RVI、DVIEVI、NGBDI、NDRDI、ARVI green、EXG、RGR、EXR、EXGR,得到共20個光譜特征指數,計算公式及定義詳見表3。
1.5 紋理特征提取
本研究采用基于灰度共生矩陣的方法進行紋理特征的計算與提取。
根據式(1),通過初始圖像的紅色、綠色和藍色波段的線性組合,生成灰度圖像。
[Gray=0.3×R+0.59×G+0.11×B] (1)
調用GEE自帶的reduceRegion( )函數縮小訓練范圍至已標記好的ROI;再利用glcmTexture( )函數對紋理特征進行直接計算及提取,該函數包含“size”“kernel”“average”三個可變參數。
1.6 精度評價方法
1.6.1 總體精度
總體精度(Overall Accuracy, OA)指被正確分類的像元總與總像元數的比值,是分類結果精度評價的基礎指標,能直觀地反映分類準確度的高低。具體計算如式(2)所示。
[OA=i=1kXiN] (2)
式中:Xi——正確分類的像元數;
N——總像元數。
1.6.2 混淆矩陣
混淆矩陣(Confusion Matrix)的每一列代表了預測類別,每一列的總數表示預測為該類別的數據的數目;每一行代表了數據的真實歸屬類別,每一行的數據總數表示該類別的數據實例的數目。每一列中的數值表示真實數據被預測為該類的數目,見表4。通過真實地表類型和分類結果分為某類的一個比較,混淆矩陣能有效反映分類結果的好壞。
還可以通過混淆矩陣準確計算各個地物類別的漏分誤差(Omission Errors, OE)和錯分誤差(Commission Errors, CE)。漏分誤差是指某類地物被漏分的概率,是相對實際類別而言的。錯分誤差是指某類地物被錯分為其他類型的概率,即實際的某一類地物有多少被錯誤地分為其他類別,是相對被錯分入的類別的概念。
1.6.3 制圖精度與用戶精度
制圖精度(Product Accuracy, PA)是指分類器將整個影像的像元正確分為該類的像元數(對角線值)與該真實像元參考總數(混淆矩陣中該類列的總和)的比率。用戶精度(User Accuracy, UA)是指正確分到該類的像元總數(對角線值)與分類器將整個影像的像元分為該類的像元總數(混淆矩陣中該類行的總和)比率。
[PA=Xii=1cXi] (3)
[UA=Xii=1rXi] (4)
漏分誤差和制圖精度、錯分誤差和用戶精度之間存在一定的數量關系,如式(5)、式(6)所示。
[OE+PA=1] (5)
[CE+UA=1] (6)
1.6.4 Kappa系數
Kappa值是一個描述診斷一致性的較為理想的指標,因此在多種領域中得到廣泛的應用[29]。Kappa系數(Kappa Coefficient)是通過把所有真實參考的像元總數(N)乘以混淆矩陣對角線(XKK)的和,再減去某一類中真實參考像元數與該類中被分類像元總數之積之后,再除以像元總數的平方減去某一類中真實參考像元總數與該類中被分類像元總數之積對所有類別求和的結果,用來計算分類結果的一致性。
Kappa系數lt;0.4,代表一致程度不夠理想;Kappa系數≥0.75,代表一致程度比較令人滿意;Kappa系數越接近1,表示一致程度越高。Kappa系數計算如式(7)所示。
[Kappa=OA-P1-P] (7)
P=[(∑i=1Xi)(∑i=1Xi)N2] (8)
1.7 冬小麥種植面積
冬小麥種植面積計算如式(9)所示。
S[C]=N × S (9)
式中:S[C]——研究區冬小麥提取面積;
S——每個冬小麥像元的實際面積。
2 結果與分析
2.1 基于單時相遙感數據的多元特征提取
導出在GEE平臺構建的各類地物樣本點位置信息,利用Envi軟件的“Compute ROI”工具計算各類樣本點在各波段反射率的平均值,并根據表3的公式計算光譜特征指數的值,結果如表5所示。由表5可知,6類地物在各光譜特征上均有差異,其中城鎮和建筑與其他5類地物相比,差異較為明顯,容易識別和提取。而冬小麥和油菜及其他植被的差異較小,很難通過光譜特征值進行分類和提取。
2.2 冬小麥提取結果與評價
2.2.1 基于單時相數據的冬小麥提取結果
基于單時相數據利用機器學習算法對地物的提取結果見圖2和圖3。
經圖像對比分析(圖2),在4種單時相影像分類方法中,SVM方法效果最差,除了對大面積的水體識別效果較好之外,對其他地物的果很差,存在大量錯分和漏分現象,尤其是大量植被像元錯分為城鎮和裸土。兩種決策樹分類后影像“椒鹽現象”較為明顯,且冬小麥種植田塊與其他植被界限模糊,GBDT算法分類效果略優于CART算法。RF分類算法表現最好,錯分、漏分較少,“椒鹽現象”不明顯,對冬小麥田塊與街道、冬小麥與油菜和其他植被之間的劃分更為清晰明顯(圖3)。
2.2.2 精度評價
基于2021年3月21日的哨兵2號衛星影像,以混淆矩陣的形式表示分類結果精度如表6所示。
CART算法對冬小麥提取精確度較低,被正確分類的冬小麥像元為469個,被漏分的31個像元被誤分為油菜、其他植被、裸土和城鎮及建筑,分別為24個、10個、9個和1個;除此之外,油菜的漏分率較高,為21.40%。GBDT算法對冬小麥提取的精確度較高,為98.00%,且漏分誤差較低,僅10個像元被漏分。SVM算法對冬小麥的提取精度的錯分誤差高于漏分誤差,將油菜、裸土和其他植被錯分為冬小麥,且油菜和其他植被的錯分誤差較大。RF算法對冬小麥的提取精度最高,為98.60%,漏分誤差為1.40%,錯分誤差也相對最低,為6.81%。
基于單時相影像分類結果的精度評價如表7所示。
在基于單時相影像分類的4種機器學習分類算法結果中,總體精度由高到低分別為:RF方法和GBDT方法最高,CART方法次之,SVM最低。RF和GBDT總體精度為0.967,Kappa系數達0.960,但GBDT對于冬小麥提取的用戶精度和制圖精度低于RF;CART方法對冬小麥的用戶精度最低,為0.958,即漏分誤差最高;SVM方法總體精度最低,僅0.514,Kappa系數也相對最低,為0.416。
2.3 冬小麥種植區域面積變化分析
研究區內冬小麥提取面積等于被分類像元數乘以每像元代表實際面積,本研究采用的遙感影像空間分辨率為30 m,因此每像元代表實地面積應為900 m2。利用RF方法計算結果如表8所示。
由表8可知,2016—2020年,研究區內冬小麥種植面積提取結果較為精確,與各年份統計年鑒數據對比,利用本方法提取精度最高的年份為2020年,最低為2019年,分別達到98.71%和92.83%,5年平均精確度達96.60%。
3 結論與討論
3.1 結論
基于單時相遙感數據,利用四種機器學習分類模型提取揚州市冬小麥種植面積。
1) RF分類算法對冬小麥的提取效果最優,圖像沒有明顯的“椒鹽現象”,且冬小麥田塊與城鎮建筑以及其他植被之間的分界線條更加清晰可見。其他三種算法中,SVM算法的分類效果最差,基本只對大面積水體具有較好識別效果;兩種決策樹分類算法相較,GBDT算法分類效果略優。
2) 在四種機器學習分類算法結果中, RF和GBDT總體精度最高,為0.967,Kappa系數達0.960,但RF具有更高的用戶精度和制圖精度;CART方法對冬小麥的漏分誤差最高,為0.958;SVM方法總體精度和Kappa系數相對最低,分別為0.514和0.416。
3) 對比分析2016—2020年研究區內冬小麥提取面積與各年統計年鑒數據,結果顯示,提取精確度最高的年份為2020年,精確度達98.71%;最低為2019年,精確度為92.83%,5年平均精確度達96.60%,整體效果較好。
綜上,RF分類算法在基于單時相、多光譜遙感影像數據的冬小麥提取過程中具有較好效果,可以為區域其他農作物的精確分類和提取提供參考。
3.2 討論
1) 對于分類結果的斑塊化、碎片化問題沒有得到很好的解決。原因之一是基于光譜波段的面向像元的分類方法只能單純地以每個像元為單位進行計算和分類,并不能很好地顧及分類對象之間的連續性和區域化特征,也不能精準計算像元與像元之間的聯系與規律;第二是研究區內主要包括耕地、城鎮用地和水體,其中,城鎮與耕地的邊界模糊,城鎮用地可能包括部分耕地,耕地周圍也存在建筑用地。這個問題存在于許多面向像素的分類研究中,針對這個問題的具體解決方法就是改變分類的基本單位,從單個的像素轉向已經被提前分割好的“對象”,進行面向對象的分類。目前已有一些學者針對面向像素和面向對象的分類方法展開了研究,如張殿岱等[30]通過對新疆庫車市東部綠洲—荒漠過渡帶進行分類研究,雖然監督分類方法精確度已經達到94%以上,但與之相比,基于多尺度分割的面向對象的方法總體精度提高了近4%。魏夢凡[31]提出了一種將SVM與面向對象相結合的分類方法,對河南開封市的冬小麥進行衛星遙感分類,得到的分類精度高于分別單獨使用SVM和面向對象的分類方法。這些學者的研究結果表明,面向對象分類方法在衛星遙感地物分類領域有巨大的運用潛力和發展前景。
2) 單時相只需一幅或幾幅研究區的衛星影像,數據獲取較為簡單易行,分類效果較好,但并不適用于每一種分類算法,如本研究中的SVM分類方法精確度很低。同時在冬小麥提取過程中,錯分誤差皆高于漏分誤差,這表明往往被錯分為冬小麥的像元要多于被漏分的冬小麥像元。因此從理論上來說,在冬小麥種植面積提取中,分類后提取值會略大于實際值。造成這種結果的具體原因還需進一步研究和探討。
3) 由于時間、地點的限制,本文實地調查點數量不夠充足,訓練集的部分樣本數據來自GEE云平臺對歷史影像進行目視解譯的方法獲得,因此對分類器的訓練可能會存在一些誤差。 GEE云平臺雖然有使用便捷、運算速度快和不占用本地內存等優點,但也存在一些不利因素,如貝葉斯分類器2022年后暫停使用;SVM分類器不穩定,目前只允許較小樣本容量運行,否則會因為樣本量過大導致報錯,而縮小樣本則會降低模型精確度;對于非監督分類器,如最小距離分類算法的運行結果,無法進行精度驗證,因此本文所使用的分類算法較為局限。同時本研究只選用了單獨一個時期的衛星影像進行實驗,沒有選擇多個生育期進行連續性試驗來對比驗證精度。 在分類特征的選取上,只是通過重要性排序大致篩選了各項特征,并未對所提取的各項特征參數進行優化選取(如交叉驗證),在一定程度上會形成數據冗余,從而影響分類效率。
參 考 文 獻
[ 1 ] 王利民, 劉佳, 楊福剛, 等. 基于GF-1衛星遙感數據識別京津冀冬小麥面積[J]. 作物學報, 2018, 44(5): 762-773.
Wang Limin, Liu Jia, Yang Fugang, et.al. Acguisition of winter wheat area in the Beijing?Tianjin?Hebei region with GF-1 satellite data [J]. Acta Agronomica Sinica, 2018, 44(5): 762-773.
[ 2 ] Zeyada, Ezz, Nasr, et al. Evaluation of the discrimination capability of full polarimetric SAR data for crop classification [J]. International Journal of Remote Sensing, 2016, 37(11): 2585-2603.
[ 3 ] 楊偉, 方濤, 許剛. 基于樸素貝葉斯的半監督學習遙感影像分類[J]. 計算機工程, 2010, 36(20): 167-169.
Yang Wei, Fang Tao, Xu Gang. Semi?supervised learning remote sensing image classification based on Na?ve Bayesian [J]. Computer Engineering, 2010, 36(20): 167-169.
[ 4 ] 蔣治浩, 林輝, 張懷清, 等. 面向對象結合卷積神經網絡的GF-1影像遙感分類[J]. 中南林業科技大學學報, 2021, 41(8): 45-55.
Jiang Zhaihao, Lin Hui, Zhang Huaiqing, et al. Remote sensing image of GF-1 classification using object?oriented method and convolutional neural network [J]. Journal of Central South University of Forestry amp; Technology, 2021, 41(8): 45-55.
[ 5 ] 孫慶松. 基于Sentinel數據的縣域尺度農作物分類研究[D]. 邯鄲: 河北工程大學, 2021.
[ 6 ] Chi M M, Bruzzone L. Semisupervised classification of hyperspectral images by SVMs optimized in the primal [J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(6): 1870-1880.
[ 7 ] Rutkowski L, Jaworski M, Pietruczuk L, et al. The CART decision tree for mining data streams [J]. Information Sciences, 2014, 266: 1-15.
[ 8 ] 陳雨桐. 集成學習算法之隨機森林與梯度提升決策樹的分析比較[J]. 電腦知識與技術, 2021, 17(15): 32-34.
Chen Yutong. Analysis and comparison of stochastic forest and gradient lifting decision tree for ensemble learning algorithms [J]. Computer Knowledge and Technology, 2021, 17(15): 32-34.
[ 9 ] Mahlein A K, Rumpf T, Welke P, et al. Development of spectral indices for detecting and identifying plant diseases [J]. Remote Sensing of Environment, 2013, 128: 21-30.
[10] Gao B. NDWI-A normalized difference water index for remote sensing of vegetation liquid water from space [J]. Remote Sensing of Environment, 1996, 58(3): 257-266.
[11] 查勇, 倪紹祥, 楊山. 一種利用TM圖像自動提取城鎮用地信息的有效方法[J]. 遙感學報, 2003(1): 37-40.
Zha Yong, Ni Shaoxiang, Yang Shan. An effective method for automatic extraction of urban land use information using TM image [J]. Journal of Remote Sensing, 2003(1): 37-40.
[12] Huete A R. Mapping paddy rice with multi?date moderate?resolution imaging spectroradiometer (MODIS) data in China [J]. Journal of Zhejiang University(Science A: An International Applied Physics amp; Engineering Journal), 2009, 10(10): 1509-1522.
[13] Liu H Q, Huete A R. A feedback based modification of the NDVI to minimize canopy background and atmospheric noise [J]. IEEE Trans. Geoscience and Remote Sensing, 1995, 33(2): 457-465.
[14] Prabhakar M, Prasad Y G, Thirupathi M, et al. Use of ground based hyperspectral remote sensing for detection of stress in cotton caused by leafhopper (Hemiptera: Cicadellidae) [J]. Computers and Electronics in Agriculture, 2011, 79(2): 189-198.
[15] Jordan C F. Derivation of leaf?area index from quality of light on the forest floor [J]. Ecology, 1969, 50(4): 663-666.
[16] Woebbecke D M, Meyer G E , Von Bargen K, et al. Color indices for weed identification under various soil, residue, and lighting conditions [J]. Transactions of the ASAE, 1995, 38(1): 259-269.
[17] Gitelson A A, Stark R, Grits U, et al. Vegetation and soil lines in visible spectral space: A concept and technique for remote estimation of vegetation fraction [J]. International Journal of Remote Sensing, 2002, 23(13): 2537-2562.
[18] Sims D A, Gamon J A. Relationships between leaf pigment content and spectral reflectance across a wide range of species, leaf structures and developmental stages [J]. Remote Sensing of Environment, 2002, 81(2): 337-354.
[19] Mao D, Wu X, Deppong C, et al. Negligible role of antibodies and C5 in pregnancy loss associated exclusively with C3?dependent mechanisms through complement alternative pathway[J]. Immunity, 2003, 19(6): 813-822.
[20] 安葳鵬, 程小博, 劉雨. Fleiss' Kappa系數在貝葉斯決策樹算法中的應用[J]. 計算機工程與應用, 2020, 56(7): 137-140.
An Weipeng, Cheng Xiaobo, Liu Yu. Application of Fleiss' Kappa coefficient in Bayesian decision tree algorithm [J]. Computer Engineering and Applications, 2020, 56(7): 137-140.
[21] 張殿岱, 王雪梅. 基于高分辨率遙感影像的植被分類方法比較[J]. 林業資源管理, 2021(3): 108-113.
Zhang Diandai, Wang Xuemei. Comparison of vegetation classification methods based on high?resolution remote sensing images [J]. Forest Resources Management, 2021(3): 108-113.
[22] 魏夢凡. 基于Sentinel-2A衛星遙感影像的開封市冬小麥種植面積提取技術研究[D]. 開封: 河南大學, 2019.