鄭文慧 王潤紅 曹銀軒 靳 寧 馮 浩 何建強
(1.西北農林科技大學旱區農業水土工程教育部重點實驗室, 陜西楊凌 712100;2.西北農林科技大學中國旱區節水農業研究院, 陜西楊凌 712100;3.山西能源學院資源與環境工程系, 晉中 030600; 4.中國科學院水利部水土保持研究所, 陜西楊凌 712100)
黃土高原位于我國西北地區中部,是典型的旱作農業區,在國家糧食安全體系中具有舉足輕重的作用[1]。黃土高原蒸發強烈,干旱少雨且年內降雨分布不均勻[2],同時田間管理水平落后,導致水資源嚴重匱乏,限制了黃土高原農業的發展[3-4]。因此,采取有效的田間管理措施提高水資源利用效率是旱區農業可持續發展的必然趨勢。地膜覆蓋技術具有節水、保墑和增產的性能[5],因此在黃土高原大田作物生產中被廣泛應用[6]。然而,隨著地膜用量的逐漸增加和覆蓋面積的不斷擴大,地膜易破碎、難降解、難回收的短板日益顯露,生態環境問題日益嚴重[7-8]。精準獲取覆膜農田的時空分布信息有助于發揮地膜覆蓋技術的積極作用、緩解生態環境壓力,也有助于相關部門對地膜的使用和分布進行監管和調度,提高對地膜污染的防治能力。
隨著科學技術的深入發展,應用遙感技術快速提取覆膜農田信息成為可能。遙感技術具有信息獲取快、觀測范圍大等特點,能夠宏觀地把握地物空間分布概況[9-11],從而解決了大范圍內覆膜農田監測的難題。近年來,覆膜農田的監測和識別逐漸發展為農業遙感領域的研究熱點[12-15]。目前,我國大多數相關研究地區主要集中在新疆等地膜連片分布地區,該地區的地膜識別相對容易。此外,已有研究多采用支持向量機和決策樹等單一算法進行分類,較少采用多分類器集成算法。
谷歌地球引擎(Google Earth Engine,GEE)是專門用于衛星影像及其它空間數據解譯運算的開源智能云平臺[16],它將谷歌最先進的云計算能力和存儲能力用于處理各類熱點問題,為遙感工作者及其他公眾用戶提供了便利[17-19]。近年來,GEE平臺逐漸被廣泛應用于農田面積提取等研究[20-21]。GEE平臺改變了傳統遙感軟件處理數據的定式,解決了大尺度應用研究中數據收集難、解譯效率低的弊端,從而為黃土高原覆膜農田的識別提供了可能。
本研究以甘肅省定西市安定區團結鎮作為黃土高原覆膜農田的典型區域,借助GEE平臺,利用分辨率30 m的陸地衛星地表反射率數據(USGS Landsat 8 Surface Reflectance Tier 1),采用特征選擇和隨機森林算法對該地區的覆膜農田進行提取,構建基于GEE平臺的黃土高原覆膜農田識別方法框架,以研究隨機森林算法的關鍵參數對遙感影像地物分類結果的影響。通過分析不同特征組合下的遙感影像分類結果,確定識別黃土高原覆膜農田的最優特征組合方案;通過比較不同的分類算法,驗證隨機森林算法在黃土高原覆膜農田識別中的有效性。
本研究選擇黃土高原和西秦嶺山地交匯處的甘肅省定西市安定區團結鎮作為研究區域(圖1)。該地區地勢南高北低,山脈南北走向,屬溫帶大陸性季風氣候,總面積約134.43 km2,年平均氣溫6.3℃,有效積溫2 300℃,年平均降雨量430 mm,無霜期140 d。統計數據顯示,截至2019年底,團結鎮總耕地面積達53.11 km2,約占全鎮總面積的2/5[22]。該地區屬于典型的黃土高原地膜覆蓋種植區,地膜覆蓋馬鈴薯種植面積占總種植面積的90%以上。

圖1 研究區域位置圖和地面樣本點分布示意圖Fig.1 Location schematic of study area and distributions of land surface sample points
1.2.1Landsat-8衛星數據
本研究所需Landsat-8衛星數據來源于GEE平臺(https:∥earthengine.google.com)的陸地衛星地表反射率數據(USGS Landsat 8 Surface Reflectance Tier 1),空間分辨率為30 m,時間分辨率為16 d。該數據已進行過大氣校正,消除了大氣和光照等因素所造成的輻射誤差。
黃土高原主要的覆膜作物為春玉米和馬鈴薯,一般于4月下旬至5月上旬播種[23-24]。在5月上中旬時,冬小麥正處于拔節抽穗期,夏玉米還未種植,春玉米和馬鈴薯剛剛播種,此時地膜受作物葉片的干擾程度小,容易獲取光譜信息。因此,5月上中旬是解譯研究區地膜覆蓋范圍的最佳時相。首先利用時間和空間的過濾函數獲取團結鎮上空2018年5月11日的Landsat-8影像,軌道號為130/035;然后對該影像進行去云處理,以減少云層遮擋的影響;最后使用團結鎮的矢量圖進行影像裁剪。
1.2.2地面樣本數據
團結鎮內的地物類型主要包含白色地膜、黑色地膜、植被覆蓋、裸露農田、水體和不透水層(包括建筑、道路、山體、廢棄用地等)共6種土地覆蓋類型。基于地球大數據科學工程數據共享服務系統(http:∥data.casearth.cn/)提供的全球分辨率30 m精細地表覆蓋數據和Google Earth高分辨率影像,采集了團結鎮6種不同土地覆蓋類型共計648個矩形樣本,樣本尺寸為2像素×2像素,并在GEE平臺中隨機分為訓練數據和驗證數據兩類,兩類數據的數量基本一致(表1)。

表1 研究區地物分類體系及樣本數量Tab.1 Classification scheme and sample number of surface features in study area
1.3.1基于GEE平臺的覆膜農田識別框架
基于GEE平臺提取團結鎮覆膜農田區域的具體步驟(圖2)為:①對獲取的Landsat-8影像數據進行預處理,并提取影像的光譜特征、指數特征和紋理特征。②使用提取的遙感識別特征和訓練數據選取隨機森林(Random forest,RF)算法的關鍵參數。③利用參數優化后的RF算法進行紋理特征重要性分析,獲得優選紋理特征。④基于提取的遙感識別特征和優選紋理特征制定6種不同的分類方案,利用參數優化后的RF算法進行不同方案下的地物分類并從中提取出覆膜農田區域,通過混淆矩陣方法和驗證數據對分類結果進行精度評價,確定最佳分類方案。⑤使用最佳分類方案和同一地面樣本數據分別利用支持向量機(Support vector machines,SVM)、決策樹(Decision tree,DT)和最小距離分類(Minimum distance classifier,MDC)算法進行地物分類,并進行精度驗證,通過與RF分類精度進行比較和McNemar’s檢驗,評價RF算法的分類性能。

圖2 基于GEE平臺提取研究區覆膜農田區域的技術流程圖Fig.2 Technical flowchart of extraction of plastic-film-mulched farmland based on Google Earth Engine platform in study area
1.3.2遙感識別特征構建
本研究基于Landsat-8地表反射率數據提取了光譜、指數和紋理3組特征進行地膜識別。其中,光譜特征包括遙感影像可見光、近紅外和短波紅外7個波段的反射率數據。指數特征包括歸一化植被指數[25]、歸一化水體指數[26]和歸一化建筑指數[27]。紋理特征選用灰度共生矩陣(Gray level co-occurrence matrix,GLCM)來提取。GLCM是由HARACLICK等[28]提出的通過計算影像灰度級之間聯合條件概率密度來提取紋理特征的一種統計學方法。GEE平臺提供了基于GLCM快速計算紋理特征的函數,可在短時間內同時導出18種不同紋理特征。若將18種紋理測度全部用于機器學習分類必然會產生冗余,因此本研究選取最為常見的和平均、方差、對比度、異質性、逆差矩、熵、角二階矩和相關性8種紋理指標來區分不同地物類型的空間結構差異。由于光譜特征中考慮了影像的7個波段,因此選用的紋理特征共包含56(8×7)個波段信息。最終共提取了66個光譜特征、指數特征以及紋理特征,其中紋理特征占全部遙感特征的80%以上。
為了進一步提高覆膜農田的識別精度和算法運行效率,研究利用RF算法對56個紋理特征進行重要性分析,然后按照重要性排序,逐一添加紋理特征開展覆膜農田識別工作,最后通過評價分類的生產者精度、用戶精度、總體精度和平均精度(白膜和黑膜的生產者精度與用戶精度的平均值)來選取最優紋理特征組合,從而實現基于最優特征集下的覆膜農田識別。
1.3.3隨機森林關鍵參數對分類結果的影響
RF算法在一定程度上可以避免過擬合[29-31],對噪聲和異常值有較好的容忍性,表現出很多普通機器學習算法未有的獨特優勢[30,32]。
RF算法可在GEE平臺上實現,且在構建RF算法時僅需對兩個最為關鍵的參數進行優化,即決策樹數量T和節點分裂特征個數M,其他參數保持默認值。一般地,增加決策樹數量T可有效減小算法的泛化誤差,但同時降低計算效率;節點分裂特征個數M是單棵決策樹分類性能的決定性因素,并對樹之間的相關性產生影響[33]。

1.3.4團結鎮覆膜農田的識別
為了評價不同特征組合在覆膜農田識別中的表現,本研究制定了6組不同的分類方案,具體為:光譜特征(方案S);指數特征(方案I);優選紋理特征(方案T1);光譜+指數特征(方案S+I);光譜+指數+優選紋理特征(方案S+I+T1);光譜+指數+全部紋理特征(方案S+I+T2)。利用參數優化后的RF算法和325個訓練數據進行不同特征組合下的地物分類,并從分類結果中提取出覆膜農田區域,對比分析不同分類方案的分類精度,從而選取最佳分類方案。
為了進一步比較不同分類算法在覆膜農田識別中的有效性,本研究基于最佳分類方案,使用同一訓練和驗證樣本,分別采用SVM、DT和MDC算法提取覆膜農田區域,依據分類精度和McNemar’s檢驗結果與RF算法提取結果作對比分析,從而評價不同算法的分類性能。SVM算法是以統計學為理論基礎,以結構風險最小化為原則的機器學習方法[34],核函數是影響其分類性能的決定性因素之一,本研究選用線性核函數進行分類,該核函數已被證明在覆膜農田識別中效果最佳[13]。DT算法是一種依據分割閾值對遙感影像的像元進行歸類的非參數監督分類方法[35],包括ID3、C4.5和CART共3種常見類型,本研究選用其中的CART算法執行地物分類。MDC算法是通過計算未知類別向量與訓練樣本向量中心點的距離,將非樣本像元歸類到距離最短類別中的分類方法[36],本研究采用歐氏距離計算距離。
1.3.5識別精度驗證
采用混淆矩陣法對分類結果進行精度評價,包括生產者精度(Producer accuracy,PA)、用戶精度(User accuracy,UA)、總體精度(Overall accuracy,OA)和Kappa系數4個評價指標[37-38]。
此外,利用McNemar’s檢驗來檢測不同算法間分類精度的差異,該檢驗是基于兩個算法的混淆矩陣而計算的非參數檢驗,以Z值來評判算法間差異的顯著性[39]。現有研究表明,若|Z|>1.96,則表明在0.05檢驗水平下兩種算法間的分類精度差異性顯著。
決策樹數量T和節點分裂特征個數M對RF算法的袋外誤差均有明顯的影響(圖3)。隨著T的增大,袋外誤差開始降低,尤其是當T<100時,此時因還未形成“森林”,袋外誤差明顯降低;當T≥100時,袋外誤差趨于穩定。節點分裂特征個數M的增加也可以有效降低袋外誤差,但相比參數T的影響較小,且參數M對算法的作用也與T的取值有關。當T<100時,M的增加能夠引起袋外誤差大幅度降低,而當T>100時,M的變化對袋外誤差的影響不明顯。當M<6時,袋外誤差降低相對明顯;在M≥6時誤差變化幅度很小,尤其在T≥100后基本趨于穩定。因此,兼顧RF算法的穩定、精度與效率,本研究選取T=600、M=8(即默認值)作為RF算法的輸入參數用于下一步最優特征子集的篩選。

圖3 隨機森林算法中決策樹數量T和節點分裂特征個數M與袋外誤差的關系Fig.3 Relationships between number of trees (T) or variables per split (M) and error of out-of-bag dataset in random forest algorithm
白膜覆蓋農田識別的生產者精度和用戶精度波動較小,且隨紋理特征數量的增加均呈緩慢上升趨勢,在特征數量達到12時,兩種精度趨于平穩并保持在90%以上(圖4a)。黑膜覆蓋農田識別的生產者精度和用戶精度的變化幅度較大,當特征數量小于4時,生產者精度直線增長,隨后轉變為小區間內浮動,精度保持在85%以上;而用戶精度則在特征數量增加到2時,由53.13%直接上升到82.35%,隨后保持在85%上下波動(圖4b)。特征數量小于10時,總體精度呈現整體上升趨勢,之后隨著特征數量的增加而逐漸趨于平緩,在特征數量為14和15時達到較大值,其值依次為87.93%和87.62%(圖4c)。根據平均精度,即白膜和黑膜的生產者精度與用戶精度的平均值(圖4d),可知該值在特征數量為15、23和36時較高,分別為90.66%、90.79%和90.86%。

圖4 不同紋理特征數量與識別精度之間的關系曲線Fig.4 Relationships between number of textural features and recognition accuracy
總體而言,本研究的RF算法運行過程中,使用的特征數量越多,則運算時間越長,工作效率越低,而通過重要性分析和精度評價篩選特征,將貢獻度和重要性較小的變量予以剔除,進而以較少的特征變量來確保較高的分類精度,降低變量維度。因此,本研究確定前15個紋理特征作為最優紋理特征組合。
根據不同特征組合下隨機森林地物分類結果的空間分布(圖5),可以看出方案I(圖5b)與方案S+I(圖5d)的分類結果中不透水層的分布范圍大于其他方法,并且已經超出了Google Earth高分辨率影像中目視解譯的不透水層范圍,存在一定程度的不合理性。方案T1(圖5c)獲取的分類結果中農田區域約占研究區的1/2,這與統計數據(約2/5)不相符,因此僅依靠優選紋理特征的識別結果也不可靠。而方案S(圖5a)、方案S+I+T1(圖5e)以及方案S+I+T2(圖5f)得到的分類結果中各類地物的空間分布較為合理,也與Google Earth高分辨率影像大致相符。

圖5 基于隨機森林算法和不同特征組合下的研究區地物分類結果Fig.5 Classification results of land covers in study area based on random forest algorithm and different feature combinations
根據不同分類方案下隨機森林覆膜農田識別結果的空間分布(圖6),可以看出覆膜農田集中分布在研究區的北部和西南部,在中部、東部較為分散。在對Google Earth高分辨率影像進行目視解譯的過程中發現,研究區存在大量白色地膜覆蓋區域,且主要集中在西部地區。然而方案S(圖6a)與方案S+I(圖6d)獲取的覆膜農田分布范圍較小且分散,方案I(圖6b)得到的覆膜農田分布中白膜和黑膜分布范圍差異較大,同時白色地膜分布信息缺失較多,因此均存在嚴重的錯分漏分現象。方案T1(圖6c)、方案S+I+T1(圖6e)以及方案S+I+T2(圖6f)得到的分類結果差異不明顯,提取的覆膜農田結構均較為明顯,空間分布基本符合目視解譯的結果,錯分漏分現象較輕。

圖6 基于隨機森林算法和不同特征組合下的研究區覆膜農田空間分布Fig.6 Spatial distributions of plastic-film-mulched farmlands in study area based on random forest algorithm and different feature combinations
對研究區內隨機選中區域在不同方案下的分類結果的細節進行對比分析(圖7),可見與對應的Google Earth實景影像和Landsat-8 OLI標準真彩色合成影像相比,6種方案的分類結果在像元上均存在不同程度的誤差。其中,方案S(圖7c)、方案S+I(圖7f)和方案S+I+T1(圖7g)的分類結果與實際情況吻合程度相對較高,像元誤差相對較小。

圖7 研究區某一隨機覆膜農田區域在不同特征組合下的分類結果對比Fig.7 Comparisons of classification results of plastic-film-mulched farmlands at random site in study area based on different feature combinations
根據混淆矩陣計算的不同特征組合下的地物分類精度(表2),可知6種不同特征組合下地物分類的總體精度均超過80%。其中方案S、方案I和方案T1這3種單一特征方法的總體精度分別為92.57%、80.50%和87.62%,Kappa系數分別為0.91、0.76和0.84,表明光譜特征在影像分類過程中發揮著重要作用。與方案S相比,方案S+I中添加指數特征可有效提升分類精度,總體精度和Kappa系數分別提高1.24個百分點、0.01。此外,在“光譜+指數”特征的基礎上加入紋理特征也可改善分類精度,與方案S+I相比,方案S+I+T1和方案S+I+T2的總體精度分別提高了1.24、0.62個百分點,Kappa系數分別增加了0.02和0.01。單從覆膜農田的分類精度上來看,無論是生產者精度還是用戶精度,白膜都遠高于黑膜,表明白膜的可分離性優于黑膜。對不同特征組合下白膜的分類精度進行分析,可知方案S、方案S+I以及方案S+I+T1的生產者精度最高為98.68%;而用戶精度在方案S+I+T1時達到最大值97.40%。同樣分析黑膜的分類精度,發現方案S+I+T1下生產者精度最高為92.50%,方案S的用戶精度最高為95.83%。綜合考慮分類性能和工作效率,確定本研究的最佳分類方案為S+I+T1,即光譜+指數+優選紋理特征。

表2 基于不同特征組合和隨機森林算法的研究區地物分類精度Tab.2 Classification accuracies of land covers based on different feature combinations and random forest algorithm in study area
在特征組合S+I+T1下,與RF算法(圖8a)相比,SVM(圖8b)、DT(圖8c)和MDC(圖8d)算法的分類結果差異明顯,尤其是DT和MDC算法提取的覆膜農田沒有從整體上呈現出其空間分布特征。進一步對比不同算法的分類精度(表3),可知RF算法精度明顯高于SVM、DT和MDC算法,總體精度分別高3.10、7.74、50.78個百分點,Kappa系數分別高0.04、0.10和0.62。由于RF、SVM和DT均為非參數監督分類方法,只有MDC屬于參數監督分類方法,這表明非參數監督方法相比參數監督方法更適合用于地貌復雜地區的地物分類。單從覆膜農田的分類精度來看,在RF算法下,白膜的生產者精度和用戶精度達到最大值,分別為98.68%和97.40%;黑膜的生產者精度和用戶精度也達到最大值,分別為92.50%和91.36%。

圖8 方案S+I+T1下基于不同機器學習算法的研究區覆膜農田空間分布Fig.8 Spatial distributions of plastic-film-mulched farmlands based on scheme S+I+T1 and different classification algorithms in study area

表3 方案S+I+T1下基于不同機器學習算法的研究區地物分類精度比較Tab.3 Classification accuracies based on different classification algorithms of scheme S+I+T1 in study area
此外,根據RF、SVM、DT和MDC算法分類結果的McNemar’s檢驗,可知RF算法與SVM、DT、MDC算法之間的Z值分別為2.89、5.00和12.88,結果均大于1.96,表明在0.05檢驗水平下RF算法與SVM、DT、MDC算法的分類精度差異性顯著。綜上可知,4種機器學習算法中RF算法在地物分類和覆膜農田識別上優勢明顯,能夠有效地提高識別精度和工作效率。
本研究提出了基于GEE平臺快速提取覆膜農田的方法,獲得了甘肅省定西市安定區團結鎮的覆膜農田空間分布情況,識別精度和效率比已有相關研究有所提升。LU等[40]基于Landsat系列數據開展新疆地區的覆膜農田識別工作,總體精度和Kappa系數分別達到97.82%和0.97,由于新疆地區覆膜農田幾乎呈連片分布狀,在一定程度上降低了工作難度。哈斯圖亞[41]選擇了同樣位于黃土高原的寧夏固原地區作為研究區進行覆膜農田提取,總體精度和Kappa系數為90.67%和0.87。本文地物分類的總體精度和Kappa系數分別為95.05%和0.94,實現了地膜分布相對破碎地區的精準識別,可為地貌復雜地區應用農業遙感技術提供參考。此外,研究同時考慮了白膜和黑膜覆蓋農田,并成功對其分別進行提取,這也彌補了XIONG等[42]在其研究結果分析中提出的未考慮研究區中的黑膜而導致精度降低這一缺陷。
目前大多數研究對于隨機森林算法關鍵參數的選取多參考經驗值,如哈斯圖亞[41]、張鵬等[43]根據經驗將決策樹數量T設為500、節點分裂特征個數M取輸入特征數的平方根;侯蒙京等[44]參考大量研究將參數T設為1 000、參數M保持默認,這在一定程度上限制了RF算法高精度優勢的發揮。本研究首先根據參數T和M的經驗值確定了它們的取值范圍,然后遍歷所有參數組合來執行RF算法分類,最終選擇運算效率可接受范圍內使袋外誤差最低的參數值,作為下一步研究中RF算法的輸入參數。結果表明,在利用RF算法進行影像分類時,參數T和M均對袋外誤差有明顯影響,且參數T的影響大于參數M。當參數M一定時,并非參數T越大,袋外誤差就越小,因此通過不斷提高參數T的值來降低袋外誤差往往是無法實現的。這與RODRIGUEZ-GALIANO等[32]的研究結果相近。本研究中,參數T取600、參數M保持默認值的組合可在運算效率承受范圍內使袋外誤差最低。這表明RF算法關鍵參數的優化是提高覆膜農田識別精度的有效途徑。
遙感識別特征決定了各類地物之間的相似性和差異性,是判讀識別各類地物的依據。本研究基于RF算法對紋理特征進行重要性分析,按照重要性排序逐一添加紋理特征并進行分類精度驗證,確定前15個特征為優選紋理特征,并結合光譜和指數特征制定了6套方案進行覆膜農田識別。結果表明,基于“光譜+指數+優選紋理”特征的總體精度和Kappa系數最高,分別為95.05%和0.94。這與朱秀芳等[45]的研究結果相近,該研究認為紋理特征越多并不代表分類精度越高,分類前進行特征優選是必要工作。然而該研究僅依靠優選紋理特征進行分類,總體精度和Kappa系數分別為94.84%和0.89,并提出可通過增加指數特征來改善分類精度。本研究針對其提出的不足之處加以改進,明顯提高了覆膜農田的識別精度。
作為目前機器學習領域的研究熱點,隨機森林被廣泛應用于地物分類研究中。本研究基于“光譜+指數+優選紋理”特征評價不同算法的分類性能時發現,無論是從生產者精度、用戶精度、總體精度和Kappa系數還是McNemar’s檢驗結果來看,隨機森林算法均顯著優于其他算法,這與哈斯圖亞[41]、侯蒙京等[44]的研究結果相符。沙先麗[12]基于Landsat系列數據,利用決策樹模型和多特征結合方法提取新疆地區的覆膜農田信息,但是在研究區地膜覆蓋連片、地物特征明顯的前提下分類的總體精度和Kappa系數僅為91.35%和0.89。究其原因,在所用數據和特征子集相同的情況下,關鍵因素可能在于所采用的算法。這也再次印證了隨機森林算法在覆膜農田識別中的有效性。
本研究主要考慮的是春玉米、馬鈴薯等春播作物地膜覆蓋種植區域的單一時相識別,盡管其種植面積占全年覆膜農田面積的90%左右,但仍然缺失其他季節的覆膜農田信息。在其他季節,研究區主要的覆膜作物為蔬菜,而蔬菜的播種時間幾乎取決于農戶本身,不確定因素很多,因此對覆膜蔬菜種植區域進行提取難度較大,有待后續進一步深入研究。此外,本研究僅考慮了基于像元的遙感影像分類方法,而裴歡等[46]的研究表明面向對象分類方法為土地利用/覆蓋信息提取提供了新的有效途徑,該方法在覆膜農田識別中的應用潛力還需要進一步深入探討。
(1)確定隨機森林算法關鍵參數的最佳取值能夠大幅提高遙感影像的分類精度。在非關鍵參數保持默認的條件下,在一定閾值范圍內存在決策樹數量T和節點分裂特征個數M的最佳參數組合,能夠在運算效率可承受范圍內使袋外誤差最小。因此,在利用隨機森林算法實現影像分類之前,對其關鍵參數進行了優化,以獲取更為可靠的分類結果。
(2)基于優選紋理特征的分類性能優于基于全部紋理特征的分類,且相比其他方案,基于“光譜+指數+優選紋理”特征的識別結果最佳。基于“光譜+指數+優選紋理”特征分類的總體精度達95.05%,比基于單一特征方案的總體精度高2.48~14.55個百分點,同時也比“光譜+指數”特征、“光譜+指數+全部紋理”特征方案分別高1.24、0.62個百分點。因此,在實際應用中建議采用優選紋理特征和多特征相結合的方法進行覆膜農田識別。
(3)隨機森林算法的總體精度比支持向量機、決策樹和最小距離分類算法分別高3.10、7.74、50.78個百分點。結合McNemar’s檢驗結果,隨機森林算法與其它3種算法間的Z值分別為2.89、5.00和12.88,表明隨機森林算法與其它算法間的分類精度存在顯著性差異。因此,隨機森林算法是較適于覆膜農田識別的方法。