中圖分類號:TP79;S812 文獻標識碼:A 文章編號:1007-0435(2025)04-1258-09
Abstract: Aboveground biomass(AGB) is an important index to evaluate vegetation status and desertification process in desert grassand. In order to evaluate the aboveground biomass (AGB)of desert grassland rapidly, accurately and efficiently,the desert grasslandof Seriphidium transiliense in Xinjiangwas takenas the research area in this study. The AGB data of grassland were collected in the vegetation growth season,and the unmanned aerial vehicle(UAV) data were obtained simultaneously. Ten vegetation indices were selected as thecharacteristic variables,and three machine leaming algorithms were used to construct the AGB inversion model. The genetic algorithm (GA) was introduced to optimize the model parameters,and then the best AGB inversion model was selected.The results showed that the three algorithms all had high prediction perfor mance,among which the XGBoost model had significant advantages.Especially after integrating four typical vegetation indices and using genetic algorithm(GA)optimization,the prediction accuracy reached the highest (
,
,of which RVI contributed the most,accounting for 3 5 % .Therefore,the XGBoost model based on four typical vegetation indices combined with GA optimization was identified as the most suitable model for grassland AGB remote sensing inversion in the study area.The results of this study could provide a reference for the selection ofremote sensing inversion methods for monitoring grassland biomass and the improvement of accuracy.
Key words: Desert grassland; Aboveground biomass; Unmanned aerial vehicle; eXtreme gradient boosting: Random forest;Light gradient boosting machine
荒漠草地約占全國草原總面積的 $8 . 1 \% ^ { [ 1 ] }$ ,在維持區域生態和生產平衡方面發揮著關鍵作用,但由于其生態特性較為脆弱,對環境變化具有較高的敏感性,從而極易遭受損害。在草地管理實踐中,草地地上生物量(Abovegroundbiomass,AGB)[2-3]是評價草地退化、修復和生態系統穩定性的重要指標之一,快速準確地定量反演草地AGB對促進草原可持續發展具有重要意義。
植被指數是牧草生長狀況的重要外部指標,常被用于草地AGB的遙感估算[4-5],如歸一化植被指數(Normalized difference vegetation index,NDVI)[6]增強型植被指數(Enhanced vegetation index,
、土壤調節植被指數(Soil-adjustedvegetationindex,MASVI)等[8]。已有研究表明,植被指數與葉面積指數或生物量相關的生化參數之間存在高度相關性9,通過遙感平臺捕捉植被的反射光譜特性,計算植被指數、建立與實測值之間的統計模型,為草地AGB的遙感估算提供了重要手段。不同遙感平臺提供的數據源在空間分辨率、時間分辨率、光譜分辨率以及覆蓋范圍等方面存在差異;為此,在開展相關研究時,應當謹慎選擇適宜的遙感平臺獲取源數據,以確保研究的準確性和有效性。近年來,無人機(Unmannedaerialvehicle,UAV)遙感因具有獲取影像速度快、空間分辨率高、云下獲取影像等傳統遙感技術無法比擬的優勢,在草地資源調查方面有著廣闊的應用前景[10]。但是,基于無人機遙感數據如何選取精確且可靠的草地AGB反演方法,來實現退化草地發展趨勢的有效監測,是草地資源現狀研究中的一個重要問題。
目前,草地AGB遙感反演方法通常分為線性回歸和機器學習[11兩類。線性回歸方法的參數模型雖構建簡單、易于實現,但其有效性在很大程度上依賴于變量與生物量之間關系的線性假設:如孫世澤等在天山山脈的陰陽坡草地區域,采集了無人機多光譜影像生成多種植被指數,并據此構建了用于估算AGB的線性回歸模型[12];Zhang等通過無人機可見光數據,構建了一個基于冠層高度模型(Canopyheightmodel,CHM)與實際測量AGB的對數模型[13]。機器學習算法因能有效解決參數模型中特征變量間的共線性問題,減小誤差、提高預測精度被廣泛應用。其中,隨機森林(Randomforest,RF)[14]、極限梯度提升(eXtreme gradient boosting,XGBoost)[15]、輕量級梯度提升(Lightgradientboostingmachine,LightGBM)[16]等算法在植被參數估算中應用較多:如Li等人利用RF模型對美國得克薩斯州草原AGB進行了估算[1;Jia等基于XGBoost模型估算的內蒙古東部草原AGB[18];Bui等利用LightGBM模型對越南北部省份森林AGB進行了估算[19]。
前人[20-21]對荒漠草地AGB的研究中,主要基于典型的植被指數結合線性回歸方法進行模型的構建,而對多種植被指數與機器學習算法結合,以提升模型性能的方法尚未得到充分驗證。因此,本研究以新疆廣泛分布且面臨嚴重退化問題的伊犁絹蒿(Seriphidiumtransiliense)荒漠草地為研究對象,利用無人機(UAV)采集的高分辨率多光譜影像以及地面實測的草地AGB數據,選取了10種植被指數作為特征變量,結合RF,XGBoost和LightGBM三種先進的機器學習算法,并采用遺傳算法(GA)對這些算法模型的超參數進行細致優化,以建立更為精確的荒漠草地AGB反演模型。本研究旨在通過比較和分析不同模型的估算精度,篩選出最優性能的模型,從而為無人機遙感技術在荒漠草地AGB估算領域的應用提供科學依據和技術支持。
1 材料與方法
1. 1 研究區概況
伊犁絹蒿荒漠草地主要分布在新疆北部低海拔地區,屬于溫帶大陸性半干旱半荒漠氣候,多作為春秋放牧場[22]。因自然條件惡劣及過度的放牧利用,使其生產力迅速下降、群落結構發生改變而造成了嚴重退化[23]。研究區位于新疆維吾爾自治區烏魯木齊市米東區柏楊河鄉境內(圖1),地處
,
之間,平均海拔
,年降水量為
左右,降水主要集中在8一9月;該區域植被群落中,伊犁絹蒿為優勢種,而角果藜(Ceratocarpusarenarius)與叉毛蓬(Petrosimoniasibirica)則分別作為亞優勢種與之共存,該地區為典型的伊犁絹蒿荒漠草地分布區[24]

1. 2 數據獲取及處理
1.2.1樣帶和樣方布置遵循植叢分布均勻的原則,參照研究區草地生長周期,于伊犁絹蒿荒漠草地植被生長旺盛期(6月下旬)內設置5條長
相隔
的樣帶,獲取無人機多光譜影像,在每條樣帶中每隔
布設1個植物群落測定樣方,采集大小為
的樣方,每條樣帶50個樣方,共計250個樣方。
1.2.2數據的獲取試驗選擇晴朗無云天氣、地面能見度高、風力不超過3級的天氣開展;在北京時間12:00—16:00間進行多光譜數據、地面實測數據的采集。
(1)無人機多光譜數據獲取
采用大疆精靈4多光譜版(DJIP4Multispectral)無人機進行數據采集,其相機配置了6個 1 / 2 . 9 英寸CMOS傳感器,包括1個彩色傳感器用于可見光成像和5個單色傳感器用于多光譜成像,5個單色傳感器分別覆蓋以下波段:藍(B)
;綠(G
;紅
;紅邊(RE)
;近紅外
。
為確保飛行系統的穩定性和安全性,選擇在晴朗且無風的天氣條件作業,并將作業時間安排在日間光照最為理想的12:00—16:00時段。無人機設定在
的高度上空(空間分辨率為
以每秒
的速度勻速飛行,并采用等間隔拍照模式,每隔2.0秒進行一次拍攝,以實現對航線方向上樣方的完整記錄。此外,航向和旁向重疊率均設定為7 5 % ,以收集伊犁絹蒿荒漠草地的詳細影像資料。
(2)草地地上生物量獲取
采用齊地劉割法對樣方內所有的地上生物量進行采集,并使用電子天平對收集于袋中的生物量進行即時稱重,以計算每平方米面積上的地上生物量鮮質量
。
1.2.3數據處理植被指數法是遙感反演地表參數的基本方法之一,對采集的5幅單波段影像使用ArcGis10.8軟件進行指數計算,根據前人和相關研究的經驗[21.25],選取了4種指數作為典型的植被指數和6種指數作為添加的植被指數共計10種植被指數,進行草地AGB建模并比較模型精度,其植被指數信息[4,6-8.20-21]如表1所示。

1.3地上生物量反演模型構建
隨機森林回歸[26]是基于Bagging集成學習方法,將多個決策樹集成到一個森林中,并將它們組合起來預測最終結果。本研究中關鍵的超參數設置為:樹的最大深度(max_depth)為10;葉子節點的最大數量(max_samples_leaf)為5O;決策樹數量(n_estimators)為100。
XGBoost[15]是梯度提升決策樹(Gradientboost-ingdecisiontree,GBDT)的一種高效實現,給損失函數增加了正則化項;且因有些損失函數是難以計算導數的,其使用損失函數的二階泰勒展開作為損失函數的擬合。本研究中關鍵的超參數設置為:學習率(learningrate) = 0 . 1 5 ,最小損失函數下降值(gamma)
,max_depth
,n_estimators : = 1 5 0 。
LightGBM2]是XGBoost一種高效實現,其關鍵的超參數設置為:learningrate
,gamma °leddash 0.01,max_depth
,n_estimators
。
遺傳算法(Geneticalgorithm,GA)作為一種經典的啟發式優化策略[28,其在并行計算能力、算法流程的明晰性以及執行全局搜索的有效性方面展現出顯著的優勢。因此,將其與機器學習模型進行整合,旨在增強模型的優化性能及其對于不同問題的適應能力。
在Windowsl1系統上配置Anaconda
PyCharm的算法環境,于Python3.11中加載Scikit-Learn、GDAL、Spectral等庫,將上述植被指數作為自變量、草地AGB作為因變量輸入模型,通過RF,XGBoost,LightGBM3種算法建立基于典型植被指數(4種)典型及添加的植被指數(10種)的6個反演模型,并在此基礎上加入GA進行參數尋優構建6個優化后的模型,共構建12個草地地上生物量反演模型。在模型訓練過程中,數據集被劃分為訓練集和驗證集,其劃分比例為 70 % 用于訓練, 30 % 用于驗證。
1. 4 反演精度驗證
選用決定系數、均方根誤差(RMSE)2個指標對反演模型進行精度驗證[28-29]。
能反映出預測值與實測值之間的相關性強度,RMSE可反映出預測值與實測值之間的偏差。
的值越大、RMSE的值越小,表明模型精度越高,其計算公式為:


式(1,2)中, n 為樣本量, i 為第i個樣本,
分別為估測值、估測均值、觀測值和觀測均值。
2 結果與分析
2.1默認算法下的生物量反演
以研究區內250個草地AGB采樣點的鮮重為因變量,分別選擇典型植被指數(4種)典型及添加的植被指數(10種)作為自變量,得到3種機器學習算法的生物量結果(表2):當變量為4種典型植被指數時,XGBoost算法的反演精度最高,
為0.89,RMSE為4.77;在添加6種植被指數變量輸入模型后,LightGBM算法的反演精度最高,
為0.90,RMSE為4.62;RF和LightGBM算法的反演精度提升較為明顯,
均提升超過 1 5 % ,達到0.76以上;而XGBoost算法受新輸人變量的影響不強,
下降了 0 . 0 1 。

2.2加入遺傳算法的生物量反演
為提高反演精度,將遺傳算法與3種機器學習算法進行了結合(表3),基于典型植被指數模型反演中,XGBoost算法的反演精度最高,
為
0.94,RMSE為3.44;添加6種植被指數變量輸入模型后,XGBoost算法的
下降了O.O2,RF和LightGBM算法的反演精度提升明顯,
均提升超過 2 5 % 。

2.3 變量貢獻率
基于典型植被指數模型的4種變量中(圖2),NDVI,EVI對RF,LightGBM2種機器學習算法的
貢獻率較大,均超過 26 % ;RVI,SAVI對XGBoost 的貢獻率較大,均超過 27 % 專
基于典型及添加其他植被指數模型的10種變量

中(圖3),DVI,GNDVI,NDRE對RF和LightGBM2種機器學習算法的貢獻率較大,均超過 10 % ,RVI,
LCI對XGBoost的貢獻率最大,分別為 40 % 和 20 % SAVI,WDRVI在3種算法重的貢獻率均不足 7 % 號

2.4 模型擬合分析
研究區草地AGB實測值和模型預測值的擬合分析(圖4)發現,相較于典型植被數據,采用添加植被指數的數據時,3種機器學習算法模型的散點分布均具有一定的收斂,表明變量的增加可以顯著提高模型擬合效果。
結合遺傳算法后,基于典型植被指數數據時的RF,LightGBM算法模型的分布散點收斂效果不強,表現為對部分生物量的低估散點的增加,對XGBoost算法收斂效果較好,散點基本分布在擬合曲線上;基于典型及添加植被指數數據時,表現為RF,LightGBM算法模型的分布散點收斂效果較好,對XGBoost算法模型的收斂效果較差,多出一些對生物量的低估、高估的散點。綜合來看,基于典型植被指數數據結合遺傳算法的XGBoost模型反演效果最佳,預測的伊犁絹蒿荒漠草地AGB范圍為
。
3討論
3.1非參數模型優勢
植被指數是構建草地AGB遙感反演模型的基本變量[30],近年來,諸多學者采用機器學習算法中RF,XGBoost,LightGBM等進行植被參數估算[31-32],發現基于機器學習算法構建的AGB反演模型在解決小樣本數據時具有一定的優勢,且通常具有較高的預測性能。對比前人的研究[21],發現基于同一時期的無人機遙感數據,參數模型的
在
之間,RMSE在
之間;而本研究中基于機器學習算法的
在
之間,RMSE在
之間;這表明在同一物候期內,采用機器學習算法構建的荒漠草地地上AGB反演模型更具有優勢。
3.2不同機器學習算法模型性能差異分析
對比RF,XGBoost和LightGBM這3種在算法性能與敏感性中發現:伊犁絹蒿荒漠草地AGB的反演中,3種基于決策樹的集成學習算法表現出色,具備較大應用潛力,但它們在準確度和處理速度上有所不同。RF由于其隨機性可能在準確度上不如XGBoost和LightGBM,后者分別因提供更多參數和靈活性以及更快的處理速度和相似的準確度而受到青睞。本研究發現RF,LightGBM算法對輸入隨機森林RF 極限梯度提升XGBoost 輕量級梯度提升1 5 % ;反之,XGBoost算法隨著變量的增加反演精度
下降1 % ~ 2 % ,表現出略微下降。這可能是因為隨機森林和LightGBM能夠有效地利用這些額外的特征來提高模型的預測能力。隨機森林通過特征的隨機選擇可能會更好地捕捉到這些新增特征的重要性[26],LightGBM的葉子-wise分裂策略可能有助于模型更細致地學習數據中的復雜關系[19];而XGBoost的梯度提升機制可能會對這些新增的不相關信息或噪聲敏感,從而影響了模型的性能[18]
3.3遺傳算法優化下各模型性能差異分析
在融人遺傳算法后,不同數據源下XGBoost,LightGBM算法的反演精度均有所提升,
提升約
10 % ,而RF算法在采用典型植被指數的反演精度降低。這可能是遺傳算法能幫助XGBoost和LightGBM更好地進行特征選擇和超參數優化,而RF本身對特征選擇就不是那么敏感,它的性能更多依賴于模型的多樣性,而不是單個特征的重要性[26]。因此,遺傳算法在特征選擇上的優化可能并沒有給隨機森林帶來顯著的增益[28],甚至可能由于選擇了次優的特征組合而降低了模型的性能。
采用典型植被數據融入遺傳算法時,XGBoost模型對整個研究區的AGB反演估算能力明顯優于其他兩種算法。XGBoost模型的估算能力優于RF,這與張子慧等[11]和王婷等[33]對草地AGB反演的結果一致,而LightGBM是一種新發展起來未曾運用到草地AGB反演的研究中的模型,故無法將該模型的結果與其他的研究進行對比分析。在
XGBoost模型的輸入變量中,無論是基于典型植被指數或典型及添加的植被指數數據,RVI的貢獻率均為最大,超過 3 5 % 。其原因可能為RVI對土壤背景的敏感性較低,因此在植被覆蓋較低的荒漠草地,更能反映植被生長的實際狀況;這也
等[34]與葉靜蕓等35研究結果一致。荒漠草地的植被分布較稀疏,常面臨混合象元問題[36],本文采用無人機高分辨率遙感數據構建的AGB反演模型可作為中低分辨率遙感數據和地面實測數據之間的橋梁,減少混合象元誤差,準確估算廣泛區域的植被地上生物量[37-38]
4結論
本研究探討了無人機遙感技術在荒漠草地地上生物量(AGB)反演中的應用,通過采集無人機多光譜數據和地面實測AGB數據,提取多種植被指數,構建了基于隨機森林(RF)、極限梯度提升(XGBoost)和輕量級梯度提升(LightGBM)的草地AGB反演模型。結果表明:基于機器學習算法構建的AGB反演模型在解決小樣本數據時具有優勢,且通常具有較高的預測性能。三種基于決策樹的集成學習算法(RF,XGBoost和LightGBM)在AGB反演中表現出色,但各有特點,XGBoost模型在默認算法下表現最佳,尤其在典型植被指數模型中
,RMSE
。然而,添加植被指數后,LightGBM模型的精度略高于其他模型(
,
。加入遺傳算法優化后,XGBoost模型在典型植被指數模型中的精度進一步提升,達到
,成為最佳模型。此外,RVI對該模型的貢獻率最大( 3 5 % ,其次是NDVI和EVI。未來研究將基于此模型,引入更多輸人因素優化草地AGB的反演研究,以期為草地資源的可持續利用提供有力支持。
參考文獻
[1]陳林,曹萌豪,宋乃平,等.中國荒漠草原的研究態勢與熱點分析——基于文獻計量研究[J].生態學報,2021,41(24):9990-10000
[2] 卜靈心,來全,劉心怡.不同機器學習算法在草原草地生物量估算上的適應性研究[J].草地學報,2022,30(11):3156-3164
[3]ZHANGYX,HUANGJX,HUANGH,etal.Grasslandaboveground biomass estimation through assimilating remotesensing data into a grass simulation model[J].Remote Sensing,2022,14(13):3194
[4]WENHONG M, JINGYUNF,YUANHE Y,et al. Biomasscarbon stocks and their changes in northern China’s grasslandsduring 1982-2006[J]. Science China,Life Sciences,2010,53(7) :841-50
[5]IFTIKHAR A,FIONA C,EDWARD D,et al. Modeling man-aged grassland biomass estimation by using multitemporalremote sensing data—a machine learning approach[J]. IEEEJournal of Selected Topics in Applied Earth Observations andRemote Sensing,2017,10(7):3254-3264[6]徐斌,楊秀春,陶偉國,等.中國草原產草量遙感監測[J].生態學報,2007(2):405-413
[7] GARROUTTE L E,HANSEN JA,LAWRENCEL R.Using NDVI and EVI to map spatiotemporal variation in thebiomass and quality offorage for migratory elk in the greater yel-lowstone ecosystem[J]. Remote Sensing,2016,8(5):404[8]任安才.基于TM影像的川西北理塘草地生物量與植被指數關系研究[D].成都:四川農業大學,2009:16-17[9]許明,王蕊,湯萃文.草地生物量遙感估算方法綜述[J].甘肅科技,2020,36(21):55-58[10]陳斌,甘輝林,顧新民,等.無人機遙感在草原生態監測中的作用[J].農業與技術,2023,43(15):66-73[11]張子慧,吳世新,趙子飛,等.基于機器學習算法的草地地上生物量估測——以祁連山草地為例[J].生態學報,2022,42(22):8953-8963[12]孫世澤,汪傳建,尹小君,等.無人機多光譜影像的天然草地生物量估算[J].遙感學報,2018,22(5):848-856
[13] ZHANG H,SUN Y,CHANG L,et al. Estimation of grasslandcanopy height and aboveground biomass at the quadrat scaleusing unmanned aerial vehicle[J].Remote Sensing,2018,10(6):851
[14]NA Z,XIAOLIR,HONGLIN H,et al. Estimating the grassland aboveground biomass in the Three-River HeadwaterRegion of China using machine learning and Bayesian modelaveraging[J].Environmental Research Letters,2O21,16(11):
114020[15]張亦然,劉廷璽,童新,等.基于XGBoost算法的草甸地上生物量的高光譜遙感反演[J].草業學報,2021,30(4):1-12
[16] MORAIS T G,JONGEN M,TUFIK C,et al. Characteriza-tion of portuguese sown rainfed grasslands using remote sensingandmachine learning[J].Precision Agriculture,2O22,24(1):
161-186
[17]LI Z,ANGERER JP,JAIME X,et al. Estimating rangelandfine fuel biomass inwestern texas using high-resolution aerialimagery and machine learning[J].Remote Sensing,2022,14(17):4360
[18] JIA ZY,ZHANG Z H,CHENG Y X,et al. Grassland biomassspatiotemporal patterns and response to climate change in east-ern Inner Mongolia based on XGBoost model estimates[J].Ecological Indicators,2024(158) :111554
[19]BUI Q T,PHAM Q T,PHAM V M,et al. Hybrid machinelearning models for aboveground biomass estimations[J].Ecological Informatics,2024,79(10):102421
[20]李瑩,張勇娟,靳瑰麗,等.基于Landsat數據的烏魯木齊市草地地上生物量時空演變及趨勢分析[J].草地學報,2023,31(7):1950-1963
[21]馬建.基于多源遙感數據的伊犁絹蒿荒漠草地植物的識別與反演[D].烏魯木齊:新疆農業大學,2022:12-19,47
[22]朱進忠,吳詠梅.伊犁絹蒿荒漠不同退化階段草地經濟性狀演變的分析[J].草業科學,2005,22(10):1-6
[23]武紅旗,范燕敏,靳瑰麗,等,伊犁絹蒿荒漠草地植物光譜特征[J].草業科學,2019,36(7):1765-1773
[24]韓萬強,劉文昊,靳瑰麗,等.伊犁絹蒿荒漠草地主要植物的高光譜識別[J].中國草地學報,2022,44(6):1-10
[25]LINXC,CHENJJ,LOUPQ,etal.Improving the estimationofalpine grassland fractional vegetation cover using optimizedalgorithmsandmulti-dimensional features[J].PlantMethods,2021,17(1):96
[26]高宏元,侯蒙京,葛靜,等.基于隨機森林的高寒草地地上生物量高光譜估算[J].草地學報,2021,29(8):1757-1768
[27]黃志明,周紀,丁利榮,等.藏東南冰川地區
空間分辨率全天候地表溫度生成[J].遙感學報,2021,25(8):1873-1888
[28]王昊煜,高培超,宋長青,等.基于文獻計量和遺傳算法的土地利用優化研究進展[J].生態學報,2023,43(3):1286-1293
[29]邢曉語,楊秀春,徐斌,等.基于隨機森林算法的草原地上生物量遙感估算方法研究[J].地球信息科學學報,2021,23(7):1312-1324
[30]LIYC,LIMY,LIC,et al. Forest aboveground biomass esti-mation usingLandsat8 and Sentinel-1A data with machinelearningalgorithms[J].ScientificReports,202O,1O(1):9952
[31]蔣馥根,孫華,李成杰,等.聯合GF-6和Sentinel-2紅邊波段的森林地上生物量反演[J].生態學報,2021,41(20):8222-8236
[32]劉占宇,黃敬峰,吳新宏,等.草地生物量的高光譜遙感估算模型[J].農業工程學報,2006,22(2):111-115
[33]王婷,周偉,肖潔蕓,等.基于遙感數據和機器學習算法的草地地上生物量估算研究[J].冰川凍土,2023,45(2):753-762
[34]XUM,CAOCX,TONGQX,etal.Remotesensingbasedshrub above-ground biomassand carbon storage mapping in MuUsdesert,China[J].Science China Technological Sciences,2010,53(1):176-183
[35]葉靜蕓,吳波,劉明虎,等.烏蘭布和沙漠東北緣荒漠——綠洲過渡帶植被地上生物量估算[J].生態學報,2018,38(4):1216-1225
[36]LU D.The potential and challenge of remote sensing-basedbiomassestimation[J].International Journal ofRemote Sens-ing,2006,27(7):1297-1328
[37]高燕,梁澤毓,王彪,等.基于無人機和衛星遙感影像的升金湖草灘植被地上生物量反演[J].湖泊科學,2019,31(2):517-528
[38]李淑貞,徐大偉,范凱凱,等,基于無人機與衛星遙感的草原地上生物量反演研究[J].遙感技術與應用,2022,37(1):272-278
(責任編輯劉婷婷)