999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于梯度提升回歸樹的三江源地區植被指數的預測方法研究

2025-06-23 00:00:00張國晶顏青松秦文強張茲予李希來黃建強
草地學報 2025年5期
關鍵詞:模型研究

中圖分類號:S19 文獻標識碼:A 文章編號:1007-0435(2025)05-1655-14

Abstract:To reveal the spatio-temporal patternand influencing factors of vegetation changes in the Sanji angyuanregion from 2OOO to 2O23,and to forecast the possible change trend of vegetation under climate change, in this study NDVI data and climte data including temperature,precipitation,wind speed and barometric pressure from four regions within Sanjiangyuan-Dari,Mado,Yushu,and Qumalai were utilized to analyze the normalized Diference Vegetation Index at the same period. The NDVI prediction model was established by using machine learning algorithms-Gradient Boosting Regressor,AdaBoost Regressor,Random Forest,and Neural Networks.On this bisis,allmodels were fine-tuned and validated to enhance performance and reliability. Finally,an optimal model of simulation accuracy was selected to simulate vegetation change under multiple scenarios.The results showed that temperature was the most significant meteorological factor influencing NDVI, explaining up to 67.29% of the variability. The Gradient Boosting Regressor showed better performance than other models in all the study areas. This model achieved a Mean Squared Error(MSE)ranging from O.000 45 to 0.001 04 and an R2 value exceeding O.9O. It showed strong fiting ability. The Gradient Boosting Regressor proved to be highly accurate and stable in predicting NDVI, which provides a robust approach for forecasting vegetation changes and is instrumental for early warning of vegetation degradation in response to climate change. Theresearch findings provide a robust scientific basis for ecological conservation initiatives,facilitating the for mulation of strategies to alleviate the efects ofclimatechange on the vegetation within the Sanjiangyuan area.

Key words:NDVI;Machine learning;Gradient boosted regression tree;Sanjiangyuan region

在過去的幾十年中,為了有效監測陸地植被活動的變化,歸一化植被指數(Nomalized difference veg-etationindex,NDVI)和葉面積指數(Leafareaindex,LAI)被相繼提出[1-2]。由于具有簡單性和長期存檔的便利性,NDVI已被廣泛采納和應用[3,為大規模監測陸地植被活動提供了有力支持[4-5]。NDVI是目前最為常用的表征植被狀況的指標,它與植被覆蓋度、生物量、葉面積指數密切相關6,在衡量地表植被覆蓋狀況和生態環境質量等方面起著舉足輕重的作用。在青藏高原地區,由于植被類型相對單一,NDVI可以被看成是高原草地生產力的替代指標。多年來,眾多學者針對不同尺度的區域NDVI進行了廣泛而深入的研究。孔冬冬等依據NDVI數據,對中國植被的生長狀況及其在不同時間尺度干旱事件中的響應特性進行了深入研究。研究結果表明,多年平均日照時數對植被十旱的響應具有顯著性,且其影響程度在不同地區表現出顯著的差異性。康堯等8則選定蒙古高原為研究對象,通過結合NDVI和陸地表面溫度(Landsurface temperature,LST)構建了NDVI-LST特征空間,并利用該空間計算了蒙古高原的溫度植被干旱指數(Temperature vegetation dryness index,TVDI),進而揭示了蒙古地區植被與干旱之間的響應關系。尹振良等9的研究表明,中國西北地區植被覆蓋的增加與區域氣溫、降水等干旱指標密切相關。靳專等[10]提出了一種RBF-CASA模型預測三峽庫區消落帶植被凈初級生產力(Net primary productivity,NPP)均方根誤差降低了23.861;劉愛霞等[11]建立了一套適合于大尺度荒漠化監測的遙感指標體系,分別對中國及中亞地區1995年和2001年的荒漠化分布狀況進行了監測評價。姚付啟等12運用NDVI,植被指數(Ratiovegetation index,RVI反演冬小麥葉面積指數。Van-noppen[13]使用NDVI評估農作物產量。以上研究表明,NDVI在監測地表覆蓋變化、生態環境演變和農業生產等方面具有廣泛的應用前景和重要的研究價值。本研究旨在深入探索機器學習技術在NDVI預測領域的應用潛力,旨在通過提升預測的準確性,為地表覆蓋變化監測、生態環境評估和農業生產管理等領域提供精準的數據支持和有價值的科學依據。

近年來,機器學習技術已在土壤、養殖業和草地資源監測等多個領域獲得了廣泛運用。王飛等[14學者使用五種機器學習算法套索算法(Leastabsoluteshrinkageandselectionoperator,LASSO),多元自適應回歸樣條函數(Multivariateadaptiveregressionsplines,MARS),分類與回歸樹(Classificationandregressiontrees,CART),隨機森林(Randomforest,RF),以及隨機梯度增進算法(Stochasticgradientboosting,SGT),在3個不同地理區域(奇臺綠洲、渭-庫綠洲和于田綠洲)預測干旱區土壤鹽分。構建了干旱區域土壤鹽分預測模型。王曉燕等[15]利用RF、反向傳播神經網絡(Backpropagationartificialneuralnetwork,BP-ANN)以及支持向量機(Supportvectormachine,SVM)等算法,成功構建了甘肅省農業干旱監測模型,該模型為不僅為農業干旱的監測提供了有力的技術支持,更為干旱評估提供了更加科學、準確的新途徑,對甘肅省農業生產的持續發展具有重要意義。因此,在使用多種機器學習算法預測NDVI在指導畜牧業生產,科學管理草地資源,避免過度放牧,防止草地退化方面具有十分重要的意義。

共享社會經濟路徑(Shared socioeconomic pathways,SSPs)是研究氣候變化與預估的重要環節,第六次國際耦合模式比較計劃(Coupledmodelintercomparisonprojectphase6,CMIP6)提出了該路徑的設定,使人類社會經濟發展水平與溫室氣體排放相關聯,在能源、水資源、農業等領域和區域的氣候變化影響與風險評估中得到廣泛應用[16-17]。此外,最新推出的CMIP6模式,其分辨率有了較大的提高,氣候模擬能力對中國大部分地區[18]等地區的模擬效果較好,其模擬能力通過了眾多專家學者的驗證。

三江源地區擁有豐富的高寒草地資源,是全球獨特的高寒草地基因庫,具有重要的生態服務功能,也是當地牧民經濟發展的基礎。近年來,全球氣候變暖趨勢日益顯著,對草原生態系統產生了深遠影響,預測NDVI的變化趨勢顯得尤為重要。通過精準預測NDVI,我們能夠及時掌握植被覆蓋度的動態變化,從而為制定和實施針對性的生態保護政策提供科學依據,保障高寒草地生態系統的健康與穩定。因此,有必要全面監測和分析三江源地區NDVI發展趨勢,以揭示高寒草地資源的退化及其時空分布特征,明確高寒草地資源生態系統的安全狀況。植被的生長受當季溫度、降水和風速的影響[19]-[21]。高速風會加速水分蒸發,引發風蝕和沙塵暴。此外,植物對氣象因素有一定的適應性,氣象因素的影響存在滯后期。本研究以三江源地區的NDVI為研究對象,分析2000—2023年三江源地區NDVI的時空變化趨勢;探討了NDVI與溫度、降水、風速和氣壓的關系;并結合CMIP6的共享社會經濟路徑2-4.5情景(Shared socioeconomicpathway2-4.5,SSP2-4.5)和高排放社會經濟路徑5-8.5情 景(Shared socioeconomic pathway 5-8.5,SSP5-8.5)數據集下的溫度、相對濕度和降水等氣象預測數據,對三江源地區未來的NDVI進行模擬。

1 材料與方法

1.1 研究區概況

青海省氣候類型多樣,包括高寒氣候和高原大陸性氣候等,是我國高寒草地面積分布最廣泛的地區之一,在維護西北地區生物圈生態平衡和氣候變化中具有顯著的環境效益和經濟價值。本文選擇的研究區域是青海省三江源地區,包含瑪多(地理位置為 33° 50~35°40N,96°50~99°20E) 、曲麻萊( 33°36 ~35°40 N, 92°56~97°35E )、達日 33°42~ 35°19N,95°21~96°53E) 及玉樹 (31°45~36°10 E)四個地區,它們涵蓋了青藏高原地區典型的草地類型和放牧方式。其中,瑪多地區代表的半干旱高寒草原區海拔 4000m 以上,山原面積寬廣,年降水 100~300mm ,主要生長了紫花針茅為建群種的高寒草原植被,土壤為高寒草原土。該區域僅宜發展畜牧業,并且以羊等小畜為主。曲麻萊為代表的半濕潤高寒草甸區,海拔 4000m 以上,地面完整,主要為山原與高山,多冰川,湖泊和洼地。此地年降水量 300~500mm ,主要土地類型為高寒草甸山原和高寒草甸高山,適宜發展以藏羊等小畜生長為主的畜牧業。達日和玉樹地區代表的高寒半濕潤灌叢草甸與高山草甸區海拔 3800m 以上,地形表現為山原與高山。此區域年降水量 gt;500mm ,主要土地類型陰坡為高寒灌叢草甸,陽坡為高山草甸。所選研究區域均為是我國乃至全球都備受矚目的重要高原草地生態區,對所選研究區域進行NDVI預測有重要意義。

1.2 NDVI數據獲取

為了盡可能全面地了解研究區域長期的植被覆蓋情況,本研究選用了中分辨率成像光譜儀(Moderateresolution imaging spectroradiometer,MODIS)平臺下的MOD13A3數據產品。MOD13A3(V006)數據產品(https://lpdaac. usgs.gov/products/modl3a3v006/)下載自美國航空航天局(NationalAeronauticsand SpaceAdministration,NASA)。該數據為空間分辨率 1km 的月合成產品,包括紅光、藍光、近紅外、中紅外波段的反射率以及NDVI和EVI2個植被指數[22。MOD13A3數據經過了幾何精度校正、輻射校正和大氣校正等預處理步驟,同時采用了最大值合成法(Maximumvaluecomposite,MVC)來減少云、大氣和太陽高度角等因素的影響。此外,MOD13A3數據集也采用了一系列質量控制方法,包括經驗模式分解和交叉輻射定標等,以降低由于衛星軌道漂移和噪音等因素引起的誤差,從而提高了數據的精度和可靠性。數據時間為2000—2023年1—12月。MOD13A3數據可通過NASA的網站免費獲取,為研究青海省的植被覆蓋變化提供了可靠的數據支持。

1.3 氣象數據來源

歷史氣象數據來源于中國氣象數據網(https://data.cma. cn/dataService/cdcindex/datacode/A. 0ol9.0o0l. S00l/show_value/normal.html)中國地面氣象觀測歷史數據集(月值)如表1所示,本文下載了青海省多個數據站點的2000—2023年逐月氣壓,溫度/氣溫,相對濕度,月降水量。其中數據站點分別為曲麻萊、玉樹、瑪多、達日。數據依據氣候研究中心(Climaticresearchunit,CRU)發布的全球0.5氣候數據以及WorldClim發布的全球高分辨率氣候數據,通過Delta空間降尺度方案在中國地區降尺度生成。并用496個獨立氣象觀測點數據進行驗證,驗證結果可信[23]

未來氣象數據下載于國家青藏高原科學數據中心(https://data.tpdc.ac.cn)最新發布的SSPs環境(SSP2-4.5,SSP5-8.5),每個環境包含3個GCMs(EC-Earth3、GFDL-ESM4、MRI-ESM2-0)氣候數據,研究選取GFDL-ESM4中的SSP2-4.5和SSP5-8.5,該數據以聯合國政府間氣候變化專門委員會耦合模式比較計劃第六階段發布的全球空間分辨率 gt;100km 氣候模式數據集和WorldClim發布的全球高分辨率氣候數據集為基礎,通過Delta空間降尺度方案在中國地區降尺度生成數據,空間分辨率為 1km ,再通過重采樣生成 250m 數據集。

表1研究區域各地氣象數據Table1Meteorological data across the study area

1.4NDVI數據提取方法

針對于NDVI數據處理:首先對MOD13A3數據利用MRT(MODIS reprojection tool)工具將原始影像經過拼接、轉換投影后,得到空間分辨率為1km的Tiff格式數據,之后統一定義坐標系為WGS_84。之后利用MRT(MODISreprojectiontools)和Arcgis工具對下載的遙感影像數據進行拼接,掩膜提取和投影轉換等預處理,其中掩膜為各地區的shp文件。之后使用Arcgis的柵格計算器對數據進行去除異常填充值,將有效值一2000至10000以外的無效值數據置為空值,將有效值乘以轉化因子0.0001等數據處理,提取出所需的數據集如表2所示。

表2研究區域各地區NDVI值

2機器學習模型構建

2.1機器學習算法選擇和模型構建

在本研究中,為了深人探討研究地區氣象條件與植被生長之間的內在聯系,我們采用了四種主流的機器學習算法:梯度提升回歸樹(Gradientboostingregressiontree,GBRT)、隨機森林回歸(Randomforestregression,RFR)、自適應回歸(Adaboostregression,ADA)以及神經網絡回歸(Neuralnetworkregression,NNR)。GBRT通過迭代構建多個弱學習器,有效捕捉復雜非線性關系,適用于高維數據;ADA通過加權組合弱學習器,具備魯棒性,能夠減小數據噪聲干擾,對難以預測的樣本施加更高的關注度;RFR通過引入隨機性,減少了過擬合問題,并且能夠評估特征的重要性,有助于理解特征對預測的影響;NNR以其強大的表達能力和學習復雜模式的能力,適應多種數據結構,尤其擅長捕捉深層次非線性關系。這種多算法對比的方法不僅有助于揭示各算法的優缺點,還能確保預測模型的穩健性和研究結論的可靠性。

研究流程首先涉及對所收集的氣象數據通過ArcGIS軟件投影裁剪以及重采樣等處理,使氣象數據空間分辨率與NDVI數據集一致,并進行特征提取。此外,在本研究中,由于氣象數據各變量的量綱和取值范圍存在顯著差異,為了確保模型訓練過程中各變量能夠被均衡地考慮,本實驗對所有變量進行了標準化處理。以確保數據質量并增強模型的解釋力。對于一個具有均值為 μ 和標準差為 σ 的變量 x ,標準化后的變量 x 通過以下公式計算:

隨后,我們將處理后的數據集劃分為訓練集和測試集,隨機打亂取其中 80% 數據作為訓練集來訓練所有的機器學習算法,然后用剩余 20% 數據作為測試集,將其與衛星獲取的同時期測試集數據進行對比,來分析模型的穩定性或魯棒性。同時,我們引人了 Δk -fold交叉驗證技術來增強模型的穩健性及其泛化能力。GBRT模型的具體產生過程如下:

假設數據集為 yN) },損失函數為 L(y,f(x)) ,每棵回歸樹的葉節點數為 J ,將其輸人空間分割成 J 個不相交區域R1m,R2m,…,RJm ,并為每一個區域估計一個常量值bjm 。回歸樹 用公式表示為:

其中, .I(x∈Rjm 是指示函數,用來判斷輸入樣本 x 是否屬于區域 Rjm 。如果 x 落在區域 Rjm 中,則I(x∈Rjm)=1 ,否則為0。這個指示函數幫助定義回歸樹 在各個區域上的輸出。

步驟1:模型的初始化:構建一個初始模型f0(x),ρ 為常數值,表示根節點的類別,其目標是最小化所有樣本的損失函數

步驟2:負梯度的計算:設 m=1,2,…,M 表示迭代次數,迭代生成 M 棵回歸樹,即生成弱學習器的個數,記 m 表示第 m 棵樹:對于所有的樣本 N,i=

1,2…,N,i 表示第 i 個樣本,對每個樣本 i 計算損失函數 L(yi,f(x)) 的負梯度。負梯度 rim 被視為當前模型在樣本 i 上的殘差,它用于指導后續回歸樹的構建。這個負梯度反映了當前模型與目標值之間的偏差。

針對上一步產生的殘差生成一棵回歸樹gm(x) ,將第 Σm 棵樹的輸入空間分割成 J 個不相交區域 R1m Φ?1m,R2m,…,RJm ,并計算梯度下降的步長:

步驟3:更新模型,學習效率 lr 是一個用于控制模型每次更新時步長的超參數,它決定了每棵樹對最終模型的貢獻程度。學習率在梯度提升算法中的作用是通過縮小每一棵樹的預測值,防止過擬合,幫助模型逐步逼近最優解:

fm(x)=fm-1(x)+lrρmgm(x)

其中: fm(x) 是第 ?m 輪的預測值, fm-1(x) 是第m-1 輪的預測值, lr 是學習效率, ρm 是每棵樹的步長系數,通常通過最小化損失函數來確定, 是第 Ωm 棵樹的預測值。

步驟4:輸出模型 fm(x) 。

GBRT模型的預測精度主要受到回歸樹的數量 (M) 、學習效率(r)和樹的葉節點數 (J) 的影響,其中回歸樹的棵樹表示基礎學習器的數量,學習率則是為防止模型過度擬合而設置的,以縮減每個基模型對于最終結果的影響,而樹的葉節點數表示每棵回歸樹的最大深度或最大分裂次數,即決策樹的復雜度[24]。以上3個參數的優化和選擇過程將在后文中進一步論述。

2.2參數調優和模型驗證

以梯度回歸樹作為代表,使用不同數量的回歸樹的數量( 50~400 )、不同的學習率 (0,01~0.25) 和樹的葉節點數(3~5)來訓練模型,以觀察各參數對于模型預測精度的影響。同時為了評估模型優劣,使用均方誤差作為預測模型的評價指標,定義如下:

式中: n 是樣本數量, ni 是第 i 個樣本的真實目標值, 是第 i 個樣本的模型預測目標值。均方誤差的使用是為了在優化過程中,優化器能夠最小化這個指標,表示模型的擬合效果越好。

如圖2所示,學習率在模型訓練過程中扮演著關鍵角色,其主要功能是防止模型過度擬合,讓其預測能力受損。學習率通過調整每個回歸樹的貢獻程度來實現。通常情況下,較低的學習率會減少每棵樹對最終模型的貢獻,從而需要更多的回歸樹來構建最優模型。當回歸樹的數量固定時,不同學習率下的模型表現存在顯著差異。較高的學習率可能會在訓練初期更快地提高預測精度,但較低的學習率則更有可能獲取更高的預測精度,即模型的泛化能力更強[25]

在分析學習率對模型性能的影響之后,本研究采用網格搜索法來確定最優的模型參數。網格搜索是一種全面且高效的參數優化方法,它通過系統地遍歷預先定義的參數組合來尋找最佳參數設置[26]。通過這種方法,我們能夠找到在特定學習率下,模型在訓練集和測試集上均表現出最佳性能的參數組合。這一過程不僅確保了模型的穩健性,而且提高了模型的預測準確性。

2.3 特征因子分析

為了提高模型的預測準確性和泛化能力,本文從原始數據集中刪除了一些不相關或多余的特征。圖3描述了所有特征的相關性矩陣。從中觀察到,NDVI的月均值與溫度的相關性尤為顯著, R2 高達0.79,這充分表明溫度與NDVI均值之間存在強烈的正相關性。此外,降水量與NDVI均值的相關性也較強, R2 高達0.75,顯示出降水量與平均值之間存在明顯的正相關關系。對于相對濕度與壓強,其與NDVI月均值的相關性系數分別為0.68和0.78,意味著相對濕度、壓強與平均值之間存在較強的正相關性。然而,風速、海拔與平均值呈負相關性,且風速的相關性相對較弱, R2 僅為一0.19。依據這些相關性,刪除了風速這一因子,因為它對NDVI的影響較小,不能夠有效地預測NDVI。

圖3各特征因子的相關性矩陣Fig.3Correlationmatrix for each eigenfactor

2.4 預測結果分析

圖4展示了在采用梯度提升回歸模型對四個地區氣象數據進行預測時各特征的重要性占比。橫坐標代表特征重要性評分,縱坐標代表各特征因素。分析結果發現,溫度的特征重要性最高,達到了0.6486,這充分說明了溫度在氣象預測模型中的核心地位。緊隨其后的是海拔與氣壓,其重要性為0.1362和0.0946,雖然與溫度相比較低,但這兩個因素仍對預測結果產生了積極的貢獻,對此我們分析認為海拔以及氣壓影響植被類型間接與氣溫有關,因此海拔和氣壓的重要性較高。其次是相對濕度的重要性較低,為0.0921,顯示出該特征在預測中的影響較小。相比之下,降水量的重要性最低,僅為0.0285。綜上所述,所選四個研究地區的氣象數據預測因子中,溫度是最主要的影響因素,而其他特征的影響則相對較小。

圖5顯示的是瑪多地區作為具體案例的學習曲線。縱坐標代表訓練得分情況,橫坐標代表訓練樣例。對所研究的四種機器學習算法(GBRT,RFR,ADA和NNR)的學習曲線進行詳細分析,能為模型選擇和優化提供重要依據[27]。因為學習曲線是評估模型性能隨訓練樣本數量變化的重要工具。如圖5(d)對NNR學習曲線的分析發現,隨著訓練樣本數量的增加,訓練得分與交叉驗證得分之間的差距逐漸縮小。這表明模型在逐漸提高對訓練數據和新數據的泛化能力。然而隨著樣本數量的進一步增加,兩者得分均趨向于收斂至較低水平(0.8左右),模型泛化能力適中。相較之下,GBRT,RFR,ADA三種模型的學習曲線表現出更為穩定的趨勢。這些模型中,訓練得分與交叉驗證得分之間的差距較小,且隨著訓練樣本數量的增加,兩者的得分趨勢保持一致,值均高達0.85以上,且未出現明顯的欠擬合或過擬合問題[28]。綜合比較各模型的學習曲線趨勢,可以明確GBRT模型表現最為出色。無論是訓練數據還是交叉驗證數據,其得分均保持在較高水平,并且隨著訓練樣本數量的增加,得分穩定性良好,未出現明顯的欠擬合或過擬合問題。

圖4四個地區GBRT模型下特征值重要性Fig.4Importance of eigenvalues under in the GBRT model for the four regions

圖6顯示的是瑪多地區四種模型典型案例的殘差圖。縱坐標代表模型預測值的殘差值大小,橫坐標代表模型預測的數值。如圖6(a)在GBRT模型中,學習曲線呈現出訓練分數與交叉驗證分數均高且穩定的特點。同時,殘差隨著預測值的上升,維持在0附近呈隨機分布,這充分證明該模型具備優秀的擬合和泛化能力[29-30]。RFR和ADA模型的殘差圖也顯示殘差在0附近隨機分布,盡管略有模式化傾向,但整體表現依然良好。以上三種模型的波動都在 -0.06~0.06 之間。相對而言,NNR的殘差呈現出較大的波動,在 -5.0~7.5 之間,比其他模型波動較大。綜上所述,GBRT模型在擬合與泛化能力上達到了較為理想的平衡,因此被認定為是四種模型中的最佳選擇。

圖6瑪多地區四種模型下的殘差圖Fig.6Residual plots in the four models for theMaduo region

圖7顯示的是四個研究區域四個模型的預測值與真實值的擬合圖,縱坐標代表NDVI目標值,橫坐標代表預測的時間節點。對比玉樹、曲麻萊、達日、瑪多四個地區NDVI值的機器學習模型預測結果比較。為確保實驗的準確性,我們在實驗過程中隨機選取數據作為訓練集和測試集,并且采用了 Δk -fold交叉驗證方法進行建模和驗證。這一措施有效提升了模型的魯棒性和泛化能力。我們發現GBRT模型在多數地區展現出較高的預測準確性,其 R2 均在0.90及以上,尤其在達日地區,高達0.95。相比之下,RFR模型也表現出較好的預測能力,其 R2 也均在O.9O及上,但在MSE略遜于GBRT模型。ADA模型的 R2 均低于0.92。NNR模型在多個地區的預測中存在明顯的偏差,其 R2 低于0.87。總體而言,GBRT模型在此研究中表現出最佳的預測性能。

MODS13A3數據集更新頻率為每月一次,氣象數據通常早于MODIS數據發布,本研究的未來氣象數據集使用了CMIP6的SSP2-4.5、SSP5-8.5數據集下提供的氣溫、相對濕度、降水等氣象數據,進行NDVI預測。眾多研究已經證明了使用該未來氣象數據集預測NDVI的可行性[31-33]。我們的研究以達日地區為例,預測達日地區未來一年的NDVI變化情況。如圖8顯示的是使用GBRT算法得出的達日地區未來一年月均NDVI的預測值(縱坐標),橫坐標為日期。SSP2-4.5、SSP5-8.5排放情景下,預測結果均與真實值整體趨勢一致,精度均較高。如圖所示,在SSP5-8.5排放情景下,未來達日地區的NDVI還會緩慢上升,與整體趨勢相同。

圖8GBRT預測未來一年達日地區月均NDVI值

圖9分析了在SSP5-8.5排放情景下,如果氣象條件發生顯著變化,如溫度驟降、溫度急劇升高、干旱洪澇、相對濕度巨大變化對該地區NDVI的影響,供相關機構做出正確決策,保護當地農牧業的發展。如圖所示,溫度的變化會使得NDVI發生較大波動。當溫度增加或者減少 5% 會使得NDVI出現大幅度降低的情況。說明了溫度對于NDVI特征重要性占比較高,而相對濕度和壓強的變化也顯著影響NDVI的穩定性。當相對濕度增加 5% 后,研究區域NDVI值明顯提高,反之明顯降低。在壓強增加的情況下,NDVI顯著提升,在壓強減小的情況下,NDVI變化波動并不明顯。對于降水,其變化對于NDVI的波動影響較小。該現象與前文實驗結果一致。該預測結果為該地區如何應對全球變暖的問題提供了科學依據,有助于相關機構制定有效的保護措施,確保當地農牧業的可持續發展。

圖9GBRT預測的達日地區氣候變化影響下月均NDVI值Fig.9Monthly NDVI under climate change impacts predicted by GBRT in Dari district

3討論

本研究對四種回歸模型在四個研究地區的預測性能進行了全面的評估。如表3所示,ADA回歸模型的表現處于中等水平,其 R2 處于0.87452至0.92187之間,而NNR模型的整體性能相對較弱,MSE值比其他模型高, R2 值較低,處于0.74821至0.85895之間。RFR模型在多數地區表現良好,這與李彩琳等[34]指出的RFR算法對羌塘草原NDVI模擬精度較高研究表現一致。但相較GBRT模型,其MSE和 R2 數值稍遜一籌。GBRT模型在各地區的綜合表現中均顯著優于其他模型。其平均均方誤差(MSE)極低,僅在 0.00045~0.00104 之間, R2 值最高,達到0.95087,顯示出對各地數據的強大擬合能力[35]。GBRT具有高預測性能以及靈活性,能夠適應各種類型和復雜度的數據,包括連續數據、離散數據和混合類型的數據,而且對于缺失值和異常值具有較強的魯棒性;其次GBRT能夠準確捕獲數據集中的復雜模式和非線性關系,從而產生精準的預測結果[36]。因此,基于以上評估結果可以斷定:梯度提升回歸模型在不同地區的數據集上均展現出穩健的預測性能,是最佳的回歸模型。

表3研究區域四種算法擬合精度對比Table3Comparison of the fitting accuracy of the four algorithms in the study area

氣象因素無疑是影響NDVI的關鍵因子。在所有預測結果中,都隱含著一個假設:將來的氣候狀況與過去幾十年大致相仿。如果隨著全球氣候變化,未來的氣候與過去存在較大偏差,則預測結果的可靠性要受損。對于影響NDVI的主要氣象因素,不同學者有不同的看法。有些學者認為氣溫是主要因素,而另一些學者則認為降水起關鍵作用。卓嘎等指出降水量和熱量條件均是高原植被生長的影響因素,降水與植被覆蓋的影響較氣溫密切。本研究發現,青海省三江源地區NDVI與氣溫有顯著相關性。Zhang等38利用GIMMSAVHRR數據集和氣候數據集MERRA指出青藏高原夏季溫度與NDVI的相關性較高,為 R2=0.62 。韓炳宏等[39]基于2000—2018年MODISNDVI數據及氣象數據,探討了青藏高原地區NDVI的時空變化趨勢及其與氣溫、降水的關系,研究發現青藏高原地區NDVI與同期氣溫和降水均顯著相關,但與氣溫的關系更密切。孟夢等[40]指出溫度對高海拔地區

NDVI的影響超過降水,且降水對青藏高原NDVI的影響具有滯后性。這些結果均與本文的研究一致。而出現這些差異的原因可能在于不同地區對氣溫和降水的敏感度有所不同。此外,研究的時間、所用的數據以及研究方法的差異也可能導致結果不一致[41]。

圖10分析了研究區域NDVI近20年來變化趨勢,本研究發現青海省三江源地區整體NDVI呈波動上升狀態。其中,李達等[42]基于MOD09A1數據反演青藏高原生長季植被NDVI分析其時空特征和空間差異時,發現2001一2018年間青藏高原生長季NDVI呈緩慢上升趨勢,且空間差異明顯。馮秀燕[21]基于MODIS-NDVI3g數據分析2000—2020青海省及各子區域NDVI的時間變化趨勢、突變特征、空間分布特征以及未來變化趨勢等,發現2000—2020年青海省植被以 0.015?10a-1 速率呈改善變化趨勢,極大值常出現在2018年及其以后。這些發現均與本文研究結果一致。

圖10四個研究區域2000一2023年八月份NDVI變化圖Fig.10NDVI changes from August 2OOO to 2O23 in the four study areas

本研究還存在一定的局限性。例如,由于數據源的限制,本研究只針對青海省三江源地區4個區域進行了NDVI預測,對于其他地區是否適用還需要進一步驗證。此外,雖然梯度提升回歸樹在本研究中表現出色,但在實際應用中可能還需要結合其他算法或方法進行優化[43-45],其次遙感圖像的精度也會影響最終結果,本研究采用的MOD13A3空間分辨率為 1km[46-47] ,后續實驗如果采用更高精度的遙感圖像數據,會對預測結果準確性能提供更高的保障。雖然氣象因素對NDVI起著舉足輕重的作用,但它們不是全部因素。在局部地區,光照,地形和海拔高度對NDVI都會施加一定的影響。為了更精確的預測NDVI,將來的研究可以考慮DEM(數字地面高程)數據,相信預測精度在現有的基礎上還會有所提升。這是因為青藏高原地區海拔高,地形復雜多變,湖泊濕地分布廣泛。在很高海拔地區,植物無法生長,水域廣闊的地方也沒有植被,NDVI應該賦0。

綜上所述,本研究通過機器學習技術對青海省三江源地區典型區域的NDVI進行了預測,結果能為當地的畜牧業發展提供一定的指導,為設置合理的牲畜量和放牧強度提供了確鑿的科學證據。此外,本研究也為機器學習在其他領域的應用提供了有益的啟示。

4結論

本研究聚焦于青海省三江源地區NDVI的預測方法,通過結合機器學習技術,遙感技術和氣象數據,成功構建了四種機器學習模型(分別為梯度提升回歸樹、自適應增強回歸、隨機森林以及神經網絡)。其中,基于梯度提升回歸樹的預測模型表現最好。該模型在訓練與測試過程中均展現出較高的準確性和穩定性,在預測未來兩年內月均NDVI方面取得了極高的精度。同時,在氣象數據用來預測NDVI中,溫度作為特征的重要性占比最高。本研究結果為青海省三江源地區的生態環境監測和農業生產活動提供了科學、可靠的依據。通過嚴謹的數據處理、算法選擇及模型調優,本研究為氣候變化條件下三江源地區植被覆蓋度預測提供了有力的技術支撐。

參考文獻

[1]崔燦,郭英,沈彥俊.新疆荒漠植被的時空分布變化及其驅動因素[J].中國生態農業學報,2021,29(10):1668-1678

[2]SHIL,FANHJ,YANGLY,etal.NDVI-based spatial andtemporal vegetation trends and their response to precipitationandtemperature changes in the Mu Us Desert from 2O0O to2019[J].Water Science and Technology,2023,88(2):430-442

[3] 李雪銀,孫愛芝,吳雙雙.黃土高原表土花粉與植被覆蓋度定量模型的建立及應用[J].第四紀研究,2023,43(5):1309-1327

[4]方春爽,朱睿,盧睿,等.基于GEE的石羊河流域植被覆蓋變化特征及其影響因素分析[J].遙感技術與應用,2023,38(5):1167-1179

[5] 田曉鳳,張,李俞.關中平原城市群氣候變化和人類活動對植被NDVI變化的影響[J].安徽農業科學,2024,52(5):68-73,78

[6]吉珍霞,裴婷婷,陳英,等.2001—2020年青藏高原草地NDVI時空變化及驅動因子分析[J].草地學報,2022,30(7):1873-1881

[7]孔冬冬,張強,顧西輝,等.植被對不同時間尺度干旱事件的響應特征及成因分析[J].生態學報,2016,36(24):7908-7918

[8]康堯,郭恩亮,王永芳,等.溫度植被干旱指數在蒙古高原干旱監測中的應用[J].應用生態學報,2021,32(7):2534-2544

[9]尹振良,馮起,王凌閣,等.2000-2019年中國西北地區植被覆蓋變化及其影響因子[J].中國沙漠,2022,42(4):11-21

[10]靳專,胥燾,黃應平,等.三峽庫區消落帶植被NPP估算基于機器學習優化CASA模型[J].生態學報,2024,44(6):2464-2478

[11]劉愛霞.中國及中亞地區荒漠化遙感監測研究[D].北京:中國科學院研究生院(遙感應用研究所),2004:123-124

[12]姚付啟.冬小麥高光譜特征及其生理生態參數估算模型研究[D].楊凌:西北農林科技大學,2012:103-106

[13]VANNOPPENA,GOBINA.Estimatingfarm wheat yieldsfromNDVI and meteorological data[J].Agronomy,2021,11(5):946-946

[14]王飛,楊勝天,丁建麗,等.環境敏感變量優選及機器學習算法預測綠洲土壤鹽分[J].農業工程學報,2018,34(22):102-110

[15]王曉燕,李凈,邢立亭.基于3種機器學習方法的農業干旱監測比較[J].干旱區研究,2022,39(1):322-332

[16]WANGYJ,XIEZK,MALHISS,et al.Effects of rainfallharvesting and mulching technologies on wateruse effciencyand crop yield in the semi-arid Loess Plateau,China[J].Agri-cultural Water Management,2009,96(3):374-382

[17]KHAN SU,WANG XK,MEHMOOD T,et al. Comparison oforganic and inorganic mulching for weed suppression in wheatunderrain-fed conditionsof Haripur,Pakistan[J].Agronomy,2021,11

[18]王意錕,金愛武,方升佐.浙西南毛竹林覆蓋對土壤滲透性及生物特征的影響[J].應用生態學報,2017,28(5):1431-1440

[19]張中華,周華坤,趙新全,等.青藏高原高寒草地生物多樣性與生態系統功能的關系[J].生物多樣性,2018,26(2):111-129

[20]劉夢楠.北方城市森林公園訪客表情的時空分異及藍綠空間體驗驅動研究[D].沈陽:沈陽農業大學,2023:62-67

[21]馮秀燕.1961-2020年青海省主要極端氣候變化特征及其對植被NDVI的影響研究[D].蘭州:西北師范大學,2022:58-59

[22]劉靖宇,李遠斌,董昊,等.基于多源時空數據的冬小麥產量預測模型[J].江蘇農業科學,2023,51(19):198-208

[23] PENG S Z,DING Y X,LIU W Z,et al. 1 km monthly tem-perature and precipitation dataset for China from 19Ol to 2017[J]. Earth System Science Data,2019,11(4):1931-1946

[24] JIANG S,LI J Y,ZHANG S,et al. Landslide risk predictionby using GBRTalgorithm:Applicationof artificial intelligencein disaster prevention of energy mining[J].Process Safety andEnvironmental Protection,2022,166:384-392

[25]龔越,羅小芹,王殿海,等.基于梯度提升回歸樹的城市道路行程時間預測[J].浙江大學學報(工學版),2018,52(3):453-460

[26]王燕,郭元凱.改進的XGBoost模型在股票預測中的應用[J].計算機工程與應用,2019,55(20):202-207

[27]羅璇,周敏,李莉.基于人工神經網絡的茄子皮紫色素的提取研究[J].中國調味品,2018,43(10):176-180

[28]張曉夢.北方漢族人群38個Y-STR基因座檢測和容差分析并應用機器學習預測親緣關系的探索研究[D].太原:山西醫科大學,2022:25-32

[29]章明清,李娟,孔慶波,等.作物肥料效應函數模型研究進展與展望[J].土壤學報,2016,53(6):1343-1356

[30]錢瑩,方秀男.多元線性回歸模型及實例應用[J].中國科技信息,2022,(4):73-74

[31]張云峰,向東,佘濟云,等.2種氣候環境的湖南省2021—2050年歸一化植被指數時空動態變化預測[J].東北林業大學學報,2024,52(1):46-53,91

[32]傅迎豪.基于機器學習的CMIP6優選模式集對區域作物需水量的預測分析研究[D].銀川:寧夏大學,2023:4-74

[33]桑春云.三江源地區干旱特征分析及未來干旱預測[D].南京:南京信息工程大學,2023:14-75

[34]李彩琳,宋彥濤,張靖,等,基于隨機森林算法的羌塘草原NDVI時空格局及其預測模型[J].生態學雜志,2024,43(6),1664-1673

[35]張仕良.基于深度神經網絡的語音識別模型研究[D].合肥:中國科學技術大學,2017:95-107

[36]史永勝,翟欣然,胡巧珺.基于機器學習的鈉離子電池剩余使用壽命預測[J.華南師范大學學報(自然科學版),2023,55(3):17-24

[37]卓嘎,陳思蓉,周兵.青藏高原植被覆蓋時空變化及其對氣候因子的響應[J].生態學報,2018,38(9):3208-3218

[38]ZHANGL,GUOH,WANGC,etal.Thelong-term trends(1982-2Oo6)in vegetation greenness of the alpine ecosystemintheQinghai-TibetanPlateau[J].Environmental EarthSci-ences,2014,72(6):1827-1841

[39]韓炳宏,周秉榮,顏玉倩,等.2000-2018年間青藏高原植被覆蓋變化及其與氣候因素的關系分析[J].草地學報,2019,27(6):1651-1658

[40]孟夢,牛錚,馬超,等.青藏高原NDVI變化趨勢及其對氣候的響應[J].水土保持研究,2018,25(3):360-365,372

[41]金哲人,馮琦勝,王瑞涇,等.基于MODIS數據與機器學習的青藏高原草地地上生物量研究[J].草業學報,2022,31(10):1-17

[42]李達,林龍圳,林震,等.黃河流域生態保護和高質量發展的EKC檢驗[J].生態學報,2021,41(10):3965-3974

[43]李倩.基于深度學習的草地產草量預測方法研究[D].包頭:內蒙古科技大學,2022:40-41

[44]于文濤.復雜地表時空連續植被參數遙感反演方法研究[D].北京:中國科學院大學(中國科學院空天信息創新研究院),2021:97-100

[45]厲方楨,朱華忠,李愈哲,等.阿勒泰地區草地表層土壤容重的空間格局分析[J].草業科學,2018,35(12):2801-2811

[46]李佳儀,馬小花,喬麗娜,馬莉,卞瑩瑩.中國北方農牧交錯區生態系統服務價值時空變化特征及驅動力分析[J].草地學報,2024,32(7):2263-2272

[47」楊涵,孫慧蘭,葉茂,等.伊犁河谷植被物候變化特征及其對氣候變化的響應[J].草地學報,2024,32(3):859-868

(責任編輯付宸)

猜你喜歡
模型研究
一半模型
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲高清日韩heyzo| 国产AV毛片| 久综合日韩| 试看120秒男女啪啪免费| 少妇被粗大的猛烈进出免费视频| 成年免费在线观看| 久久国产精品无码hdav| 色综合成人| 91精品伊人久久大香线蕉| 国产精品一区二区久久精品无码| 91福利国产成人精品导航| 成人福利在线观看| 久久99蜜桃精品久久久久小说| 国产浮力第一页永久地址| 亚洲国产日韩视频观看| 国产成人精品一区二区免费看京| 午夜啪啪福利| 亚洲欧美天堂网| 2020国产在线视精品在| 日韩精品亚洲一区中文字幕| 亚洲 欧美 偷自乱 图片| 亚洲精选高清无码| 久草视频一区| 在线亚洲小视频| 日本少妇又色又爽又高潮| 波多野结衣国产精品| 亚洲一区二区约美女探花| 久久精品丝袜| 成人国产免费| 日韩av高清无码一区二区三区| 国产精品99久久久久久董美香 | 欧美高清国产| 亚洲欧美一区二区三区麻豆| 成人av手机在线观看| 在线免费观看a视频| 亚国产欧美在线人成| 一级毛片在线直接观看| 国产青榴视频在线观看网站| 999国产精品| 亚洲午夜国产精品无卡| 污污网站在线观看| 波多野结衣一级毛片| 亚洲精品图区| 亚洲无码视频一区二区三区 | 国产人成午夜免费看| 欧美亚洲一区二区三区在线| 不卡无码网| 中文字幕亚洲综久久2021| 色综合久久88色综合天天提莫 | 2021国产在线视频| 国产乱子伦精品视频| 在线国产毛片手机小视频| av大片在线无码免费| 香蕉久久国产精品免| 国产对白刺激真实精品91| 国产精品不卡永久免费| 99精品久久精品| 亚洲中文字幕无码爆乳| 亚洲视频a| 好吊色国产欧美日韩免费观看| 91无码网站| 在线观看欧美精品二区| 一级爱做片免费观看久久| 亚洲一级毛片免费看| 久久99精品久久久久久不卡| 波多野一区| 亚洲香蕉久久| 国产精品男人的天堂| 精品第一国产综合精品Aⅴ| 久久久91人妻无码精品蜜桃HD| 一级毛片在线免费看| 国产精品网址在线观看你懂的| 在线观看无码av五月花| 亚洲精品视频免费观看| 永久免费无码日韩视频| 天天色综网| 国产乱人伦AV在线A| 福利在线不卡| 久久性妇女精品免费| vvvv98国产成人综合青青| 亚洲精品视频免费| 亚洲日本精品一区二区|