999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于國產(chǎn)資源一號02D衛(wèi)星和機(jī)器學(xué)習(xí)算法的欽州灣濱海土壤鹽分反演

2024-01-29 07:58:22田義超鄭丹琳黃友菊張亞麗林俊良姚貴釗姚媛元北部灣大學(xué)資源與環(huán)境學(xué)院北部灣海洋發(fā)展研究中心廣西欽州55000北部灣大學(xué)廣西北部灣海洋環(huán)境變化與災(zāi)害研究重點(diǎn)實(shí)驗(yàn)室海洋地理信息資源開發(fā)利用重點(diǎn)實(shí)驗(yàn)室廣西欽州55000廣西壯族自治區(qū)自然資源遙感院廣西南寧50028
中國環(huán)境科學(xué) 2024年1期
關(guān)鍵詞:模型研究

田義超,鄭丹琳,張 強(qiáng),盧 芳,黃友菊,陶 進(jìn),張亞麗,林俊良,姚貴釗,姚媛元(.北部灣大學(xué)資源與環(huán)境學(xué)院,北部灣海洋發(fā)展研究中心,廣西 欽州 55000;2.北部灣大學(xué),廣西北部灣海洋環(huán)境變化與災(zāi)害研究重點(diǎn)實(shí)驗(yàn)室,海洋地理信息資源開發(fā)利用重點(diǎn)實(shí)驗(yàn)室,廣西 欽州 55000;.廣西壯族自治區(qū)自然資源遙感院,廣西 南寧 50028)

土壤鹽漬化又稱土壤鹽堿化,指在自然和人為作用下土壤表層鹽分含量不斷增加,以至超過某一限度的現(xiàn)象和過程.近年來隨著人為破壞、自然環(huán)境變化以及海平面不斷上升,土壤鹽堿化成為了糧食產(chǎn)量不斷減少的誘因之一.據(jù)估計,全球約有2.3 億hm2的灌溉土地和4500 萬hm2的農(nóng)田受到鹽堿化的影響[1].因此,為了農(nóng)田的可持續(xù)發(fā)展,對土壤鹽分進(jìn)行估算、監(jiān)察,實(shí)現(xiàn)大范圍土壤鹽分制圖刻不容緩.

國內(nèi)外利用衛(wèi)星遙感進(jìn)行土壤鹽漬化監(jiān)測研究始于20世紀(jì)70年代[1-2].1992年,Dwivedi 等[3]通過 TM 影像研究了印度恒河沖積平原土壤鹽漬化問題,他們發(fā)現(xiàn)不同波段組合會對土壤鹽漬化的估算結(jié)果產(chǎn)生影像.隨著科技的進(jìn)步,研究方法日趨成熟,研究者們開始嘗試構(gòu)建不同的土壤鹽分反演模型,主要分為兩類,一是利用統(tǒng)計方法進(jìn)行建模,主要的統(tǒng)計方法有偏最小二乘回歸(PLSR)[4]、逐步多元線性回歸(SMLR)[5]等,其中偏小二乘回歸被證明相較于其他回歸方法能夠提供更好的預(yù)測精度[6-9].二是利用機(jī)器學(xué)習(xí)方法進(jìn)行建模,主要有神經(jīng)網(wǎng)絡(luò)(NN)[10]、支持向量機(jī)(SVM)[11]、隨機(jī)森林回歸(RFR)等[12],其中神經(jīng)網(wǎng)絡(luò)算法[13]由于其收斂速度快等優(yōu)勢被廣泛使用.Wang 等[14]基于不同的數(shù)據(jù)源創(chuàng)建Bootstrap-BP 土壤鹽分反演模型,認(rèn)為與以往研究中光譜指標(biāo)的線性回歸模型相比,Bootstrap-BP 模型的預(yù)測精度有很大提高.2017年Vermeulen 等[15]分別建立神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹(DT)和隨機(jī)森林4 個模型對南非Vaalharts 和Breede 區(qū)域的鹽分進(jìn)行遙感監(jiān)測,結(jié)果表明利用高程及其導(dǎo)數(shù),結(jié)合地統(tǒng)計學(xué)和最大似然法,能夠很好的識別鹽漬土.Wang 等[16]采用偏最小二乘回歸、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、支持向量機(jī)和隨機(jī)森林四種預(yù)測建模方法對土壤鹽度進(jìn)行建模和估計.2020年Wang 等[17]以新疆干旱荒漠地區(qū)土壤鹽分為研究對象,比較了兩種遙感數(shù)據(jù)源(OLI 和MSI)在土壤鹽度監(jiān)測中的性能,發(fā)現(xiàn)MSI 數(shù)據(jù)集與Cubist 模型的組合總體上具有更好的模型性能和精度指標(biāo).

隨著科學(xué)技術(shù)的發(fā)展,越來越多的機(jī)器學(xué)習(xí)方法被引入到土壤鹽分的反演中,但較少涉及到集成學(xué)習(xí).集成學(xué)習(xí)主要有Bagging 算法[18]、Boosting 算法[19]和Stacking 算法等,其中Boosting 算法可以將弱學(xué)習(xí)者轉(zhuǎn)換為強(qiáng)學(xué)習(xí)者以提高模型的準(zhǔn)確性,該算法有極端梯度Boosting(XGBoost)、分類Boosting(CatBoost)、自適應(yīng)Boosting(AdaBoost)、輕梯度Boosting(LightGBM)和梯度提升決策樹(GBDT).王飛等[20]以我國新疆為研究區(qū),比較了5 種機(jī)器學(xué)習(xí)算法構(gòu)建的土壤鹽分含量反演模型,認(rèn)為隨機(jī)梯度增進(jìn)算法(SGT)預(yù)測精度相對最高.2021年Ma 等[21]人通過對新疆塔里木盆地中北部渭-庫綠洲的土壤鹽漬化進(jìn)行研究,發(fā)現(xiàn)XGBoost 模型的預(yù)測精度優(yōu)于分類與回歸樹和隨機(jī)森林.這類算法具有更準(zhǔn)確的預(yù)測性能,在模型預(yù)測能力優(yōu)于參數(shù)回歸模型,被廣泛應(yīng)用于空氣質(zhì)量監(jiān)測[22]、災(zāi)害預(yù)測[23]、水質(zhì)反演[24]等,但目前在研究土壤鹽分方面,利用集成學(xué)習(xí)方法對土壤鹽分反演的相關(guān)研究較少.

濱海鹽漬土主要是由沿海地區(qū)鹽漬淤泥發(fā)育而成,積鹽過程的鹽分補(bǔ)給方式主要是海水浸漬以及海水倒灌[25].欽州灣位于廣西沿海中部,屬于我國北部灣的一部分,是廣西重要的海灣,其作為南亞熱帶濱海平原區(qū),自然環(huán)境復(fù)雜多變,生態(tài)脆弱性較高[26-27].同時,隨著城市化、港口建設(shè)和填海等人為活動的加劇,欽州灣濱海區(qū)域環(huán)境壓力逐漸增加,土壤質(zhì)量、農(nóng)業(yè)生產(chǎn)和區(qū)域生態(tài)系統(tǒng)的安全受到嚴(yán)重影響.但目前關(guān)于該地區(qū)土壤鹽分空間分布狀況及分布規(guī)律還尚無文獻(xiàn)可循.有鑒于此,本研究以廣西欽州灣濱海區(qū)域土壤為研究對象,以國產(chǎn)資源一號02D 衛(wèi)星作為數(shù)據(jù)源并從中提取特征變量.利用AdaBooost、LightGBM、XGBoost、RFR 以及CatBoost 五種不同機(jī)器學(xué)習(xí)算法,設(shè)置了5 種不同變量組合來研究不同機(jī)器學(xué)習(xí)算法及不同變量組合對模型精度的影響,并基于最優(yōu)算法的最優(yōu)變量組合對研究區(qū)域內(nèi)的土壤鹽分進(jìn)行預(yù)測.本研究的3個主要目標(biāo)如下:(1)比較不同機(jī)器學(xué)習(xí)模型在估算土壤鹽分方面的性能;(2)確定不同變量組中特征變量對機(jī)器學(xué)習(xí)模型精度的影響;(3)驗(yàn)證不同特征變量對模型重要性的貢獻(xiàn).

1 材料與方法

1.1 研究區(qū)概況

研究區(qū)選取位于欽州灣濱海地區(qū)的一處水田,介于21°38′10″~21°38′40″N,108°46′34″~108°50′25″E 之間,東西貫長約6.621 km,南北貫長約1.051 km,面積約352.4 hm2.該區(qū)域?qū)儆谀蟻啛釒Ъ撅L(fēng)氣候,夏季濕熱,冬季干冷,一年中,氣溫最高在35℃左右,最低在11℃左右,全年平均氣溫在22℃左右,年均降水量1658 mm,年總?cè)照諡?673 h[28].該區(qū)域位于廣西沿海中部的欽州灣,欽州灣是廣西海岸帶中段,其西北為臺地、丘陵,茅嶺江出???東北為飲江平原,東南為犀牛角平原.欽州灣濱海地區(qū)的土壤成土母質(zhì)主要是花崗巖和砂頁巖,在地帶性氣候的作用下,陸地部分形成了典型淺海赤紅壤,土壤有機(jī)質(zhì)較為豐富[29].研究區(qū)具體位置如圖1所示.

圖1 研究區(qū)及采樣點(diǎn)空間分布Fig.1 Distribution of the study area and sampling points

1.2 地面數(shù)據(jù)采集與處理

本文于2021年6月中旬對研究區(qū)進(jìn)行實(shí)地調(diào)查與土壤采樣.在采樣過程中,設(shè)置了10 m×10 m 的樣點(diǎn)格網(wǎng),以格網(wǎng)交叉點(diǎn)作為采樣點(diǎn),利用GPS 確定每個采樣點(diǎn)的經(jīng)緯度坐標(biāo),通過手持式多參數(shù)土壤速測儀對每個樣點(diǎn)的土壤電導(dǎo)率進(jìn)行多次測量,待穩(wěn)定后記錄,取測量值均值作為各樣點(diǎn)電導(dǎo)率,保證了結(jié)果的可靠性,最后共采集94 份土壤樣本.參考前人的研究[30],將各樣方點(diǎn)實(shí)測電導(dǎo)率轉(zhuǎn)換為土壤鹽分含量,并導(dǎo)入ArcGIS10.2 中進(jìn)行矢量化.電導(dǎo)率轉(zhuǎn)換為土壤鹽分含量公式如下:

式中:SS 為土壤鹽分含量,g/kg;EC 為電導(dǎo)率,μS/cm.

1.3 遙感數(shù)據(jù)與預(yù)處理

資源一號02D 衛(wèi)星于2019年9月12日發(fā)射,由自然資源部主持建造,是資源一號02C 星的接續(xù)星,屬于中等分辨率遙感業(yè)務(wù)衛(wèi)星[31].該衛(wèi)星具有幅寬大、光譜分辨率高的突出特點(diǎn),海岸藍(lán)、黃、紅邊等多光譜譜段及高光譜影像可提供豐富的地物光譜信息,拓展了資源調(diào)查與監(jiān)測的手段,為及時掌控自然資源質(zhì)量、分布情況以及變化趨勢提供了支撐.資源一號02D 衛(wèi)星采用太陽同步軌道,軌道高度778km,軌道傾角為98.5°,回歸周期為55d,重訪周期為3d.衛(wèi)星配置了9 譜段可見近紅外相機(jī)和166 譜段高光譜相機(jī),其中,全色譜段與多光譜波段空間分辨率分別為2.5 和10m;高光譜相機(jī)的光譜范圍400~2500nm,空間分辨率30m[32].

結(jié)合野外采樣時間以及遙感影像云量等因素,本研究所選取的數(shù)據(jù)源為2021年6月16日獲取的ZY1-02D VNIC 影像,包括2.5 m 全色波段與10 m 多光譜波段,數(shù)據(jù)來源于中國資源衛(wèi)星應(yīng)用中心(https://data.cresda.cn/).為使影像盡可能反映地表實(shí)際信息,對該數(shù)據(jù)進(jìn)行預(yù)處理,過程包括輻射定標(biāo)、大氣校正、正射校正、幾何校正、圖像融合以及裁剪等.其中大氣校正采用FLAASH 大氣校正法,影像全色波段和多光譜波段的融合采用Gram-Schmidt Pan Sharpening 法.對于對應(yīng)土壤采樣點(diǎn)的光譜反射率本研究提取了所有土壤樣點(diǎn)在ZY1-02D VNIC 影像上該采樣點(diǎn)的平均反射率,作為遙感反射率來反演土壤鹽度.以上步驟在ENVI 5.3 中完成.

1.4 特征提取

在ENVI5.3 以及ArcGIS10.2 等遙感軟件的支持下,本研究共選擇了37 個特征變量構(gòu)建鹽分反演模型,其中包括遙感影像的4 個原始波段、9個植被指數(shù)、13 個鹽分指數(shù)、3 個主成分波段以及8 個紋理特征.表1 顯示了37 個特征變量的計算方式.

表1 反演參數(shù)計算公式Table 1 Calculation formula of inversion parameters

(1)原始波段.遙感影像原始波段承載大量光譜信息,是地物識別的基礎(chǔ),本研究提取經(jīng)預(yù)處理后的ZY1-02D 遙感影像單波段光譜信息,分別為藍(lán)波段(B)、綠波段(G)、紅波段(R)、近紅外波段(NIR).

(2)植被指數(shù).植被指數(shù)是對地表植被狀況的有效、簡單和經(jīng)驗(yàn)的度量[33],可以有效地反映植被信息.本研究依據(jù)研究區(qū)植被覆蓋特點(diǎn)及前人研究成果提取了9 種植被指數(shù),分別為歸一化植被指數(shù)(NDVI)、增強(qiáng)植被指數(shù)(EVI)、差值植被指數(shù)(DVI)、比值植被指數(shù)(RVI)、大氣阻抗植被指數(shù)(ARVI)、廣義差分植被指數(shù)(GDVI)、綠波段比值植被指數(shù)(GRVI)、聯(lián)合光譜響應(yīng)指數(shù)(COSRI)、綠色大氣阻抗指數(shù)(GARI)、土壤調(diào)節(jié)植被指數(shù)(SAVI).

(3)鹽分指數(shù).鹽分指數(shù)可以有效反映土壤鹽分信息,表征土壤鹽漬化信息.根據(jù)前人研究成果,提取了11 種鹽分指數(shù),分別為:鹽分指數(shù)(S1)、鹽分指數(shù)(S2)、鹽分指數(shù)(S3)、鹽分指數(shù)(S4)、鹽分指數(shù)(S5)、鹽分指數(shù)(S6)、鹽分指數(shù)(SI-T)、鹽分指數(shù)(SI1)、鹽分指數(shù)(SI2)、鹽分指數(shù)(SI3)、鹽分指數(shù)(INT1)以及歸一化鹽分指數(shù)(NDSI).

(4)主成分波段.由于遙感影像波段數(shù)量較多,造成一定的信息冗余,于是本研究使用主成分分析變換特征,提取影像主成分變換的前3 個主成分作為特征變量,分別為主成分分析波段 PC1、PC2、PC3.

(5)紋理特征.紋理特征包含了豐富的影像信息,被廣泛運(yùn)用于高分辨率影像信息識別中.本研究在ENVI5.3 軟件支持下對ZY1-02D 數(shù)據(jù)進(jìn)行主成分變換后,通過Co-occurrence Measures 工具采用灰度共生矩陣(GLCM)的方法對第一主成分波段進(jìn)行紋理特征提取,共提取ZY1-02D 影像PCA1 的8 個紋理特征值,即均值(MEA)、方差(VAR)、同質(zhì)性(HOM)、對比度(CON)、相異性(DIS)、熵(ENT)、二階距(SEC)、相關(guān)性(COR).

1.5 研究方法

1.5.1 研究路線 在資源一號衛(wèi)星數(shù)據(jù)與實(shí)地采樣數(shù)據(jù)的基礎(chǔ)上,本研究通過提取ZY1-02D遙感影像的波段信息、植被指數(shù)、鹽分指數(shù)、主成分波段以及紋理特征,構(gòu)建了能夠反演土壤鹽分的特征變量數(shù)據(jù)集.通過比較AdaBooost、LightGBM、XGBoost、RFR以及CatBoost 五種機(jī)器學(xué)習(xí)算法以及不同變量組合的預(yù)測精度,得出最優(yōu)反演模型來估算研究區(qū)土壤的鹽分含量.具體技術(shù)路線如圖2所示.

圖2 土壤鹽分反演技術(shù)路線Fig.2 Technical route for soil salinity inversion

1.5.2 機(jī)器學(xué)習(xí)方法 Adaboost 是Freund 等在1997年提出的,他們將加權(quán)投票的相關(guān)研究成果[49]與在線分配問題結(jié)合,并在Boosting 問題框架下進(jìn)行對應(yīng)推廣,得到了著名的AdaBoost[50]算法.該算法的優(yōu)點(diǎn)在于使用簡單的弱分類器,通過不斷的進(jìn)行權(quán)值分配與迭代最終得到強(qiáng)分類器,可以深挖分類器的能力,也不存在過擬合的現(xiàn)象,因此能顯著提高學(xué)習(xí)精度.

RFR 是Breiman[51]提出的一種機(jī)器學(xué)習(xí)算法,該算法可以有效處理分類和回歸問題.隨機(jī)森林集成了所用的分類投票結(jié)果,投票最高的結(jié)果作為最后輸出的結(jié)果.目前,大量的理論研究已經(jīng)證明,RFR具有較高的預(yù)測精度,能夠很好地容忍異常值和噪聲,并且不容易過擬合.

Xgboost 是2016年開發(fā)的一種在GBDT 算法基礎(chǔ)上加以改進(jìn)機(jī)器學(xué)習(xí)算法[52],現(xiàn)已廣泛用于解決數(shù)據(jù)挖掘問題.XGBoost 通過二階的泰勒展開表達(dá)式優(yōu)化損失函數(shù),并且在目標(biāo)函數(shù)之外加入了正則項(xiàng),整體求最優(yōu)解,避免了過擬合,從而提高了預(yù)測的精度[53].

LGBM 是微軟在2017年提出的一種梯度提升算法,是基于傳統(tǒng)GBDT 算法改進(jìn)的模型[54].LGBM通過梯度單邊采樣技術(shù)去除梯度小的數(shù)據(jù),用剩余的數(shù)據(jù)對信息增益進(jìn)行估計,并且利用獨(dú)立特征合并技術(shù)減少特征的數(shù)量.

CatBoost 是俄羅斯Yandex 學(xué)者于2017年提出的一種新型開源機(jī)器學(xué)習(xí)庫,它由Categorical 和Boosting 組成[55],是一種以對稱決策樹基學(xué)習(xí)器實(shí)現(xiàn)的模型[56].

1.5.3 模型精確度評估 本研究采用了決定系數(shù)R2以及均方根誤差RMSE 來評估機(jī)器學(xué)習(xí)模型在土壤鹽分估算中的精度.其中決定系數(shù)R2指的是預(yù)測值與實(shí)測值的擬合程度,當(dāng)R2的值越接近1 即代表模型的精度越高.RMSE 主要用于模型驗(yàn)證,反映預(yù)測值與真實(shí)值之間的偏差.數(shù)值越小,模型精度越高[57].決定系數(shù)R2和RMSE 的計算公式如下所示:

2 結(jié)果與分析

2.1 研究區(qū)土壤鹽度特征

本研究所調(diào)查的94 個采樣點(diǎn)均均勻分布在研究區(qū)范圍內(nèi).根據(jù)前人研究成果[58],將區(qū)域土壤鹽漬化程度劃分為非鹽漬化、輕度鹽漬化、中度鹽漬化、重度鹽漬化以及鹽土5個等級,分級標(biāo)準(zhǔn)見表2.由表3 可知,本研究94 個采樣點(diǎn)的土壤鹽度范圍為0.740~10.352 g/kg,74 個建模樣本與20 個檢驗(yàn)樣本均值分別為1.739 和1.465 g/kg,標(biāo)準(zhǔn)差為1.927 和0.958 g/kg,變異系數(shù)(變異系數(shù)反映樣點(diǎn)值的離散程度,變異系數(shù)<0.1 為弱變異性;0.1<變異系數(shù)<1 為中等變異;變異系數(shù)>1 為強(qiáng)變異)分別為1.10 和0.65,屬于強(qiáng)變異與中等變異.根據(jù)土壤鹽漬化程度分級標(biāo)準(zhǔn),統(tǒng)計實(shí)測樣點(diǎn)土壤含量數(shù)據(jù),建模集與檢驗(yàn)集中非鹽漬化樣點(diǎn)個數(shù)分別占37.838%和40%,輕度鹽漬化樣點(diǎn)個數(shù)占48.649%和45%,中度鹽漬化樣點(diǎn)個數(shù)占5.405%和10%,重度鹽漬化樣點(diǎn)個數(shù)2.703%和5%,鹽土樣點(diǎn)個數(shù)5.405%及0%,占比最大均為輕度鹽漬化.

表2 土壤鹽漬化程度分級標(biāo)準(zhǔn)Table 2 Grading standard of soil salinization degree

表3 采樣點(diǎn)統(tǒng)計分析Table 3 Statistical analysis of sampling points

2.2 特征變量與鹽分的相關(guān)性

根據(jù)采樣點(diǎn)的坐標(biāo)信息,在 ArcGIS10.2 及RStudio 軟件的支持下,從反演參數(shù)中提取對應(yīng)實(shí)測樣本點(diǎn)的各特征變量值,使用R 語言中的Cor 函數(shù)對實(shí)測樣本土壤鹽分含量與對應(yīng)的特征變量值進(jìn)行皮爾森相關(guān)系數(shù)計算.實(shí)測點(diǎn)土壤鹽分含量與反演參數(shù)的相關(guān)性見表4.從相關(guān)性結(jié)果來看:(1)通過計算植被指數(shù)變量組(r=0.062),原始波段變量組(r= 0.019),鹽分指數(shù)變量組(r=0.078),遙感影像數(shù)據(jù)指數(shù)變量組(r=0.012),紋理特征變量組(r=0.068)共5 組變量相關(guān)性的平均絕對值,可以得到鹽分指數(shù)變量組相較于其他特征變量組而言,與土壤鹽度之間存在較高的相關(guān)性,而遙感影像數(shù)據(jù)指數(shù)及原始波段與土壤鹽分含量相關(guān)性較低.(2)在37 個特征變量中,鹽分指數(shù)S2、S1、S6 與土壤鹽分含量關(guān)系較為密切,其中S2 的相關(guān)性系數(shù)r=0.201,在37 個特征變量中與鹽分相關(guān)性最高,其次為S1 相關(guān)性系數(shù) r=0.196,兩者均為正相關(guān);S6 的相關(guān)性系數(shù)r=0.192,與土壤鹽分含量呈負(fù)相關(guān).這3 個指數(shù)是適合作為ZY1-02D 影像在濱海區(qū)域進(jìn)行鹽漬化信息評估的鹽分指數(shù).相對而言,鹽分指數(shù)中的SI-T、SI2則與土壤鹽分含量相關(guān)性較低.(3)除鹽分指數(shù)外,植被指數(shù)中的RVI(r=0.121),紋理特征中的MEA(r=-0.160)、COR(r=0.146)也與研究區(qū)土壤鹽分含量存在較高的相關(guān)性.

2.3 不同模型以及不同方案結(jié)果與對比

將所提取的37 個特征變量作為全變量組分別構(gòu)建AdaBooost、LightGBM、XGBoost、RFR、CatBoost 五種機(jī)器學(xué)習(xí)算法的土壤鹽分含量估算模型,模型精度如圖3 和表5所示.通過計算訓(xùn)練集和測試集的R2以及RMSE,可以看出在五種機(jī)器學(xué)習(xí)算法中,CatBoost 模型在測試階段中精度最高,R2達(dá)到了 0.8317,RMSE 達(dá)到了 0.3957g/kg.LGBM、XGBR、RFR 在測試階段中的模型擬合精度較為接近,三者的R2分別為0.5575,0.5768,0.5914,RMSE分別為0.6288,0.6243,0.6317g/kg,但在預(yù)測精度上與CatBoost 還有一定的差距.在5 個機(jī)器學(xué)習(xí)模型中AdaBoost 的預(yù)測精度最低,其中R2僅為0.2247,RMSE 為0.8244 g/kg,遠(yuǎn)遠(yuǎn)低于其他4 個機(jī)器學(xué)習(xí)模型,由此可見AdaBoost 不適合于本研究區(qū)土壤鹽度含量反演.

表5 基于全變量組的不同模型精度Table 5 Different model accuracies based on full variable groups

圖3 基于全變量組的不同模型精度Fig.3 Different model accuracies based on full variable groups

為探究不同特征變量在同一機(jī)器學(xué)習(xí)算法下對土壤鹽分含量反演的準(zhǔn)確性的影響,本研究設(shè)計了5 種不同變量組合場景,基于CatBoost 機(jī)器學(xué)習(xí)算法對5 個場景進(jìn)行建模與訓(xùn)練.其中場景一為僅使用原始波段組,場景二為原始波段與植被指數(shù)13個特征變量,場景三為原始波段、植被指數(shù)與鹽分指數(shù)26 個特征變量,場景四為原始波段、植被指數(shù)、鹽分指數(shù)與主成分波段29 個特征變量,場景五為全變量組共37 個特征變量.不同場景測試結(jié)果如表6所示.

表6 基于CatBoost 模型的不同變量組精度Table 6 Accuracy of different variable groups based on CatBoost model

可以發(fā)現(xiàn),擬合效果最好的變量組合為SC5(R2=0.8317,RMSE=0.3957g/kg),其次是SC4,該場景測試集R2為0.7348,RMSE 為0.6199g/kg,R2值較全變量組相差0.086,RMSE 值較全變量組相差0.2242g/kg.相比之下,僅使用原始波段作為特征變量的模型擬合程度最差,R2值為0.2016,RMSE 值為2.2587g/kg,并且出現(xiàn)一定程度的過擬合現(xiàn)象;其次使用原始波段與植被指數(shù)作為輸入變量的模型擬合效果也不理想,R2值為0.3505,RMSE 值為1.2702g/kg,也存在一定程度的過擬合現(xiàn)象.綜上所述,可以認(rèn)為僅將原始波段作為輸入變量以及原始波段、植被指數(shù)作為輸入變量的反演模型不適于研究區(qū)土壤鹽分含量反演.

2.4 特征變量重要性分析

CatBoost 算法可以識別特征變量的重要性,本研究將37 個特征變量放入模型進(jìn)行重要性排序,檢驗(yàn)特征變量對于土壤鹽分含量反演的重要性.結(jié)果重要性值越高,則代表該特征變量在土壤鹽分反演中越重要.重要性排序結(jié)果如圖4所示,其中可以發(fā)現(xiàn)對于濱海地區(qū)土壤鹽分反演重要性最大的特征是MEA,該特征表示的是遙感影像第一主成分紋理特征的均值,次重要的特征是植被指數(shù)ARVI,原始波段藍(lán)波段(B)、植被指數(shù)COSRI、鹽分指數(shù)SI1,近紅外波段(NIR).在原始波段變量組中,藍(lán)波段與近紅外波段對模型貢獻(xiàn)度較高,而紅波段貢獻(xiàn)相對較低;植被指數(shù)中,由近紅外波段、紅波段、藍(lán)波段計算得到的ARVI,由綠波段、藍(lán)波段、近紅外波段計算得到的COSRI 以及由近紅外波段、綠波段計算得到的GRVI 對模型有重要貢獻(xiàn),但SAVI在模型中貢獻(xiàn)較低;鹽分指數(shù)中,SI1 以及S3 對模型有重要貢獻(xiàn),但NDSI 以及S5 對模型精度影響不大;主成分波段中,第三主成分波段與第一主成分波段也對模型精度有重要影響;特征變量MEA 與COR對模型有較大貢獻(xiàn),但其中的DIS 以及ENT 對模型貢獻(xiàn)度較低.

圖4 基于CatBoost 模型全變量組的變量重要性Fig.4 Variable importance based on CatBoost model full variable group

2.5 研究區(qū)鹽分反演制圖

通過以上結(jié)果,可以發(fā)現(xiàn)利用CatBoost 機(jī)器學(xué)習(xí)算法,并且選用全變量組作為輸入變量的模型擬合效果最好.因此本研究采用這個模型對研究區(qū)的土壤鹽分含量進(jìn)行反演,利用ArcGIS10.2 對反演結(jié)果進(jìn)行可視化,得到的研究區(qū)土壤鹽分含量反演圖.結(jié)果如圖5所示,研究區(qū)土壤鹽分含量預(yù)測值在0~8.784 g/kg 范圍內(nèi),均值為2.478g/kg.研究區(qū)域內(nèi)土壤均呈現(xiàn)不同程度的鹽漬化,鹽漬化土以輕度等級為主,與實(shí)測樣本的鹽分含量結(jié)果相符合,表明反演結(jié)果準(zhǔn)確率較高.通過統(tǒng)計各鹽分等級土壤所占的像元,結(jié)果表明,輕度鹽漬土分布廣泛,面積占比最大為50.841%,主要集中分布在研究區(qū)西部,在東部地區(qū)分布較零散;其次為中度鹽漬土,面積占比為34.792%,在研究區(qū)區(qū)域內(nèi)分布較為零散;重度鹽漬土面積占比為12.118%,分布主要集中在西南角以及中心區(qū)域;鹽土面積占比為1.634%,主要集中在南邊邊界線附近;非鹽漬化土最少面積僅占0.616%.

圖5 研究區(qū)土壤鹽分反演結(jié)果Fig.5 Inversion results of soil salinity in study area

3 討論

3.1 不同機(jī)器學(xué)習(xí)算法的選擇

近年來,越來越多的機(jī)器學(xué)習(xí)算法被運(yùn)用在土壤鹽分的研究中,也取得較好的結(jié)果.本研究中利用國產(chǎn)資源一號衛(wèi)星數(shù)據(jù),選用了5 個不同的機(jī)器學(xué)習(xí)算法對欽州灣濱海土壤鹽分含量進(jìn)行估算.通過比較5 個模型的結(jié)果,得到了CatBoost 模型反演土壤鹽分精度最高,其中R2達(dá)到了0.8317,RMSE 為0.3957g/kg.該值高于2019年奚雪等[59]在黃河三角洲墾利縣使用BP和SVM機(jī)器學(xué)習(xí)模型對當(dāng)?shù)貫I海土壤進(jìn)行鹽分反演的精度(R2分別為 0.436 和0.387;RMSE 分別為1.297 和1.006g/kg);也高于2018年王多多等[60]以上海崇明東灘為研究區(qū)利用多元樣條自回歸模型(MARS)建立的濱海土壤鹽分的估算模型(R2=0.74,RMSE=0.96 ds/m).由此可以發(fā)現(xiàn)本研究所采用的CatBoost 新型機(jī)器學(xué)習(xí)算法在濱海地區(qū)土壤鹽分含量估算方面相較于傳統(tǒng)機(jī)器學(xué)習(xí)模型以及線性回歸模型有更好的擬合效果.

但本研究所采用的CatBoost 模型預(yù)測精度低于馮雪力等[61]利用BP 人工神經(jīng)網(wǎng)絡(luò)對內(nèi)蒙古河套灌區(qū)進(jìn)行鹽分反演的模型精度(R2=0.8908),主要的原因可能在于所選擇的數(shù)據(jù)源以及相關(guān)變量有關(guān).馮雪力等[61]的研究選用的數(shù)據(jù)源是RADARSAT-2精細(xì)四極化單視復(fù)型(SLC)雷達(dá)影像,并且模型的輸入變量是基于多元回歸篩選的原始光譜反射率二階導(dǎo)數(shù)、雷達(dá)后向散射特性以及地表組合粗糙度,這在一定程度上大大提高模型精度,該數(shù)據(jù)與本研究采用的國產(chǎn)資源一號衛(wèi)星光學(xué)傳感器數(shù)據(jù)相比,屬于主動傳感器成像方式,這種數(shù)據(jù)的雷達(dá)后向散射系數(shù)和土壤含水量之間具有較好的相關(guān)性,這對土壤鹽漬化建模非常有用,因此馮雪力等[61]采用的雷達(dá)極化數(shù)據(jù)反演精度更高,但考慮到本研究主要探討的是國產(chǎn)資源一號衛(wèi)星在濱海土壤鹽漬化反演中的適用性,因此本研究尚未加入雷達(dá)數(shù)據(jù)到訓(xùn)練模型中,未來可以考慮將SAR、PolSAR 及InSAR主動傳感器衛(wèi)星數(shù)據(jù)加入到模型中來提高模型訓(xùn)練的精度.但是,本研究所采用的CatBoost 模型精度顯著高于張雅莉等[62]基于 landsat8OLI 影像光譜采用多元逐步回歸的方法建立的土壤鹽分預(yù)測模型(R2=0.7776),說明CatBoost 新型機(jī)器學(xué)習(xí)算法相較于傳統(tǒng)的線性回歸模型能夠大大提升土壤鹽漬化的模型擬合精度.

3.2 不同特征變量的選擇

本研究中設(shè)置了不同的輸入變量場景,發(fā)現(xiàn)當(dāng)輸入變量僅為4 個原始波段(SC1)以及由原始波段、植被指數(shù)(SC2)所構(gòu)建模型擬合效果較差(R2分別為0.2016、0.3505).當(dāng)引入鹽分指數(shù)后,模型的預(yù)測值擬合能力得到較大的提升,預(yù)測精確度提高了34.53%.這可能與本研究中原始波段以及植被指數(shù)與鹽分含量相關(guān)系數(shù)較低有關(guān),并且鹽分指數(shù)作為反映土壤鹽分含量的直接參數(shù),相較于其他間接參數(shù)對模型精度的提高起到較大的作用.這與邊玲玲等[63]研究所得的結(jié)果一致,他們認(rèn)為鹽分指數(shù)與土壤含量之間存在一定的相關(guān)性,在估算應(yīng)用方面具有很大貢獻(xiàn).Aldakheel 等[64]的研究也表明鹽度指數(shù)對預(yù)測鹽度有重要作用.在本研究中,當(dāng)模型輸入變量為全變量(SC5)時,得到了最好的土壤鹽分反演模型精度(R2=0.8317),擬合效果最好.這可能是由于全變量組中所包含的信息較多,可以在一定程度上提高模型精度.全變量組中相較于SC3 引入了主成分波段以及由PCA1 計算得到的紋理特征,模型精度提高了12.45%.因此,可以證明在本研究中主成分波段以及紋理特征的引入可以有效提高機(jī)器學(xué)習(xí)模型的反演精度.此前,已有學(xué)者對主成分波段在土壤鹽分含量反演過程中的表現(xiàn)進(jìn)行探究,Metternicht 等[65]認(rèn)為從理論上講,主成分分析可以應(yīng)用于鹽分的識別和變化檢測,因?yàn)镻CA1 的穩(wěn)定亮度和PCA2 的穩(wěn)定綠度可以使得鹽漬土壤從非鹽漬土壤中分離出來,而PCA3 的差異亮度和PCA4 的差異綠度則解釋了地表鹽度發(fā)生的變化.Judkins 等[66]的研究也發(fā)現(xiàn)PCA1 與表層土壤鹽分具有較高的相關(guān)性,對表層土壤電導(dǎo)率的變化具有較高的光譜響應(yīng)性.

本研究對全變量組的特征變量重要性進(jìn)行排序,排序結(jié)果如圖4所示.可以發(fā)現(xiàn)紋理特征中的均值(MEA)對土壤鹽分含量最為敏感,其次紋理特征中的相關(guān)性(COR)也對土壤鹽分較為敏感.這可能是由于紋理信息是物體的固有屬性,其反映的是圖像灰度性質(zhì)及其空間關(guān)系,能夠在一定程度上增強(qiáng)模型的預(yù)測性能[67].對于紋理特征在土壤鹽漬化方面的表現(xiàn),許多學(xué)者都進(jìn)行了相關(guān)研究,如Ren 等[68]的研究表明利用遙感光譜結(jié)合紋理特征可以提高濱海地區(qū)鹽漬土分類精度,為準(zhǔn)確掌握土壤鹽漬化提供了新途徑.臺翔等[69]通過建立植被覆蓋下的土壤含鹽量極限學(xué)習(xí)機(jī)反演模型,發(fā)現(xiàn)加入紋理特征參數(shù)能有效提高模型精度.Hoa 等[70]通過構(gòu)建越南湄公河三角洲地區(qū)土壤鹽分反演模型,認(rèn)為從圖像波段提取的紋理特征對土壤鹽度建模有重要作用.在本研究中紋理特征貢獻(xiàn)了重要作用,這與此前的研究結(jié)論大抵相符.

除紋理特征外,在本研究中藍(lán)波段(B1)與近紅外波段(B4)對土壤鹽分含量也較為重要.此前已有大量研究證明光譜指數(shù)對于土壤鹽度估算有所貢獻(xiàn).在這些研究中,可見的紅色、中紅外和近紅外波段被認(rèn)為是土壤鹽度估計最重要的預(yù)測變量[71],Fan等[72]指出350~549nm(含OLI 傳感器深藍(lán)、藍(lán)光和綠光波段),6695~1001nm(含OLI 傳感器近紅外波段),都是比較重要的辨別土壤鹽堿化的光譜信息,能較好的提取土壤鹽漬化的信息.Metternicet 等[73]發(fā)現(xiàn),受鹽分影響的土壤具有較高的光譜反射率,尤其是在藍(lán)色波段.本研究大體上與這些結(jié)論一致.

在前人的研究中,植被指數(shù)被認(rèn)為是估算土壤鹽度的關(guān)鍵變量,許多學(xué)者通過構(gòu)建土壤鹽分與植被指數(shù)的模型也很好地對研究區(qū)進(jìn)行了反演.本研究的結(jié)果也表明,植被指數(shù)對于土壤鹽分估算具有一定的重要性.在本研究中,重要性前十個特征變量中,有三個是植被指數(shù),分別是ARVI、CORSI 以及GRVI.其原因可能是這些植被指數(shù)主要由藍(lán)波段、近紅外波段以及紅波段計算得到.邊慧芹等[74]的研究表明了植被指數(shù)ARVI 與土壤含鹽量相關(guān)性較高,能在一定程度上反映土壤鹽分含量,可用于土壤鹽分估算模型的構(gòu)建.Vermeulen等[15]的研究證明由藍(lán)色、紅色和近紅外波段計算得到的COSRI 是土壤鹽分反演中要考慮的重要變量.本研究與以上研究結(jié)論較為一致,ARVI、CORSI 在模型中重要性排名第二、第四位,在估算研究區(qū)土壤鹽分方面起到重要作用.

3.3 模型的不確定以及未來研究方向

本研究利用Catboost 模型對研究區(qū)土壤鹽分進(jìn)行反演,通過模型預(yù)測研究區(qū)的土壤鹽分范圍為0~8.784g/kg 范圍內(nèi),均值為:2.478g/kg,得到模型精度R2=0.8317.利用機(jī)器學(xué)習(xí)模型擬合時,我們也注意到擬合參數(shù)與樣本數(shù)的關(guān)系,本研究中土壤樣本點(diǎn)數(shù)量有97 個,其中建模樣本有74 個,檢驗(yàn)樣本有20 個,實(shí)際投入模型訓(xùn)練的樣本數(shù)74 個遠(yuǎn)遠(yuǎn)大于模型的擬合變量達(dá)34 個,但是從模型的擬合效果中確實(shí)可以發(fā)現(xiàn),模型的訓(xùn)練精度較高,而驗(yàn)證的精度稍低,這具有一定的局限性.但是,本研究在驗(yàn)證階段的精度(R2=0.8317)也高于王多多等[60]在上海崇明島東灘灘涂的土壤鹽分反演精度(R2=0.74)以及張雅莉等[62]在艾比湖流域鹽漬化土壤鹽分的反演精度(R2=0.7776),因此研究結(jié)果可以應(yīng)用于欽州灣濱海土壤鹽分反演的研究中,但是應(yīng)該注意到該模型對于不同的時空尺度土壤鹽分的反演還有待進(jìn)一步探索.

機(jī)器學(xué)習(xí)算法相對于傳統(tǒng)的回歸分析方法具有一定的優(yōu)勢,但機(jī)器學(xué)習(xí)方法的選擇、參數(shù)的確定均對預(yù)測模型的精度有一定的影響,這可能會使得模型的預(yù)測結(jié)果存在一定的不確定性.其次,本研究所使用的土壤鹽分含量是由土壤電導(dǎo)率利用公式進(jìn)行轉(zhuǎn)換,也可能會影響模型的估算結(jié)果;最后,衛(wèi)星自身傳感器誤差以及遙感圖像在進(jìn)行處理的過程中存在的誤差也可能會對模型的擬合結(jié)果產(chǎn)生一定的影響.在未來的研究中可以進(jìn)行改進(jìn):適當(dāng)增加土壤樣本數(shù)量,提供更加真實(shí)可靠的樣本數(shù)據(jù);采用Python 語言Scikit-learn 提供的GridSearch 算法對機(jī)器學(xué)習(xí)算法進(jìn)行超參數(shù)尋優(yōu);引入Sentinel-1A、Radarsat-2、Landsat 和SRTM DEM 等數(shù)據(jù),提取相關(guān)的環(huán)境變量如極化雷達(dá)參數(shù)、地表溫度和地形因子等構(gòu)建土壤鹽分含量模型;將CatBoost 與粒子群算法相結(jié)合,采用優(yōu)選變量的方式,減少變量間的冗余程度以提高土壤鹽分估算的精度.

近年來,遙感技術(shù)作為大面積土壤鹽分的反演提供了可能性.以往的研究多采用Sentinel 衛(wèi)星[59]、Landsat[60]以及RADARSAT-2[61]等主被動衛(wèi)星數(shù)據(jù)對不同地區(qū)的土壤鹽漬化進(jìn)行反演,但是這些研究多采用國外的衛(wèi)星數(shù)據(jù)源,而針對國內(nèi)的眾多衛(wèi)星數(shù)據(jù)探討較少.國產(chǎn)衛(wèi)星數(shù)據(jù)像高分系列中的眾多衛(wèi)星如高分1 號和高分2 號均提供了光學(xué)衛(wèi)星數(shù)據(jù)、而高分3 號也提供了SAR 數(shù)據(jù),這些國產(chǎn)主被動衛(wèi)星數(shù)據(jù)源均可以提取本研究所用到的各種土壤特征參數(shù)和變量,融合國產(chǎn)多源衛(wèi)星影像數(shù)據(jù)的不同優(yōu)勢,這可為國產(chǎn)衛(wèi)星數(shù)據(jù)在土壤鹽漬化中的反演提供了可能,未來均可成為中國土壤鹽漬化反演的重要數(shù)據(jù)來源.

本研究所采用的資源一號02D 衛(wèi)星數(shù)據(jù)能夠衍生大量的鹽分指數(shù)、植被指數(shù)以及紋理指數(shù)等變量,提取優(yōu)勢特征成為提高土壤鹽度估算精度的關(guān)鍵問題.為此,本研究基于樣地實(shí)測數(shù)據(jù)和資源一號02D 衛(wèi)星數(shù)據(jù)衍生的各種特征變量,首次對比了AdaBooost、LightGBM、XGBoost、RFR 以及CatBoost 五種不同機(jī)器學(xué)習(xí)算法在濱海土壤鹽分估算中的優(yōu)劣特性,同時探討了不同變量選擇對模型精度的影響.本文所提供的技術(shù)方法雖然應(yīng)用于我國的南亞熱帶地區(qū),但是該方法論同樣的適用于北方的干旱半干旱地區(qū),這為國際同行利用機(jī)器學(xué)習(xí)算法和國產(chǎn)衛(wèi)星數(shù)據(jù)研究土壤鹽漬化問題提供了技術(shù)經(jīng)驗(yàn)和方法參考,其研究結(jié)果也開創(chuàng)了利用機(jī)器學(xué)習(xí)算法和國產(chǎn)衛(wèi)星數(shù)據(jù)研究我國土壤鹽漬化問題的先河.

4 結(jié)論

4.1 研究區(qū)實(shí)測土壤鹽分含量范圍為 0.727~10.352g/kg,均值為1.739g/kg,實(shí)測樣點(diǎn)中輕度鹽漬化占比最大.

4.2 對比5 種機(jī)器學(xué)習(xí)算法及不同輸入變量,CatBoost 相較于AdaBooost、LightGBM、XGBoost、RFR 有更好的預(yù)測性能,CatBoost 結(jié)合全變量組在預(yù)測階段取得了最高精度,R2達(dá)到0.8317,RMSE達(dá)到0.3957g/kg,適用于研究區(qū)土壤鹽分含量反演研究.

4.3 紋理特征中的均值對土壤鹽分含量最為敏感;第一主成分紋理特征表現(xiàn)最好,其次為植被指數(shù)與原始波段.

4.4 研究區(qū)土壤鹽分含量預(yù)測范圍為0~8.784g/kg,均值為2.478g/kg,輕度鹽漬土分布廣泛,主要集中分布在研究區(qū)西部,在東部地區(qū)分布較零散;其次為中度鹽漬土,在研究區(qū)分布較為零散;重度鹽漬土分布主要集中在西南角以及中心區(qū)域;鹽土主要集中在南邊邊界線附近.

猜你喜歡
模型研究
一半模型
FMS與YBT相關(guān)性的實(shí)證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 91久久精品国产| 成人在线第一页| 国产中文一区a级毛片视频| 亚洲色图欧美| 国产精品太粉嫩高中在线观看| 亚洲综合九九| 欧美中文字幕无线码视频| 高清视频一区| 一级毛片无毒不卡直接观看| 美女一区二区在线观看| 久久这里只有精品国产99| 五月综合色婷婷| 国产成人高清亚洲一区久久| 无码AV高清毛片中国一级毛片| 毛片久久网站小视频| 欧美精品三级在线| 经典三级久久| 国产欧美性爱网| 色男人的天堂久久综合| av尤物免费在线观看| 久久毛片基地| 亚洲精选无码久久久| 亚洲精品日产AⅤ| 国产超碰在线观看| 国产国产人免费视频成18| 五月婷婷导航| 波多野结衣久久精品| 亚洲国产高清精品线久久| 综合五月天网| 国产精品女主播| 亚洲综合香蕉| 国产国产人成免费视频77777| 毛片网站在线播放| 国产剧情一区二区| 5388国产亚洲欧美在线观看| 99视频在线免费| 久久久久久国产精品mv| 72种姿势欧美久久久大黄蕉| 国产成+人+综合+亚洲欧美| 亚洲成人动漫在线| 亚洲男人的天堂在线观看| 麻豆国产精品一二三在线观看| 国产精品精品视频| 狠狠做深爱婷婷久久一区| 囯产av无码片毛片一级| 欧美怡红院视频一区二区三区| 婷婷伊人五月| 人人爽人人爽人人片| 欧美一级片在线| 国产午夜无码专区喷水| 国产免费久久精品99re丫丫一| 亚洲综合专区| 美女一级毛片无遮挡内谢| 国产成人精品免费av| 亚洲精品第一页不卡| 亚洲一区二区日韩欧美gif| 日韩视频福利| 伊人久综合| 无码人妻热线精品视频| 国产97视频在线| 日韩精品中文字幕一区三区| 亚洲国产成人麻豆精品| 免费人成在线观看成人片| 国产亚洲精品va在线| 国产一级小视频| 97综合久久| 亚洲日本中文综合在线| 999国产精品| 在线另类稀缺国产呦| 国产在线观看一区精品| 久青草网站| 婷婷六月综合网| 激情爆乳一区二区| 亚洲另类色| 欧美区一区二区三| 久久久久国产一区二区| 丁香五月婷婷激情基地| 狂欢视频在线观看不卡| 国产jizzjizz视频| 亚洲一区二区视频在线观看| 国产无码制服丝袜| 亚洲码在线中文在线观看|