
中圖分類號(hào):X53; X825 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-988X(2025)05-0061-09
Abstract: A highly polluted tailings pond in Xihe County,Longnan City,Gansu Province was selected as the study area to compare the inversion accuracy of different models for estimating heavy metal arsenic(As) content in typical mining area soils. Field soil sampling, laboratory spectral measurements, and spectral transformation preprocessing were conducted. Characteristic wavelengths were selected using the random forest(RF) model, and the spectral curves were preprocessed accordingly. Based on the selected bands, partial least squares regression(PLSR), back propagation neural network(BP),and random forest(RF) models were employed to estimate soil As content. Results identified 400,407,1 294,2 245,2260,2 344,and 2 429nm ascharacteristic wavelengths sensitive to soil As. All three models achieved good estimation performance,with the BP neural network demonstrating the highest accuracy. In particular, the model incorporating transformed spectral indices achieved an R2 of 0.947, indicating strong predictive ability. The study demonstrates that in areas with high pollution levels and complex soil backgrounds, the BP neural network combined with spectral feature selection ofers superior capability for As content inversion. Key words: soil spectral curve; characteristic band; partial least squares regression model; BP neural network model;random forest model
礦產(chǎn)資源是人類社會(huì)利用的自然資源中必不可少的一部分,隨著國(guó)民經(jīng)濟(jì)的日益發(fā)展,我們對(duì)于礦產(chǎn)資源的需求也日益增加.但在礦產(chǎn)資源的開采過程中極易對(duì)礦區(qū)及周邊環(huán)境造成一定程度上的污染,所以快速、準(zhǔn)確地獲取相關(guān)信息對(duì)礦區(qū)土壤重金屬污染情況進(jìn)行研究就十分迫切.
傳統(tǒng)的土壤重金屬污染調(diào)查是通過野外實(shí)地采樣來進(jìn)行土壤特性檢測(cè),利用原子熒光法、原子吸收光譜法和X射線熒光光譜法等測(cè)定方法來獲取土壤中重金屬的含量,從而獲取土壤中重金屬的污染情況[1].盡管該方法能夠準(zhǔn)確獲取土壤中重金屬的含量,但需要耗費(fèi)的人力、物力和時(shí)間均較多.而高光譜技術(shù)由于其具有的多波段特性且低成本、耗時(shí)短、高效率等優(yōu)點(diǎn)而在重金屬含量估算等相關(guān)研究中被廣泛應(yīng)用].
利用高光譜反演土壤重金屬含量的主要手段包括直接反演和間接反演.直接反演通過土壤重金屬含量與高光譜數(shù)據(jù)之間的相關(guān)性來建立反演模型.間接反演主要是針對(duì)于受到重金屬污染的大多數(shù)土壤,通過利用重金屬元素與土壤之間的相關(guān)性來建立相關(guān)模型[3].買買提·沙吾提等[4]對(duì)新疆渭庫綠洲土壤樣本中As, Hg ,Pb等6種均未超過國(guó)家土壤背景值的重金屬進(jìn)行研究分析,采用地理加權(quán)回歸(Geographically Weighted Regression,GWR)和普通最小二乘法回歸(Ordinary Least Squares,OLS)構(gòu)建土壤重金屬的高光譜反演模型以估算土壤重金屬元素含量.郭云開等[5以岳陽縣某地區(qū)耕地土壤重金屬Fe,As,Cr為例,提出了一種遺傳算法(GeneticAlgorithm,GA)優(yōu)化支持向量機(jī)(SupportVectorMachine,SVM)的重金屬含量反演模型,對(duì)比SVM回歸模型,預(yù)測(cè)精度有明顯提高.Pyo等以韓國(guó)錦江流域尾礦為研究區(qū)域進(jìn)行土壤采樣,基于測(cè)量的土壤反射率采用卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeural Networks,CNN)來估計(jì)As,Cu和Pb濃度,并生成了相對(duì)準(zhǔn)確的估計(jì)結(jié)果.Bhaga等[對(duì)澳大利亞海灣沉積案例進(jìn)行分析,使用極限梯度提升(eXtremeGradientBoosting,XGBoost)模型作為重金屬Pb預(yù)測(cè)的高級(jí)超級(jí)學(xué)習(xí)(SuperLearner,SL)算法,結(jié)果表明該模型相較于其他模型的可靠性更高.在污染嚴(yán)重的礦區(qū)里,土壤具有復(fù)雜的地質(zhì)背景和多樣的重金屬組成,現(xiàn)有的模型在準(zhǔn)確性和適用性上面臨著嚴(yán)峻的挑戰(zhàn).土壤中多種重金屬的相互作用以及復(fù)雜的地質(zhì)條件增加了模型預(yù)測(cè)的難度,常規(guī)方法難以滿足高精度預(yù)測(cè)的需求.因此,選擇合適的數(shù)學(xué)算法建立土壤光譜信息與土壤屬性之間的關(guān)系以準(zhǔn)確預(yù)測(cè)這些區(qū)域的土壤重金屬含量顯得尤為必要[8].
偏最小二乘回歸模型(PartialLeastSquaresRegression,PLSR)、隨機(jī)森林(RandomForest,RF)和BP(BackPropagation,BP)神經(jīng)網(wǎng)絡(luò)等不同的反演模型各有其優(yōu)勢(shì)和局限性.PLSR由于能簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)和分析兩組變量間的相關(guān)性,在建模過程中集中了主成分分析、典型相關(guān)分析和線性回歸分析方法的特點(diǎn),因此可以實(shí)現(xiàn)對(duì)全部波段信息的概括[9].BP神經(jīng)網(wǎng)絡(luò)模型以反向傳播誤差為基礎(chǔ)逆向進(jìn)行權(quán)值修正,并且由于其范圍廣、易操作、擴(kuò)充性強(qiáng)等優(yōu)點(diǎn)也被廣泛應(yīng)用[10].RF是基于多個(gè)決策樹的集成學(xué)習(xí)算法,可以防止過擬合且預(yù)測(cè)效果穩(wěn)定,是一種有效的土壤預(yù)測(cè)方法[11].
本研究旨在比較這些模型在土壤重金屬As含量反演精度上的表現(xiàn),以確定最優(yōu)模型,為有效管理和保護(hù)高污染礦區(qū)及其周邊環(huán)境提供科學(xué)依據(jù)和方法支持.因此,本研究通過室內(nèi)實(shí)測(cè)獲取土壤高光譜反射率數(shù)據(jù),提取特征波段,將深入探討PLSR模型、BP神經(jīng)網(wǎng)絡(luò)模型和RF模型在土壤重金屬As含量反演中的應(yīng)用效果及其優(yōu)缺點(diǎn).
1 實(shí)驗(yàn)數(shù)據(jù)
1. 1 研究區(qū)概況
本文以隴南市西和縣某尾礦庫為研究對(duì)象,該尾礦庫位于甘肅省隴南市西和縣盧河鎮(zhèn)草關(guān)村境內(nèi),地處西秦嶺南側(cè)長(zhǎng)江流域嘉陵江水系西漢水上游,地勢(shì)由西北向東南傾斜,境內(nèi)平均海拔 1692m 氣候濕潤(rùn),四季分明,屬暖溫帶半濕潤(rùn)性氣候.研究區(qū)年平均氣溫 8.4°C ,平均無霜期 183d ,平均日照期為 1842h ,年均降水量為 533mm :該尾礦庫總占地面積為 22 090m2 .盡管該礦自2022年底已開展環(huán)保設(shè)施完善工程,但由于多年來的礦產(chǎn)開采會(huì)導(dǎo)致礦石、礦渣中的重金屬經(jīng)雨水沖刷、淋溶滲入周邊土壤中或河流中,致使礦區(qū)周邊地區(qū)的土壤重金屬As含量明顯超標(biāo),對(duì)周邊生態(tài)環(huán)境造成污染.
1.2樣本采集及光譜數(shù)據(jù)獲取
野外采樣路線應(yīng)充分考慮研究區(qū)地形和土壤空間分布等特點(diǎn),因此采樣時(shí)應(yīng)盡可能選擇地形平坦的區(qū)域進(jìn)行,共采集43個(gè)樣點(diǎn)并使用GPS記錄樣點(diǎn)位置(圖1).采集的土壤樣品在室內(nèi)常溫風(fēng)干、磨碎后過100目尼龍篩后用于后續(xù)重金屬含量的測(cè)定[12].土壤樣品經(jīng)三酸( HNO3 , HF HClO4 )消解法預(yù)處理后,土壤重金屬As的含量采用微波消解原子熒光法(HJ680-2013)測(cè)定[13].樣品測(cè)試中均有空白對(duì)照,同時(shí)采用國(guó)標(biāo)溶液進(jìn)行質(zhì)量控制[14].使用玻璃電極法測(cè)定土壤樣品的 pH 值(水土比
,測(cè)定得到的土壤平均 pH 值為7.46.
分別對(duì)處理后的樣品進(jìn)行土壤基本理化性質(zhì)和高光譜數(shù)據(jù)的測(cè)定,測(cè)定的土壤中As的含量統(tǒng)計(jì)如表1所示.
圖1研究區(qū)概況及采樣點(diǎn)分布
Figl General situation of the study area and distribution of sampling points

表1土壤重金屬As的含量統(tǒng)計(jì) (mg?kg-1 )
Tab1 Content statistics of heavy metal Asin soil (mg?kg-1 )

土壤光譜數(shù)據(jù)主要使用美國(guó)ASD公司的FieldSpec4便攜式地物光譜儀在室內(nèi)進(jìn)行獲取,在實(shí)驗(yàn)室條件下進(jìn)行土壤的光譜測(cè)定可有效避免外界大氣、王壤水分、表面粗糙度等環(huán)境因素的影響.測(cè)試選擇在暗室中進(jìn)行,選擇75W的鹵素?zé)糇鳛槲ㄒ还庠础?25° 裸光纖鏡頭接收反射波段,測(cè)量前需將儀器預(yù)熱至少 15min ,且進(jìn)行白板定標(biāo)校正,獲得絕對(duì)反射率,測(cè)量時(shí)光源距離樣品 30cm ,光線與樣品成 45° 角,探頭距樣本 10cm 位于光源對(duì)面,探頭光纖末端位于土壤樣本正上方,測(cè)得的光譜波長(zhǎng)范圍為 350~2500nm
獲取的原始光譜曲線如圖2所示,可以看出所選取的43個(gè)土壤樣品的光譜曲線都具備了土壤光譜曲線的一般特征且各條光譜曲線的變化趨勢(shì)整體相似.土壤光譜曲線在 350~1350nm,1450~ 1 650nm 及 1 950~2 150nm 波段處光譜反射率均隨著波長(zhǎng)的增加而上升.
圖2土壤樣品的原始光譜曲線Fig2 Original spectral curve of soil samples

2 研究方法
2.1土壤重金屬As污染程度評(píng)估方法
土壤As元素環(huán)境背景值為 12.0mg?kg-1[15] 由研究區(qū)域土壤樣本中As元素含量的統(tǒng)計(jì)結(jié)果可見表1,土壤重金屬As含量的均值達(dá) 93.8mg?kg-1 ,遠(yuǎn)超出甘肅省王壤重金屬As的背景值.對(duì)43件王壤樣品中的重金屬As含量依據(jù)《土壤環(huán)境質(zhì)量農(nóng)用地土壤污染風(fēng)險(xiǎn)管控標(biāo)準(zhǔn)(試行)》(GB15618-2018)國(guó)家標(biāo)準(zhǔn)(表2),采用單項(xiàng)污染指數(shù) Pi 對(duì)As進(jìn)行評(píng)估,將土壤中的重金屬元素含量與當(dāng)?shù)乇尘爸颠M(jìn)行比較,產(chǎn)生污染程度評(píng)價(jià)[16].
表2土壤污染風(fēng)險(xiǎn)篩選值與風(fēng)險(xiǎn)管制值(GB15618-2018)
Tab1 Screening value and risk control value of soil pollution risk(GB 15618-2018)

污染指數(shù) Pi 的計(jì)算公式為

其中, Ci 為 i 元素實(shí)測(cè)含量值 (mg?kg-1) , Bi 為 i 元素風(fēng)險(xiǎn)篩選值 (mg?kg-1) . Pi 越大,污染越嚴(yán)重, Pilt;0.7 為安全范圍, 0.7i?1 為警戒范圍, 1i?2 為輕度污染范圍, Pigt;2 為重度污染范圍.
2.2土壤光譜數(shù)據(jù)處理
1)光譜曲線均值處理.為減少光譜測(cè)定過程中環(huán)境干擾等因素的影響,在室內(nèi)測(cè)定過程中對(duì)每個(gè)土壤樣品均進(jìn)行5次光譜測(cè)定,并將ViewSpec軟件算數(shù)平均處理后的土壤樣本光譜反射率作為實(shí)際反射光譜數(shù)據(jù)進(jìn)行研究.
2)光譜曲線平滑處理.在使用光譜儀測(cè)得光譜數(shù)據(jù)的過程中,較易在某些波段處出現(xiàn)噪聲.在對(duì)土壤反射光譜曲線進(jìn)行分析之前,需對(duì)曲線進(jìn)行平滑處理,平滑處理后的光譜曲線可以在一定程度上減少噪聲產(chǎn)生的影響,凸顯王壤光譜特性,從而減小隨機(jī)誤差對(duì)光譜數(shù)據(jù)產(chǎn)生的影響.
3)光譜曲線噪聲區(qū)波段的剔除.一些噪聲在土壤光譜曲線平滑處理后仍難以消除[17],并會(huì)在建模階段產(chǎn)生大量誤差.為避免這些誤差,需要剔除光譜采樣過程中波段兩側(cè)出現(xiàn)的不穩(wěn)定噪聲區(qū),去除 350~399nm 和 2450~2500nm 兩處波段的數(shù)據(jù),每次測(cè)量可獲得2051個(gè)波段.
4)光譜指標(biāo)變換.由于在光譜測(cè)定過程中受到的外界多方面因素的干擾使得土壤光譜特征在一定程度上被削弱,因此本文通過對(duì)原始土壤光譜進(jìn)行光譜指標(biāo)變換,分別經(jīng)過原始光譜倒數(shù) (1/R )、倒數(shù)對(duì)數(shù)(log(1/R))、多元散射校正(MultiplicativeScatterCorrection,MSC)及標(biāo)準(zhǔn)正態(tài)變換(StandardNormalVariate,SNV)來增強(qiáng)光譜的特征信息,突出可見光波段的光譜差異性,以更好地構(gòu)建土壤重金屬含量的反演模型,經(jīng)上述處理后的光譜曲線可見圖3.
圖3處理后的土壤光譜曲線
Fig3 Soil spectral graph after treatment

2.3 隨機(jī)森林重要性評(píng)估選取特征波段
使用高光譜技術(shù)反演估算土壤重金屬As的含量,首先確定土壤光譜的特征波段.土壤的組成復(fù)雜,土壤中的重金屬離子很容易與有機(jī)質(zhì)結(jié)合形成穩(wěn)定的化合物,從而對(duì)土壤不同光譜反射率波段造成影響,表現(xiàn)出與土壤重金屬含量的顯著相關(guān)[18].
隨機(jī)森林模型作為一種集成學(xué)習(xí)方法,在處理高維數(shù)據(jù)和復(fù)雜非線性關(guān)系方面具有顯著優(yōu)勢(shì),能夠評(píng)估每個(gè)特征對(duì)預(yù)測(cè)結(jié)果的重要性,從而有效地篩選出關(guān)鍵特征.通過對(duì)樣本重新采樣的方法得到不同的訓(xùn)練樣本集,在這些新的訓(xùn)練樣本集上分別訓(xùn)練學(xué)習(xí)器,最終合并每一個(gè)學(xué)習(xí)器的結(jié)果,作為最終的學(xué)習(xí)結(jié)果.其中,每個(gè)樣本的權(quán)重是一樣的.特征對(duì)目標(biāo)變量預(yù)測(cè)的相對(duì)重要性可以通過樹中的決策節(jié)點(diǎn)的特征使用的相對(duì)順序(即深度)來進(jìn)行評(píng)估.決策樹頂部使用的特征對(duì)更大一部分輸入樣本的最終預(yù)測(cè)決策做出貢獻(xiàn).因此,可以使用接受每個(gè)特征對(duì)最終預(yù)測(cè)的貢獻(xiàn)的樣本比例來評(píng)估該特征的相對(duì)重要性.即假定有變量 X1,X2,… X?M ,需要計(jì)算出 M 個(gè)VIM得分統(tǒng)計(jì)量.RF常規(guī)的VIM計(jì)算方法分為兩種,即根據(jù)Gini指數(shù)和袋外數(shù)據(jù)(Out-of-BagData,OOB)錯(cuò)誤率計(jì)算得到,變量 Xj 的得分統(tǒng)計(jì)量分別用 VIMj (Gini)和VIMj (OBB)表示.本文僅對(duì)Gini指數(shù)進(jìn)行重要性評(píng)價(jià)的方法.
Gini指數(shù)的計(jì)算公式為

其中, K 為自助樣本集的類別數(shù),
為節(jié)點(diǎn) λm 樣本屬于第 k 類的概率估計(jì)值.
變量 Xj 在節(jié)點(diǎn) Σm 的重要性,即節(jié)點(diǎn) Ψm 分枝前后Gini指數(shù)變化量為:
VIMjm(Gini)=GIm-GIl-GIr,
GIι 和 GIr 分別表示由節(jié)點(diǎn) Ωm 分裂的兩新節(jié)點(diǎn)的Gini指數(shù).
如果變量 Xj 在第 i 棵樹中出現(xiàn) M 次,則變量 Xj 在第 i 棵樹的重要性為

變量 Xj 在RF中的Gini重要性定義為

其中, n 為RF中分類樹的數(shù)量.
2.4 反演模型建立
為了驗(yàn)證隨機(jī)森林篩選出的特征波段的合理性和有效性,將其分別應(yīng)用于PLSR和BP神經(jīng)網(wǎng)兩種不同的預(yù)測(cè)模型中.PLSR和BP神經(jīng)網(wǎng)絡(luò)各自具有獨(dú)特的優(yōu)勢(shì)和適用場(chǎng)景,通過在不同算法中應(yīng)用相同的特征波段,可以充分利用這兩種算法在數(shù)據(jù)處理和預(yù)測(cè)方面的優(yōu)勢(shì),實(shí)現(xiàn)算法之間的互補(bǔ).同時(shí),將RF的預(yù)測(cè)結(jié)果與PLSR和BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果進(jìn)行比較,對(duì)比不同模型的預(yù)測(cè)精度、穩(wěn)定性和適用性可以更直觀地評(píng)估特征波段在不同算法中的預(yù)測(cè)性能,從而選擇出最優(yōu)的預(yù)測(cè)模型.
基于RF模型得到的土壤不同波段下反射率對(duì)王壤重金屬As含量預(yù)測(cè)的相對(duì)重要性排序,將排序靠前的波段作為建模的特征波段,分別利用PLSR,BP及RF構(gòu)建土壤重金屬As含量的特征波段估算模型,并對(duì)構(gòu)建的模型進(jìn)行精度驗(yàn)證,按照決定系數(shù) (R2 )和均方根誤差(RootMean SquareError,RMSE)作為模型擬合優(yōu)度的主要評(píng)價(jià)指標(biāo)并以此為依據(jù)對(duì)三種反演模型的精度進(jìn)行比較.
PLSR模型是集多元線性回歸、主成分分析與典型相關(guān)分析于一體的一種回歸算法[19],即在 p 個(gè)變量 y1,…,yp 與 m 個(gè)自變量 x1,…,xm 之間進(jìn)行建模,首先提取兩個(gè)變量組之間的第一對(duì)成分t1(x1,…,xm 之間的線性組合)和 u1(y1,…,yp 之間的線性組合);其次建立因變量 y1,…,yp 與 χt 的回歸,如果回歸方程已達(dá)到滿意的精度,則算法中止.否則繼續(xù)第二對(duì)成分的提取,直到達(dá)到滿意的精度[13].
偏最小二乘回歸方程式如下:

其中, F0 和 EΦ0 分別表示因變量組和自變量組的 n 次標(biāo)準(zhǔn)化觀測(cè)數(shù)矩陣.
BP神經(jīng)網(wǎng)絡(luò)模型由輸入層、隱層、輸出層3層結(jié)構(gòu)組合而成,采用誤差反向傳播算法進(jìn)行學(xué)習(xí),數(shù)據(jù)逐層向后傳播,網(wǎng)絡(luò)連接權(quán)值逐層向前修正,層與層之間多采用全連接的方式,同一層單元之間不存在相互連接,每一層的神經(jīng)元的狀態(tài)只對(duì)下一層的神經(jīng)元的狀態(tài)有影響.算法原理如圖4所示.
圖4BP算法原理示意圖

RF模型是一種基于決策樹的集成學(xué)習(xí)算法,其通過Bootstrap取樣法從 n 個(gè)訓(xùn)練樣本中有放回地隨機(jī)選取 n 個(gè)樣本得到 m 個(gè)子集,并對(duì)每個(gè)子集單獨(dú)訓(xùn)練一棵決策樹,將 Ψm 棵決策樹預(yù)測(cè)結(jié)果的平均值作為回歸隨機(jī)森林的輸出.算法原理如圖5所示.
圖5RF算法原理示意圖
Fig5Schematic diagram of algorithm principle of RF

3 結(jié)果與分析
3.1 土壤重金屬As的含量分析
樣本土壤As的 Pi 值統(tǒng)計(jì)結(jié)果見表3.研究區(qū)域土壤重金屬As的污染指數(shù)整體較大,重度污染達(dá)到 39.53%
表3土壤重金屬As的污染指數(shù)統(tǒng)計(jì)
Tab3 Statistical table of pollution index of heavy metal As in soil

3.2 特征波段的選取
通過RF模型將土壤重金屬As含量及土壤光譜各個(gè)波段反射率的重要性關(guān)系進(jìn)行排序,反映出來的重要性排序前30的波段結(jié)果如圖5所示.為避免臨近波段為同一特征波段的影響,因此優(yōu)先選取重要性排序靠前且臨近間隔 ?5nm 的波段作為特征波段,最終選定特征波段為400,407,1294,2245,2260,2344,2429nm 共7個(gè)波段.
圖6土壤光譜反射率波段重要性排序 Fig6 Importance ranking of soil spectral reflectance bands

3.3模型建立與精度評(píng)價(jià)
基于RF選取的特征波段,進(jìn)一步應(yīng)用多種波波段變換技術(shù),分別進(jìn)行 1/R,log1/R ,MSC及SNV變換,以探索不同變換對(duì)模型性能的影響.將提取的光譜特征波段下的光譜反射率作為自變量,研究區(qū)樣本的土壤As元素含量作為因變量,并對(duì)43個(gè)樣本按比例進(jìn)行隨機(jī)劃分,將其中30個(gè)樣本作為訓(xùn)練集,剩下13個(gè)樣本作為測(cè)試集,三種模型預(yù)測(cè)精度及對(duì)比見表4,各模型建模的最優(yōu)結(jié)果見圖7,散點(diǎn)圖見圖8.
通過表4及圖 7~8 可以看出,三種模型均能較好地估算土壤重金屬As含量,其中BP神經(jīng)網(wǎng)絡(luò)模型建模的測(cè)試集 R2 值均在0.81以上且各種變換下的模型精度均較其他模型更高.所有光譜變換中,MSC和SNV較其他變換的測(cè)試集 R2 更低,預(yù)測(cè)精度稍差.
通過與RF的預(yù)測(cè)結(jié)果進(jìn)行比較,可以發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型在估算精度上表現(xiàn)最優(yōu),特別是在光譜指標(biāo)變換后,其 R2 值高達(dá)0.947.這一結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)在重污染礦區(qū)土壤重金屬As含量的估算方面具有顯著優(yōu)勢(shì).相比之下,雖然RF也表現(xiàn)出了一定的預(yù)測(cè)性能,但在本研究的數(shù)據(jù)集上,BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果更為準(zhǔn)確和穩(wěn)定.
表4土壤重金屬As含量模型預(yù)測(cè)精度及對(duì)比
Tab 4 Prediction accuracy and comparison of heavy metal As content models in soil

圖7不同模型下土壤重金屬As含量建模最優(yōu)結(jié)果

圖8不同反演模型下土壤重金屬As含量最優(yōu)結(jié)果的散點(diǎn)圖
Fig 8Scater plot of optimal results of heavy metal As content in soil under different inversion models

4討論
土壤作為可持續(xù)發(fā)展的重要資源,對(duì)人類的生存發(fā)展起著極其重要的作用.在礦產(chǎn)資源的開采過程中,重金屬等污染物在土壤環(huán)境介質(zhì)中遷移,最終對(duì)礦區(qū)生態(tài)環(huán)境和人體健康造成嚴(yán)重威脅[20].礦區(qū)土壤重金屬污染主要來自Pb,Cd,Cr,As, Hg Cu, Mn 和 Zn 等的污染[21],我國(guó)許多地區(qū)土壤重金屬含量都要遠(yuǎn)超其標(biāo)準(zhǔn)值,礦區(qū)土壤環(huán)境治理尤為重要.礦區(qū)重金屬污染土壤修復(fù)成為我國(guó)環(huán)境治理的重要方面之一,為此對(duì)礦區(qū)土壤重金屬的含量進(jìn)行反演估算對(duì)生態(tài)環(huán)境修復(fù)也有著重要意義.
為了消除儀器本身引起的信號(hào)誤差及數(shù)據(jù)采集中的噪聲,本研究采用了多種光譜變換如倒數(shù)、倒數(shù)對(duì)數(shù)、MSC及SNV來增強(qiáng)與重金屬相關(guān)的光譜信息,并基于上述光譜變換使用PLSR,BP,RF3種模型對(duì)礦區(qū)土壤重金屬As的含量進(jìn)行估算.通過不同變換發(fā)現(xiàn)光譜指標(biāo)變換可以在一定程度上突出可見光波段的光譜差異性,基于光譜變換后的建模結(jié)果的精度除PLSR模型外都有所增加,這表明光譜變換對(duì)于提高重金屬含量估算的準(zhǔn)確性具有積極作用.楊君怡等[1基于PLSR對(duì)土壤重金屬As進(jìn)行反演,在其建立的多種不同光譜變換下的反演模型中,經(jīng)光譜變換后的模型精度雖有所提高,但只有基于倒數(shù)對(duì)數(shù)的一階微分變換的精度略高于本研究PLSR模型的反演精度.王雪梅等[22]采用偏最小二乘回歸、支持向量機(jī)回歸、BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林回歸方法對(duì)土壤重金屬As的含量進(jìn)行預(yù)測(cè),其中BP神經(jīng)網(wǎng)絡(luò)模型較PLSR模型預(yù)測(cè)精度更高,與本研究結(jié)果一致.李志遠(yuǎn)等[23]通過對(duì)土壤原始光譜反射率進(jìn)行多種變換后對(duì)土壤重金屬As含量進(jìn)行反演建模,得到了更高的精度,說明了光譜指標(biāo)變化可以增強(qiáng)土壤光譜反射信息,提高土壤重金屬含量的預(yù)測(cè)精度.
在比較PLSR,BP和RF3種模型的性能時(shí),可以發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型在處理復(fù)雜的非線性關(guān)系和高維數(shù)據(jù)方面顯示出顯著優(yōu)勢(shì),與倪斌等[24]的研究結(jié)果相似.這種模型能夠靈活捕捉土壤中多種因素的復(fù)雜相互作用,包括不同礦物質(zhì)組成、地質(zhì)特征及人為活動(dòng)對(duì)As含量的影響,無需過多的數(shù)據(jù)預(yù)處理即可建立準(zhǔn)確的預(yù)測(cè)模型,從而為環(huán)境科學(xué)研究和土壤污染管理提供了強(qiáng)大的工具和方法.相比之下,PLSR模型雖然簡(jiǎn)單且易于實(shí)現(xiàn),但在處理非線性關(guān)系時(shí)可能表現(xiàn)不佳.RF模型雖然具有強(qiáng)大的泛化能力和魯棒性,但在本研究中并未表現(xiàn)出優(yōu)于BP模型的性能.這可能與土壤樣本的特性和數(shù)據(jù)分布有關(guān).
近年來,土壤重金屬高光譜遙感監(jiān)測(cè)技術(shù)在理論和方法體系上均取得了明顯進(jìn)步,但現(xiàn)實(shí)研究中仍有諸多問題亟待解決[25],一方面現(xiàn)階段學(xué)者們建立的某些土壤重金屬高光譜定量反演模型雖然精度較高,但大都只適用于特定研究區(qū)的特定樣本,難以大規(guī)模推廣應(yīng)用,另一方面土壤重金屬高光譜監(jiān)測(cè)成熟模型較少且尚未得到全面驗(yàn)證,仍無法完全取代人工野外布點(diǎn)、采樣、化驗(yàn)的監(jiān)測(cè)方法.
基于光譜指標(biāo)變換建立PLSR,BP,RF3種模型對(duì)研究區(qū)土壤重金屬As的含量能進(jìn)行較好地反演,為該地區(qū)的土壤環(huán)境治理可以提供一定幫助.本研究也存在一定的局限性,如研究區(qū)域范圍有限、土壤樣本數(shù)在空間上分布不夠均勻等.因此未來可以針對(duì)不同土壤類型進(jìn)行研究,并擴(kuò)大研究區(qū)域面積,以獲取更多數(shù)量和更均勻分布的土壤樣本.還可以考慮融合多源數(shù)據(jù),如遙感數(shù)據(jù)和地面監(jiān)測(cè)數(shù)據(jù)以提高重金屬含量估算的準(zhǔn)確性和可靠性,并以此建立能夠進(jìn)行實(shí)際應(yīng)用的預(yù)測(cè)模型.
5 結(jié)論
選取甘肅省隴南市西和縣某尾礦庫這一重污染礦區(qū)為研究對(duì)象,實(shí)測(cè)土壤樣品中重金屬As的含量及其光譜反射率,通過RF模型對(duì)土壤反射率波段進(jìn)行重要性分析,確定了土壤的特征光譜.隨后分別利用PLSR模型、BP神經(jīng)網(wǎng)絡(luò)模型及RF模型對(duì)土壤重金屬As的含量進(jìn)行了反演與分析.研究結(jié)果顯示,基于RF模型對(duì)土壤重金屬As的各個(gè)波段進(jìn)行重要性分析,土壤重金屬As的光譜曲線在400,407,1294,2245,2260,2344,2429nm波段處重要性排序靠前,是土壤重金屬As進(jìn)行估算的特征波段.這不僅驗(yàn)證了RF模型在特征波段選取上的有效性,也為后續(xù)的光譜分析和重金屬含量估算提供了重要依據(jù).在特征波段的基礎(chǔ)上,利用PLSR,BP神經(jīng)網(wǎng)絡(luò)及RF模型對(duì)土壤重金屬As的含量進(jìn)行了反演.結(jié)果顯示,3種模型均表現(xiàn)出一定的估算能力,且在不同變換方法下均能獲得較好的反演精度.其中,BP神經(jīng)網(wǎng)絡(luò)模型在倒數(shù)變換下的估算精度最高,測(cè)試集 R2 值達(dá)到0.947,顯示出其在高污染礦區(qū)小樣本土壤重金屬含量估算中的穩(wěn)定性和適用性.同時(shí),光譜指標(biāo)經(jīng)過適當(dāng)變換后,能夠顯著提升光譜特征信息的顯著性,進(jìn)而優(yōu)化建模的精確度.這一點(diǎn)在不同模型應(yīng)用各自最優(yōu)變換方法所展現(xiàn)表現(xiàn)中也得到驗(yàn)證.
參考文獻(xiàn):
[1] 郭學(xué)飛,曹穎,焦?jié)櫝桑龋寥乐亟饘傥廴靖吖庾V遙感監(jiān)測(cè)方法綜述[J].城市地質(zhì),2020,15(3):7.
[2] 王穎,王志一,黃勇等.礦區(qū)土壤重金屬砷含量高光譜反演研究[J].世界核地質(zhì)科學(xué),2023,40(1):89.
[3] 郭穎,畢如田,鄭超,等.土壤重金屬高光譜反演研究綜述[J].環(huán)境科技,2018,31(1):67.
[4] 買買提·沙吾提,阿不都艾尼·阿不里,胡昕.干旱區(qū)綠洲農(nóng)田土壤重金屬含量高光譜反演[J].中國(guó)環(huán)境科學(xué),2024,44(4):2208.
[5] 郭云開,張思愛,謝曉峰,等.基于GA-SVM的耕地土壤重金屬含量高光譜反演方法的研究[J].土壤通報(bào),2021,52(4):968.
[6] AJCP,ASMH,AYSK,etal.Estimationofheavy metals using deep neural network with visibleand infrared spectroscopy of soil-ScienceDirect[J].SciTotalEnviron,741 [2024-07-04].
[7] BHAGAT S K,TRAN T M,YASEEN Z M.HeavyMetalContaminationPredictionusingEnsemble Model:Case Study of Bay Sedimentation,Australia[J].JHazardMater,202O,403:123492.
[8]方臣,匡華,周小娟,等.湖北恩施地區(qū)土壤重金屬高光譜反演模型研究[J].環(huán)境科學(xué)與技術(shù),2021,44(9):154.
[9]張清文,吳風(fēng)華,宋敬茹,等.基于光譜變換的濱海濕地土壤全氮含量建模預(yù)測(cè)[J].土壤,2023,55(4):880.
[10] 郭云開,劉寧,劉磊,等.土壤Cu含量高光譜反演的BP神經(jīng)網(wǎng)絡(luò)模型[J].測(cè)繪科學(xué),2018,43(1):6.
[11] 張佳琦,潘瑜春,高世臣,等.基于稀疏樣點(diǎn)的土壤重金屬含量模擬方法[J].環(huán)境科學(xué),2024,45(4):2417.
[12] 周俊馳,劉孝利,雷鳴,等.湖南典型礦區(qū)耕地土壤重金屬空間特征研究[J].地理空間信息,2018,16(8):90.
[13] 張?jiān)疲跗G,等.某氧化銅礦尾礦區(qū)重金屬污染特征及農(nóng)作物健康風(fēng)險(xiǎn)評(píng)價(jià)[J].有色金屬工程,2021,11(4):125.
[14] 馬曉紅,楊松,溫靜,金尾礦庫土壤重金屬污染特征及生態(tài)健康風(fēng)險(xiǎn)評(píng)估[J].西北師范大學(xué)(自然科學(xué)版),2025,61(3):43.
[15] 謝曉華.成縣黃渚礦區(qū)尾礦庫潰壩土壤污染評(píng)價(jià)[J].甘肅農(nóng)業(yè)科技,2013(6):33.
[16] 周瑤,成永生,王丹平,等.優(yōu)化光譜指數(shù)結(jié)合PLSR的多金屬礦區(qū)土壤砷含量高光譜反演[J/OL].中國(guó)有色金屬學(xué)報(bào):1-23[2023-11-14].
[17]楊君怡,錢樂祥,鄭艷偉,等.基于高光譜的土壤砷和銅元素含量估算[J].科技通報(bào),2018,34(11):120.
[18] 楊晗,三江源區(qū)土壤重金屬含量高光譜反演研究[D].重慶:重慶交通大學(xué),2020.
[19] 孔維哲.基于相關(guān)系數(shù)法的彩色圖像立體匹配方法[J].地理空間信息,2021,19(12):106.
[20] 李吉鋒.超累積植物修復(fù)礦區(qū)土壤重金屬污染研究進(jìn)展[J].礦產(chǎn)保護(hù)與利用,2020,40(5):138.
[21] SHEN Q,XIAK,ZHANG S W,etal.Hyperspectralindirectinversionofheavy-metalcopper in reclaimed soil of iron ore area.[J].SpectrochimActa A,2019,222:117191.
[22] 王雪梅,玉米提·買明,黃曉宇,等.基于連續(xù)小波變換下的土壤有害元素砷含量估測(cè)[J].光譜學(xué)與光譜分析,2023,43(1):206.
[23] 李志遠(yuǎn),鄧帆,賀軍亮,等.土壤重金屬碑的高光譜估算模型[J].光譜學(xué)與光譜分析,2021,41(9):2872.
[24] 倪斌,黃照強(qiáng),江淼,等.基于CASIamp;SASI航空高光譜的雄安新區(qū)西南部農(nóng)田土壤重金屬鎳含量反演研究[J].地質(zhì)與勘探,2022,58(6):1307.
[25] 成永生,周瑤.土壤重金屬高光譜遙感定量監(jiān)測(cè)研究進(jìn)展與趨勢(shì)[J].中國(guó)有色金屬學(xué)報(bào),2021,31(11):3450.
(責(zé)任編輯 武維寧)