周忠科 王澤強 王唯 宋曉寧 徐夕博



摘要 為評估土壤重金屬的富集狀態及空間分異態勢,選取山東省章丘市為研究區,系統采集425處土壤樣品,測定土壤中鉻(Cr)元素含量,采用描述性統計特征評估重金屬在土壤中的富集狀態;獲取與土壤采樣同期的Landsat-8 OLI遙感數據,將土壤重金屬的環境要素作為自變量,測定的土壤Cr元素含量為因變量,構建基于隨機森林算法的土壤重金屬空間模擬模型,完成土壤中的重金屬含量預測和空間分布模擬。結果表明,土壤重金屬Cr含量均值高出土壤元素背景值37.22%,但低于農用地土壤污染風險篩選值,表明土壤中Cr的富集在可管控范圍內;隨機森林算法支持的空間模擬模型具有較好的精度和穩定度,精度系數R2和RMSE值分別為0.87和7.19,優于普通克里格法(R2=0.66,RMSE=13.15)對土壤重金屬的空間分布模擬。
關鍵詞 土壤重金屬;隨機森林算法;遙感;空間分布模擬;鉻
中圖分類號 X53? 文獻標識碼 A? 文章編號 0517-6611(2023)14-0051-04
doi:10.3969/j.issn.0517-6611.2023.14.013
基金項目 環境演變與自然災害教育部重點實驗室開放課題(2022-KF-14)。
作者簡介 周忠科(1997—),男,山東棗莊人,從事生態遙感研究。*通信作者,副教授,碩士,從事生態旅游研究。
收稿日期 2022-07-30
土壤是地表生物正常進行各類生命活動的基礎和媒介。重金屬是土壤的重要組成部分,因其具備毒性大、富集性強、殘留周期長的特點,極易對人類和動植物造成危害。隨著我國改革開放以來多年的工業化發展,土壤重金屬污染愈發嚴重[ 1-3]。土壤中的重金屬元素會污染正常耕作的耕地土壤,威脅動植物正常生長,并在食物鏈的累積作用下危及人類的健康[ 4-9]。
實現對土壤重金屬的含量特征和空間分布的監測是開展土壤污染治理和修復的關鍵。由于土壤中重金屬元素的種類、含量不是一成不變的,是不斷在累積的,因此傳統方法便是在實驗室內不斷對土壤重金屬含量、種類進行調查和檢測。例如,賈佳瑜等[ 10]采用室內實測和地統計法相結合的方式對土壤重金屬含量及其空間分布特征進行分析;黃志偉等[ 1]對表層土壤重金屬含量開展實地調查的方法,進行土壤重金屬污染特征及潛在風險評價;SONG等[ 11]利用地理信息系統的方法,來繪制重金屬空間分布熱點圖,以此來建立空間分布與工業布局之間的相互關系,以判別土壤重金屬的空間分布受到人類活動干擾的情況。上述研究,較好地完成了對研究地區土壤重金屬含量特征和空間分布評估,但是此種方式費時費力,測試過程中也產生污染廢物,會對測試人員和周邊環境造成二次污染。所以尋找一種高效、準確的調查與監測方法是非常有必要的。近些年,隨著遙感技術的快速發展,衛星影像的空間分辨率和對地物的光譜敏感性有了顯著的提升,為各種環境相關信息進行光譜定量分析提供了數據支撐和技術支持[ 12]。盡管重金屬元素在土壤中含量較低,直接建立重金屬與衛星光譜數據之間的聯系較為困難;但是可以利用基于衛星數據獲得的多種環境要素信息(例如高程、坡度和植被指數等),間接地表征土壤重金屬的含量和富集狀態,并以此為輸入變量,進行區域建模,完成土壤重金屬空間分布模擬。相對比傳統方式,土壤重金屬污染的監測調查更為方便快捷,同時節省大量的費用和成本。
筆者選取山東省章丘市為研究區,對 425 處土壤樣品進行系統采集,并對土壤中Cr元素含量進行化學分析,通過分析重金屬含量的描述性特征,評估重金屬的富集狀態,進一步建立基于隨機森林算法的空間模擬模型,實現對土壤重金屬的含量預測和空間分布模擬,為保護周邊居民身體健康、動植物健康生長和土壤修復提供技術和理論支持。
1 材料與方法
1.1 研究區概況
章丘區位于山東省中部,地理坐標在 36°25′~37°09′N 、 117°10′~117°35′E,是省會濟南市的一個轄區,總面積約為1 719 km2(圖1),人口約107.6萬。章丘地形南高北低,地形分別為山區、丘陵、平原、洼地,其中山區和丘陵占比達到 56.7%左右,黃河流經北境。章丘區屬于溫帶半濕潤大陸性季風氣候,四季分明,雨熱同季,春旱多風,夏季多雨,秋季溫爽,冬季干冷。年平均氣溫12.8 ℃,年降水量600.8 mm。章丘區內鐵路和公路橫縱貫通,交通便捷[ 13]。區域內涵蓋多種產業的發展,尤其是第二產業交通裝備、機械制造、生物食品和化工材料等,為區域經濟發展奠定了堅實的基礎[ 14]。
1.2 樣品采集與實驗室分析
表層(0~20 cm)土壤樣本在章丘區實地采集,在選取和設計時,綜合考慮研究區的土地利用和水文地質條件,基于多點取樣、等量混合、與抽樣統計原理相結合的原則,并結合已知的道路信息,確保順利完成采樣。在每個采樣點,按照100 m范圍為半徑,將表層土壤混合至1 kg左右的綜合土壤樣本,密封到聚乙烯塑料袋中,送往實驗室待測[ 15-16]。同時利用手持GPS,記錄采樣點的真實坐標,將完成的425處采樣點做好記錄。送回實驗室的土壤樣本,簡單去除雜草、根、枯枝殘留物和小石子等明顯雜質,將樣品放置在25 ℃的條件下自然風干,其后采用研缽進行研磨,過0.2 mm篩;最后在實驗室內采用石墨爐原子吸收光譜法分析檢測425份樣品的Cr含量,技術規范和回收率符合預期監控要求。
1.3 多源環境遙感數據及預處理
該研究采用的環境遙感數據主要包括高程、坡度、坡向、黏土礦物比值(CMR)、改進的歸一化差異水體指數(MNDWI)、 歸一化差異植被指數(NDVI)、改進的土壤調節植被指數(MSAVI)、增強植被指數(EVI)和紅綠比率指數(RGRI)。高程、坡度和坡向的原始數據獲取自ASTER GDEM數字高程的數據產品(下載自地理空間數據云https://www.gscloud.cn/),其后采用ArcGIS 10.2的分析工具,完成區域的高程數據圖、坡度數據圖和高差斜坡數據圖[ 17]。其余環境指數的計算是基于Landsat-8多光譜遙感數據,原始數據免費從美國地質勘探局網站(https://glovis.usgs.gov)獲取得到,其后經過圖像裁剪、輻射校正、輻射亮度值的提取以及光譜信息加強等操作后,運用數學公式(1)~(6)計算得到相應的環境指數[ 18-19];最后取樣點的425個經緯度坐標分別導入相應的高程數據圖、坡度數據圖、高差數據圖和各類環境指數圖,在上述數據圖中分別完成提取,得到各個采樣點對應的值。上述數據的預處理和求算均在ENVI 5.3.1軟件中完成。
CMR=SWIR1SWIR2(1)
MNDWI=Green-SWIR1Green-SWIR2(2)
NDVI=NIR-RedNIR+Red(3)
MSAVI=2×NIR+1-(2×NIR+1)2-8×(NIR-Red)2(4)
EVI=2.5×(NIR-Red)NIR+6×Red-7.5×Blue+1(5)
RGRI=RedGreen(6)
式中,Blue波段、Green波段、Red波段、NIR波段、SWIR1波段、SWIR2波段分別指Landsat多光譜影像中的第2、3、4、5、6和7波段;CMR是指通過2個短波紅外波段的比值,環境意義表示的是巖石或土壤中黏土礦物含量情況;
MNDWI是可以很容易地區分建筑用地背景下的陰影和水體,更好地提取水體特征。利用MNDWI解決了在建筑背景下提取水體信息效果不佳的問題,從而使建筑背景下的水體信息提取更精確。NDVI作為一種常見的植被指數,其取值區間為[-1,1],-1、0、1分別表示地面覆蓋為水、雪或有云的天空,地表有巖石或裸土等情況,對可見光的反射率較高;當地表有植被覆蓋時,且覆蓋密度越大,NDVI越大;但NDVI也具有缺點,就是對高植被覆蓋地區的靈敏度不高。MSAVI克服了傳統的土壤調節植被指數難以適應不斷變化的土壤條件,該指數能夠很好地解釋背景的光學特征變化,并且土壤背景的靈敏度也在一定程度上得到提高。EVI可以降低大氣和土壤噪聲以及水汽的影響,對于檢測區的植被情況具有一個穩定的反映;用于植被茂密區,但對植被稀疏區也具備一定的探測能力,工作原理是通過將紅光和近紅外波段的范圍設定變得更窄來實現,與此同時引入藍光波段來糾正氣溶膠的散射與土壤背景。紅綠比率指數(RGRI)是指將紅波段與綠波段相比較,得到一個比值,可以顯著區別茂密與稀疏林地。為便于接下來土壤重金屬空間模擬模型的建立,所有環境指數圖在建立之后,均進行30 m分辨率的空間重采樣。
1.4 空間模擬模型的建立與精度評估
土壤重金屬與遙感數據之間有著極其復雜的關系,選擇與土壤重金屬最為密切的遙感數據作為模型輸入自變量,有助提高模型的效率和計算精度。皮爾遜相關系數(Pearson correlation coefficient)是2個變量的協方差與標準差之間的一個比值,可以表示2個變量之間存在的相關關系,應用廣泛[ 20],其公式如下:
r(x,y)在[-1,1]之間取值,當其值為正時,表示正相關;當其值為負時,表示負相關;當其值為0時表示不相關。因此,r的絕對值越大,說明變量之間存在的相關性越強,否則相關性就越弱。該研究采用皮爾遜相關系數分析遙感數據與土壤重金屬之間的相關性。
隨機森林模型(random forest,RF)是由一定數量決策樹整合而成的集成模型的一種,通過對策樹投票或平均數據集的劃分,得到了分類或回歸的隨機森林輸出結果[ 21]。隨機森林算法具有訓練速度快、預測精度佳和適合不平衡數據集的特點[ 22-24]。決策樹數量和分裂節點數目是構建基于隨機森林算法的土壤重金屬空間模型的重要參數,經過多次測試,分別設置為1 000和3。
采集的425個土壤樣品采用隨機抽樣法選取383份數據用作訓練集來構建隨機森林模型,剩下42個數據作為獨立數據集用來評估模型的精度。決定系數(R2)和均方根誤差(RMSE)是評價空間模擬模型的常用指標,R2表示因變量被自變量完全解釋信息的程度,RMSE表示模型估算值與實測值差值的大小,較大的R2和較小的RMSE表示模型具有更好的預測精度和穩定性[ 25]。計算公式如下:
2 結果與分析
2.1 土壤重金屬的描述性統計特征
從表1可以看出,土壤中Cr含量超出元素背景值[ 26]37.22%,但是沒有超出《土壤環境質量農用地土壤污染風險管控標準》(GB 15618—2018)的篩選值,檢測結果均在風險管控值范圍之內。值得注意的是,Cr元素的中位數值超過背景值,Cr元素可能為該區域內具有較高等級的潛在風險元素。變異系數主要用來評價數據離散程度的相對大小[ 15],該研究測得Cr變異系數為0.03~0.06,離散程度較小,屬于低度變異。峰度和偏度主要用來衡量數據的分布狀態,該研究的總樣本集、建模集和驗證集的偏度值均大于1,處在正偏狀態,表明土壤中Cr元素含量的分布受到不同程度的外部因素干擾。
2.2 土壤重金屬與多源環境遙感變量相關分析
研究區域的地質地貌、植被覆蓋、氣候條件和人類活動對土壤中重金屬元素含量的影響很大,選取建模因子對反演模型質量的好壞影響很大。在Cr元素建模時需要綜合考慮光譜波段、衍生光譜指數和地形等因素,這樣建立的反演模型得出的反演結果最優。綜合考慮光譜波段、光譜衍生指數和地形因素,在數據齊全的情況下,篩選出相關系數最高的因子,結果表明,Cr和高程、坡度、坡向、近紅外、短波紅外2、增強植被指數和短波紅外1的相關系數分別為0.231、-0.194、-0.153、-0.112、0.090、0.077和0.060,均具有明顯相關性,因而選為土壤重金屬的敏感環境變量,用于模型的輸入自變量。
2.3 空間分布模擬模型建立與對比
以選擇得到的重金屬敏感的環境要素作為輸入變量,測得的Cr元素含量為因變量,分別訓練得到隨機森林和普通克里格估算模型,用于土壤重金屬的含量預測和空間分布模擬。模型在驗證集中預測的效果如圖2所示。從圖2可以看出,普通克里格模型(R2=0.66 和RMSE=13.15)的估算值和實測值基本保持在1∶1 線附近,具備一定的估算能力,但普通克里格在估算過程中出現高估和低估誤差偏離點較多。隨機森林模型的重金屬預測精度指標R2和RMSE分別為0.87和7.19,相對普通克里格模型R2上升了31.82%,RMSE 下降了45.32%;隨機森林模型的估算值與實測值在標準1∶1 線的兩側,預測值與實測值偏差較小,估算效果最佳。
2.4 土壤重金屬空間分布
為進一步檢驗隨機森林算法支持下的土壤重金屬空間模擬模型的穩定性與可靠性,將得到的模型推廣應用至整個研究區進行Cr元素的含量預測及空間模擬。模擬得到的Cr元素含量的空間分布如圖3所示,整體來看,模擬模型對重金屬Cr元素含量的估算值在52.06~139.16 mg/kg,實測采樣點Cr元素含量在39.10~257.30 mg/kg,能夠基本保持一致;重金屬Cr元素含量的高值區主要分布在研究區的西南部和東南部地區。此外,研究區內也存在大量散點狀分布的中度Cr元素污染區域,主要分布于山區與居民區交接的工廠附近,應引起重視。
Cr元素的分布受到人類活動的影響較大。章丘西南和東南工業園區內的石化配件、機械制造、塔機和新型建材等產業排放的廢氣,汽車尾氣中排放的Cr和來自城市污水處理廠及被工業廢水污染過泥土利用是土壤重金屬含量升高的一個重要原因。此外,章丘也是我國著名的農產品生產基地,農產品生產過程中大量使用農藥化肥特別是有機肥的使用也會使土壤中Cr元素產生富集。
3 結論
(1)土壤Cr元素含量高出背景值37.22%,但低于農用地土壤污染風險篩選值,說明Cr在土壤中的富集處在可管控范圍內。
(2)隨機森林算法支持的空間模擬模型具有較好的精度和穩定度,R2為0.87,RMSE是7.19,預測精度指標優于普通克里格法(R2=0.66,RMSE=13.15)。
(3)研究區土壤重金屬Cr的高值區主要分布在章丘區的西南部和東南部地區,并且Cr總體上呈散點狀分布,這與當地工業園、農業生產和煤礦公司礦井的分布具有對應關系。
參考文獻
[1] 黃志偉,李文靜,李偉杰,等.東江流域土壤重金屬污染特征及潛在風險評價[J].農業環境科學學報,2022,41(3):504-515.
[2] 吳春生,黃翀,劉高煥,等.黃河三角洲土壤含鹽量空間預測方法研究[J].資源科學,2016,38(4):704-713.
[3] ROZEMA J,FLOWERS T.Crops for a salinized world[J].Science,2008,322(5907):1478-1480.
[4] CAO J,XIE C Y,HOU Z R.Transport patterns and numerical simulation of heavy metal pollutants in soils of leadzinc ore mines[J].Journal of mountain science,2021,18(9):2345-2356.
[5] AB RHAMAN S M S,NAHER L,SIDDIQUEE S.Mushroom quality related with various substrates bioaccumulation and translocation of heavy metals[J].Journal of fungi,2021,8(1):1-17.
[6] 賈中民.渝西北土壤重金屬污染特征、源解析與生態健康風險評價[D].重慶:西南大學,2020.
[7] 張瑞鋼,錢家忠,陳鈺輝,等.玉米和小麥秸稈生物炭對土壤重金屬污染修復實驗研究[J].合肥工業大學學報(自然科學版),2022,45(3):347-355.
[8] 閆曉強,李漢杰,周輝,等.農田土壤重金屬污染的危害及修復技術[J].南方農業,2022,16(2):24-26.
[9] 胡小蘭,雷沖,王顯卿,等.重慶市墊江南部土壤重金屬污染及潛在生態風險評價[J].安徽農業科學,2023,51(7):64-67,76.
[10] 賈佳瑜,劉小芳,趙勇鋼,等.汾河流域下游農田土壤重金屬空間分布特征與污染評價[J].干旱區資源與環境,2021,35(8):132-137.
[11] SONG Y X,LI H M,LI J Z,et al.Multivariate linear regression model for source apportionment and health risk assessment of heavy metals from different environmental media[J].Ecotoxicology and environmental safety,2018,165:555-563.
[12] 宋清泉,徐夕博,吳泉源,等.基于PMF模型的土壤重金屬定量源解析及環境風險評價[J].湖南師范大學自然科學學報,2022,45(1):76-83.
[13] 濟南市統計局,濟南市第七次全國人口普查領導小組辦公室.濟南市第七次全國人口普查公報[N].濟南日報,2021-06-16(A04).
[14] 中共章丘市委黨校課題組.轉變經濟發展方式背景下的縣域工業經濟發展研究:以山東省章丘市為例[J].中共濟南市委黨校學報,2013(3):122-126.
[15] 徐夕博,呂建樹,徐汝汝.山東省沂源縣土壤重金屬來源分布及風險評價[J].農業工程學報,2018,34(9):216-223.
[16] 趙明海.礦區土壤重金屬遙感估算以及空間分布成圖:以陜西大西溝礦為例[D].西安:長安大學,2018.
[17] 魯如坤.土壤農業化學分析方法[M].北京:中國農業科技出版社,2002.
[18] 田穎,陳卓奇,惠鳳鳴,等.歐空局哨兵衛星Sentinel-2A/B數據特征及應用前景分析[J].北京師范大學學報(自然科學版),2019,55(1):57-65.
[19] WANG J Z,DING J L,YU D L,et al.Capability of Sentinel2 MSI data for monitoring and mapping of soil salinity in dry and wet seasons in the Ebinur Lake region,Xinjiang,China[J].Geoderma,2019,353:172-187.
[20] 代杰瑞,龐緒貴,喻超,等.山東省東部地區土壤地球化學基準值與背景值及元素富集特征研究[J].地球化學,2011,40(6):577-587.
[21] BREIMAN L.Random forests[J].Machine learning,2001,45(1):5-32.
[22] 方珂.基于多光譜遙感的隨機森林回歸模型反演土壤重金屬含量[D].西安:長安大學,2020.
[23] TAN K,WANG H M,CHEN L H,et al.Estimation of the spatial distribution of heavy metal in agricultural soils using airborne hyperspectral imaging and random forest[J/OL].Journal of hazardous materials,2020,382[2022-04-15].https://doi.org/10.1016/j.jhazmat.2019.120987.
[24] 張松林.CART-分類與回歸樹方法介紹[J].火山地質與礦產,1997,18(1):67-75.
[25] LIU K,ZHAO D,FANG J Y,et al.Estimation of heavymetal contamination in soil using remote sensing spectroscopy and a statistical approach[J].Journal of the Indian society of remote sensing,2017,45(5):805-813.
[26] 賴書雅,董秋瑤,宋超,等.南陽盆地東部山區土壤重金屬分布特征及生態風險評價[J].環境科學,2021,42(11):5500-5509.