陳銀瑩,柳云龍, *
1. 上海師范大學(xué)地理系,上海 200234;2. 上海師范大學(xué)城市生態(tài)與環(huán)境研究中心,上海 200234
土壤反射光譜中隱藏著土壤信息,不同反射波段的反射值是不同土壤特性綜合信息的反映。分析土壤高光譜特性并利用其研究土壤問(wèn)題,已廣泛應(yīng)用于土壤方面的研究(黃淑玲等,2015;賴(lài)寧等,2015;Casa et al.,2012)。隨著工業(yè)化進(jìn)程發(fā)展,大量重金屬污染物通過(guò)各類(lèi)生產(chǎn)排放進(jìn)入土壤中,由于重金屬不易被分解、易在土壤中富集,導(dǎo)致土壤重金屬污染(蔡茜茜,2018;遲光宇等,2017;Li et al.,2017)。且由于工業(yè)區(qū)受人為干擾強(qiáng)烈,污染源眾多,重金屬污染呈現(xiàn)種類(lèi)多、差異大、空間分布變異大等特點(diǎn),使得監(jiān)測(cè)難度上升(蔣煜峰等,2015;李小平等,2010)。傳統(tǒng)的實(shí)驗(yàn)室重金屬含量測(cè)量方法雖然能夠獲取較高測(cè)量精度,但采樣效率低下且無(wú)法獲取連續(xù)的空間信息,在對(duì)重金屬污染源眾多、重金屬分布空間異質(zhì)性高的工業(yè)區(qū)的研究中,傳統(tǒng)的研究方法無(wú)法較好地滿足對(duì)工業(yè)區(qū)土壤重金屬含量的檢測(cè)。
國(guó)內(nèi)外研究發(fā)現(xiàn),利用土壤光譜反射率反演預(yù)測(cè)土壤重金屬含量,較之傳統(tǒng)的實(shí)驗(yàn)室測(cè)定方法,具有便捷快速、大批量、低成本、對(duì)土地破壞性低的特點(diǎn)(Lewis et al,2004;Viscarra et al.,2007)。一般地,自然環(huán)境中的土壤重金屬含量較低,并且對(duì)土壤光譜反射率在可見(jiàn)光-近紅外反射波譜內(nèi)的影響微弱,甚至沒(méi)有任何影響(郭穎等,2018;Alloway,2013)。因此通過(guò)直接分析土壤重金屬元素的光譜特征來(lái)估算其含量的工作難以進(jìn)行。然而,工業(yè)區(qū)受人類(lèi)活動(dòng)影響強(qiáng)烈,如工業(yè)生產(chǎn)排放、生活垃圾排放、汽車(chē)尾氣排放、汽車(chē)零部件磨損等,土壤中重金屬元素富集現(xiàn)象嚴(yán)重,較高的含量使得利用土壤高光譜進(jìn)行土壤重金屬含量預(yù)測(cè)成為可能。此外,土壤中富集的重金屬元素與土壤中有機(jī)質(zhì)、粘土礦物、鐵錳氧化物、碳酸鹽礦物等土壤組分存在一定相關(guān)關(guān)系——主要為吸附與賦存作用,使土壤組分對(duì)光譜反射率有所影響,為在可見(jiàn)光-近紅外反射波譜內(nèi)間接預(yù)測(cè)土壤重金屬元素含量提供可能性參考(程先鋒,2017;Pinheiro et al.,2017),這是高光譜遙感探究土壤重金屬含量的機(jī)理所在。國(guó)內(nèi)外研究表明,利用可見(jiàn)光-近紅外光譜能夠進(jìn)行較大面積的土壤重金屬含量反演估算(王維等,2011;Tan et al.,2014;呂杰等,2015),但由于各研究區(qū)土壤類(lèi)型不同,所受氣候、成土母質(zhì)、生物以及人為活動(dòng)影響不同,土壤物質(zhì)組成具備差異性;且該物質(zhì)本身的獨(dú)特光譜特征會(huì)導(dǎo)致土壤所反映的特征波段位置不同,同時(shí)由于各研究所采用的反演模型不同,導(dǎo)致最優(yōu)模型的選擇也有所差異(Kooistra et al.,2001;張威等,2014;張龍龍等,2015)。
在對(duì)多種土地利用類(lèi)型,包括礦區(qū)、河流沉積區(qū)、郊區(qū)等區(qū)域的土壤重金屬的研究過(guò)程中,偏最小二乘回歸模型(Partial Least Squares Regression Model,PLSR)是利用土壤光譜反演土壤重金屬含量最常用的模型,一般適用于變量多而樣本少的數(shù)據(jù);多元逐步回歸線性模型(Stepwise Multiple Linear Regression Model,SMLR)則是最為傳統(tǒng)的擬合模型,擬合過(guò)程自動(dòng)剔除影響不明顯的變量,直接選擇具備突出影響的變量作為輸入變量進(jìn)行擬合。多項(xiàng)研究表明,這兩種模型均能夠滿足較大區(qū)域的土壤重金屬含量反演需求,適用于本研究中變量多的數(shù)據(jù)特點(diǎn)(Shi et al.,2013;Shi et al.,2014;王菲等,2016;郭穎等,2018)。目前利用受強(qiáng)烈人為干擾的工業(yè)區(qū)土壤光譜反演土壤重金屬含量方面的研究為數(shù)不多,本研究選取上海閔行區(qū)西南部工業(yè)區(qū)土壤重金屬為研究對(duì)象,分析工業(yè)區(qū)土壤的光譜特征,確定反演土壤重金屬 Cu、Cr、Mn、Pb、Zn的特征波段,并采用偏最小二乘法及多元逐步回歸線性法建立重金屬高光譜預(yù)測(cè)模型,探討在城市工業(yè)區(qū)中利用高光譜數(shù)據(jù)估算土壤重金屬含量的適用性。
研究區(qū)為上海市閔行區(qū)西南部工業(yè)區(qū)(121°22′E,31°00′N(xiāo)),總面積 3.5 km2。重點(diǎn)發(fā)展機(jī)電產(chǎn)業(yè)(軌道交通、電站設(shè)備),以醫(yī)藥療產(chǎn)業(yè)(常用藥物)和輕工業(yè)(食品飲料)為輔。根據(jù)研究區(qū)域內(nèi)地形分布、土地利用與覆蓋的狀況,在數(shù)字底圖上通過(guò)網(wǎng)格布點(diǎn)大致確定采樣點(diǎn)和取樣數(shù),使采樣點(diǎn)分布相對(duì)均勻。實(shí)際取樣時(shí),根據(jù)工業(yè)區(qū)內(nèi)工業(yè)企業(yè)、建筑物和道路的實(shí)際分布特點(diǎn),對(duì)采樣點(diǎn)數(shù)量和空間分布進(jìn)行適度調(diào)整,土壤采樣深度為0~20 cm,采樣點(diǎn)GPS精確定位,共采集土壤樣品63個(gè)。采樣點(diǎn)分布如圖1所示。樣品帶回實(shí)驗(yàn)室后,經(jīng)風(fēng)干、碾碎、過(guò)100目篩后,密封保存?zhèn)溆谩悠贩譃閮煞荩环萦糜诟吖庾V測(cè)定,一份用于重金屬含量分析。

圖1 研究區(qū)土壤采樣點(diǎn)分布圖Fig. 1 Distribution of soil sampling points in the study area
土壤樣本的反射光譜使用荷蘭 Ava Field-2便攜式高光譜地物波譜分析儀采集,波段范圍在300~1700 nm。在300~1040 nm范圍內(nèi)采樣間隔為0.59 nm,在1040~1700 nm范圍內(nèi)采樣間隔為3.8 nm,光譜分辨率為5 nm,輸出波段為1421個(gè)。選取預(yù)處理后的2 cm樣品放入直徑為10 cm的器皿內(nèi),為減少因土壤樣品表面凹凸不平所產(chǎn)生的散射光影響所測(cè)精度,對(duì)樣品表面進(jìn)行刮平處理。選擇距離土壤表面20 cm的能夠提供平行光的鹵光燈作為光源,探頭采用 15°光源照射角度、5°視角場(chǎng)和15 cm探頭距離,同時(shí)利用標(biāo)準(zhǔn)白板進(jìn)行定標(biāo),獲取絕對(duì)反射率。為減少測(cè)量不穩(wěn)定性所帶來(lái)的誤差,每個(gè)土樣采集 10條光譜曲線,去掉異常光譜曲線后取平均值,得到的平均值作為土壤樣品的實(shí)際反射光譜數(shù)據(jù)。采用X熒光分析檢測(cè)法進(jìn)行土壤Cu、Cr、Mn、Pb、Zn全量分析,該方法具有制樣簡(jiǎn)便、可分析種類(lèi)多、無(wú)損、快速、準(zhǔn)確的優(yōu)點(diǎn),能夠同時(shí)檢測(cè)多種金屬元素且不產(chǎn)生廢棄物(王世芳等,2016;王鑫等,2018;Bilo et al.,2017;侯張明,2016;鐘山等,2014)。
光譜測(cè)定過(guò)程中由于光譜儀或外界其他光源的干擾會(huì)產(chǎn)生誤差,為消除背景噪聲、增大原始光譜曲線的特征、減弱原始數(shù)據(jù)的誤差,需要對(duì)數(shù)據(jù)進(jìn)行平滑處理及數(shù)據(jù)變換,以提高光譜的性噪比(吳明珠等,2014)。利用 ENVI(Exelis Visual Information Solutions,Boulder,CO,USA)軟件對(duì)光譜數(shù)據(jù)進(jìn)行平滑處理與包絡(luò)線去除處理,把反射率進(jìn)行歸一化處理(0~1),消除光譜曲線背景噪音,突出光譜特征值。對(duì)光譜數(shù)據(jù)進(jìn)行低階微分變換能夠有效去除背景漂移與基線干擾,放大原始數(shù)據(jù)所表達(dá)的信息,突出土壤原始光譜隱藏的反射特征。本研究對(duì)原始光譜數(shù)據(jù)進(jìn)行一階微分(First Derivative,F(xiàn)D)、二階微分(Second Derivative,SD)、均方根一階微分(Root Mean Square First Derivative,RMSFD)、均方根二階微分(Root Mean Square Twice Derivative,RMSTD)、倒數(shù)一階微分(Reciprocal Transformation First Derivative,RTFD)、倒數(shù)二階微分(Reciprocal Transformation Second Derivative,RTSD)、倒數(shù)對(duì)數(shù)一階微分(Absorbance Transformation First Derivative,ATFD)、倒數(shù)對(duì)數(shù)二階微分(Absorbance Transformation Second Derivative,ATSD)共8種變換形式的處理(張秋霞等,2017;吳明珠等,2014;Shi et al.,2013)。

圖2 研究區(qū)樣本點(diǎn)土壤光譜曲線走勢(shì)圖Fig. 2 Spectral curve of soil in sampling points in the study area
為減少光譜測(cè)定過(guò)程中所產(chǎn)生的誤差和數(shù)據(jù)記錄的冗余、增強(qiáng)相似光譜之間的差別,需要對(duì)原始光譜進(jìn)行平滑處理,處理后的 63個(gè)樣本點(diǎn)光譜曲線走勢(shì)見(jiàn)圖 2。土壤光譜曲線基本走勢(shì)大致分為4種基本類(lèi)型,包含平直型(富含有機(jī)質(zhì)的土壤)、緩斜型(與水耕熱化聯(lián)系的水稻土)、陡坎型(富鐵鋁土壤)、波浪型(干旱地區(qū)土壤)(戴昌達(dá),1981)。由圖2可知,63個(gè)樣點(diǎn)土壤光譜反射率在10.01%~50.20%之間變化,土壤光譜反射率曲線基本平行且緩慢抬升,走勢(shì)基本一致,均屬于緩斜型。光譜曲線在可見(jiàn)光區(qū)域增加較快,在近紅外區(qū)域增加緩慢。光譜曲線在近紅外區(qū)域差異較大。土壤有機(jī)質(zhì)和鐵氧化物對(duì)其產(chǎn)生的影響主要在可見(jiàn)光和近紅外波段,土壤含水量的增加使光譜反射率下降(徐彬彬等,1991)。圖3(a)所示為樣本光譜曲線去包絡(luò)線圖,經(jīng)處理的光譜曲線突出顯示了光譜的吸收特征和反射特征。在可見(jiàn)光至部分近紅外(400~1650 nm)譜段內(nèi),受鐵氧化物的影響,最低反射率出現(xiàn)在409.55 nm處。總體光譜反射率的吸收谷出現(xiàn)在425 nm處,吸收深度為0.43。在825~900 nm譜段受有機(jī)質(zhì)的影響存在 C-H吸收帶,在1400~1425 nm譜段受粘土礦物中所含OH-基團(tuán)和H2O的影響存在結(jié)晶水的吸收峰(程先鋒等,2017;江振藍(lán)等,2017)。圖3(b)所示為63個(gè)樣點(diǎn)中重金屬含量最高與最低樣點(diǎn)的光譜反射率及平均光譜反射率圖,重金屬含量最高的樣點(diǎn)光譜反射率低于重金屬含量最低的樣點(diǎn)光譜反射率,重金屬含量最低樣點(diǎn)的光譜反射率在400~600 nm之間,低于平均反射率(600~840 nm),二者反射率幾乎相等,840 nm之后雖然重金屬含量最低樣點(diǎn)的光譜反射率略低于平均反射率,但仍十分接近。這些差異性可作為分析土壤反射光譜與重金屬關(guān)系的基礎(chǔ)(肖捷穎等,2013)。

圖3 樣點(diǎn)光譜去包絡(luò)線圖和研究區(qū)重金屬含量最高與最低點(diǎn)光譜曲線以及所有樣點(diǎn)平均光譜曲線圖Fig. 3 Sample spectrum to the envelope graph and the spectral curves of the highest and lowest soil samples in the study area and the average spectral curves of all sample
對(duì)工業(yè)區(qū)土壤重金屬含量進(jìn)行統(tǒng)計(jì)分析,結(jié)果如表1所示。由表1可知,土壤重金屬Cu、Cr、Mn、Pb、Zn含量平均值依次為 29.38、106.32、583.14、34.13、111.15 mg·kg-1,工業(yè)區(qū)土壤重金屬平均含量均超過(guò)上海市土壤環(huán)境背景值。變異系數(shù)表示各樣點(diǎn)重金屬含量的平均變異程度,在一定程度上能反映樣品受人為影響的程度。工業(yè)區(qū)土壤中Cr、Mn變異系數(shù)較小,分別為0.13、0.18,說(shuō)明這兩種元素受外界影響比較一致,空間分異相對(duì)較小。土壤Cu、Pb、Zn的變異系數(shù)分別為0.6、0.86和0.55,空間分異較大,說(shuō)明土壤Cu、Pb、Zn受外界干擾比較顯著,易受到較強(qiáng)的工業(yè)生產(chǎn)排放、交通運(yùn)輸?shù)热藶榛顒?dòng)因素影響(蔣煜峰等,2015)。對(duì)土壤5種重金屬含量進(jìn)行相關(guān)分析,分析結(jié)果如表2所示。由表可知,土壤 Cu與 Pb、Zn,土壤Pb與Zn的含量在0.01水平呈顯著相關(guān),土壤Cr與Mn在0.05水平呈顯著相關(guān),表明工業(yè)區(qū)土壤重金屬之間表現(xiàn)為復(fù)合污染或者具有同源性,多數(shù)土壤樣品被2種以上重金屬元素污染(韓玉麗等,2015)。
為了獲取土壤重金屬含量與反射光譜之間的關(guān)系,對(duì)土壤重金屬含量與土壤光譜數(shù)據(jù)不同變換形式進(jìn)行相關(guān)性分析。通過(guò)相關(guān)系數(shù)的大小確定特征波段范圍及最優(yōu)特征波段,結(jié)果見(jiàn)表 3,特征波段將作為反演因子進(jìn)行數(shù)據(jù)建模。總體而言,原始光譜數(shù)據(jù)經(jīng)微分變換后能夠在某種程度上提高其與重金屬含量的相關(guān)性,但不同重金屬與不同光譜變換數(shù)據(jù)的相關(guān)性不同,特征波段也不同。土壤重金屬Cu與二階微分光譜變換數(shù)據(jù)相關(guān)性最強(qiáng),特征波段范圍在1088.17~1440.21 nm,最優(yōu)特征波段為1440.21 nm。土壤重金屬Cr與方根二階微分光譜變換數(shù)據(jù)相關(guān)性最強(qiáng),特征波段范圍在584.06~985.52 nm,最優(yōu)特征波段為834.44 nm。土壤重金屬 Mn與倒數(shù)一階光譜變換數(shù)據(jù)相關(guān)性最強(qiáng),特征波段范圍在 756.22~1047.57 nm,最優(yōu)特征波段為984.98 nm。土壤重金屬Pb與方根二階微分光譜變換數(shù)據(jù)相關(guān)性最強(qiáng),特征波段范圍在1372.65~1440.21 nm,最優(yōu)特征波段為 1440.21 nm。土壤重金屬Zn與二階微分光譜變換數(shù)據(jù)相關(guān)性最強(qiáng),特征波段范圍在1011.18~1649.15 nm,最優(yōu)特征波段為1642.50 nm。一般認(rèn)為,原始光譜的低階微分能夠放大數(shù)據(jù)特征,提高其與重金屬含量的相關(guān)性(于慶等,2018;賀軍亮等,2015)。本研究中,Cr、Mn、Pb含量與光譜原始數(shù)據(jù)的方根低階微分變換、倒數(shù)低階微分變換以及對(duì)數(shù)低階微分變換之后的相關(guān)性更強(qiáng),也能夠用于反演模型的建立,這能夠?yàn)楣庾V數(shù)據(jù)預(yù)處理提供新的參考方法。5種重金屬的最優(yōu)特征波段均在近紅外波段范圍內(nèi),但不同重金屬的最優(yōu)特征波段位置不同,特征波段范圍也不一致,這與工業(yè)區(qū)內(nèi)土壤組分受強(qiáng)烈人為活動(dòng)影響較復(fù)雜,以及不同土壤組分對(duì)不同重金屬的吸附與賦存作用不同有關(guān)(張靜靜等,2018)。

表2 土壤重金屬含量相關(guān)系數(shù)矩陣Table 2 Soil heavy metal content correlation matrix

表1 工業(yè)區(qū)土壤重金屬含量的描述性統(tǒng)計(jì)分析Table 1 Descriptive statistical analysis of soil heavy metal content mg·kg-1

表3 不同重金屬與反射光譜相關(guān)波段分析結(jié)果Table 3 Results of analysis of bands associated with different heavy metals and reflectance spectra
隨機(jī)選取 51個(gè)樣本作為建模樣本用于模型建立,12個(gè)樣本作為驗(yàn)證樣本用于模型精度檢驗(yàn)。將土壤光譜數(shù)據(jù)的8種變換形式與重金屬含量在0.01水平上顯著相關(guān)的波段(即特征波段)作為自變量,5種重金屬含量作為因變量,分別采用偏最小二乘回歸模型(PLSR)以及多元逐步線性回歸模型(SMLR)構(gòu)建工業(yè)區(qū)重金屬含量預(yù)測(cè)模型,分析建模效果,確定最優(yōu)模型并利用驗(yàn)證樣本進(jìn)行檢驗(yàn),最優(yōu)建模結(jié)果及其光譜變換形式如表4所示。
最優(yōu)模型的選擇要求檢驗(yàn)所建模型的決定系數(shù)(Coefficient of Determination,R2)與均方根誤差(Root Mean Square Error,RMSE)的大小(夏芳等,2015;徐良驥等,2017)。決定系數(shù)R2反映模型的建模精度與穩(wěn)定性,一般認(rèn)為R2<0.5,模型無(wú)法對(duì)所求變量進(jìn)行預(yù)測(cè);0.5≤R2<0.65時(shí),模型具備初步預(yù)測(cè)能力;0.65≤R2<0.81時(shí),模型具備較好的預(yù)測(cè)能力;R2≥0.81時(shí),模型預(yù)測(cè)能力良好(Vohland et al.,2011)。均方根誤差則檢驗(yàn)?zāi)P蛯?duì)樣本的擬合度,在對(duì)同種重金屬的不同預(yù)測(cè)模型進(jìn)行檢驗(yàn)時(shí),誤差越低越好(程先鋒等,2017)。由表4可知,每種重金屬的最優(yōu)預(yù)測(cè)模型所選用的數(shù)據(jù)變換形式不同。土壤Cu、Pb、Zn偏最小二乘回歸最優(yōu)模型選用二階變換,土壤 Cr選用方根二階變換,土壤Mn選用倒數(shù)二階變換。多元逐步線性回歸模型中,土壤Cu、Mn最優(yōu)模型選用方根二階變換,土壤Cr、Pb選用倒數(shù)一階變換,土壤Zn選用倒數(shù)對(duì)數(shù)二階變換。從建模效果來(lái)看,PLSR建模與驗(yàn)證的決定系數(shù)R2除Zn外均低于0.5,建模精度較低,不具備預(yù)測(cè)變量的能力。而SMLR建模的R2均達(dá)到0.65以上,其中Zn的R2達(dá)到0.974,均具備較好的預(yù)測(cè)能力;驗(yàn)證的R2除Mn外其他均達(dá)到0.5以上。與PLSR建模精度相比,SMLR建模精度與驗(yàn)證精度均明顯提高,RMSE均有所下降,說(shuō)明SMLR預(yù)測(cè)模型反演預(yù)測(cè)效果更好,對(duì)樣本的擬合度更高,更具有穩(wěn)定性與可靠性。一般地,數(shù)據(jù)低階微分變換形式能夠提高反演精度,但多數(shù)研究?jī)H采用一階微分、二階微分形式,而較少利用其他變換形式的低階微分形式進(jìn)行模型反演(于慶等,2018;賀軍亮等,2015;龔紹琦等,2010)。本研究所建的5種重金屬的最優(yōu)反演模型中,精度最高的模型所使用的數(shù)據(jù)變換形式分別是方根二階變換、倒數(shù)一階變換、倒數(shù)對(duì)數(shù)二階變換,說(shuō)明使用其他變換形式的低階微分能夠獲得比原數(shù)據(jù)的低階微分更高的模型精度,這可為今后的數(shù)據(jù)處理研究特別是工業(yè)區(qū)等受人為活動(dòng)強(qiáng)烈影響區(qū)域的反演研究提供參考。
(1)經(jīng)統(tǒng)計(jì),上海閔行區(qū)西南部工業(yè)區(qū)土壤重金屬Cu、Cr、Mn、Pb、Zn存在明顯積累,含量平均值依次為29.38、106.32、583.14、34.13、111.15 mg·kg-1,且表現(xiàn)為復(fù)合污染或具有同源性。空間分布上,土壤Pb、Cu、Zn空間分異較大,變異系數(shù)分別為 0.86、0.6和 0.55,受到工業(yè)生產(chǎn)等強(qiáng)烈人為活動(dòng)因素干擾;土壤Cr、Mn空間分異小,受外界干擾小。
(2)經(jīng)降噪處理后工業(yè)區(qū)土壤光譜反射曲線整體走勢(shì)一致,呈緩斜型,反射率在10.01%~50.20%之間。除特定譜段受鐵氧化物(409.55 nm)、有機(jī)質(zhì)(825~900 nm)、水(1400~1425 nm)的影響存在光譜曲線吸收帶外,光譜反射曲線走勢(shì)均隨波長(zhǎng)增加而上升。
(3)土壤重金屬含量與不同光譜變換數(shù)據(jù)相關(guān)性分析結(jié)果表明,土壤Cu最優(yōu)特征波段為1440.21 nm;土壤Cr為834.44 nm;土壤Mn為984.98 nm;土壤Pb為1440.21 nm;土壤Zn為1642.50 nm。最優(yōu)特征波段均在近紅外波段范圍內(nèi)。

表4 工業(yè)區(qū)土壤光譜反射率預(yù)測(cè)重金屬含量模型建模及驗(yàn)證精度比較Table 4 Prediction of spectral reflectance of soil in industrial area comparison of modeling and verification accuracy of heavy metal content model
(4)與PLSR建模精度相比,SMLR建模的R2均達(dá)到0.65以上,其中Zn的R2達(dá)到0.974;驗(yàn)證的R2除Mn外其他均達(dá)到0.5以上。SMLR的建模效果優(yōu)于PLSR,各項(xiàng)系數(shù)檢驗(yàn)說(shuō)明SMLR反演預(yù)測(cè)效果更好,對(duì)樣本的擬合度更高,更具有穩(wěn)定性與可靠性,所建模型基本能滿足工業(yè)區(qū)土壤重金屬含量反演預(yù)測(cè)需求。