張義璇
華北理工大學礦業工程學院 河北唐山 063210
礦產資源開發促進了社會經濟的發展,但也給礦區周邊生態環境造成了不同程度的污染[1]。尾礦庫一般是由筑堤截斷谷口或周圍地形成的,主要用作對堆存金屬材料或非金屬材料采礦,通過礦物選別后排出尾礦或其余工業廢棄物的場地。研究尾礦庫的重金屬含量以及鈍化尾礦庫中的重金屬對保護礦區及周邊尾礦環境有重要意義。
土壤中重金屬元素含量很低,在土地光譜反射率的各個波段吸收特性并不明顯,且由于土壤組成成分復雜,各種組成對反映光譜信號的直接影響往往是非線性地混合,從而造成了土壤的反射系統復雜化。常用方式主要是多元線性回歸分析和偏最小二乘回歸分析。鄭光輝等利用偏最小二乘回歸分析建立光譜反射率與土壤重金屬As含量的模型,檢驗預測模型精度,證明可以通過偏最小二乘回歸分析對土壤中As含量進行預測[2]。雖然偏最小二乘回歸分析模型一般都適用于土壤重金屬元素含量反演,但隨著科學技術的發展,一些非線性模型逐漸被用于土壤反演領域中。如BP神經網絡分析(BP)、支持向量機(SVM)、隨機森林(RF)等,這些非線性的數學分析方法在一定程度上提高了預測模型的精度。王金鳳等通過對Zn光譜的7種變換分析,并采用3種建模方法,研究得出基于二階微分變換的隨機森林算法準確度最高[3]。成功等基于多元線性回歸、偏最小二乘回歸、BP神經網絡回歸模型,分別建立土壤重金屬(Cr、Zn、Ni)含量的反演模型,結果表明BP模型的Cr反演效果最好[4]。本文以承德某礦區的釩鈦磁鐵尾礦庫為研究區,通過礦區尾礦樣品采集并進行室內測試,再進行光譜與重金屬元素檢測,建立尾礦重金屬含量反演最佳模型。
對河北省承德市某礦區尾礦庫進行尾礦樣本采集,取樣深度為20cm,重量約為1000g。根據需要可以分層采集尾礦樣品,共采集尾礦樣品81個,采集的尾礦樣品取樣深度以及采集量基本保持一致。采集的尾礦樣品用密封袋保存并且用手持GPS定位,同時對尾礦樣點的情況進行記錄。
影響光譜數據的有很多因素,所以需要對尾礦進行室內處理,通過對尾礦樣品進行室內自然風干來降低水分影響,用橡膠錘敲砸、研具研磨來減小尾礦粒徑影響,將處理后的尾礦過20目篩子,將過篩后的每個尾礦樣品分為3份,其中一份用來測尾礦光譜,另一份密封保存備用,最后一份用來測理化性質再過100目篩子用來測重金屬含量,采用四分法處理尾礦進行含量測定。參考《土壤農化分析》尾礦理化性質測定方法,使用酸溶消解法提取重金屬元素,重金屬提取態使用火焰法以及石墨爐法(島津AA-6880)進行重金屬含量測定[5]。
本研究采用的是ASD Field spec4地物光譜儀進行光譜數據采樣,光檢測范圍為30~2500nm,使用前先進行白板校正,待儀器穩定后再進行實驗,實驗過程中每檢測5個樣本,需要重新優化一次。每份樣本采樣間隔為1nm,共采集10次,并對10條光譜曲線計算平均值,作為該樣點光譜標準曲線。對原始光譜(R)進行SG濾波變換(SG)、一階微分變換(FD)以及二階微分變換(SD)的數學處理。
實驗檢測了研究區尾礦樣品重金屬含量,并分析了其統計特征值(表1),在土壤學研究中,通常使用偏度系數、峰度系數來描述土壤測定數據分布情況、偏離對稱性程度,變異系數來描述土壤性質的異常程度。本文利用統計分析可知,研究區尾礦重金屬元素的均值、標準差、偏度系數、峰度系數及變異系數[6]。
根據重金屬含量統計結果可知,該礦區尾礦庫尾礦樣本全量Cu平均含量為200.44mg/kg,含量范圍為144.02~251.68mg/kg。標準差為22.82,偏度系數與峰度系數分別為-0.1、-0.3,變異系數為11.38%。全量Zn平均含量為168.78g/kg,含量范圍為155.16~180.69mg/kg,標準差為5.48,偏度系數與峰度系數分別為-0.27、-0.43,變異系數為3.25%。全量Cr平均含量為454.52mg/kg,含量范圍為141.16~739.71mg/kg,標準差為139.29,偏度系數與峰度系數分別為-0.41、-0.67,變異系數為30.65%。全量Pb平均含量為1.81mg/kg,含量范圍為0.89~3.05mg/kg,標準差為0.69,偏度系數與峰度系數分別為0.13、-1.64,變異系數為38.24%。全量Cd平均含量為0.09μg/kg,含量范圍為0.07~0.12mg/kg,標準差為0.01,偏度系數與峰度系數分別為0.15、1.96,變異系數為12.45%。土壤標準值參照GB15618-2018《土壤環境質量農用地土壤污染風險管控標準(試行)》pH>7.5。
根據偏度系數的程度可知:假如偏度系數在-0.5~0.5之間,那么數據是較為對稱的;假如偏度系數在0.5~1之間(正偏度)或者-1~-0.5之間(負偏度),那么數據偏斜;假如偏度系數大于1(正偏度)或小于-1(負偏度),那么數據高度偏斜。如果峰度系數為0,則表示該總體數據分布與正態分布的陡緩程度相同;如果峰度系數大于0,則表示該總體數據分布與正態分布相比較為陡峭;如果峰度系數小于0則表示該總體數據分布與正態分布相比較為平坦,峰度系數的絕對值數值越大表示其分布形態的陡緩程度與正態分布的差異程度越大。根據變異的程度可將變異系數進行等級劃分,變異系數在0~15%之間分為小變異,變異系數在16%~35%之間為中等變異,變異系數在高于36%為高度變異。
從尾礦5個重金屬的偏度系數來看,全量Cu、全量Zn、全量Cr、全量Pb偏度系數在在0.5~1之間或者-1~-0.5之間,是輕度偏斜,全量Cd是高度偏斜,偏度系數大于1。由峰度系數可知全量Cu、全量Zn、全量Cr峰度系數小于0,這幾種重金屬含量分布呈平頂峰趨勢,由峰度系數可知全量Pb、全量Cd峰度系數大于0,這幾種重金屬含量分布呈尖頂峰趨勢。根據全量Cu、全量Zn、全量Cd變異系數可知這3種重金屬屬于小變異,表明尾礦重金屬含量在尾礦中的分布比較均勻,全量Cr變異系數為30.65%屬于中等變異,全量Pb變異系數為38.24%屬于高度變異,表明這兩種重金屬含量分布差異性較大。
將尾礦現場采樣樣品使用KS選擇法2∶1分為建模集和驗證集,并對研究區尾礦的原始光譜(R)進行以下3種數學預處理,光譜平滑去噪(SG)、光譜一階微分(FD)、二階微分(SD),并選取與重金屬含量相關性最高的8個波段作為特征波段作為多元逐步回歸(MLSR)的自變量,尾礦的重金屬元素Cu、Zn、Cr、Cd、Pb分別作為因變量,分別建立多種光譜變換的尾礦重金屬含量預測模型。并將驗證集數據代入多元逐步回歸模型中,并對模型的精度和穩定性進行綜合評價(表1)。
多元逐步回歸模型(MLSR)屬于線性模型,該模型容易出現建模集過度擬合情況,導致建模集精度過高,驗證集精度較低。從多元逐步回歸尾礦各個重金屬含量反演最優模型評價結果可知,在建模樣本中,Cu最優模型R2小于0.6,模型擬合精度較低;Zn最優模型R2小于0.6,模型擬合精度較低;Cr最優模型R2小于0.6,模型擬合精度較低;Cd最優模型R2均小于0.6,模型擬合精度較低。Pb三種模型R2小于0.6,模型擬合精度較低。在驗證集中Cu的R2低于0.6;Zn的R2低于0.6,綜合來說二階特征變換精度相對較高,但不具備樣本重金屬含量預測能力(RPD<1.4);Cr的模型不具備預測能力;Cd二階微分特征變換預測模型精度R2小于0.6,RPD也均小于1.4,不具備模型預測能力,Pb二階微分特征變換預測模型精度R2小于0.6,RPD也均小于1.4,不具備模型預測能力。綜合來說,在多元逐步回歸尾礦各種反演模型中,反演精度較高的是Zn,其他模型較低。光譜的微分變換能高建模樣本和驗證樣本的精度,提高模型的預測能力。
從偏最小二乘尾礦各個重金屬含量最優反演模型評價結果可知,在建模樣本中,Cu一階微分變換R2大于0.6,一階微分特征變換具有較高的模型擬合效果,Zn一階微分變換模型精度較高,Cr二階微分變換具有較高的模型擬合效果,Cd最優模型R2均小于0.6,不具有較高的擬合效果,Pb最優反演模型R2均小于0.6,不具有較高的擬合效果。在驗證集中Cu的模型R2小于0.6,不具有一定的樣本預測能力(RPD<1.4);Zn一階特征變換模型R2大于0.6,具有粗略的樣本重金屬含量預測能力;Cr最優模型R2小于0.6;Cd最優模型R2低于0.6,不具有的樣本預測能力,Pb最優模型R2低于0.6,不具有的樣本預測能力(RPD<1.4)。
從BP神經網絡尾礦各個重金屬含量最優反演模型評價結果可知(表2),在建模樣本中,Cu二階微分變換模型R2小于0.6,Zn一階微分變換模型精度較高,Cr二階微分變換具有較高的模型擬合效果,Cd二階微分特征變換R2小于0.6,不具有較高的擬合效果,Pb一階微分特征變換R2均小于0.6,不具有較高的擬合效果。在驗證集中Cu的模型R2低于0.6,不具有樣本預測能力(RPD<1.4);Zn二階微分特征變換模型R2接近0.5,樣本重金屬含量預測能力較差(RPD<1.4);Cr一階微分特征變換模型R2均小于0.6,PRD指數小于1.4,不具備樣本重金屬含量預測能力;Cd二階微分特征變換模型R2低于0.6,不具有的樣本預測能力(RPD<1.4),Pb一階微分特征變換模型R2低于0.6,不具有的樣本預測能力(RPD<1.4)。

表2 不同重金屬對應的最優反演模型
本章詳細介紹了尾礦光譜建模方法以及模型精度評定方法,采用多元逐步回歸模型(MLR)、偏最小二乘模型(PLS)、BP神經網絡模型分別建立研究區尾礦重金屬含量預測模型,并通過交叉驗證法對建立的特征波段模型進行精度驗證,并按照精度評定指標對模型進行精度評定,以選擇各重金屬元素的最佳特征波段反演模型。
(1)尾礦光譜經微分變換后,其與各重金屬元素含量的相關性大多數變高,基于Cu、Zn、Cr、Cd、Pb建立的重金屬含量反演模型,光譜經過微分特征變換后,幾乎所有的模型建模集以及驗證集精度都能顯著提高。
(2)MLR模型精度普遍較低,基于多元逐步回歸篩選剔除剩下的顯著波段,構建ASD光譜信息PLS模型,能夠有效地提高模型的預測精度。可以通過BP神經網絡進行大量的模型訓練,篩選出最優模型。
(3)模型精度整體偏低,PLS-FD反演Cu以及BP-FD反演Zn含量模型能夠粗略預測尾礦重金屬含量。