段海芹,呂衛光,秦 秦,孫麗娟,宋 科,薛 永
(1上海市農業科學院生態環境保護研究所,農業部上海農業環境與耕地保育科學觀測實驗站,上海市農業環境保護監測站,上海低碳農業工程技術研究中心,上海市設施園藝技術重點實驗室,上海 201403;2上海海洋大學海洋生態與環境學院,上海 201306)
近年來,隨著我國城市化、工業化、農業集約化的快速發展,土壤重金屬污染問題日益嚴重,不但影響生態環境,也會給人體健康帶來諸多風險。準確評價土壤重金屬污染狀況是制定科學合理的土壤重金屬污染防治方案的基礎和前提。近年來,國家先后出臺了《土壤環境質量標準》(GB 15618—1995)、《食用農產品產地環境質量評價標準》(HJ 332—2006)、《土壤環境質量建設用地土壤污染風險管控標準(試行)》(GB 36600—2018)等來規范土壤重金屬污染的監測及評價。傳統的土壤重金屬污染評價方法主要有:單因子指數法[1]、地累積指數法[2]和內梅羅指數法[3]等。近年來,又出現了模糊數學法[4]、支持向量機法(SVM)[5]、BP人工神經網絡法[6]以及基于GIS的地統計評價法[7]等綜合或系統評價方法。
基于GIS的土壤重金屬污染評價主要是結合土壤重金屬污染周邊環境的空間信息,利用緩沖區分析、疊置分析、數字地形分析等空間分析功能以及可視化技術對土壤重金屬污染進行分布特征分析、影響因素分析以及預警分析等。王春紅等[8]分別從土壤重金屬來源、地統計學和GIS在土壤重金屬污染研究中的應用、土壤重金屬污染評價方法和土壤重金屬污染預測幾個方面綜述了基于GIS和地統計學的土壤重金屬污染研究進展。李冰茹等[9]分別從專題圖制作、空間分析、數據管理等方面總結和探討了GIS在土壤重金屬污染評價中的具體應用。陶美霞等[10]從大數據與GIS的概念出發,從數據采集、數據管理、空間分析和可視化4個方面對大數據GIS的發展進行了闡述探討。本文結合GIS技術特點、空間分析功能以及土壤重金屬污染情況,闡述GIS在土壤重金屬污染評價中專題圖制作、空間特征分析以及預警模型建立等具體應用,同時對不同插值方法做簡要概述,以探討該領域目前面臨的主要問題和下一步研究方向。
土壤污染專題圖可以有效的反應重金屬在土壤中的空間分布特征,并從中挖掘出引起區域內土壤環境變異的因素。通常的做法是根據已知數據,選取不同的插值方法繪制空間分布圖,并進行分層設色,從而直觀、形象的揭示土壤重金屬污染的空間分布特征。土壤重金屬污染具有空間分布的變異性,克里格插值是通過觀測點與預估點之間的空間位置以及相對位置關系來確定觀測值的權重,并進行滑動加權平均來估計未知點的平均值,從而反應土壤中污染物的二維分布情況。克里格插值法為土壤重金屬的空間分布預測提供了一種無偏最優估值方法,并被證明是分析土壤重金屬空間分布及其變異規律最為有效的方法之一[8]。
待估采樣點的幾何性質、變異函數以及已知采樣點的數據結構等會影響克里格插值的效果,因此,不同的使用范圍應選用相應的克里格插值方法。Saby等[11]選取了法國巴黎附近的區域,并分別利用普通克里格、對數正態克里格以及協同克里格方法進行空間插值,結果表明,對數正態克里格插值的效果最好。Liu等[12]以浙江杭州、湖州和江西的部分地區作為試驗區,采用普通克里格和對數正態克里格兩種插值方法繪制重金屬空間分布圖,并使用析取克里格進行超出閾值的重金屬濃度的概率計算,同時使用協同克里格方法減少Cu、Zn、Cr這三種重金屬的采樣密度。凌輝等[13]采用5種不同的插值方法比較重慶市江津區吳灘鎮的部分區域土壤中Cr的空間變異性,結果顯示普通克里格法的效果最好,而反距離加權法的效果最差。侯沁言等[14]選取凱江流域作為試驗區,分別使用析取克里格法、徑向基函數法、普通克里格法和反比距離權重法進行空間插值,結果表明普通克里格插值方法的誤差最小,更接近于真實情況。總體上,克里金插值在塊金尺度上較為明顯,利用此方法對土壤重金屬污染情況進行讀圖分析時易將污染變異區域擴大化,模糊重金屬污染分布區域邊界。因此,在土壤重金屬污染專題圖制作過程中,插值方法的選擇需要根據研究區域面積、背景因素等進行綜合考慮,將分析誤差降到最小。
近幾年,GIS中新集成了模糊數學、回歸模型等數學模型,土壤重金屬的污染評價更加的靈活和客觀[15]。同樣地,在大數據時代,GIS的可視化重點已不單單局限于靜態的圖形、符號、尺度和三維等方面[16],可以結合一些新的可視化分析軟件,如OpenGL、Echarts、CesiumJS、kepler.gl、Mapbox等,通過交互可視界面對土壤重金屬污染進行多尺度、多因素的分析和比較。
土壤重金屬污染的來源很廣泛,既包括垃圾站點等點狀污染源,也有河流等線狀污染源,甚至還有可能是來自于自身的成土母巖,這些污染源雖然形狀不一,但都包含了空間位置特征,都對周圍土壤的影響形成了空間上的距離效應[9]。因此,對這些污染源進行緩沖區分析,可以有效地揭示其對周邊環境的影響。趙彥峰等[17]通過將重金屬空間分布圖、鎮區圖和工廠分布圖進行疊加,并以工廠為中心建立緩沖區,發現距工廠越遠,土壤重金屬含量越低。陳優良等[15]通過建立河流的緩沖區,結合河流與樣區的空間分布,驗證了Pb、Ni和Cu可能以下滲及擴散的方式進行傳播的推測。GIS的緩沖區分析在獲得土壤重金屬污染源的影響范圍、距離關系等結果的同時,也可以用來對污染源的影響因子進行分析或對位置地物進行風險評價。劉賢趙等[18]對地表水質和城市化的關系進行緩沖區分析,發現當緩沖區半徑為2 km時,影響水質的主要因素是建設用地和人口密度。代英等[19]借助ArcGIS9.0平臺,結合地統計學、緩沖區分析和疊加分析,發現成都平原核心區不同區域、不同斷面和不同流域內Hg和Pb的含量均存在顯著差異。
在土壤重金屬污染評價中,GIS的疊加分析功能主要是將土壤重金屬的分布特征圖與研究區域的成土母質圖進行疊加,以分析土壤重金屬的空間分布特征與土壤質地、地形、大氣沉降和人類活動等各種因素之間的關系[9]。Li等[20]將重金屬的空間分布圖與道路、建筑、工廠的地圖進行疊加,發現重金屬的可能來源是主要道路、工業建筑的交叉區域,污染區域一般是老工業區和居民區。趙彥峰等[17]將重金屬空間分布圖、工廠分布圖及鎮區緩沖區圖進行疊加,發現距城鎮越遠,土壤中Pb含量越低;距工廠越遠,土壤中Cu、Zn、Cd含量越低。史文嬌等[21]將雙城市空間分布圖與工廠、道路、城鎮、土壤類型、土壤理化性質、高程等數據進行疊加,以分析重金屬空間變異的原因。Facchinelli等[22]為了探尋意大利皮埃蒙特地區土壤重金屬的污染程度與變異情況,通過克里格插值得到了重金屬的空間變異圖,采用主成分分析和聚類分析方法,找出了污染程度最高的重金屬,通過疊置分析,得出了主要污染源是人類活動的結論。
GIS中的數字高程模型和數字地形模型都是借助坡度和坡向分析來描述地形起伏狀態,以此來分析土壤中重金屬的空間遷移規律。在分析因流水侵蝕而影響的污染面積時,可以先使用正射影像生成三維數字高程模型對流水侵蝕造成的重金屬遷移變化特點進行分析,再依據尾礦侵蝕中水的徑流方向結合采樣點三維數組進行計算分析[23]。利用不規則三角網構建三維數字高程模型不僅可視化效果好,而且能夠更加清晰地展示重金屬在空間的富集特征和分布規律[24],同時數字地形分析不僅能夠直觀地揭示土壤重金屬的分布特征,也可以分析重金屬隨著地形變化的遷移規律。兩者結合可以更好地揭示重金屬元素在三維空間的分布規律。
傳統的GIS空間數據庫以相對靜態數據為主(如土壤重金屬污染采樣點數據等),無法滿足大數據時代流數據的要求,且空間數據查詢及分析主要針對可控制的操作,查詢僅為靜態的一次查詢[16]。同樣地,在土壤重金屬污染方面,獲取某一時間點或時間段的土壤重金屬富集量及其空間特征,往往無法反映不同時段土壤中重金屬的富集量和積累進度等信息[9]。因此,可以考慮對土壤重金屬污染點位的數據進行實時動態采集,同時融合土地利用數據、遙感影像數據、POI數據、建筑數據等多源數據,對土壤重金屬污染進行綜合分析。在技術方面,空間分析方法可以多樣化;空間數據存儲和管理可以使用PostgreSQL關系型數據庫與HBase、MongoDB等非關系型數據庫相結合的方式,也可以使用基于MapReduce范式的Hadoop或者Spark大數據框架進行實時計算分析;數據處理可以應用為導向,綜合使用時空聚合、多尺度分析等方法。
土壤重金屬的預測是指在一定時間內分析和評價土壤重金屬污染狀況,確定土壤質量變化的趨勢以及達到一定變化極限所需的時間,以便及時了解土壤環境的變化,糾正各種預警信息,并及時給出相應的對策[25]。目前,土壤重金屬污染預測模型主要包括灰色預測模型、土壤重金屬累積預測模型、回歸預測模型和情景預測模型等,污染物動力學預測方法主要包括時間動態預測模型,非線性動態模型和正交性動態預測模型等[26]。周勇[27]將回歸預測模型和灰色預測模型進行耦合,預測了東湖湖水的水質。孟凡喬等[28]運用土壤重金屬累積預測模型對河北省蛟河區和府河區表土層(0—20 cm)中重金屬進行了累計預測分析,并預估了該地區20年后土壤中As、Hg等的含量。葛向東等[29]利用灰色預測模型對江蘇省錫山市的耕地預警系統進行了研究,預測了土壤質量指數的變化趨勢。隨著GIS技術的普及,越來越多學者開始借助地理信息系統輔助設計預警模型。嚴加永等[30]利用地理信息系統(GIS)技術成功實現了北京市及近郊土壤重金屬污染的預警和Pb元素超標年限的預測。李向等[31]采用地理信息系統(GIS)與多智能體系統(MAS)相結合的方式,在包頭市及近郊完成了多智能體評價及預測的分工和協作規則,為處理土壤重金屬污染評價和安全預警提供了平臺。但在分析土壤重金屬污染來源時,由于對各污染來源因子與各重金屬間關系缺乏合理深入的探究,對污染源的分析結果常常比較寬泛,往往造成源分析(土壤)結果的不確定性。
目前,關于重金屬預測方面的機器學習方法有很多,包括BP神經網絡[32]、貝葉斯最大熵(Bayesian maximum entropy,BME)法[33]、隨機森林(RF)模型[34]等。研究表明,BP神經網絡的函數逼近能力、模式識別、回歸計算等已被廣泛應用于環境科學領域,并取得了一定的效果[35-36];BME作為一種相對新穎的地統計學方法,能夠綜合利用各種類型數據,從而提高預測的準確性[37];隨機森林模型在大數據挖掘和處理方面具有獨特的優勢,可以在較少量的運算條件下解決不同因子間缺失值情況以及傳統分類方法的過度擬合問題[34]。范俊楠等[32]利用監測數據建立的3層BP神經網絡模型預測了湖北省重點監測區域重金屬Mn、Co、V、Ag、Ti、Sb的含量,顯示構建的BP神經網絡預測模型具有良好的精準度。費徐峰等[37]應用貝葉斯最大熵(Bayesian maximum entropy,BME)法對浙江省杭州市土壤重金屬的空間分布進行了預測,為提高土壤重金屬預測精度提供了新的思路。Hu等[38]通過利用條件推理樹和隨機森林模型對珠三角流域土壤中重金屬來源進行分析,發現土壤中重金屬As、Cd、Cr、Cu、Ni、Pb和Zn的含量中分別有48%、42%、50%、51%、49%和24%來自于人類活動。郭星等[34]通過采用隨機森林模型對重金屬的污染來源進行探討,發現道路距離是影響Pb的最主要因素,其次是GIP和企業距離。另外,考慮到BME法的多源數據融合能力,在今后的研究中還可以引入與土壤重金屬密切相關的其他土壤屬性信息(如有機質、pH等)、人為因素信息(工業、農業、交通等數據)等。此外,在后續引入數值變量的研究中還可以對不同克里金方法和BME法進行比較,進一步提高輔助數據的利用效率[37]。
近年來,隨著大數據GIS以及Web可視化技術的發展,可以使用更多樣豐富的形式來輔助土壤重金屬的預測。比如,利用Python和Vue搭建一個土壤重金屬預測web交互式系統,借助Echarts、Mapbox、Leaflet等可視化工具,通過ArcGIS Server API將ArcGIS的分析結果展示到Web端,以支持用戶自定義分析和查詢需求。
GIS技術的引入在制作污染評價專題圖、分析土壤空間特征以及建立預警模型等各個環節都起到了很好的促進作用,使得土壤重金屬污染評價更加直觀、精確。但是,也存在一些不足:①大數據時代,基于泛在信息融合的跨領域研究越來越受到人們的重視,可以結合土地利用數據、遙感影像數據、POI數據、建筑數據等多源數據進行土壤重金屬污染多尺度的分析;②時空GIS仍然是當前研究的熱點,獲取某一時間點或時間段的單一土壤重金屬污染數據以及單一的專題圖輸出方式很難較好地反應土壤重金屬污染的變化趨勢,無法對其污染情況做出準確預測。因此,可以對污染數據進行實時采集、處理、分析并輔以可交互的可視化分析方式,以更好地反應出土壤重金屬污染的變化規律以輔助決策;③土壤重金屬含量空間變異研究方面。由于土壤中重金屬的含量受人為因素影響較大,很難滿足正態分布,即很難符合內蘊假設,因此,空間插值的準確性有待提高。