李富富,陳東湘,王院民,顏道浩,吳紹華
基于隨機森林與地統計預測城市土壤PAHs分布
李富富1,陳東湘3,王院民1,顏道浩1,吳紹華2,4*
(1.南京大學地理與海洋科學學院,江蘇 南京 210046;2.浙江財經大學土地與城鄉發展研究院,浙江 杭州 310018;3.浙江財經大學東方學院,浙江 杭州 314408;4.國土資源部城市土地資源監測與仿真重點實驗室,廣東 深圳 518034)
收集南京城區采樣點位置信息和環境變量等數據,應用地統計和隨機森林方法,以及兩種方法相結合分別預測土壤多環芳烴(polycyclic aromatic hydrocarbons, PAHs)含量,并比較不同方法預測精度.結果表明:隨機森林與地統計方法結合能大幅度提高城市土壤污染物制圖精度,整合克里金與隨機森林預測殘差模型擬合優度2相比克里金插值法提高74.8%.PAHs空間制圖結果能夠較好擬合污染物的變化范圍,識別污染高值區與低值區的空間分布.隨機森林輸出特征重要性發現影響南京城區土壤PAHs分布的主控因子為土壤碳和土壤粒度以及工廠密度.本研究可為城市污染物高分辨率和高精度制圖以及污染防控治理提供參考.
城市土壤;多環芳烴;空間分布;地統計;隨機森林
城市土壤作為污染物的源與匯,對城市生態環境質量和人類健康具有重要影響[1].多環芳烴(PAHs)是一種土壤中常見的持久性有機污染物,具有三致毒性,在城鎮化進程中城市土壤PAHs污染愈加嚴重[2].為了有效防控PAHs對人體和生態環境的危害,需要對PAHs含量和空間分布進行研究.由于城市土壤的空間高度異質性和污染來源的復雜多樣性[3-4],開展土壤污染物空間分布高精度制圖有利于研究污染物排放、遷移以及累積特性,為制定污染物防控政策提供支持.
當前對PAHs污染空間分布研究主要采用地統計方法和數理統計法.應用地統計方法能直觀地觀察污染熱點區域.鄭一等[5]利用克里金插值法評價了天津表土多環芳烴含量,克里金法計算半變異函數,描述了污染物在空間分布上的結構性.由于城市中人類活動強烈,污染物分布在局部變異也會很大,導致克里金插值結果精度并不高.而數理統計方法更多是用來提取PAHs主要成分譜信息,結合源指紋特征推斷PAHs來源,只能粗略對污染物高低值樣點進行分類[6].傳統的空間制圖方法難以精細化表征城市土壤污染空間分布,因此需要在前人基礎上提出新的方法研究土壤PAHs空間分布.
研究表明土壤PAHs累積受到眾多源匯因子的影響.例如工廠廢棄物排放[7]、生物質燃燒[8]、冶煉、煤炭加工[9]、城市交通排放[10]等源因子,以及大氣干濕沉降速率[11-12]、土壤有機碳和黑碳含量[13-14]、土壤粒度[15-16]等匯因子.同時有研究報道土壤pH值會影響土壤微生物活性和有機物吸附PAHs親和力進而間接影響土壤PAHs累積[17],城市植被也會對PAHs累積過程產生直接或間接影響[18-21].利用這些環境因子或可更精確地預測土壤PAHs空間分布.隨機森林模型可以很好地處理非線性問題[22],已經應用在地學領域,如土地利用分類[23]、土壤有機質含量預測[24-25]、土壤氮元素預測[26].可利用隨機森林模型揭示環境因子與PAHs累積的非線性信息,而克里金法可以描述PAHs含量與空間位置關系,因此機器學習方法與地統計方法組合或可對PAHs空間分布做出高精度的預測[27].
本研究選擇南京市作為研究區,采集土壤污染數據與環境變量數據,驗證隨機森林模型與地統計方法結合對土壤PAHs制圖精度,提出高空間變異的城市土壤PAHs制圖方法,識別環境因子對PAHs累積影響的重要性,為制定污染防控措施和進一步研究PAHs累積過程提供理論參考.

圖1 研究區位置以及采樣點分布
本研究選取南京主城區作為研究區(31°56'~ 32°10'N,118°40'~118°58'E)(圖1).南京屬丘陵地區,氣候類型為北亞熱帶濕潤氣候,年均氣溫15.4℃,年均降水量為1106mm.全市森林覆蓋率為27.3%,綠化覆蓋率為44.2%.南京地區的土壤在北、中部廣大地區為黃棕壤,南部有小面積的紅壤.南京市重工業產值比重較大,電子設備制造業、化工制造業、汽車制造業、石油加工、煉焦業實現的工業總產值均超過億元.南京市主城區人為活動劇烈,人口密度大,交通密集,是PAHs重要排放源.
采用網格布點法采集樣品,在研究區用五點法采集表層(0~5cm)土壤樣品 111個,樣點分布如圖1.樣品在常溫條件下干燥,過20,60,100目篩保存于棕色玻璃瓶中,置于-4℃環境中待檢測.

提取與凈化:將5g土樣與5g無水硫酸鈉混合均勻,用濾筒包裹后置于索式抽取器的抽濾筒中,在平底燒瓶中依次加入100mL的二氯甲烷和正己烷混合液(=1:1),2g活化的銅片,連續索式提取24個小時;提取液在旋轉蒸發儀上濃縮至約2mL后,加入10ml正己烷,繼續濃縮至1~2mL.將濃縮后的提取液加入硅膠層析柱進行分離凈化.采用正己烷濕法裝柱,依次裝入棉花,5g硅膠以及2cm的無水硫酸鈉;濃縮液上柱后,分別用15mL正己烷和50mL的二氯甲烷和正己烷混合液(=2:3)進行淋洗,正己烷淋洗正構烷烴后不收集,混合溶劑淋洗多環芳烴后收集處理.收集后的溶液用正己烷轉換溶劑后,用高純氮吹至1mL,裝入GC瓶,上機待測.
儀器分析:用氣相色譜-質譜聯用儀(Shimadzu QP2010Ultra)對濃縮液中的多環芳烴進行定量分析.色譜柱為Rtx-5MS(長度30m,內徑0.5mm,涂層0.25mm),載氣為氦氣.采用不分流進樣,進樣量設定為1mL.接口和離子源的溫度分別設置成280,230℃.離子源采用EI模式,數據采集則選擇SIM模式.
質量控制:樣品處理過程中,每6個樣品增加一個空白和基質空白實驗;每12個樣品做一次重復實驗,如果偏差超過15%則重新測試.16種多環芳烴采用外標法測定,標準曲線的溶液濃度依次為4,10, 50,100,400,800mg/L.通過添加標樣的方法做回收率實驗,萘的平均回收率為73.8%,其他15種化合物平均回收率為84.5%~104.2%,符合環境樣品分析要求.
1.2.2 土壤其他指標分析 土壤總碳采用重鉻酸鉀-硫酸消化法測定;酸處理去除碳酸鈣、硅酸鹽,氧化處理去除有機碳,干燥后用元素分析儀(CHN- O-Rapid)測定黑碳含量.土壤粒度(SOT)和pH值:土壤粒度采用英國馬爾文土壤顆粒激光粒度儀測定;土壤pH值采用電位法測定.
土壤PAHs排放、遷移、降解和累積受到多種因素的共同影響.本文將土壤總碳(TOC)、土壤黑炭(BC)、土壤粒度(SOT)、土壤pH值、非滲透系數(IMP)、葉面積指數(LAI)、工廠密度(PLA)作為環境變量,通過建立模型來預測土壤PAHs最終累積含量的空間分布.由百度地圖上抓取的南京市工廠點位數據進行密度計算得到工廠密度.非滲透系數、葉面積指數通過遙感解譯獲得[28].所有環境變量進行500m×500m空間參數化,為建模提供基礎數據.
1.4.1 克里金法 空間制圖克里金法是基于區域化變量理論進行空間插值的方法.克里金法基于采樣數據計算半方差函數來反映區域化變量結構信息,根據待估計點有限鄰域內采樣數據,考慮待估計點與采樣點的空間關系,滿足二階平穩假設條件下對待估計點進行無偏最優估計.本研究利用普通克里金法繪制土壤PAHs空間分布圖.
1.4.2 隨機森林空間制圖 隨機森林是一種以bagging方法集成CART決策樹進行分類或回歸的機器學習集成算法.本研究應用Python中scikit- learn庫建立隨機森林模型,參數n_estimators=500, max_features=0.33.本研究PAHs含量變異較大,不符合正態分布,因此采用分層隨機抽樣將數據集分為訓練數據集與驗證數據集.模型建立后將參數化環境變量數據輸入模型繪制土壤PAHs空間分布圖.
1.4.3 整合隨機森林與克里金法 克里金法考慮了PAHs含量空間位置的關系.隨機森林模型考慮了PAHs在環境中累積與環境因子的關系.整合克里金法與隨機森林法或可更好地預測城市土壤中多環芳烴含量.本研究采用模型平均與殘差補償來整合兩種模型.模型平均即將兩種方法預測的結果進行簡單平均作為最終結果.殘差補償即先應用克里金插值預測,然后將預測結果的殘差作為因變量,環境變量為自變量建立隨機森林模型,最后將隨機森林預測結果與克里金插值結果進行相加得到最終預測結果.將參數化環境變量數據分別輸入整合模型繪制土壤PAHs空間分布圖.
1.4.4 精度評價 將驗證集數據應用于4種模型來評估模型精度,即克里金插值模型(K),隨機森林模型(RF),兩種模型的均值模型(K-RFaverage),殘差補償模型(RFerr+K).計算每種模型預測的平均誤差(ME)、平均絕對誤差(MAE)、均方根誤差(RMSE)和決定系數(),ME越接近0表明估計越無偏.MAE和RMSE越小表明預測誤差越小;越接近于1表明模型擬合優度越高.
隨機森林模型特征重要性函數可以用來識別影響區域內PAHs累積的主控因子.特征重要性函數通過計算環境變量對樣本集進行分割后降低預測目標的不確定性大小,用Gini index減小值表示,Gini index減少值越大,則因子重要性越大[29].因子重要性實質上是對PAHs分布預測結果貢獻大小的統計.比如土壤碳、粒度和工廠密度等因子對預測結果貢獻大,說明PAHs的累積與這些因子有關,通過前人研究結果可知工廠排放是PAHs累積的源因子[30],土壤碳、粒度是匯因子[16,31].

表1 研究區采樣點土壤PAHs含量描述性統計
研究區內采樣點總計111個,分層隨機抽樣86個為訓練樣本,25個為測試樣本(圖1).利用SPSS進行數據描述性統計分析.由表1可以看出,訓練集與驗證集極大值、極小值、平均值較為統一.訓練集和驗證集的變異系數分別為131%和155%,說明土壤多環芳烴含量變異很大.根據偏度值和峰度值可以判斷,訓練集和驗證集均為非正態分布.克里金插值雖然不嚴格要求數據呈正態分布,但當數據偏離正態分布太遠可能插值效果不理想.隨機森林則對數據分布特征沒有要求.分層隨機抽樣保證了訓練集和驗證集數據分布的基本一致,因此模型建立與評價可靠性高.
2.2.1 克里金模型插值分析 使用ArcMap地統計模塊選擇普通克里金法插值分析.計算得半方差函數幾乎為一條水平直線,塊金值為0.19,基臺值為0.20,塊金值與基臺值的比值大于0.95,表明其空間自相關性較弱,插值的準確性較低.
2.2.2 隨機森林訓練集結果分析 使用Python3.6中scikit-learn庫建立隨機森林模型.第一個隨機森林模型為完全隨機森林模型(RF),以城市土壤PAHs為因變量.第二個模型為殘差隨機森林模型(RFerr),克里金插值預測值與實測值的殘差為因變量.在訓練集上隨機森林顯示出很好的擬合優度,決定系數為0.949,對于克里金插值殘差的訓練集,決定系數達到了0.957(圖2).
2.2.3 模型精度評價 觀察模型評價的4個指標(表2),從ME和2數值上看隨機森林模型顯示出最好的預測精度;而MAE和RMSE在數值上顯示RFerr+K模型是最好的預測模型.ME表示預測結果隨機誤差的平均值,由于隨機森林模型在預測低值區和高值區時存在系統性偏差,即存在低值區被高估和高值區被低估的現象.對于南京地區來說當土壤多環芳烴均值為750mg/kg[32],環境變量對其無法進一步精確區分;當高值大于4800mg/kg時,受樣點數影響,機器學習效果較差(圖4b).因此ME不能說明隨機森林模型比RFerr+K模型精度更高.2是預測值回歸平方和與總離差平方和之比,反映了自變量對因變量的解釋程度,2接近于1,觀察點在回歸直線附近越密集.由于隨機森林模型在PAHs含量中值區預測效果很好,因此2較高.但是隨機森林在低值區和高值區預測存在偏向相反的系統性誤差,雖然整體上2顯示回歸擬合較好,但是不能認定其精度更高,還需要結合樣點總體空間分布預測精度進行判斷.

a為隨機森林模型在PAHs含量訓練集上預測結果;b為隨機森林模型在克里金殘差訓練集上預測結果
RFerr+K模型評估結果顯示其絕對誤差(MAE)和均方根誤差(RMSE)最小,模型精度最高.2較高也表明了其整體上可以較好地解釋因變量的變異,但是僅依靠這些統計指標無法反映模型在污染高值區與低值區空間分布預測精度.因此結合圖3、圖4對樣點總體空間分布的模型精度進行比較.由圖3可以看出隨機森林模型在中值區2.8~3.5擬合很好,而高值區低值區有較大偏差;RFerr+K模型在1.7~4.0高低值區整體上有較好的預測精度.圖4中隨機森林模型最低值預測結果為750mg/kg,而最高值僅為4800mg/kg,與實測值24,17043mg/kg有較大差距;而RFerr+K模型最低值預測結果為0mg/kg,而最高值為8325mg/kg,在空間分布預測上準確度和精細度都有很大提升.
因此RFerr+K模型可以整合環境變量以及空間結構信息,為0.687相比克里金插值法提高74.8%,同時對PAHs高值區和低值區有較好的識別以及提升整體上預測精度.機器學習算法可以處理土壤PAHs含量與影響因子之間的非線性關系,結合地統計方法可提高制圖精度.

表2 模型精度評價

圖3 各模型驗證集擬合優度
a為克里金插值模型驗證集擬合優度;b為隨機森林模型驗證集擬合優度;c為RFerr+K模型驗證集擬合優度;d為K-RF average模型驗證集擬合優度,陰影部分表示預測精度置信水平為95%的置信區間
各模型建立完成后輸入相關參數進行模型制圖,結果如下(圖4).從整體上看4種模型制圖具有一定一致性,土壤PAHs含量高值區均位于研究區西南部.克里金模型和隨機森林模型由于考慮的影響因素不同,最終在預測圖中體現出差異.克里金模型通過半變異函數定量化PAHs分布的空間結構,預測高低值分布范圍較廣.隨機森林模型通過環境變量與PAHs含量的非線性關系預測中值區精細度較高.對PAHs高值區和低值區空間分布識別以及整體精度上RFerr+K模型顯示了良好的預測效果.如圖5所示,隨機森林輸出因子重要性前5位分別為土壤總碳(TOC)、土壤黑碳(BC)、土壤粒度(SOT)、工廠密度(PLA)、土壤pH值,說明隨機森林模型綜合了這些環境變量信息比較精細地預測PAHs含量.而葉面積指數(LAI)和非滲透系數(IMP)難以精細表征出植被和降雨徑流、入滲對PAHs積累的關系.需要更合適的指標.

圖4 不同模型土壤PAHs空間分布預測
a為克里金插值模型預測圖;b為隨機森林模型預測圖;c為K-RF average模型預測圖;d為RFerr+K模型預測圖

圖5 因子重要性評價
隨機森林特征重要性函數表示該環境變量對預測結果的相對貢獻值,隨機森林對因子重要性評價可以識別PAHs分布主控因子.結合前人研究確定PAHs源與匯,以便于更深入地研究該種因素影響過程、機理.輸出因子重要性結果如圖5,土壤總碳(TOC)、黑碳(BC)、土壤粒度(SOT)、工廠密度(PLA)排在前列,說明這些因子是PAHs累積的主控因子.
研究表明土壤碳對PAHs的物理化學行為、生物過程有顯著的影響,如有機質吸附限制了土壤中PAHs的降解是其富集的主要影響因子[14,31];黑碳具有高度芳香化結構,生物化學和熱穩定性好,具有較大的表面積,能使極性或非極性有機化合物線性吸附發生偏離[33].土壤粉粒對PAHs吸附有很大影響;粗粉砂中有機質對PAHs富集能力很強[34].工業企業點位與PAHs排放量密切相關,一些焦化企業是土壤PAHs主要排放源[35].本研究區企業密度高值區與污染高值區分布趨于一致.土壤pH值對PAHs預測也有相當影響,土壤pH值可能影響腐殖質的極性,從而影響腐殖質對PAHs親和力.葉面積指數和非滲透系數2個指標對PAHs分布預測貢獻較小,可能由于其難以表征植被與降雨徑流、入滲對PAHs累積過程的影響.隨機森林因子重要性排序結果與前人研究揭示影響PAHs排放源、吸附、遷移、降解等過程的環境變量基本相符,表明利用隨機森林特征重要性函數可以識別環境因子對土壤多環芳烴富集影響的重要程度.
3.1 以南京市作為研究區,建立各預測模型.通過精度驗證發現RFerr+K模型能夠有效整合環境變量以及空間結構信息,對PAHs污染高值區和低值區有較好的識別以及提升整體預測精度.
3.2 因子重要性評價結果表明土壤總碳、黑碳和土壤粒度是影響PAHs累積的匯因子,工廠排放是PAHs累積的源因子.
[1] Paterson E, Sanka M, Clark L. Urban soils as pollutant sinks — a case study from aberdeen, Scotland [J]. Applied Geochemistry, 1996,11(1): 129-131.
[2] 姚 宏,張士超,劉明麗,等.基于城鎮化進程表層土壤多環芳烴來源解析及風險評價[J]. 環境科學, 2018,39(2):889-898. Yao H, Zhang S C, Liu M L, et al. Sources and risk assessment of polycyclic aromatic hydrocarbons from the urbanization process of topsoil [J]. Environmental Science, 2018,39(2):889-898.
[3] Yunker, Mark B, Macdonald, et al. PAHs in the fraser river basin: A critical appraisal of pah ratios as indicators of pah source and composition [J]. Organic Geochemistry, 2002,33(4):489-515.
[4] 倪進治,駱永明,魏 然,等.長江三角洲地區土壤環境質量與修復研究V.典型地區農業土壤中多環芳烴的污染狀況及其源解析[J]. 土壤學報, 2008,45(2):234-239. Ni J Z, Luo Y M, Wei R, et al. Soil environmental quality and remediation in yangtze river delta region V. pollution status and sources of polycyclic aromatic hydrocarbons in agricultural soils of typical districts [J]. Acta Pedologica Sinica, 2008,45(2):234-239.
[5] 鄭 一,王學軍,劉瑞民,等.天津地區土壤多環芳烴的克里格插值與污染評價[J]. 中國環境科學, 2003,23(2):113-116. Zheng Y, Wang X J, Liu R M, et al. Kriging interpolation and pollution assessment of pahs in soil in tianjin area [J]. China Environmental Science, 2003,23(2):113-116.
[6] 劉 庚,畢如田,王世杰,等.某焦化場地土壤多環芳烴污染數據的統計特征[J]. 應用生態學報, 2013,24(6):1722-1728. Liu G, Bi R T, Wang S J, et al. Statistical characteristic analysis of soil PAHs in a coking contaminated site of China [J]. Chinese Journal of Applied Ecology, 2013,24(6):1722-1728.
[7] 朱崗輝,孫 璐,廖曉勇,等.郴州工業場地重金屬和PAHs復合污染特征及風險評價[J]. 地理研究, 2012,31(5):831-839. Zhu G H, Sun L, Liao X Y, et al. Combined pollution of heavy metals and PAHs and its risk assessment in industrial sites of Chenzhou city [J]. Geographical Research, 2012,31(5):831-839.
[8] Cao H, Chao S, Qiao L, et al. Urbanization-related changes in soil pahs and potential health risks of emission sources in a township in southern jiangsu, China [J]. Science of the Total Environment, 2016, 575:692.
[9] 薛荔棟,郎印海,劉愛霞,等.黃海近岸表層沉積物中多環芳烴來源解析[J]. 生態環境學報, 2008,17(4):1369-1375. Xue L D, Lang Y H, Liu A X, et al. Source analysis of polycyclic aromatic hydrocarbons in coastal surface sediments of the yellow sea [J]. Acta ecologica sinica, 2008,17(4):1369-1375.
[10] Reis A P M, Shepherd T, Nowell G, et al. Source and pathway analysis of lead and polycyclic aromatic hydrocarbons in lisbon urban soils [J]. Science of the Total Environment, 2016,573:324-336.
[11] Maisto G, Nicola D E, Lovien Pet al. Pahs and trace elements in volcanic urban and natural soils [J]. Geoderma, 2006,136(1):20-27.
[12] Wilcke W. Global patterns of polycyclic aromatic hydrocarbons (pahs) in soil [J]. Geoderma, 2007,141(3/4):0-166.
[13] Liu S D, Xia X H, Zhai Y W, et al. Black carbon (bc) in urban and surrounding rural soils of Beijing, china: Spatial distribution and relationship with polycyclic aromatic hydrocarbons (pahs) [J]. Chemosphere, 2011,82(2):223-228.
[14] Yang Y, Tao S, Zhang N, et al. The effect of soil organic matter on fate of polycyclic aromatic hydrocarbons in soil: A microcosm study [J]. Environmental Pollution, 2010,158(5):1768-1774.
[15] Li H, Chen J, Wei W, et al. Distribution of polycyclic aromatic hydrocarbons in different size fractions of soil from a coke oven plant and its relationship to organic carbon content [J]. Journal of Hazardous Materials, 2010,176(1):729-734.
[16] Liao X, Ma D, Yan X, et al. Distribution pattern of polycyclic aromatic hydrocarbons in particle-size fractions of coking plant soils from different depth [J]. Environmental Geochemistry & Health, 2013, 35(3):271-282.
[17] Pietri J C A, Brookes P C. Relationships between soil ph and microbial properties in a uk arable soil [J]. Soil Biology & Biochemistry, 2008, 40(7):1856-1861.
[18] Kiss M, Takács á, Pogácsás R, et al. The role of ecosystem services in climate and air quality in urban areas: Evaluating carbon sequestration and air pollution removal by street and park trees in szeged (hungary) [J]. Moravian Geographical Reports, 2015,23(3):36.
[19] Komprdová K, Komprda J, Men?ík L, et al. The influence of tree species composition on the storage and mobility of semivolatile organic compounds in forest soils [J]. Science of the Total Environment, 2016,553:532-540.
[20] Selmi W, Weber C, Rivière E, et al. Air pollution removal by trees in public green spaces in strasbourg city, france [J]. Urban Forestry & Urban Greening, 2016,17:192-201.
[21] Simonich S L, Hites R A. Vegetation-atmosphere partitioning of polycyclic aromatic hydrocarbons [J]. Environmental Science & Technology, 1994,28(5):939.
[22] 方匡南,吳見彬,朱建平,等.隨機森林方法研究綜述[J]. 統計與信息論壇, 2011,26(3):32-38. Fang Q N, Wu J B, Zhu J P, et al. Review of random forest methods [J]. Statistics and information BBS, 2011,26(3):32-38.
[23] 郭玉寶,池天河,彭 玲,等.利用隨機森林的高分一號遙感數據進行城市用地分類[J]. 測繪通報, 2016,(5):73-76. Guo Y B, ChiT H, PengL, et al. Classification of urban land using gaofen remote sensing data from random forest [J]. Bulletin of surveying and mapping, 2016,(5):73-76.
[24] 任 麗,楊聯安,王 輝,等.基于隨機森林的蘋果區土壤有機質空間預測[J]. 干旱區資源與環境, 2018,32(8):144-149. Ren L, Yang L A, Wang H, et al. Spatial prediction of soil organic matter in apple region based on random forest [J]. Resources and environment in arid region, 2018,32(8):144-149.
[25] 王茵茵,齊雁冰,陳 洋,等.基于多分辨率遙感數據與隨機森林算法的土壤有機質預測研究[J]. 土壤學報, 2016,53(2):342-354. Wang Y Y, Qi Y B, Chen Y, et al. Prediction of soil organic matter based on multi-resolution remote sensing data and random forest algorithm [J]. Acta agronomica sinica, 2016,53(2):342-354.
[26] 郭澎濤,李茂芬,羅 微,等.基于多源環境變量和隨機森林的橡膠園土壤全氮含量預測[J]. 農業工程學報, 2015,31(5):194-202. Guo P T, Li M F, Luo W, et al. Prediction of soil total nitrogen content in rubber plantations based on multi-source environmental variables and random forests [J]. Acta agriculturae sinica, 2015,31(5):194-202.
[27] Li J, Heap A D, Potter A, et al. Application of machine learning methods to spatial interpolation of environmental variables [J]. Environmental Modelling & Software, 2011,26(12):1647-1659.
[28] 李 靜,柳欽火,尹高飛,等.中國-東盟1km分辨率葉面積指數數據集(2013) [DB/OL]. 全球變化科學研究數據出版系統, 2015. Li J, Liu Q H, Yin G F, et al. China - asean leaf area index data set with 1km resolution (2013) [DB/OL]. Global change science research data publishing system, 2015.
[29] 李 航.統計學習方法[M]. 北京:清華大學出版社, 2012:69-72. Li H. Methods of statistical learning [M]. Beijing: TsinghuaUniversity Press, 2012:69-72.
[30] Li B, Zhou S, Wang T, et al. An improved gridded polycyclic aromatic hydrocarbon emission inventory for the lower reaches of the yangtze river delta region from 2001 to 2015 using satellite data. Journal of Hazardous Materials, 2018,360:329-339.
[31] Nam J J, Thomas G O, Jaward F M, et al. Pahs in background soils from western europe: Influence of atmospheric deposition and soil organic matter[J]. Chemosphere, 2008,9(70):1596-1602.
[32] 張俊葉,俞 菲,俞元春.中國主要地區表層土壤多環芳烴含量及來源解析[J]. 生態環境學報, 2017,26(6):1059-1067. Zhang J Y, Yu F, Yu Y C. analysis of polycyclic aromatic hydrocarbons (pahs) content and source in surface soil of major regions in China [J]. Acta ecologica sinica, 2017,26(6):1059-1067.
[33] Yang Y, Zhang N, Xue M, et al. Impact of soil organic matter on the distribution of polycyclic aromatic hydrocarbons (pahs) in soils [J]. Environmental Pollution, 2010,158(6):2170-2174.
[34] Ni J Z, Luo Y M, Wei R, et al. Distribution of polycyclic aromatic hydrocarbons in particle-size separates and density fractions of typical agricultural soils in the yangtze river delta, east china [J]. European Journal of Soil Science, 2008,59(6):1020-1026.
[35] Li B, Wang J, Wu S, et al. New method for improving spatial allocation accuracy of industrial energy consumption and implications for polycyclic aromatic hydrocarbon emissions in china [J]. Environmental Science & Technology, 2019,53(8):4326-4334.
Distribution prediction of soil PAHs based on random forest and geostatistics methods in urban area.
LI Fu-fu1, CHEN Dong-xiang3, WANG Yuan-min1, YAN Dao-hao1, WU Shao-hua2,4*
(1.School of Geography and Ocean science, Nanjing university, Nanjing 210046, China;2.Institute of land and urban-rural development, Zhejiang university of Finance & Economics;Hangzhou 310018, China;3.School of Dongfang, Zhejiang university of Finance & Economics, Hangzhou 314408;4.The Key Laboratory of Urban Land Resources Monitoring and Simulation, Ministry of Land and Resources, Shenzhen 518034, China)., 2019,39(12):5240~5247
Based on the locational and environmental vairables collected at sampling points in Nanjing city, the Geostatistics and Random forest models were combined to predict the distribution of soil PAHs. Results showed that combination of these two could improve the prediction accuracy of PAHs in the research area. The model fitness achieved by the combined model was 74.8% higher than that from the traditional Kriging method. The generated map also characterized the spatial variation pattern better, and identified the high and low polluted areas. The importance of environmental variables in the output from the random forest model showed that soil carbon, soil texture and plant density were the main controlling factors for PAHS distribution. This study could provide a methodology framework for high-resolution and high-precision mapping of urban pollutants, such as PAHs.(部分單詞間缺少空格)
urban soil;PAHs;spatial distribution;geostatistics;random forest
X53
A
1000-6923(2019)12-5240-08
李富富(1996-),男,河南信陽人,南京大學碩士研究生,主要從事城市土壤與環境研究.
2019-05-07
國家自然科學基金資助項目(41671085);國土資源部城市土地資源監測與仿真重點實驗室開放基金資助課題(KF201803064)
* 責任作者, 教授, shaohua@zufe.edu.cn