孫娓娓,黃映雪,張杰,胡業剛
阜陽師范學院數學與統計學院,安徽阜陽236041
基于統計分析和BP網絡的土壤重金屬污染研究
孫娓娓,黃映雪,張杰,胡業剛
阜陽師范學院數學與統計學院,安徽阜陽236041
土壤中重金屬不僅對植物生長造成影響,還通過食物鏈危害人類健康,并可能造成大氣和水污染等問題,影響和改變城市土壤的生態功能。因此,為了改善生活環境,徹底解決污染問題,就必須找出重金屬污染的原因。本文通過污染指數評價、統計相關分析、BP網絡空間插值等方法建立數學模型,得到了土壤重金屬污染程度、原因及污染源位置,為環境保護和城市發展提供重要依據。
重金屬污染;污染指數;相關分析;BP網絡
城市土壤是城市生態系統的重要組成部分。對土壤地質環境異常的查證,以及應用已獲取的海量數據資料對城市環境質量進行評價是很有必要的。研究人類活動影響下城市土壤環境的演變模式,對于城市的生態建設、提高農產品食品安全和人民身體健康、以及可持續發展都具有十分重要的意義。本文對某城區土壤重金屬元素Cu、Zn、Pb、Cd、Ni、Cr、As、Hg的含量和空間分布進行統計分析探討,利用BP網絡確定污染源的位置,查明重金屬污染的影響因素及對環境的潛在危害,以期了解不同的城區活動對土壤重金屬形態分布的作用及影響,為評價重金屬的環境效應和治理保障城市居民的身心健康提供依據。
由于人類活動對不同環境的影響程度不同,一般將城區化為5個功能區:生活區、工業區、山區、主干道路區、公園綠地區[1]。為了全面地分析城市土壤重金屬污染問題,首先要進行土壤采樣。為使樣點具有較好的代表性,采用近似網格法(1 km×1 km)布點,在不同功能區共采集土樣319個。根據GPS記錄采樣點的位置,利用MATLAB軟件繪制出樣點分布如圖1所示。然后利用專門儀器測試,獲得每個樣本所含Cu、Zn、Pb、Cd、Ni、Cr、As、Hg8種重金屬元素的濃度數據。此外,按照2 km的間距在遠離人群和工業的自然區取樣,將其作為該城區土壤中元素的背景值。

圖1 樣點分布圖Fig.1Distribution of samp les
目前,對土壤重金屬污染主要使用的評價方法,包括地積累指數法、污染指數法、潛在生態危害指數法[2]等等。本文采用最普遍的單因子指數法和內梅羅綜合污染指數法[3],可以評價不同土地類型的土壤受到重金屬污染的強度,具體公式為:

結合數據,得到該城市5個分類區土壤中8種重金屬的單因子污染指數pi和內梅羅綜合污染指數p綜,如表1所示。

表1 土壤重金屬污染指數Table1 Pollution index of heavymetals in soil
為了說明該城區不同區域重金屬的污染程度,依據中國《綠色食品產地環境質量現狀評價綱要(試行)》規定[4],相關標準如表2、3所示。

表2 土壤中各元素污染程度分級標準Table2 Pollution classification standard of elements in the soil

表3 土壤綜合污染程度分級標準Table 3Classification standard of comprehensive pollution in soil
通過研究對比可知,5個功能區土壤重金屬污染存在一定差異。具體如下:
1)重金屬Hg在5個分類區均屬于重度污染,尤其工業區和主干道區的污染指數分別為9.69、8.58,明顯嚴重超標。As、Cr、Ni、Pb這4種元素在5個分類區均屬于輕度污染。Cd在5個分類區均屬于中度污染。Zn除了在山區屬于輕度污染,在其他4個區均屬于中度污染。Cu除了在工業區和主干道區屬于重度污染,在其他3個區均屬于中度污染。
2)通過綜合污染指數可以看出,工業區和主干道區屬于重度污染,其余3個區都為中度污染,且其污染程度從大到小依次為工業區、主干道區、生活區、公園綠地區、山區。
3)綜合所有數據,在工業區和主干道區所有重金屬濃度都明顯高于其他功能區,表明工業污染與交通污染已經超過其他污染,成為該城市的主導污染源。
土壤中重金屬不僅對植物生長造成影響,還通過食物鏈危害人類健康,并可能造成大氣和水污染等問題。因此,為了改善生活環境,徹底解決污染問題,就必須找出重金屬污染的原因。
首先利用Excel計算出該城市土壤中8種重金屬的均值、標準差、變異系數等統計量,具體結果如表4所示。

表4 土壤中重金屬含量統計Table 4 Statisticsof heavymetals in soil
通過表4數據可知:
(1)該城市土壤中各種重金屬的平均含量均高于背景值;As、Cd、Cr、Cu、Hg、Ni、Pb、Zn分別是背景值的1.58、2.33、1.73、4.17、8.56、1.40、1.99、2.92倍,說明Cu、Hg都有一定程度上累積,主要來源于人類的工業生產活動以及交通活動。
(2)依據變異系數大小粗略分級規律,土壤重金屬含量變異系數在28.8%~60.62%之間,屬于中等程度變異[5]。則該城市土壤中As、Cd、Pb為強變異,Ni為中等變異,Cr、Cu、Hg、Zn均為弱變異;8種元素變異系數范圍為11%~81%,變異性很大,可見土壤來源受外界影響很大,可能受人為活動的不合理布局及企業和道路交通的影響。
其次,元素地球化學研究表明,成因相似的元素之間常有較好的相關性[5]。因此,統計上相關性較高的重金屬元素之間在成因上也有相似之處。運用SPSS統計軟件進行因子分析,可以得出表5的重金屬之間的相關系數。

表5 土壤中各重金屬含量的相關系數Table5Correlation coefficient of heavymetal content in the soil
由表5可見,幾種重金屬含量都與至少1種或其他幾種重金屬呈正相關;Cr、Ni相關性最強,說明來源大致相同,并且相關系數最大為0.7158,說明土壤中Cr、Ni的關系最為密切,他們的含量彼此影響較大。其次Cd、Pb呈顯著的正相關,說明來源極為相近。Zn、Cd、Cr、Cu、Ni、Pb呈正相關,可能暗示了在研究區域內存在相似的過程控制著土壤重金屬元素的含量的分布特征。但Pb、Zn、Cd、Cu在不同功能區中取的最大值,因此,Pb、Zn、Cd、Cu沒有產生復合污染物,可能具有相同的來源。
若某種重金屬的濃度在某一處取得最大值,就可以認為該處是污染源的位置。按照這個思想,我們試圖建立重金屬的濃度ρ與樣本點三維空間坐標分量(x,y,h)的函數關系式,利用319個數據進行三元函數ρ(x,y,h)的插值或擬合,然后求該函數的最大值。但由于Matlab軟件無法實現四維散點數據普通的插值或擬合,于是我們考慮統計回歸模型。為了找出重金屬濃度ρ與坐標x、y、h的關系式,首先利用數據分別作出ρ對x、y、h的散點圖,如元素As效果如圖2所示。

圖2 As元素的散點圖Fig.2Scattered pointsof Aselement
但由圖2無法看出ρ與x、y、h具有明顯的函數關系,因此很難進一步建立ρ與x、y、h的回歸模型。事實上,土壤中各種重金屬的含量與其空間位置之間存在著高度復雜的非線性映射關系,因此不宜用常規的建模方法來解決此類問題,也難以得到重金屬含量與空間位置的定量關系。
僅根據樣本中的數據顯然不能求出整個城區的污染源的位置,為了能夠充分有效地利用樣本數據的信息量,確定某重金屬在該城區的最大濃度的空間位置,我們仍然利用插值法求解,但本文采用BP神經網絡的方法進行空間加密插值[6],它能學習和存貯大量的輸入—輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。因此,可以有效地將研究區域內的海拔高程融入網絡,提高網絡的穩定性和精度。具體算法如下:
(1)確定BP網絡拓撲結構。輸入節點與輸出節點是由問題的本身決定的,該問題采用有3個輸入節點,分別表示樣本點的三維坐標x、y、h;輸出節點為8個,分別表示該樣本點中8種重金屬的濃度;隱層節點數憑經驗取6,因此這里BP網絡選用3-6-8的拓撲結構。
(2)隨機采用250個樣本數據作為訓練集,剩余的69個樣本作為測試數據。對網絡在[-1,1]范圍內的初始權值隨機取值,學習率η=0.9,誤差精度設置為0.0001,最大迭代步數為10000,當滿足設置的誤差精度或最大迭代步數,算法就停止訓練。從而確定重金屬濃度與空間位置的映射關系。
(3)用訓練好的BP網絡去進行空間插值。將所有樣本點縮小其取樣間隔(如10m),將所有加密點的x、y、h數據一一輸入該BP網絡,網絡系統就會自動算出該點8種重金屬的濃度。
(4)由所有插值點和樣本點的重金屬濃度的最大值,求出坐標確定污染源的位置(表6)。

表6 重金屬污染源位置Table6 Locationsof pollution sourcesof heavymetals
由表6可以看出,As、Zn、Cr、Ni、Cd的污染源都在4區,即主干道路區;Cu、Hg的污染源都在2區,即工業區;Pb的污染源在1區,即生活區。
本文就土壤重金屬污染問題,分別利用統計分析、BP網絡高維插值等方法,得到了污染程度、原因、污染源位置及傳播特征相關結論。該模型不僅可以用于本文未提及的其他重金屬污染問題的討論,而且還可用于其他地區的土壤,甚至大氣、水流污染等問題,具有一定的推廣性。
[1]李春明.城市表層土壤重金屬空間分布特性及影響因素[J].晉中學院學報,2014,31(3):24-27
[2]湯潔,陳初雨,李海毅,等.大慶市建成區土壤重金屬潛在生態危害和健康風險評價[J].地理科學,2011,31(1):118-122
[3]尹俊,柳云龍.上海市城郊土壤重金屬空間分布及其污染評價[J].現代農業科技,2010(10):251-255
[4]王海東,方鳳滿,謝宏芳,等.蕪湖市區土壤重金屬污染評價及來源分析[J].城市環境與城市生態,2010,23(14):36-40
[5]錢翌,張瑋,冉德超.青島城市土壤重金屬的形態分布及影響因素分析[J].環境化學,2011,30(3):652-654
[6]胡大偉,卞新民,王書玉,等.基于BP模型的南通市農田土壤重金屬空間分布研究[J].安全與環境學報,2007,7(1):91-95
[7]陳俊堅,張會化,劉鑒明,等.廣東省區域地質背景下土壤表層重金屬元素空間分布特征及其影響因子分析[J].生態環境學報,2011,20(4):646-651
Study on the Pollution of Heavy Metal in Soil Based on Statistical Analysis and BP Network
SUNWei-wei,HUANGYing-xue,ZHANG Jie,HU Ye-gang
SchoolofMathematicsand Statistics/Fuyang NormalCollege,Fuyang 236041,China
Heavymetals in soilnotonly affect the grow th of plantsbutalso harm to people'shealth through a food chain,and may cause the problem such as air and water pollution to influence the ecological function of urban soil.Therefore,in order to improve the living environmentand solve the pollution problem thoroughly,wemust find out the cause of the heavymetal pollution.In this article,themathematicalmodelwas established through pollution index evaluation,statistical analysis,BP network spatial interpolation.The soil heavy metal pollution degree,reason and pollution source location are obtained.It provides importantbasis forenvironmental protection and urban development.
Heavymetal pollution;pollution index;correlation analysis;BPnetwork
O29
A
1000-2324(2016)04-0536-04
2016-03-30
2016-06-03
安徽高校自然科學研究項目(2015KJ003,KJ2015A161);安徽省自然科學基金(1508085MA12);全國統計科學研究項目(2014LY088);安徽省質量工程項目(2015jxtd023;2015jxtd121);阜陽師范學院自然科學研究項目(2015FSKJ07)
孫娓娓(1981-),女,碩士,講師,主要從事智能計算,數據挖掘工作.E-mail:93692849@qq.com