陳 鋒,孟凡生,王業耀,張鈴松,楊 琦
1.中國地質大學(北京)水資源與環境學院,北京 100083 2.北華航天工業學院建筑工程系,河北 廊坊 065000 3.中國環境科學研究院,水污染控制技術研究中心,北京 100012 4.中國環境監測總站,國家環境保護環境監測質量控制重點實驗室,北京 100012
基于主成分分析-多元線性回歸的松花江水體中多環芳烴源解析
陳 鋒1,2,孟凡生3,王業耀1,4,張鈴松3,楊 琦1
1.中國地質大學(北京)水資源與環境學院,北京 100083 2.北華航天工業學院建筑工程系,河北 廊坊 065000 3.中國環境科學研究院,水污染控制技術研究中心,北京 100012 4.中國環境監測總站,國家環境保護環境監測質量控制重點實驗室,北京 100012
對松花江全流域14個監測斷面的16種美國環保局優先控制的多環芳烴(PAHs)的主要來源及其貢獻率應用主成分因子分析-多元線性回歸模型(PCA-MLR)進行了來源解析。結果表明:松花江全流域為化石和石油燃料的復合PAHs污染,水體環境中PAHs首要污染源為化石燃料燃燒和交通污染,合計貢獻率為63.1%,第二大污染源為工業和民用燃煤污染,合計貢獻率為36.9%,沿江的石化、石油基地、大型焦化廠、電廠都是PAHs的主要來源。
松花江;水體;多環芳烴;源解析;主成分分析;多元線性回歸
近年來隨著經濟的快速發展,地表環境水體面臨著有機、無機等污染物所帶來的巨大壓力。要想切實有效地控制河流污染、保障環境安全,就必須掌握水環境污染物的來源。水污染物源解析技術是掌握水環境污染物來源的重要方法,不僅能判斷出主要的污染源類型,還能定量計算各排放源對環境受體的貢獻,可為建立流域水污染源的識別、追蹤及預測管理體系提供技術支持。
松花江有毒有機物污染嚴重,對生態環境造成了一定影響,其中多環芳烴(PAHs)是一類具有明顯毒性、難降解的典型持久性有機污染物(POPs)。郭偉等[1]對松花江吉林-哈爾濱段表層沉積物中的18種PAHs的分布特征進行了研究,表明該段PAHs整體污染濃度較高,吉林段大于哈爾濱段。王東輝[2]研究了松花江水環境中PAHs的污染狀況,表明其污染是全江性的。史鑫源等[3]對松花江哈爾濱市區段的PAHs污染狀況進行了分析,表明以低環芳烴為主。目前對于我國PAHs源解析已有一定研究,但多是使用比值法等定性方法,缺乏對松花江全流域PAHs污染源解析的研究。本研究選取典型特征污染物PAHs中美國環保局(USEPA)優先控制的16種污染物作為源解析對象,根據所確定的研究目標,以主成分分析-多元線性回歸方法作為主要的源解析技術手段,對松花江全流域水體環境中的PAHs來源進行解析研究。
松花江是我國七大河流之一,水資源總量居全國第三位。松花江流域地理位置東經119°52′~129°30′,北緯41°42′~51°38′;流域面積55.68萬km2。松花江有2個源頭:北源嫩江,發源于大興安嶺支脈伊勒呼里山中段南側的南甕河源地;南源第二松花江,發源于海拔2 744 m的長白山主峰上著名的白頭山天池。2個江源分頭下流至吉林省松原市的三岔河附近匯合后向下,稱松花江干流。干流折向東流至黑龍江省同江市附近,由右岸匯入黑龍江。松花江總長:嫩江源合計為2 309 km,第二松花江源合計為1 897 km,干流長939 km,分為上游、中游、下游。采樣斷面示意圖見圖1。

注:底圖源自中華人民共和國1∶400萬自然地理版(南海諸島),下載地址https://219.238.166.215/mcp/default. html,下載日期2008-06-28,審圖號GS(2008)1373號。
2.1 主成分分析-多元線性回歸
主成分分析-多元線性回歸(PCA-MLR)是將多個變量通過線性變換以選出較少個數重要變量的一種多元統計分析方法。主成分分析是一種多元統計數學方法,用其可以解析數據集合,壓縮數據維數,分析多個變量之間的關系,其目的在于對大量觀測數據使用較少的有代表性的因子來說明眾多變量的主要信息。之后對選出的主成分因子進行多元線性回歸,其目的是確定不同污染源對樣品的百分數貢獻率[4]。該方法適合污染源數目較少的源定量解析,尤其是對于那些難以得到其污染源指紋譜的源解析問題。
2.2 研究區域及數據處理
數據來自2009年5月對松花江主要現有國控和省控監測斷面的PAHs監測數據,此時松花江處于平水期。檢測指標為USEPA優先控制的16種PAHs,共設14個監測斷面,數據來源于2007年“水體污染與治理國家科技重大專項”子課題1“松花江水環境特征與水污染控制總體方案研究”,其監測斷面及測定值見表1。

表1 監測斷面及監測數據表 ng/L
在因子分析過程中,為使因子分析能夠均等地處理每一個原始變量,消除由于數值間差別較大而可能帶來的一些不合理的影響,在進行主成分因子分析前,需要將各采樣點的濃度數值進行標準化處理(其中未檢測出的數值用均值代替),按式(1)進行原始數據的標準化計算:
(1)

進行多元線性回歸分析時,經常碰到自變量之間強相關的問題,即多元共線問題。主成分分析法則是解決這類問題的好辦法,可通過主成分回歸來求回歸系數。主成分回歸是將原自變量的主成分代替原自變量進行回歸分析,主成分既保留了原指標的絕大部分信息,又有主成分之間互不相關的特點。所以本分析先采用多元回歸分析,進行共線性診斷,再進行主成分分析確定所需主成分個數,最后進行主成分回歸分析。

3.1 多重回歸分析及共線性診斷
模型擬合優度情況:相關系數Ra為0.949a(a表示對原始數據經過標準化處理之后進行的回歸分析,下同),決定系數R2為0.922,R2修正系數為0.882,模型總體的假設檢驗結果見表2,模型總體擬合良好(R2=0.922),方差分析表顯示結果有統計學意義(Sig=0.000)。參數估計及其假設檢驗結果,模型總體擬合良好,有統計學意義,自變量不存在共線性。

表2 模型方差分析
3.2 主成分分析
通過KOM和Sig檢驗,得出KMO達到0.85,Sig為0,表示數據取自正態分布,認可了變量之間的相關性,適合進行因子分析。根據Kaiser標準,提取的因子特征值應大于1。從表1可以看出,符合此標準的前2個因子解釋了總方差的98.216%,說明提取前2個因子作為主因子合理。水相16種PAHs主成分分析的因子特征值及方差貢獻率、因子荷載矩陣分別見表3和表4。

表3 因子特征值和方差貢獻率

表4 因子載荷矩陣
第2個主因子F2:其中熒蒽的荷載明顯高于其他化合物,芘荷載雖不突出但較其他物質荷載差異明顯。有學者研究發現[11],熒蒽和芘主要源于工業燃煤和民用燃煤,因子2可歸為燃煤污染源。
3.3 主成分多元現行回歸分析
以主成分分析得到的2個因子作為自變量,將樣品中16種 PAHs 的總量作為因變量,進行多元線性回歸,獲得的回歸方程的標準化回歸系數可以反映各主因子,即各主要污染源的相對貢獻率,應用多元線性回歸之前先判斷數據是否滿足線性回歸的條件。模型擬合優度情況:相關系數R為0.962a,決定系數R2為0.936,R2修正系數為0.912。
表5是對整個模型的檢驗結果,它是一個方差分析表。由表5可知,所擬合的回歸模型F值為3.472,Sig為0.000,因此擬合的模型是有統計學意義的。

表5 模型方差分析
由此可知,數據的模擬過程滿足線性回歸的條件,回歸結果如式(2)所示。利用公式(3)計算各種污染源的貢獻率,其中化石燃料的燃燒源和交通污染源為松花江水體中PAHs的主要污染來源,其貢獻率為63.1%,其次為工業和民用燃煤污染源,貢獻率為36.9%。
(2)
(3)
式中x1、x2分別代表第1主因子和第2主因子的因子得分,Bi為某因子i的質量濃度。
應用主成分分析-多元線性回歸方法對松花江全流域14個主要國控和省控監測斷面中的16種PAHs進行了污染源解析,得到了松花江全流域水體中PAHs的主要來源,分別為化石燃料燃燒源、交通污染源、工業和民用燃煤污染源。由于研究流域范圍較大,每個斷面均具有站點特殊性,松花江水體中PAHs的首要的污染源為化石燃料燃燒和交通污染,兩者的合計貢獻率為63.1%,松花江全流域為化石和石油燃料的復合PAHs污染,沿江的石化、石油基地、大型焦化廠、電廠都是PAHs的主要來源。基于松花江所在地域,地域供暖期較長,加之老工業基地的特點,全流域水相中PAHs的第二大污染源為工業和民用燃煤污染,貢獻率為36.9%。
結合松花江全流域沿江的工業和企業分布,對松花江全流域水相中的PAHs進行分段研究,并針對各段的特點,對污染源類別進行細化分析。同時針對松花江全流域PAHs污染問題,應進一步對水體懸浮顆粒物及沉積物中的PAHs污染狀況進行對比研究,同時應在“十三五”期間對松花江全流域各監測斷面的PAHs污染物值進行重新測定,對比PAHs污染物隨時間推移其變化情況,為松花江全流域PAHs的控制和治理提供科學依據。
[1] 郭偉,何孟常,楊志峰,等.松花江吉林-哈爾濱段表層沉積物中多環芳烴的季節分布和來源[C]∥余剛.持久性有機污染物論壇2006暨第一屆持久性有機污染物全國學術研討會論文集.北京:中國環境科學出版社,2006.
[2] 王東輝.松花江水體中多環芳烴污染物的污染研究[J].環境科學與管理,2006,31(9):69-70,73.
[3] 史鑫源,李一凡,張寶杰.松花江哈爾濱市區段水體中PAHs污染狀況研究[C]. 余剛.持久性有機污染物論壇2007暨第二屆持久性有機污染物全國學術研討會論文集.北京:中國環境科學出版社,2007.
[4] 劉穎.上海市土壤和水體沉積物中多環芳烴的測定方法、分布特征和源解析[D].上海:同濟大學,2008.
[5] MATT F,SIMCIK,STEVEN J,et al.Source apportionment and source/sink relationships of PAHs in the coastal atmosphere of Chicago and Lake Michigan[J].Atmospheric Environment(Oxford,England:1994),1999,33(30): 1 411-1 425.
[6] KHALILI N R,SCHEFF P A,HOLSEN T M.PAH source fingerprints for coke ovebs,diesel and gasoline-engines,highway tunnels,and wood combustion emissions[J].Atmospheric Environment,1995,29:533-542.
[7] LIM L H,HARRISON R M,HARRAD S.The contribution of traffic to atmospheric concentrations of polycyclic aromatic hydrocarbons[J]. Atmospheric Environment,1999,33: 3 538-3 542.
[8] NIELSEN T,JORGENSEN H E,LARSEN J C,et al.City air pollution of polycyclic aromatic hydrocarbons and other mutagens:occurrence,sources and heaith effects[J].Science of the Total Environment,1996,190:41-49.
[9] 張巍,張樹才,萬超,等.北京城市道路地表徑流及相關介質中多環芳烴的源解析[J].環境科學,2008,29(6):1 478-1 483.
[10] LEE J H,GIGLIOTTI G L,OFFENBERG J H,et al.Sources of polycyclic aromatic hydrocarbons to the Hudson River Airshed [J].Atmospheric Environment,2004,38(35): 5 971-5 981.
[11] TIAN F L,CHEN J W,QIAO X L,et al.Sources and seasonal variation of atmospheric polycyclic aromatic hydrocarbons in Dalian,China:Factor analysis with non-negative constraints combined with local source fingerprints[J].Atmospheric Environment,2009,43(17): 2 747-2 753.
The Research of Polycyclic Aromatic Hydrocarbons in the River Based on the Principal Component-Multivariate Linear Regression Analysis
CHEN Feng1,2, MENG Fansheng3, WANG Yeyao1,4, ZHANG Lingsong3, YANG Qi1
1.School of Water Resources and Environment, China University of Geosciences, Beijing 100083, China 2.Department of Architectural Engineering, North China Institute of Aerospace Engineering, Langfang 065000, China 3.Research Center of Water Pollution Control Technology, Chinese Research Academy of Environmental Sciences, Beijing 100012, China 4.China National Environmental Monitoring Centre, State Enviromental Protection Key Laboratory of Quality Control in Environmental Monitoring,Beijing 100012, China
Pricipal Principal Component-Multivariate Linear Regression Analysis (PCA-MLR)was applied to analyze the distribution and sources of polycyclic aromatic hydrocarbons(PAHs) in the surface water from songhua river.Fourteen samples of the Level period were collected from songhua river. Diagnostic ratio analysis illustrated that the songhua river basin as fossil fuel and oil compound pollution of PAHs. The primary sources of PAHs in water songhua river is the burning of fossil fuels and traffic pollution, and both total contribution rate is 63.1%.The second major pollution sources is the industrial and civil coal pollution, and the contribution rate is 36.9%.Petrochemical, oil base along the river, large coking plant, power plants are the main source of PAHs.
Songhua river; water body;Polycyclic Aromatic Hydrocarbon(PAHs);source apportionment;Principal Component Analysis; Multiple Linear Regression(PCA-MLR)
2015-09-07;
2015-11-06
國家水體污染控制與治理科技重大專項(2014ZX07510-001,2014ZX07502-002)
陳 鋒(1981-),女, 河北廊坊人,在讀博士研究生。
王業耀
X824
A
1002-6002(2016)04- 0049- 05
10.19316/j.issn.1002-6002.2016.04.09