陳 建, 張廣偉,杜紅磊
(1.江蘇建筑職業技術學院 建筑設備與市政工程學院,江蘇 徐州 221116;2.沂沭泗局駱馬湖水利管理局,江蘇 宿遷 223800)
推廣應用
主成分分析法在奎河水污染分析中的應用
陳 建1, 張廣偉2,杜紅磊2
(1.江蘇建筑職業技術學院 建筑設備與市政工程學院,江蘇 徐州 221116;2.沂沭泗局駱馬湖水利管理局,江蘇 宿遷 223800)
文章利用主成分分析法,建立評價模型,對奎河水污染情況進行分析。通過線性分析,用貢獻率來舍棄不敏感的信息,以主成分變量代替原始數組,并計算出水污染指標的權重系數,構造出評價函數,從而定量分析影響河流水質的主要污染物。評價結果:2013年,奎河5個監測河段的水污染情況不均衡,主要污染物為氨氮、總磷。
奎河;水質;主成分分析法;綜合評價;污染
奎河發源于江蘇省徐州市西南郊的云龍湖,為徐州市內重要的景觀河道。隨著城市化進程的不斷加快,日趨頻繁和劇烈的人類活動使得奎河水質污染嚴重。近十幾年間,奎河的開發與治理矛盾尖銳。因此,如何客觀而準確的找出影響奎河水質的主要因素,對于奎河規劃治理具有重要的意義。目前國內外常用于水環境評價方法有指數法、主成分分析法、模糊綜合評價法、灰色數學法、神經網絡法等[[1-3],其中主成分分析法理論是比較完善的多元統計分析方法,在解決很多類似實際問題時已取得較好的效果[4]。文章選擇使用主成分分析方法進行實證分析,找出影響奎河水質的主要因素,定量化研究奎河水環境污染問題。
1.1 基本思想
主成分分析( Principal Components Analysis,PCA) 是研究多個定量(數值)變量間相關性的一種多元統計方法。它是研究如何通過少數幾個主分量( 即原始變量的線性組合)來解釋多變量的方差—共變量結構。具體地說,就是通過相關性分析,分離出少數幾個主分量,保證它們能代表盡可能多的原始數據信息。主成分常被用來尋找判斷某種事物或現象的綜合性指標,并將綜合指標所蘊藏的信息適當地解釋,以便更深刻地表現事物內在的規律[5]。
1.2 分析模型
1)匯總分析指標,設需要分析的河流共有n個監測斷面,k項監測指標,收集各斷面某個時段(年、季、月)平均監測數據來構成原始數據矩陣為:
(1)
式中:X為各斷面監測原始數據矩陣;xij是第i個斷面的第j項監測數據。
為排除量綱和數量級的不同,對原始數據進行標準化處理,計算公式為:

(2)
同時,設X′為標準化矩陣,見下式(3):

(3)
2)求解矩陣X′的相關系數矩陣R,并代入特征方程|λI-R|,求解非負特征值λ(λ1>λ2>…λp>0)及對應的特征向量C1,C2,…,Cp,其中Cm=(Cm1,Cm2,…,Cmk)T且(m=1,2,…,p)[7],并計算各分量的方差貢獻率為:
(4)

3)計算前r個主分量的主成分得分Yt,則:
(5)
4)以各主分量方差貢獻率為權數,構造分析函數,即
Fi=a1Y1+a2Y2+…+arYr
(6)
式中:Fi代表第i個測站點水質指標的綜合得分,綜合得分越高,表明該段河流水環境質量污染越嚴重。出現負值說明綜合水質情況達標,正值則超標。
5)分析河流的污染源情況,即綜合得分高的河段污染物超標,其中累計方差貢獻率>85%的指標為其主要污染物。
1.3 資料選取
文章選取徐州市水環境監測中心2013年奎河上5個水質監測段的平均監測數據,共11項監測指標作為分析資料,見表1。
2.1 數據標準化處理
對表1中數據進行標準化處理,結果見表2。

表1 檢測數據表
注:pH值無量綱

表2 標準化數據表
2.2 相關系數及特征根求解
將表2數據導入SPSS軟件進行計算,很容易就得到了相關系數矩陣的特征值和特征向量,并計算各特征值對應主成分的方差貢獻率,如表3所示。

表3 特征值計算結果表
由表3中的結果可知,前兩個特征值對應主成分的累計方差貢獻率已經達到92.45%> 85%,故它們所對應的2個主成分已經能夠反映原始指標的絕大部分信息,可利用它們對奎河5個檢測段的水環境質量進行分析。按各主成分線性表達式中主成分特征值及對應的標準化數據,構造出2個主成分Y1和Y2函數如下:

2.3 水污染綜合分析
各主成分得分與對應的方差貢獻率乘積的總和即為綜合得分。最后計算出5個監測段各自的主成分得分及綜合得分,得分越大,表明污染程度越嚴重,由此可對各斷面的水環境質量狀況進行排序和分級,最終結果見表4。

表4 奎河水污染分析結果
2.4 結果分析
1)由表4的結果可知,奎河水污染情況不均衡,5個監測段中1、2號測段得分最低,污染程度最小;3號測段得分處于平均水平;4、5號測段綜合得分最高,說明其污染程最高。
2)由表2數據可知,在主成分中,氨氮貢獻率為76%,總磷貢獻率達到16%,絕對值較大,對奎河水質起主導作用;其次高錳酸鹽、COD的貢獻率為7.55%,也對奎河水質產生一定的影響。由于氨氮、總磷指數代表水體富營養化的營養元素的污染狀況。因此,對于奎河的治理工作,應重點控制4、5號監測段的氨氮、總磷類污染源。
3)文章的分析結果與2013年徐州市環境質量報告中的結果基本一致,說明此分析方法符合奎河的實際情況。
通過文章的實證應用,在多指標綜合分析方面,主成分分析法的優勢明顯,主成分分析法能夠最大限度地減少水質監測數據信息損失量,以主要的變量來代替原有的多維數組,大大簡化了數據結構和計算量;并能通過數值計算確定各污染物的權重系數,避免了主觀隨意性。文章中的分析方法缺點在于只能對數值類指標進行分析,若能進一步改進,并編成計算軟件,則此分析方法在水環境質量管理方面會有較好的應用前景。
[1]白云鵬,陳永健.常用水環境質量評價方法分析[J].環境水利,2007(06):8-10.
[2]李恒,王海玲,張崢嶸.淺談水環境評價方法和水環境影響預測[J].廣東化工,2008,35(10):62-64.
[3]李惠明,尚廣平.水質現狀評價數學模型綜合研究[J].中國環境科學,1991,11(05):356-360.
[4]徐建華.現代地理學中的數學方法[M].北京:高等教育出版社,2002:37-93.
[5]周杰,葛緒廣,陳成忠,等.基于主成分分析的湖泊水環境質量評價—以磁湖為例[J].安徽農業科學,2014,42(15):4743-4745.
[6]郭勁松,王宏,龍騰銳.水資源水質評價方法分析與進展[J].重慶環境科學,1999,21(06):1-9.
[7]薛巧英.水環境質量評價方法的比較分析[J].環境科學保護,2004,30(124):64- 67.
[8]馮利華.環境質量的主成分分析[J].數學的實踐與認識,2003,33(08):32-35.
ApplicationofPrincipalComponentAnalysisinKuiheRiverWaterPollutionAnalysis
CHEN Jian1;ZHANG Guang-wei2and DU Hong-lei2
(1 Architecture Facility and Civil Project Institute, Xuzhou 221116, China; 2 Luomahu Water Conservancy Management Bureau, Suqian 223800, China)
Principal component analysis method was applied to establish the evaluation model for analyzing the situation of water pollution in the Kuihe river. Through the linear analysis, the contribution rate was used to reject insensitive information, replacing the original array with principal component variables, to calculate weight coefficient of water pollution indexes to make up the evaluation function, so as to quantity and analyze the major pollutants effecting river quality. The evaluated results show that water pollution state is unbalanced in five monitored river sections, and the main pollutants are ammonia nitrogen and total phosphorus.
Kuihe river; water quality; pollution; principal component analysis; comprehensive evaluation;pollution
X522
B
2017-08-24
陳建(1980-),男,江蘇宿遷人,工程師,講師,研究方向為水利工程施工與管理,水資源與水環境評價;張廣偉(1978-),男,江蘇宿遷人,工程師;杜紅磊(1978-),男,江蘇徐州人,工程師。