廉鐵輝,王 釗,王洪翠,羅 陽
主成分分析法在海河流域多條河流水質評價分析中的應用
廉鐵輝1,王 釗2,王洪翠2,羅 陽3
(1.天津市引灤工程于橋水庫管理處,天津301900;2.海河流域水環境監測中心,天津300170;3.海河流域水資源保護局,天津300170)
水質評價是獲得水環境現狀及其水質分布狀況、對河流水質質量進行定性或定量的評定,是水質保障的重要措施之一。利用SPSS軟件,采用主成分分析法,對11個不同河流站點的高錳酸鹽指數、化學需氧量、氨氮、總磷、銅、氟化物、鐵、錳8個水質指標進行了分析計算,從原始數據中提取總方差72.88%的2個因子來反映水體的污染程度。結果表明,主成分分析方法在指標權重選取方面可以減少主觀誤差,操作簡單,并且具有一定的優越性。
主成分分析法;水質評價;SPSS軟件;海河流域
海河流域包含8個省、自治區、直轄市的全部或部分地區,流域面積32.6萬km2,人口1.5億。河流是一個由多種環境因素和生態因子組成的一個復雜的動態系統[1],河流水質狀況直接影響人們的生活環境和居住適宜度。對河流水質的質量評價主要通過水的物理化學性質,按照相關水質標準和評價方法,對河流水環境的現狀及水質的分布狀況進行評定。水質評價在20世紀60年代,較為代表性的是霍頓水質指數法[2]。20世紀70年代,經過多個學者的研究,內梅羅水污染指數法[3]被廣泛應用。我國的水質評價起步略晚,工作開始于20世紀70年代,至今已經有很多學者提出了不同的水質評價模型[4-8],但在具體的水質評價工作中,單因素評價法[9]使用的頻率較多。針對這一情況,筆者提到的主成分分析方法(Principal Components Analysis)是一種將多維因子納入同一系統進行定性、定量化研究的理論比較完善的多元統計分析方法。
筆者采用主成分分析法,借助SPSS軟件,對海河流域11條河流進行水污染程度排序,以期為該流域的河流污染程度提供一個排名參考指數。
2.1 樣本點及監測指標確定
選取11條河流(A、B、C、D、E、F、G、H、I、J、K)采樣點的水質監測數據,取8個指標為高錳酸鹽指數(X1)、化學需氧量(X2)、氨氮(X3)、總磷(X4)、銅(X5)、氟化物(X6)、鐵(X7)、錳(X8)。
2.2 計算過程
在SPSS軟件中,使用主成分分析法對水質進行排名,首先將監測到的水質原始數據進行標準化處理,求出相關系數矩陣,然后分別對8個指標高錳酸鹽指數、化學需氧量、氨氮、總磷、銅、氟化物、鐵、錳的相關系數矩陣和特征值方差累計貢獻率進行計算,確定選取主成分的個數。
對原始數據進行標準化消除量綱的影響,得到標準化數據,見表1。

表1 標準化的水質原始數據
根據SPSS軟件的計算步驟,利用標準化后的數據求得相關系數矩陣、特征值和主成分貢獻率及累計貢獻率、初始因子載荷矩陣,分別見表2—4。

表2 相關系數矩陣

表3 特征值和主成分貢獻率及累計貢獻率

表4 初始因子載荷矩陣
從表2可以看出所選擇的8個水質指標之間的相關性,兩指標之間聯系系數的絕對值越大則這兩指標之間的聯系越緊密。如,高錳酸鹽指數(X1)與化學需氧量(X2)相關系數絕對值為0.906,在8個水質指標中相關系數的絕對值最大,表明高錳酸鹽指數與化學需氧量之間有著較大的相關性,互相影響的能力最大;而氟化物(X6)與鐵(X7)相關系數的絕對值只有0.004,在所分析的8個水質指標中相關系數的絕對值最小,表明氟化物與鐵之間相關性最差,互相影響的能力最小。由此方法,可以分析各個指標之間的相關性。
從表3可以看出,第1、2主成分的特征值分別為3.74、2.091,均大于1,方差貢獻率分別為46.747%、26.14%,其累計方差率達到72.88%,依據主成分的方差貢獻率來選擇評價指標[9,10],選取2個主成分就能解釋所選取的大部分數據,第1個主成分的方差貢獻率為46.747%,則說明第1主成分為最重要的成分,是影響河流水質的重要水質指標,其包含的信息最多,對水質變化影響最大。
圖1顯示了各指標特征值,更加直觀地顯示了不同成分的特征值大小,成分1、2的特征值遠大于1,成分3—5略小于1,成分6—8小于1、接近0。

圖1 碎石圖

圖2各水質指標在主成分空間上的投影
圖2 顯示各水質指標在主成分空間上的投影,各個水質指標在圖中的投影離中心越遠,就說明此指標與主成分之間的相關系數越大。各個指標在主成分空間投影點的位置越接近,則說明這些指標之間的聯系越緊密。
從8個指標在主成分分析空間上的投影可以看出,氨氮、總磷2個指標投影點的位置最接近,則說明它們之間聯系緊密;鐵指標與其它指標的投影點位置最遠,則說明鐵指標與其它指標之間沒有聯系。通過對各個指標在主成分空間的投影圖,可以比較直觀地顯示指標之間的親疏關系。
表4顯示的是各指標與另一個主成分之間的關系,指標與某一主成分載荷值絕對值越大,則該主成分就越多地反映指標的信息。從表4可以看出,高錳酸鹽指數、化學需氧量、銅、鐵這些指標在第1主成分上的荷載較高,說明第1主成分反映了這些指標的信息;而氨氮、總磷、氟化物、錳在第2主成分的荷載較高,則第2主成分反映的是這4個指標的信息。因此,用2個主成分就可以全面解釋原來的指標。
2.3 水質綜合評判結果
根據綜合評價函數,計算由2個主成分反映的各河流監測斷面的得分(見表5),得分越大表明該站點水質相對其它站點水質越差,從而對樣點水質情況進行分級。

表5 海河流域各監測斷面水質綜合評判結果
表5顯示各個河流站點的得分情況,綜合得分由主成分得分與方差貢獻率之積得出。從表5可以看出,站點F的水質情況最好,而站點A水質情況最差,11條河流的水質情況一目了然。
綜上所述,用主成分分析法對水質指標進行分析,可從樣本多指標中發現主要指標,選取主成分,使得在不損失太多信息的基礎上對復雜問題進行分析。通過分析,可以確定影響該11條河流的主要指標有高錳酸鹽指數、化學需氧量、銅、鐵,其次是氨氮、總磷、氟化物、錳,并對11條河流進行排名,可直觀地顯示各河流的水污染程度。該方法應用于水環境質量評價中,對客觀、準確、全面地評價水環境質量有很好的實用性。
[1]盧文喜,李迪.基于層次分析法的模糊綜合評價在水質評價中的應用[J].節水灌溉,2011(3):43-46.
[2]Jacobs H L.Water quality criteria[J].Journal of Water Pollution Control Federation,1965,37(5):292-300.
[3]Nemerow N L.Scientific stream pollution analysis[M].New York:Mc Graw Hill,1974:127-150.
[4]Sasikumar K,Mujumdar P P.Fuzzy optimization model for water quality management of a river system[J].Journal of WaterResourcesPlanningandManagement,1998,124(2):79-88.
[5]龔艷冰,張繼國.基于全排列多邊形綜合圖示法的水質評價[J].中國人口·資源與環境,2011,21(9):26-31.
[6]鄒國平,彭梅香.數據挖掘技術在水質評價中應用研究[J].計算機仿真,2012,29(1):148-151.
[7]牛紅惠,尚艷玲.模糊神經網絡在水質評價中的研究[J].計算機仿真,2012,29(4):173-176.
[8]關全成,趙雙喜.模糊貼近度法在水質評價中的應用[J].節水灌溉,2012(7):43-46.
[9]余勛,粱婕.基于三角模糊數的貝葉斯水質評價模型[J].環境科學學報,2013,33(3):904-909.
[10]馮利華.環境質量的主成分分析[J].數學實踐與認識,2003,33(8):32-35.
Application of Principal Component Analysis in Water Quality Evaluation of Several Rivers in Haihe River Basin
LIAN Tie-hui1,WANG Zhao2,WANG Hong-cui2,LUO Yang3
(1.Yinluan Project of Yuqiao Reservoir Management Office of Tianjin Municipality,Tianjin 301900,China;2.Haihe River Basin Water Environment Monitoring Center,Tianjin 300170,China;3.Haihe River Basin Water Resources Protection Bureau,Tianjin 300170,China)
Water quality assessment is one of the important measures for drinking water safety.With the help of SPSS software,CODMn,COD,NH3-N,TP,Cu,F-,Fe,Mn of water samples in 11 different rivers were analyzed and calculated using the principal component analysis.The pollution degree of rivers was reflected by the two factors that account for 72.88%of the total variance were extracted from the original data.The results show that principal component analysis which should minimize the subjective error in the aspect of index weight selected is simple in operation and has certain advantages.
principal component analysis;water quality assessment;SPSS software;Haihe River Basin
X824
A
1004-7328(2017)02-0029-04
10.3969/j.issn.1004-7328.2017.02.010
2017—01—12
廉鐵輝(1976—),男,高級工程師,主要從事水庫調度運用及水環境管理工作。