唐國平,陳德超,黃振旭,徐小峰
(蘇州科技大學 環(huán)境科學與工程學院 江蘇 蘇州215009)
基于多元統(tǒng)計和水質(zhì)標識指數(shù)的丹金溧漕河溧陽段水質(zhì)評價研究
唐國平,陳德超*,黃振旭,徐小峰
(蘇州科技大學 環(huán)境科學與工程學院 江蘇 蘇州215009)
以丹金溧漕河溧陽段為例,在利用因子分析從11個水質(zhì)評價指標中篩選出6個作為水質(zhì)評價重要指標的基礎(chǔ)上,通過分層聚類分析將4個監(jiān)測斷面2011—2014年的180個樣本點分成7組,并用非參數(shù)假設(shè)檢驗驗證了結(jié)果的可靠性。最后以各組的樣本均值為基礎(chǔ),采用水質(zhì)標識指數(shù)方法對各組的水質(zhì)樣本進行評價,并將評價結(jié)果分配到各組對應(yīng)的水質(zhì)樣本點。結(jié)果表明,丹金溧漕河溧陽段2011—2014年的水質(zhì)大部分劣于III類,枯水期內(nèi)水質(zhì)較差。
多元統(tǒng)計分析;水質(zhì)標識指數(shù);水質(zhì)評價;丹金溧漕河;溧陽
丹金溧漕河是太湖西部地區(qū)主要水運干線,北起丹陽連接大運河和長江,南至溧陽與安徽連通,全長約66.9 km。丹金溧漕河溧陽段位于丹金溧漕河下游,經(jīng)金壇市進入溧陽市境內(nèi),境內(nèi)流程約17.3 km,承擔著洪水調(diào)蓄、航運、納污等職能。近年來在當?shù)丨h(huán)保部門及各鄉(xiāng)鎮(zhèn)政府通力合作推進各項治污措施的基礎(chǔ)上,該河流水質(zhì)有所改善,但由于區(qū)域水網(wǎng)縱橫交錯,航運發(fā)達,制約水質(zhì)達標的因素復雜,污染問題仍較為嚴峻。因此,選用適當?shù)乃|(zhì)評價方法對該河流水質(zhì)狀況做出合理的評價顯得尤為重要。目前常用的水質(zhì)評價方法有指數(shù)評價法[1-2]、模糊數(shù)學綜合評價法[3-4]、灰色系統(tǒng)評價法[5-6]、人工智能模型[7]和多元統(tǒng)計方法[4,8-11]等。 上述水質(zhì)評價方法在水環(huán)境綜合評價過程中各有優(yōu)點,其中多元統(tǒng)計分析法應(yīng)用廣泛,既考慮了污染物在時空上的關(guān)聯(lián)性,又避免了大量重復計算造成的過程繁雜,具有較好的推廣應(yīng)用價值。
文中以丹金溧漕河溧陽段為例,將多元統(tǒng)計分析與水質(zhì)標識指數(shù)法相結(jié)合,首先在利用因子分析(Factor Analysis,F(xiàn)A)篩選出水質(zhì)評價重要指標的基礎(chǔ)上,通過分層聚類(Hierarchical Cluster Analysis,HCA)按樣本相似程度進行聚類分組,然后以各組的水質(zhì)均值為基礎(chǔ),采用綜合水質(zhì)標識指數(shù)法對各組樣本水質(zhì)進行評價,最后將得到的水質(zhì)評價結(jié)果分配到各組對應(yīng)的水質(zhì)樣本點,以期實現(xiàn)對多斷面、長時段的大量樣本的水質(zhì)評價。
丹金溧漕河溧陽段沿線共設(shè)有4個例行水質(zhì)監(jiān)測斷面,自上而下依次為別橋(S1)、鳳凰東橋(S2)、夏橋(S3)和新村里(S4),如圖1所示。其中,新村里斷面為國控斷面,代表了丹金溧漕河溧陽段出境前水質(zhì)。文中采用溧陽市環(huán)境監(jiān)測站提供的4個監(jiān)測斷面2011—2014年的水質(zhì)數(shù)據(jù),每個監(jiān)測斷面選取生化需氧量(BOD5)、化學需氧量(COD)、高錳酸鹽指數(shù)(CODMn)、氨氮(NH3-N)、總磷(TP)、溶解氧(DO)、石油類、揮發(fā)酚、總氮(TN)、氟化物和硫化物等11個指標作為丹金溧漕河水質(zhì)評價的基礎(chǔ)指標,水質(zhì)樣本共180個(2011年鳳凰東橋和夏橋采樣頻次為每兩月1次,其余均為每月1次)。數(shù)據(jù)分析采用的軟件為Excel 2010和SPSS20.0。

圖1 研究區(qū)域及監(jiān)測斷面示意圖
因子分析(FA)有很多方法,常用的有R型因子分析和Q型因子分析,前者使用的是變量的相關(guān)矩陣,后者使用的是樣品的相似系數(shù)矩陣[12]。文中利用因子分析主要進行評價指標的篩選,故選擇R型因子分析。 因子分析法的基本原理[13]:設(shè)對每個樣本觀測p個相互間有相關(guān)性的指標(變量)X1,X2,…,Xp,共觀測n 個樣本,則 p 個指標組成的向量 X=(X1,X2,…,Xp)T。在對原始數(shù)據(jù)作標準化處理的基礎(chǔ)上,將每個原有變量用 k(k<p)個因子 f1,f2,…,fk的線性組合來表示,即有

上式就是因子分析的數(shù)學模型,也可以用矩陣的形式表示為X=AF+ε,其中X是可實測的隨機向量;F稱為因子,由于它們出現(xiàn)在每個原有變量的線性表達式中,因此,又稱為公共因子;A稱為因子載荷矩陣,aij(i=1,2,…,p;j=1,2,…,k)稱為因子載荷;ε稱為特殊因子,表示原有變量不能被因子解釋的部分,其均值為 0。
分層聚類分析(HCA)的目的是把相似或相近的對象歸并成類,研究的主要內(nèi)容是如何度量相似性和構(gòu)造聚類的具體方法[12],包括“指標聚類”和“樣品聚類”,考慮到水質(zhì)樣本之間的差異性與相似性,文中采用樣品聚類的方法對樣本點進行分組。
相似程度的計算包括樣本間距離和組間距離兩類,前者包括歐氏距離、Chebychev距離和Minkowski距離等;后者包括最短距離法、最長距離法和離差平方和法(Ward法)等。在實際應(yīng)用中,離差平方和法分類效果較好,應(yīng)用也比較廣泛[14]。因此,文中采用Ward法,樣本間的距離采用歐氏距離。
在總體分布未知或知之甚少的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進行推斷的一類統(tǒng)計方法稱為非參數(shù)假設(shè)檢驗(Nonparametric Test),具有對樣本數(shù)據(jù)要求較低、檢驗條件寬松、計算相對簡單等優(yōu)點。SPSS中的非參數(shù)檢驗方法包括單樣本K-S檢驗、兩獨立樣本檢驗、兩配對樣本檢驗、多獨立樣本檢驗和多配對樣本檢驗等。文中采用多配對樣本檢驗對分層聚類結(jié)果進行差異性檢驗。
水質(zhì)標識指數(shù)法分為單因子水質(zhì)標識指數(shù)法和綜合水質(zhì)標識指數(shù)法,具體如下:
(1)單因子水質(zhì)標識指數(shù)法
單因子水質(zhì)標識指數(shù)Pi由一位整數(shù)及小數(shù)點后兩位有效數(shù)字組成,其公式表示如下

式中,X1代表第i項水質(zhì)指標的水質(zhì)類別,可以通過《地表水環(huán)境質(zhì)量標準》(GB3838-2002)來確定,取值為1,2,…,6;X2代表該監(jiān)測數(shù)據(jù)在X1類水質(zhì)變化區(qū)間中所處的位置,按四舍五入的原則計算確定;X3代表水質(zhì)類別與功能區(qū)劃設(shè)定類別的比較結(jié)果,反映評價指標的污染程度,為1-2位有效數(shù)字。
(2)綜合水質(zhì)標識指數(shù)法
為了避免單因子評價法以偏概全的缺點,綜合水質(zhì)標識指數(shù)既突出了污染最嚴重的指標的影響,又綜合考慮了各項水質(zhì)評價指標,以全面反映水質(zhì)樣本的總體特征。綜合水質(zhì)標識指數(shù)P由單因子水質(zhì)標識指數(shù)的平均值和最大值兩部分構(gòu)成,用公式表示如下

式中,P為n項單因子水質(zhì)標識指數(shù)的算術(shù)平均值;Pmax為n項單因子水質(zhì)標識指數(shù)中的最大值;n為水質(zhì)指標數(shù)。
通過綜合水質(zhì)標識指數(shù)P,可以判斷水體的水質(zhì)級別和污染程度,具體評判標準見表1。

表1 基于綜合水質(zhì)標識指數(shù)的綜合水質(zhì)級別判定
為了篩選出用于綜合評價水質(zhì)級別的重要指標,對4個斷面2011—2014年每月11個指標數(shù)據(jù)共180個樣本進行因子分析。從表2因子分析結(jié)果可見,KMO檢驗值為0.714,Bartlett球形檢驗的顯著性水平為0.000,說明這些變量各自不全獨立,它們之間有簡單線性相關(guān)關(guān)系,表3顯示上下游同一種污染指標的相關(guān)性,且相關(guān)系數(shù)r均在0.70以上,因此,可做因子分析;前3個公因子的特征值大于1,這3個公因子在旋轉(zhuǎn)成分矩陣表中對應(yīng)有較高因子載荷的變量為氟化物、CODMn、BOD5、石油類、COD和DO,同時根據(jù)該河段入河水質(zhì)(即S1斷面水質(zhì))調(diào)查發(fā)現(xiàn),這6個指標濃度均較高,所以選其作為水質(zhì)評價的重要指標是較合理的。

表2 KMO統(tǒng)計量和球型檢驗

表3 上下游同一種污染指標的相關(guān)性
利用SPSS20.0對180個水質(zhì)樣本進行分層聚類分析,從聚類樹狀圖可以看出,180個樣本點從分成7組變化到分成4組時,橫軸的距離出現(xiàn)了一個大幅度的增加,意味著應(yīng)將這180個樣本分成7組(分別編號G1-G7,見表4)。
為了進一步檢驗聚類分析的效果,對各分組內(nèi)的多個配對樣本進行了非參數(shù)假設(shè)檢驗,見表5。結(jié)果表明,所檢驗的7個分組的漸近顯著性水平都大于0.05,故認為這7個分組內(nèi)各水質(zhì)樣本間不存在顯著差異,證明聚類分析是有效的。因此,可用組內(nèi)樣本的均值(見表6)代表各組樣本的總體特征進行水質(zhì)評價,從而減輕水質(zhì)評價的工作量。

表4 7組樣本各自對應(yīng)的水質(zhì)樣本點

表5 7組樣本非參數(shù)假設(shè)檢驗結(jié)果
把通過分層聚類得到的7個組的組內(nèi)樣本均值代入水質(zhì)標識指數(shù)公式(2)-(4)中,得到各組水質(zhì)樣本的單因子水質(zhì)標識指數(shù)及綜合水質(zhì)標識指數(shù),見表6。從表6可以看出,7組樣本的水質(zhì)狀況分布在III類~IV類之間,其中有3組是III類水質(zhì),分別為G1、G3、G4;有4組是IV類水質(zhì),分別為G2、G5、G6、G7。 此外,還可比較水質(zhì)狀況相近樣本的水質(zhì)優(yōu)劣,如G1、G3和G4都是III類水質(zhì),其污染程度為G4>G3>G1;G2、G5、G6和G7都是IV類水質(zhì),其污染程度為G7>G5>G6>G2。

表6 7組樣本單因子和綜合水質(zhì)標識指數(shù)評價結(jié)果
把上述各組樣本的水質(zhì)評價結(jié)果根據(jù)表4分配到各自對應(yīng)的樣本點,以實現(xiàn)對多斷面、長時段的大量樣本的水質(zhì)評價。圖2為丹金溧漕河溧陽段4個斷面2011—2014年的綜合水質(zhì)標識指數(shù)評價結(jié)果。
從橫向來看,丹金溧漕河溧陽段的4個斷面水質(zhì)都較差,大部分劣于III類。聯(lián)系該河段沿線的污染源分布情況,可以發(fā)現(xiàn)S1斷面水質(zhì)主要受上游來水影響;S2斷面水質(zhì)主要受工業(yè)污染(昆侖工業(yè)園)影響;S3斷面水質(zhì)主要受城鎮(zhèn)生活和工業(yè)污染(城北工業(yè)園)影響;S4斷面作為出境斷面,主要受上游匯水水質(zhì)影響。
從縱向來看,丹金溧漕河溧陽段2011—2014年水質(zhì)狀況逐年改善,這表明近年來溧陽市水污染治理工作取得了一定成效。此外,在工業(yè)廢水和生活污水排放量變化不大的情況下,丹金溧漕河水質(zhì)狀況主要受降水量的影響,枯水期與豐水期差異明顯:枯水期內(nèi)水質(zhì)較差;豐水期(5-8月)降水量充沛,河流流量相對較大,對河流中的污染物起到一定的稀釋作用,水質(zhì)好轉(zhuǎn),可達到III類水標準。

圖2 丹金溧漕河溧陽段4個斷面2011—2014年水質(zhì)評價結(jié)果
(1)將多元統(tǒng)計分析與水質(zhì)標識指數(shù)法相結(jié)合,用于多斷面、長時段的大量樣本的水質(zhì)評價,結(jié)果符合實際情況,證明了此方法的科學性和實用性。此外,在水質(zhì)評價過程中,該方法既突出了最大超標因子的影響,又綜合考慮了各項水質(zhì)評價指標,能夠全面反映水質(zhì)樣本的總體特征。
(2)丹金溧漕河溧陽段沿線的4個監(jiān)測斷面2011—2014年的水質(zhì)大部分劣于III類,因此,為了確保出境水質(zhì)穩(wěn)定達標,應(yīng)將S2-S3段作為丹金溧漕河溧陽段水污染重點控制區(qū),并重點關(guān)注枯水期的水污染問題,進一步加強控源截污工作。
[1]?TAMBUK-GILJANOVIC N.Water quality evaluation by index in Dalmatia[J].Water Research,1999,33(16):3423-3440.
[2]楊大杰.綜合水質(zhì)標識指數(shù)法及單因子水質(zhì)標識指數(shù)法在2013年官廳水庫水質(zhì)評價中的應(yīng)用[J].水利水電技術(shù),2014,45(10):28-30,41.
[3]鄒志紅,孫靖南,任廣平.模糊評價因子的熵權(quán)法賦權(quán)及其在水質(zhì)評價中的應(yīng)用[J].環(huán)境科學學報,2005,25(4):552-556.
[4]盧文喜,李迪,張蕾,等.基于層次分析法的模糊綜合評價在水質(zhì)評價中的應(yīng)用[J].節(jié)水灌溉,2011(3):43-46.
[5]于皓,劉志斌,王昭君.基于灰色聚類分析法的礦井水質(zhì)評價[J].遼寧工程技術(shù)大學學報,2003,22(S1):74-76.
[6]李國良,付強,孫勇,等.基于熵權(quán)的灰色關(guān)聯(lián)分析模型及其應(yīng)用[J].水資源與水工程學報,2006(6):15-18.
[7]周豐,郭懷成,劉永,等.基于多元統(tǒng)計分析和RBFNNs的水質(zhì)評價方法[J].環(huán)境科學學報,2007,27(5):846-853.
[8]SOLIDORO C,PASTRES R,COSSARINI G,et al.Seasonal and spatial variability of water quality parameters in the lagoon of venice[J].Journal of Marine Systems,2004,51(1-4):7-18.
[9]李連香,許迪,程先軍,等.基于分層構(gòu)權(quán)主成分分析的皖北地下水水質(zhì)評價研究[J].資源科學,2015,37(1):61-67.
[10]田玉柱,何萬生,夏鴻鳴,等.基于多元統(tǒng)計和時序方法的渭河水質(zhì)評價及預測[J].數(shù)理統(tǒng)計與管理,2014,33(5):780-789.
[11]SHRESTHA S,KAZAMA F.Assessment of surface water quality using multivariate statistical techniques:A case study of the Fuji river basin,Japan[J].Environmental Modellingamp;Software,2007,22(4):464-475.
[12]朱紅兵.應(yīng)用統(tǒng)計與SPSS應(yīng)用[M].北京:電子工業(yè)出版社,2011.
[13]王璐,王沁.統(tǒng)計軟件SPSS完全學習手冊與實戰(zhàn)精粹[M].北京:化學工業(yè)出版社,2013.
[14]何曉群.多元統(tǒng)計分析[M].北京:中國人民大學出版社,2004.
責任編輯:謝金春
Water quality assessment for Danjinlicao River in Liyang based on multivariate statistical analysis and water quality identification index
TANG Guoping,CHEN Dechao*, HUANG Zhenxu, XU Xiaofeng
(School of Environmental Science and Engineering,SUST,Suzhou 215009,China)
We studied Danjinlicao River in Liyang.Six indicators were selected out of eleven as water quality evaluation indicators through factor analysis.180 samples generated from four monitoring sections during 2011-2014 were divided into 7 groups according to hierarchical cluster analysis.Nonparametric test was applied to validate the reliability of the results.Finally,using sample mean of each group as input,we calculated the water quality identification index of each group and fed back the evaluation result of each group to their original sample.The results show that the water quality condition of Danjinlicao River in Liyang was mostly worse than Class III from 2011 to 2014,and that the water quality in dry season was poorer.
multivariate statistical analysis;water quality identification index;water quality assessment;Danjinlicao River;Liyang
X824
A
2096-3289(2017)04-0070-06
2016-08-03
溧陽市科技支撐計劃項目(LC2014007);江蘇省高校優(yōu)秀中青年教師和校長境外研修計劃資助項目
唐國平(1992-),男,江蘇興化人,碩士研究生,研究方向:環(huán)境規(guī)劃與管理。
*通信作者:陳德超(1972-),男,博士,副教授,碩士生導師,E-mail:dcchen2002@163.com。