劉 銘,朱長軍,頓珠加措,尼瑪次仁
(1.河北工程大學城建學院,河北邯鄲 057150;2.西藏自治區水文水資源勘測局日喀則水文水資源分局,西藏日喀則 857000;3.西藏自治區水利電力規劃勘測設計研究院西藏拉薩 850009)
水質評價是指按照評價目標,選擇相應的水質參數,采用相應的水質標準和評價方法,對水體的質量利用價值及水的處理要求做出評定,使用廣泛的常規環境質量評價方法大致分為綜合指數法、數理統計法、分級評價法和其他方法四大類[1]。在復雜的環境系統中存在很多模糊性,例如環境影響的“大”與“小”、污染物濃度的“高”與“低”、方案的“優”與“劣”等均無法用確定的界限加以劃分[2]。在對區域水環境質量進行水質評價時,僅將綜合指數評價法應用于環境質量綜合評價,其理論方法和實際結果存在著一定的缺陷,往往難以實現對區域水環境的總體評價。目前,聚類分析法已被廣泛應用于環境質量評價中,聚類分析方法能夠較好評價生物指標,綜合考慮生化指標,有助于合理評價水質分布與特性[3];通過聚類分析能確定海域主要污染指標和污染程度,能夠較合理地反映海域的環境質量特征[4];許多土壤研究者與環境工作者運用聚類分析在土壤質量評價中開展了卓有成效的工作[5]。大量的研究結果表明,多指標存在時應用聚類分析方法能夠對環境質量做出更為客觀、準確的綜合評價。本次水質分析采用聚類分析的統計方法,通過對水質監測監測數據的統計分析,研究比較各監測站點水質指標數據的相關關系,對具有相近數據關系的監測站點進行歸類,另外結合監測站點水質綜合評價結果和區域內地理位置及當地水污染實際情況,從而對區域水環境質量做出總體初步評價。
濟寧市位于山東省西南部,京杭大運河穿過濟寧市,素有“運河之都”的美譽,我國北方最大的淡水湖南四湖也位于其中。隨著城市的發展,濟寧市水污染情況越來越嚴重,同時南水北調工程的啟動也對濟寧市的水質提出嚴格要求。濟寧市內河流縱橫分布,各段污染狀況不同,水質監測站點的布點也因此密布整個濟寧市而且數量較多,這最終導致水質評價時會出現繁雜等困難。本次分析選取濟寧市水質監測數據,共選取包括25個地下水監測站點的水質監測結果,選取C1、SO4、總硬度、BOD5、CODMn、氨氮、亞硝酸鹽氮、硝酸鹽氮、酚共9項水質監測指標,濟寧市監測站點區域分布見下圖1,各個監測站點水質監測數據見表1:


表1 監測站點水質監測數據Tab.1 The water quality monitoring data from monitoring sites
聚類是按照某個特定標準把一個數據分割成不同的類或簇,使得類內相似性盡可能的大,同時類間的差異性也盡可能的大[6]。聚類分析方法的基本思想是研究對象之間存在著不同程度的相似性,通過分析比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類,聚類分析中常見的有系統聚類法和K均值聚類法。本次數據分析選用系統聚類法,這是目前實踐中使用最多的,該方法的分析步驟是:先將所有樣本看成一類,選用一定的方法計算樣本與樣本之間的距離和類與類之間的距離;開始,每個樣本自成一類,類類之間和樣本之間的距離相同;然后,在所有的類中選擇距離最小的合并為一個新類,并計算出其與其它類的距離;接著再將距離接近的類合并,直至將所有樣本合并為一類為止。由聚類系譜圖可以清楚的看出全部樣本的聚集過程,進而做出樣本的分類。
由于水質各項指標監測數據存在計量量綱的不同,數值大小差異較大,因此需要首先對數據進行標準化處理,本次選用極差標準化法處理數據。假設有m個聚類對象,每個對象有n個要素構成,其所對應要素數據如表2所示。

表2 聚類對象與要素數據Tab.2 The clustering objects and data elements
極差標準化公式如下:

式中Xij為監測指標原值,其中1≤i≤m,1≤j≤n為標準化后數據;為監測指標的最小值;為檢測指標的最大值。
經過標準化處理所得的數據,極大值為1,極小值為0,其余的數值均在0與1之間。
系統聚類分析的依據和基礎是數據之間的差異性,差異性的測度即為距離的計算,距離較大則樣本相似性越小。距離的計算有多種選擇方法,本次選用Pearson相關性來計算各樣本之間距離。
系統聚類的過程中類與類之間距離計算方法可以分為單連接法、完全連接法、平均連接法、組平均連接法和離差平方和法等,本次計算類與類之間距離選用組平均連接法,該方法采用的距離定義為兩類之間的平均平方距離,如下:

根據選取的濟寧市各個監測站點得到水質監測數據,利用統計分析軟件SPSS進行聚類分析計算,計算過程如下:
(1)用極差標準化方法對各水質指標的原始數據進行處理;
(2)采用Pearson相關性測度監測站點之間的樣本間距離;
(3)選用組平均法計算類間的距離,并對樣本進行歸類。
經過上述聚類個步驟方法的選擇得到聚類的結果如圖2示:

SPSS軟件聚類分析所得的樹狀圖能夠清楚顯示出這些監測站點的聚類過程,同時根據聚類分析樹狀圖的結果,能夠將監測站點分為六類,具體監測站點分類如下,第一類監測站點編號:7、13、1、3、12、4、24、21、8、10、2、6;第二類:5、25、14、15、18、23、17、16;第三類:9;第四類 19;第五類:20;第六類:11、22。
采用內梅羅綜合指數評價法,計算各監測站點的綜合指數。首先進行單組分評價,劃分組分所屬質量類別,對各類別按表3分別確定單項組分評價分值Fi,然后代入內梅羅綜合指數評價公式計算綜合評價分值F,根據F值,按照表4劃分地下水質量級別。
內梅羅綜合指數評價法公式:

經過聚類分析,濟寧市的監測站點一共分為六大類,用綜合指數法計算各監測站點的污染級別,最終將二者數據相結合,各監測站點所屬類別及分布區域和污染級別如下表5所示:
(1)第一類包括12個監測站點,24號及21號分布于中山區外,其余均分布于任城區,水質綜合評價級別除2號為IV類外其余均為II類,對2號監測站點水質數據分析知,其酚類污染物屬國家IV類標準,導致其水質級別較差;
(2)第二類包括8個監測站點,其中3個分布于任城區,5個分布于市中區,水質綜合評價級別均分布于III-V類,由監測站點數據分析知,25號、17號及5號、15號、16號監測點均是由于總硬度超出IV、V類標準,因而水質級別較差和極差;
(3)9號、19號各為一類,分別位于任城區和市中區,雖然綜合評價級別均為良好,但由監測數據可知其主要污染類別不同,19號其氯化物以及硝酸鹽氮量明顯高于9號;
(4)20號自成一類,位于市中區,其主要污染物是亞硝酸鹽氮,其含量超出國家V類標準;
(5)11號和22號分別位于任城區和中山區,均系酚類超出國家V類標準,因而分為一類,而22號由于硝酸鹽氮屬V類標準,導致水質較差。
通過聚類分析法對監測站點的分類結果看出各類間的主要區別在于水質污染級別的不同或是主要污染因素的不同,結合各個監測站點以及污染源分布圖可以得出:市中區總體水質質量較差,其主要原因是市區內人口以及工業企業密集分布,污染排放量大;任城區一些高污染排放企業周圍水質較差外,其他地區水質良好,這與任城區河流分布較多是分不開的,污染物排放后會隨河流流入湖泊,從而減輕了其對地下水污染的影響。

表3 單項組分評價分值Tab.3 Single component evaluation

表4 地下水質量劃分級別Tab.4 Groundwater quality grade

表5 綜合評價與聚類結果Tab.5 Results of comprehensive evaluation and clustering
[1]熊德琪.環境系統模糊集分析理論與應用[M].大連:大連海事大學出版社,2001.
[2]馬風才.項目環境影響模糊評價理論與應用研究[D].北京:北京航空航天大學,2001.
[3]曾淦寧,吳國權,徐曉群.多元聚類分析方法在杭州灣水質分析上的應用[J].浙江工業大學學報,2009(1):14-19.
[4]羅薇,邵秘華,周立新.聚類分析功能在大連港水域環境質量評價中的應用[J].大連海事大學學報,2004(4):51-55.
[5]蔡瞳,徐惠,吳群.土壤質量聚類分析—以封丘縣為例[J].安徽農業科學,2008,36(25):10998-10999.
[6]顧洪博,張繼杯.不確定數據的聚類分析研究及應用[J].河北工程大學學報:自然科學版,2012,29(1):109-112.