張月霞,毛金龍
(1.云南省環境科學研究院,云南 昆明 650034;
2.華能瀾滄江水電股份有限公司,云南 昆明 650206)
?
層次聚類分析法在水質監測點優化中的應用
張月霞1,毛金龍2
(1.云南省環境科學研究院,云南 昆明 650034;
2.華能瀾滄江水電股份有限公司,云南 昆明 650206)
摘要:以撫仙湖湖體2014年7月 —2015年6月污染指標的監測平均值作為原始數據,采用SPSS層次聚類分析法對不同監測點進行聚類分析,確定各監測點間的親疏關系,并結合監測點屬性等實際情況,最終將原15個監測點初步優化調整為11個監測點,獲得了最優化水質監測斷面。
關鍵詞:監測點;SPSS;層次聚類;優化;撫仙湖
0引 言
水質惡化是湖泊環境演變的重要研究主題,受到當今世界各國和學術界的廣泛關注,由于人類活動強度的不斷增加以及自然環境的變化,湖泊水質環境受到嚴重威脅,以富營養化、酸化和有機物污染等為代表的水質問題成為制約湖泊生態系統健康的主要因素[1-2]。水質的監測對于掌握水質的變化趨勢亦變得尤為重要。而水質監測中,測量斷面和測點的布置直接影響著結果的正確性,同時影響測量效率。因而在保證數據正確合理的基礎上,對監測斷面進行優化設計,將有助于提高測量工作人員的工作效率,節省經濟支出。一般地,人們常采用數理統計方法來分析河流監測斷面監測結果是否相近,以此判斷監測斷面是否需要優化去除。聚類分析是定量研究分類問題的一種數理統計方法,它是根據種類中的個體有較大相似性( 或變量) 之間相似度的統計,來確定樣品(或變量)之間的親疏關系,將樣品(或變量)分別聚類到不同的類中[3],監測斷面的聚類分析有助于確定不同斷面之間的相互關系,從而明確不同類別監測斷面的監控性質[4-5]。而層次聚類算法[6]是實際應用中聚類分析的支柱,在各種軟件包中都能找到它的身影,使用簡單且具有較高的穩定性。因此,本文以撫仙湖湖體水質監測數據為例,采用層次聚類分析的方法對監測斷面進行分類,得到最優化水質監測斷面。
1地域概況
撫仙湖位于云南省中部,昆明市東南約60km,北緯24°21′28″~24°38′00″,東經102°49′12″~102°57′26″。跨澄江、江川、華寧三縣[7]。撫仙湖屬于南盤江流域西江水系,流域面積674.69km2,水域面積約為216.6km2,湖長約31.4km,湖最寬處為11.8km,湖岸線總長100.8km,最大水深158.9m,平均水深95.2m,相應湖體水量約206.2億m3,占云南省九大高原湖泊總蓄水量的72.8%,是我國最大的深水型淡水湖泊。撫仙湖為貧營養型湖泊,水質清澈透明,含沙量很小,湖水中各生物營養元素的含量很低,生物生產力較低,是我國為數不多的保持Ⅰ類水質的大型湖泊。然而,近年來,由于人類活動的干擾以及自然環境變化,撫仙湖水質發生變化,有機污染和營養化水平不斷提高,高錳酸鹽指數、TP濃度、浮游植物豐度和葉綠素a濃度有所上升,部分月份水質達到Ⅱ類,湖泊生態健康受到威脅[1]。
2數據來源與研究方法
2.1數據來源
本研究選用2014年7月—2015年6月撫仙湖湖體15個監測點的6種監測指標——pH值、溶解氧、化學需氧量、高錳酸鹽指數、氨氮、總氮的月平均數據。各監測點樣品的采集和分析測試由玉溪市環境監測站完成。研究區域及監測點分布情況見圖1,各監測點水質指標12個月監測值月均值見表1。
2.2研究方法
為了使不同監測項指標之間具有可比性,對原始數據進行標準化預處理,轉化為無量綱的污染指數,換算公式如下:

表1 撫仙湖湖體監測點主要污染物濃度 (mg/L)

一般水質因子換算公式:
Si,j=ci,j/csi
(1)
式中:Si,j——單項水質因子i在j點的標準指數;
ci,j——(i,j)點的評價因子水質濃度或水質因子i在監測點j的水質濃度,mg/L;
csj——水質評價因子i的水質評價標準限值,mg/L;
特殊水質因子:
①DO的標準指數
(2)
(3)
式中:SDO,j——DO的標準指數;
DOf——某水溫、氣壓條件下的飽和溶解氧質量濃度,mg/L。
計算公式常采用:
DOf=486/(31.6+T)
(4)
式中:T——水溫,℃;
DOj——溶解氧實測值,mg/L;
DOS——溶解氧的水質評價標準限值;
②pH值的標準指數
SpH,j=(7.0-pHj)/(7.0-pHsd)pHj≤7.0
(5)
SpH,j=(pHj-7.0)/(pHsu-7.0)pHj>7.0
(6)
式中:SpH,j——pH值的標準指數;
pHj——pH值實測值;
pHsd——《地表水環境質量標準》中規定的pH值下限值,取6;
pHsu——《地表水環境質量標準》中規定的pH值上限值,取9。
撫仙湖湖體水質評價標準值采用《GB3838-2002 地表水環境質量標準》一級標準。地表水評價標準如表2所示。
將表1中各監測點主要污染物的月均值通過(1)~(6)式進行標準化處理后,得到標準化數據矩陣如表3所示。

表2 地表水評價標準(Ⅰ類)

表3 標準化矩陣
3數據處理
將表3中各監測點數據進行模糊聚類分析,采用SPSS16.0軟件計算,聚類方式選擇組間平均連接法(Between groups linkage),距離測量選擇歐式距離平方(Squared Euclidean Distance)。
4結果分析
計算結果如表4、表5、表6和圖2所示。

表4 案例描述
由表4可得:用聚類法分析的有效案例數為15個,無遺漏值。

表5 聚類解(2類、3類、4類)
由表5可知:用歐式距離平方,組間平均法生成了2類、3類、4類的聚類解。如分為2類時就是Ⅰ類(監測點3、5、8、12),Ⅱ類(監測點1、2、4、6、7、9、10、11、13、14、15);分為3類就是Ⅰ類(監測點10、14、15),Ⅱ類(監測點1、2、4、6、7、9、11、13),Ⅲ類(監測點3、5、8、12);分為4類就是Ⅰ類(監測點1、2、4、6、9、11、13),Ⅱ類(監測點10、14、15),Ⅲ類(監測點3、5、8、12),Ⅳ類(監測點7)。

表6 相似性矩陣
表6描述的是各個監測點之間的歐式距離平方值,相同的監測點之間的歐式距離平方值為0。不同監測點之間的歐式距離平方值越小,說明監測點之間的相似程度越大,容易歸為一類,反之,各監測點間的歐式距離平方值越大,其相似程度越小,不易歸為一類。

將撫仙湖15個監測點分為4類,聚類分析樹狀圖如圖2。
根據聚類分析結果,各類監測點分布示意圖如圖3~圖6所示。

由圖2可知,Ⅰ類(監測點3、5、8、12)的4個監測點中,監測點5和監測點8距離較近,可以將這2個監測點優化為1個點,優化后的監測點布設在原監測點5和監測點8之間,該點可命名為監測點16。由圖4可知,Ⅱ類中的監測點10、監測點14和監測點15幾乎是均勻分布在撫仙湖中,監測點14和監測點15均分布在撫仙湖東側,可以優化為1個點,建議保留監測點14。由圖5可知,Ⅲ類(監測點1、2、4、6、9、11、13)的7個監測點中,監測點1、監測點2和監測點11這3個點分布的距離較近,可以優化為1個點,優化后的監測點布設在原監測點1、監測點2和監測點11組成的三角形區域內,該點可命名為監測點17。由圖6可知,第Ⅳ類僅有監測點7,無需優化。通過聚類分析優化后的監測點分布情況如圖7所示。

5結論
基于撫仙湖湖體水質監測數據,采用層次聚類分析法對不同監測點進行聚類分析,可得出以下結論:
(1)Ⅰ類中的5個監測點(3、5、8、12)可優化為3個監測點(3、12、16)。
(2)Ⅱ類中的3個監測點(10、14、15)可優化為2個監測點(10、14)。
(3)Ⅲ類中的7個監測點(1、2、4、6、9、11、13)可優化為5個監測點(4、6、9、13、17)。
(4)第Ⅳ類僅有監測點7,無需優化。
參考文獻:
[1]高偉,陳巖,徐敏,等.撫仙湖水質變化(1980—2011年)趨勢與驅動力分析[J].湖泊科學,2013,25(5):635-642.
[2]Dodds WK,Bouska WW,Eitzmann JL et al.Eutrophication of US freshwaters: analysis of potential economic damages[J].Environmental Science & Technology,2009,43(1):12-19.
[3]張旋,王啟山,于淼,等. 基于聚類分析的水質標識指數和水質評價方法[J]. 環境工程學報, 2010, 4( 2) : 476-480.
[4]張璘,郝英群,姜勇.江蘇省地表水監測斷面優化調整的構思[J]. 環境監控與預警, 2011, 3(2):54-56.
[5]馬飛, 蔣莉.河流水質監測斷面優化設置研究——以南運河為例[J].環境科學與管理,2006,31(8):171-172.
[6]陳森平,陳啟買,吳志杰.基于核函數的層次聚類算法[J].暨南大學學報:自然科學版,2011,32(1):31-35.
[7]中國科學院南京地理與湖泊研究所.撫仙湖[M].北京:海洋出版社,1990.
Application of the Hierarchical Clustering Algorithm in Optimizing the Distribution of Water Quality Monitoring Points
ZHANG Yue-xia1, MAO Jin-long2
(1.Yunnan Institute of Environmental Science, Kunming Yunnan 650034 ,China)
Abstract:On the basis of the original monitoring data of pollution indices in Fuxian Lake from July of 2014 to June of 2015, the hierarchical clustering algorithm method in SPSS were applied to cluster the monitoring points. The relationships of monitoring points were studied and compared. In the end, the monitoring points were optimized from 15 to 11 in terms of the properties of the points based on the method.
Key words:monitoring site; SPSS; hierarchical clustering algorithm; optimization; Fuxian Lake
中圖分類號:X52
文獻標志碼:A
文章編號:1673-9655(2016)01-0020-06
作者簡介:張月霞,女,碩士,工程師,主要從事環境水力學及水污染治理研究。
收稿日期:2015-09-25