董 穎, 吳喜軍,, 李懷恩, 張亞寧, 武宏梅, 劉 靜, 張范平
(1.榆林學院 建筑工程學院, 陜西 榆林 719000; 2.西安理工大學 省部共建西北旱區生態水利國家重點實驗室, 陜西 西安 710048; 3.榆林高新區水務有限責任公司, 陜西 榆林 719000)
陜北地區是中國重要的煤炭生產基地,為典型的半干旱內陸氣候區,降水較少,地表干燥,水資源貧乏。以前該地區生態環境質量較好,但隨著近些年人口的增長與礦產資源的開發,水資源減少明顯[1],生活污水、工業廢水和農田排水大量流入水體,加上水土流失嚴重,導致飲用水源環境質量已不容樂觀,甚至影響到能源化工基地的可持續發展[2-3]。一些學者對陜北主要河流的特征污染物及水質狀況進行了研究[4],但陜北礦區水源地水質監測分析和綜合評價工作開展較少。分析該地區水源水質特征,了解其水環境狀況是污染防治的必要前提,已迫在眉睫。
主成分分析法(PCA)可以從眾多指標中篩選出幾個綜合指標,是水質評價方法之一。張涵等[5]運用主成分分析法研究了成都平原典型區地下水潛在污染源及污染源時季變化規律。孫悅等[6]運用主成分分析法研究白洋淀冰封期水污染特征,得出水質限制因子為TN,TP。但PCA在確定主成分權重時包含主觀因素,而熵值法是一種客觀賦權法,可以很好地解決這一問題。項頌等[7]基于熵值法對湖泊水生態健康狀況進行現狀評價及歷史變化分析,張繼宇等[8]采用熵值法對陸渾水庫營養狀況進行了評估,結果均表明用熵權作為權重是可行的。
尤家峁水庫是陜北榆林城區的重要飲用水水源地,作為典型的深水型水庫,因自然分層及混合過程的存在,導致水庫水體面臨沉積物內源污染釋放和外源污染匯入的雙重問題。并且尤家峁水庫采用底層取水的供水方式,其內源污染尤為明顯,深層水體周期性熱分層過程使沉積物向上覆水中釋放大量還原性污染物,存在較高的鐵和錳超標的風險,水質狀況直接影響民生飲水安全。本文根據尤家峁水庫2013—2019年連續的月水環境調查數據,運用主成分分析法和PCA-熵值結合法,對其水質狀況進行研究,分析影響水質的主要驅動因子,研究水質的時間變化規律,并分析其原因,以期為該地區飲用水環境保護和處理對策提供理論基礎和決策依據。
尤家峁水庫(38°15′00″—38°15′40″N,109°42′32″—109°43′26″E)位于榆林市榆溪河支流沙河水系下游,于1988年10月建成并投入使用,控制流域面積97 km2,總庫容1.58×107m3,有效庫容9.70×106m3,水庫水位約為1 097 m。凈水廠取水口位于水庫底層,取水管道接入點管中心標高為1 076.93 m。作為榆林城區工業生產與居民生活用水的重要水源保護地,年供水量達到8.00×106m3。尤家峁水庫來水包括兩部分:一是沙河流域來水量,二是西沙渠引用榆溪河河水進行補水,北起牛家梁鎮刀則灣,南至尤家峁水庫,全長23.8 km。
1.2.1 樣品采集及保存 2013年3月至2019年8月對尤家峁水庫實施原位監測,監測頻率為每月1~2次。采用有機玻璃采水器對凈水廠取水口點位(38°15′22″N,109°43′19″E)、取水口上0.5 m和取水口下0.5 m等3個不同深度水樣進行采集,并置于5 L聚乙烯瓶中,采樣結束后盡快運回實驗室于4 ℃冰箱保存,3 d內完成所有指標測定試驗。
1.2.2 樣品測定 尤家峁水庫為榆林城區的飲用水水源地,根據《生活飲用水衛生標準》(GB 5749-2006),實驗室測定項目選定pH值、色度、渾濁度、臭和味、肉眼可見物、總硬度(以CaCO3計)、氨氮、亞硝酸鹽氮、硝酸鹽氮、溶解性總固體、高錳酸鹽指數、硫酸鹽、氯化物、氟化物、鐵、錳、砷、六價鉻、細菌總數、總大腸菌群共20項指標。各指標的測定均按照國家《生活飲用水標準檢驗方法》(GB/T 5750-2006)進行。其中pH值采用玻璃電極法測定,色度采用光電比色法,渾濁度采用散射法,總硬度采用乙二胺四乙酸二納滴定法,氨氮采用納氏試劑比色法,高錳酸鹽指數采用酸性高錳酸鉀滴定法,氟化物采用氟試劑比色法,錳采用過硫酸銨比色法。
水質分析數據取3個不同深度采樣點監測結果的平均值。其中亞硝酸鹽氮、硝酸鹽氮、溶解性總固體、硫酸鹽、氯化物、鐵、砷、六價鉻、細菌總數、總大腸菌群等遠低于《生活飲用水水源水質標準》(CJ 3020-1993)中的二級水源水質標準,不作主成分分析。選取pH值、色度、渾濁度、總硬度、氨氮、高錳酸鹽指數、氟化物、錳這8個主要指標進行分析,數據取各個季度的平均值(春季:3—5月,夏季:6—8月,秋季:9—11月,冬季:12—2月)。將數據標準化后,應用SPSS 20.0軟件進行計算,通過主成分分析法識別影響該地區水源水質的主要驅動因子[9-11],然后運用PCA和PCA-熵值結合兩種方法分析水質的時間變化規律[12-13],并分析其原因。
1.3.1 主成分分析法 主成分分析是數學上對數據降維的一種方法。其基本思想是設法將原來眾多的具有一定相關性的指標,重新組合成一組較少個數的互不相關的綜合指標來代替原來指標,并且使其能最大程度地反映原變量所代表的信息[14-15]。每個主成分所提取的信息量用其方差來度量,方差越大,包含的信息越多。計算步驟如下:
(1) 將原始數據標準化,以消除量綱的影響;
(2) 計算相關系數矩陣;
(3) 計算特征值與特征向量;
(4) 計算主成分貢獻率及累積貢獻率,取特征值λi>>1所對應的主成分進行分析;
(5) 計算主成分載荷[16];
(6) 計算各主成分得分及主成分綜合得分。
1.3.2 主成分—熵值結合法 熵值法是一種客觀賦權法,根據指標的離散程度確定權重,可以避免人為因素帶來的偏差,但存在忽略指標本身的重要程度和不能減少維數等缺點。所以,可以在主成分分析之后,用熵權作為各個主成分的權重進行綜合評價,降低計算結果的主觀性[17-18],即本研究中提到的PCA-熵值結合法。計算步驟如下:
(1) 數據平移,對主成分得分數據進行非負化處理;
(2) 數據標準化;
(3) 計算指標信息熵值e和信息效用值d;
(1)
dj=1-ej
(2)
(4) 計算熵權;
(3)
(5) 利用熵值法賦權計算綜合得分。
尤家峁水庫2013—2019年pH值、色度、渾濁度、總硬度、氨氮、高錳酸鹽指數、氟化物、錳等8個指標的監測結果如圖1所示。

圖1 尤家峁水庫2013-2019年各季度水質監測數據
如圖1所示,2013—2019年,尤家峁水庫水質不斷惡化,出現季節性錳超標(錳最高含量0.43 mg/L,色度最高50.00度)與水體富營養化趨勢,氨氮含量較高(氨氮最高0.52 mg/L),pH值介于7.80~8.88之間,總硬度、高錳酸鹽指數、氟化物等含量滿足《生活飲用水水源水質標準》(CJ 3020-1993)中的二級水源水質標準要求。在夏季枯水期,水體伴有魚腥味、漚泥味、土霉味等不良現象與雨季翻庫等。
因子分析之前,首先要進行KMO和Bartlett的檢驗。KMO檢驗是用于比較變量間簡單相關和偏相關系數的指標,Bartlett用于檢驗數據分布以及各變量間的獨立情況。KMO>0.5,Bartlett的顯著性概率<0.05時,認為有結構效度,才能進行因子分析。本檢驗結果顯示,KMO為0.648,Bartlett的顯著性概率為0.000,符合標準,各個變量在一定程度上相互獨立,可以進行主成分分析。
應用SPSS軟件對標準化后的監測數據進行主成分分析,8個主要水質指標的相關系數矩陣如表1所示。

表1 尤家峁水庫主要水質指標的相關系數矩陣
通過表1中8項指標的相關系數可以看出,錳與渾濁度、色度存在顯著的正相關性(0.537,0.462),渾濁度與色度顯著正相關(0.812),表明錳濃度的變化會對渾濁度、色度產生較大影響。pH值與錳存在顯著的負相關性(-0.515),有研究指出,酸性水會引起固體廢棄物中金屬元素的活化與遷移[19],而尤家峁水庫水體呈現弱堿性(監測期間pH值介于7.80~8.88),這可能是pH值與錳之間存在顯著負相關的原因。
根據特征值λi>>1的原則提取的3個主成分反映了原始8個水質指標提供的69.95%的信息,基本代表了研究水體的綜合水質狀況。各主成分的特征值、貢獻率、累積貢獻率及主成分載荷如表2—3所示。

表2 尤家峁水庫水質評價方差分解主成分提取結果
主成分1貢獻率占所有影響因子貢獻率的29.97%,渾濁度、色度、錳含量在其中的載荷值較大,分別為0.873,0.823,0.605,說明它們是第一主成分的主要影響因素,對研究水體水環境質量的影響最大,為第一類主要污染源。主成分2貢獻率為24.77%,高錳酸鹽指數、氨氮在其中的載荷值較大,分別為0.773,0.741,說明它們是第二主成分的主要影響因素,對水環境質量的影響次之,為第二類主要污染源。主成分3貢獻率為15.21%。

表3 尤家峁水庫水質評價主成分載荷矩陣
因此,渾濁度、色度、錳含量是影響尤家峁水庫水質的最主要的驅動因子,又由于錳含量與渾濁度、色度之間存在顯著的正相關性,即錳減少的同時可以降低渾濁度及色度。所以可以得出,錳污染是主導因素,目前尤家峁水庫水質凈化的首要任務是除錳。
求出提取的3個主成分特征值的特征向量,將其與標準化數據X1,X2,…,X8相乘,即可得出如下3個主成分表達式。
F1=-0.256X1+0.343X2+0.364X3-
0.157X4-0.045X5+0.084X6-
0.062X7+0.252X8
F2=0.213X1-0.080X2-0.055X3-
0.249X4+0.374X5+0.390X6-
0.286X7+0.116X8
F3=-0.178X1-0.369X2+0.013X3-
0.016X4+0.402X5-0.292X6+
0.330X7+0.545X8


注:①箱體頂部、底部和內部橫線分別表示上四分位數、下四分位數和中位數的位置,箱線圖的上下兩條橫線觸須表示數據的散布范圍,分別為四分位數差1.5倍距離的值,超出上下兩條觸須范圍劃為異常值,用空心點和實心點表示; ②異常值旁邊數字表示其所在年份的序號數。
由表4可以看出,兩種方法的計算結果基本一致,2015,2016年水質較好,這應該與榆林地區當年發生的特大暴雨有關,2014年水質最差,2017,2018年水質狀況尚可,基本保持穩定。兩種方法的計算結果雖表現出相對一致性,但也存在一定差異,如2013,2015年水質全年排序存在差別,分析原始監測數據,2013年色度、渾濁度、高錳酸鹽指數濃度總體高于2015年,pH值、總硬度、氨氮、氟化物、錳總體低于2015年,且數據相差很小,不能直接說明水質優劣。由于兩種方法的權重確定方式存在差異,使得不同指標數據的變化所引起的水質變化程度有所不同,但均能較好地反映實際水質狀況,在水質特征分析方面具有較好的可靠性與適用性。

表4 尤家峁水庫水質評價主成分綜合得分及排序
圖2用箱線圖把批量數據的分布形狀直觀地表示出來,便于進行尤家峁水庫各年不同季度水質狀況的比較。箱線圖表明,PCA和PCA-熵值結合法計算的水質年內變化規律相同,冬季水質最好,得分均明顯較低,中位數分別為-0.679和-0.697;春季較好,中位數分別為-0.125和-0.246;秋季一般,中位數分別為0.049和0.004,且數據的散布范圍較大,不太穩定;夏季最差,得分均明顯較高,中位數分別為0.283和0.227。
PCA計算結果顯示在夏秋季、全年存在3個異常值點,PCA-熵值結合法計算結果顯示,在春季和全年出現兩個異常值點,結合表4數據,該異常值均出現在2014年,其得分均明顯高于其他年份,進一步說明了2014年水質較差,應相應調整水處理工藝或增大藥劑投加量,也印證了兩種賦權方法的可靠性。
尤家峁水庫水質呈季節性變化,夏季水質最差,這主要與以下幾個方面有關:①凈水廠取水口在水庫底層,夏季氣溫的升高使深水型水庫水溫分層,從而形成溫躍層,極大地阻礙了上下層水體的物質交換,水庫底層水體溶解氧無法得到補充,原有的溶解氧被有機物、底棲生物等所消耗,庫底嚴重缺氧,逐漸出現厭氧狀態,導致沉積物在水體厭氧時期較低還原性條件下鐵、錳等污染物的釋放,使上覆水中鐵和錳濃度升高,從而使得采用底層取水的尤家峁水庫水質變差。同時,高濃度鐵錳飲用水還會導致一系列濁度、色度和嗅味等問題;②夏季水溫升高會促進浮游生物、細菌等的代謝繁殖,從而引起水中有機物的腐敗變質,并且增加了有機物、氨氮等溶解性污染物的含量。由于存在著豐富的氮磷基質,死水區域藻類大量繁殖,當藻類繁殖超過水體可容載量時,部分下層水體藻類會死亡腐敗影響水質[20];③與降水的季節性變化有關,夏季強降水增多,徑流量增大,暴雨徑流的侵蝕和動態混合作用使水庫水體顆粒態污染物顯著增加,兩岸土壤中的農藥、化肥、有機物等污染物會隨著降雨徑流沖刷匯入水體。且水源水庫具有水體紊動性差、水力停留時間長等特點,暴雨徑流產生的污染會對水庫水質產生較大影響。
(1) 運用主成分分析法將尤家峁水庫多個水質指標綜合為3個主成分,反映了69.95%的信息,基本代表了研究水體的綜合水質狀況。研究得出渾濁度、色度、錳是影響水庫水質的最主要驅動因子,由于錳與渾濁度、色度之間存在顯著的正相關性,故目前水質凈化的首要任務是除錳。高錳酸鹽指數、氨氮對水質的影響次之。
(2) 應用PCA和PCA-熵值結合兩種方法分析了尤家峁水庫水質的時間變化規律。其中2014年水質最差,應相應調整水處理工藝或增大藥劑投加量,2015,2016年水質較好,這可能與當年發生的特大暴雨有關,2017,2018年水質狀況尚可。水質年內呈季節性變化,春季較好,夏季最差,秋季一般,冬季最好。夏季水質最差是由于持續高溫導致庫中藻類大量繁殖,鐵、錳、有機物、氨氮等含量增高。
(3) 通過PCA可以準確識別影響尤家峁水庫水質的主要驅動因子。運用PCA和PCA-熵值結合兩種方法均可以確定水質的時間變化規律,且兩種方法的計算結果具有較好的一致性,在水質特征分析方面均具有較好的可靠性與適用性。分析結果可為中國同類地區飲用水的保護和處理提供理論基礎和決策依據。