裴超迎,張宏宇,郝 雪,魏新鮮,李康康,李彩鳳,謝雨岍,崔 勇,
(1.北京亦莊檢測有限公司;2.北京亦莊環境科技集團有限公司,北京 100176)
我國是一個嚴重缺水的國家,水體污染及淡水資源短缺已成為制約國民經濟發展的重要因素之一。污水再生利用是解決水資源短缺問題的有效途徑,也是滿足國家水資源可持續利用重大需求的有力保障[1],生產出高品質再生水替代自來水作為水源用作工業用水具有重要意義。水源水質狀況如何對高品質再生水廠工藝設計及穩定運行具有重要意義,而對水質進行評價是了解水質狀況的有效途徑。目前,國內常用的水質評價方法有單因子指數法、綜合污染指數法、模糊綜合評價法、人工神經網絡法、主成分分析法和聚類分析法等[2-5]。
高品質再生水廠進水設計控制指標較多[6],而在日常運行中,檢測指標較少。綜合考慮再生水廠的設計與日常運行指標的控制,相比其他水質評價方法,主成分分析法更加適用于高品質再生水廠水源水質的評價。主成分分析法是考慮多指標間的相關性,通過降維處理,在盡量少損失信息的情況下,將多個指標綜合成少數幾個指標的一種多元統計方法,此方法已在河流、水庫、農作物、土壤等[7-10]方面的評價中得到廣泛應用并取得較好效果。本文以北京市某高品質再生水廠水源水質為研究對象,對一定時期內的水質進行評價,分析水質變化特點,為高品再生水廠的工藝選擇及后期運行提供技術支撐。
樣品采集時段為2021年6月至2022年1月,每天09:30 左右進行樣品采集。樣品采集執行《水質 采樣技術指導》(HJ 494—2009),樣品采集后及時進行檢測,對于不能及時檢測的樣品,依據《水質采樣樣品的保存和管理技術規定》(HJ 493—2009)進行保存。各指標的檢測執行相關國家標準和行業標準。根據高品質進水水質要求,選擇的水質檢測指標有化學需氧量(COD)、五日生化需氧量(BOD5)、懸浮物(SS)、氨氮(NH3-N)、總氮(TN)、總磷(TP)、總溶解性固體(TDS)、總有機碳(TOC)、總硬度、pH 和總堿度。
一是對原始數據進行標準化處理。去除數據的單位限制,消除量綱的影響,便于不同單位或量級的指標能夠進行比較和加權。二是對數據進行是否適合主成分分析的判定性檢驗。KMO 檢驗和Bartlett 球度檢驗用于驗證各水質檢測指標運用主成分分析的適宜性。KMO 檢驗用于檢驗變量間的相關性和偏相關性,KMO 檢驗值介于0~1,KMO 檢驗值越大,意味著變量間的相關性越強,原有變量越適合進行因子分析,一般來說,當KMO 檢驗值大于0.5 時,原始變量間存在較強的相關性,適合做主成分分析。Bartlett球形檢驗主要用于檢驗相關系數矩陣中各變量間的相關性,判斷其是否為單位陣。其顯著性系數P小于0.05 時,數據呈球形分布,相關系數矩陣不是單位陣,即原始變量之間存在相關性,適合做主成分分析。三是計算特征根,確定主成分個數。用來替代水質指標的主成分的個數確定原則為:做主成分分析后,特征值大于1;累計貢獻率大于80%;繪制碎石圖,綜合考慮,確定主成分個數。四是計算特征向量,確定主成分表達式,計算主成分得分[11-12]。
將2021年6月至2022年1月每周樣本檢測數據取平均值,每月獲得4 個樣本值,共計32 個樣本值,即樣本量為32 個。將COD、BOD5、TP、NH3-N、TN、SS、TOC、TDS、總硬度、pH 和總堿度的數據導入Stata15.1 軟件,可以得到各指標數據的分布特征,如表1所示。從表1 可以看出,樣本的TDS、總硬度、總堿度指標值相對較大并且比較分散,其中TP 指標值最小并且最為集中。

表1 原始數據分布特征
將各指標檢測值的每周平均數據導入Stata15.1軟件,采用式(1)對其進行標準化處理,原始數據的標準化結果如表2所示。在標準化數據矩陣的基礎上,計算原始指標的相關系數矩陣R。相關關系是一種非確定性的關系,相關系數是研究變量之間線性相關程度的量,結果如表3所示。

表2 原始數據標準化結果

表3 原始數據相關系數矩陣

適宜性檢驗是做主成分分析的前提,各檢測指標進行KMO 檢驗和Bartlett 球度檢驗。經KMO 取樣適當性度量,KMO 檢測值為0.65,大于0.5。經Bartlett球度檢驗,近似卡方值為158.87,自由度為55,顯著性系數為0.00,小于0.05,表明原始變量間存在相關性,適合做主成分分析。
計算相關系數矩陣R的特征根λi(λi是主成分的方差,i=1,2,…,n,λ1≥λ2≥…≥λn),明確累計方差占比。通過Stata15.1 軟件計算出特征根相應的累計方差貢獻率、特征向量,如表4所示。第一主成分特征值為5.36,第二主成分特征值為3.70,均大于1;第一主成分方差貢獻率為48.73%,第二主成分方差貢獻率為33.64%,累計貢獻率達到82.37%。根據主成分個數的確定原則,結合碎石圖,綜合考慮,確定主成分個數為2。前兩個主成分包含原始數據的絕大多數信息,可以對水質特征進行評價。

表4 總方差解釋
通過主成分計算得到初始因子載荷矩陣,它表示各主成分與評價指標之間的相關系數,數值越大說明該指標對主成分的影響越大,對污染程度的貢獻越大。從表5 可以看出,水質污染程度第一主成分與BOD5、TDS、TOC 密切相關,它反映出水體受有機物和可溶性鹽類污染的作用較強。第二主成分與總硬度、總堿度密切相關,反映出水體受易結垢離子(Ca2+、Mg2+、CO32-、HCO3-、OH-等)的影響較大。綜合可知,源水水質狀況與有機物和可溶性鹽類密切相關。

表5 主成分初始因子載荷矩陣
用因子載荷矩陣中的數據除以主成分相對應的特征值的平方根,得到對應的特征向量a,并與標準化后的數據ZXi(i=1,2,…,11)相乘,便可得出主成分Fi表達式。主成分得分采用式(2)計算。代入計算數據,第一主成分F1、第二主成分F2的表達式如式(3)和式(4)所示。
以每個主成分所對應的特征值占所提取主成分特征值之和的比例作為權重,確定主成分的綜合評定函數F,如式(5)所示。代入計算數據,其表達式如式(6)所示。
主成分綜合得分越高,說明水質受污染程度越嚴重,水質越差,隨時間分布的主成分得分結果如表6所示。其中,F表示綜合主成分得分,F1表示第一主成分得分,F2表示第二主成分得分。

表6 隨時間分布的主成分得分結果
對隨時間分布的主成分得分結果進行可視化分析,走勢如圖1所示。從圖1 可知,綜合主成分F在水樣檢測時間段(2021年6月至10月初)的整體得分逐漸減少,10月第1 周綜合主成分F達到最小,說明此時段內水質逐漸變好。10月第1 周水質最好,從10月第2 周起,水質明顯變差。

圖1 主成分得分結果走勢
2021年6月至10月初,第一主成分F1相對穩定,而第二主成分F2逐漸減少,第二主成分F2與綜合主成分F走勢基本一致,說明在此時間段內,水質好壞與F2所代表的主要易結垢離子的含量密切相關。6—7月,第二主成分F2波動較大,說明水樣中易結垢鹽分離子的含量波動較大,整體水質不穩定。2021年10月第2 周至2022年1月,綜合主成分F走勢與第一主成分F1走勢基本一致,呈逐漸升高趨勢,而第二主成分F2緩慢升高,說明此階段水質污染以有機物和可溶性鹽類為主,其在2022年1月第2 周達到最高,2022年1月整體水質最差。
本文以北京市某高品質再生水廠源水水質為研究對象,運用主成分分析法對2021年6月至2022年1月水質的主要影響指標進行分析,建立綜合評價函數模型,并對水質進行綜合評價。11 個水質指標綜合為2 個主成分進行解釋,解釋率達到82.37%。主成分分析法評價結果表明,源水水質變化的主要綜合控制指標為BOD5、TDS、TOC、總硬度和總堿度,因此,源水水質狀況與有機物和可溶性鹽類含量變化密切相關。在監測時段內,2021年6—7月和2021年10月至2022年1月水質較差,1月水質整體最差,8—9月水質相對較好,6—7月水質波動較大,水質穩定性較差。2021年6—10月第1 周,源水水質主要受可溶性鹽類含量影響;2021年10月第2 周至2022年1月,水質主要受有機物含量影響。