褚瑩倩,孫 赟,許傳鵬,薛偉鋒
(大連海關,遼寧 大連 116600)
地下水是水資源中重要組成部分。近年來,隨著地下水開采量的增加以及惡劣氣候變化,導致地下水環境質量急劇惡化,隨之而來的與地下水有關的環境問題日益突出,已引起國內外廣泛關注[1~4]。地下水一旦遭受污染,由于其自凈能力較弱,會對生態環境造成嚴重影響,直接或間接危害人類身體健康[5~7]。為了能夠及時有效的采取措施,保護和改善地下水水質,需要對地下水環境質量進行評價。
水質評價通過將確定性評價標準與不確定性監測結果相結合,水質評價沒有一個統一的評價方法,故難以建立統一的評價模型[8]。目前,國內外圍繞水質評價已開發多種方法,如單因子評價法[9]、綜合指數評價法[10]、模糊綜合評價法[11]、神經網絡法[12]、灰色評價法[13]、主成分分析法[14]和集對分析法[8,15]等。每種方法都有其側重點,但每種方法都無法全面地反映復雜的水質狀況。因此,在實際研究工作中將多種方法結合使用,能夠更加全面、準確了解水質情況。集對分析是近年提出的一種新型的處理模糊性和不確定性的數學模型,該模型通過計算評價因子與水質之間的聯系度達到對地下水水質做出評價[8,15]。主成分分析法考慮不同指標是否存在信息重疊,通過數據標準化,在保留盡量多原有信息基礎上,對多維數據降維處理,篩選出獨立綜合因子,克服了主觀隨意性,已廣泛應用于水質評價[16~19]。本研究通過主成分分析法對新鄉市地下水水質進行評價,并與文獻15中使用熵權集對分析法預測結果進行比較,分析不同水質評價模型差異原因,為新鄉市地下水水質保護和改善提供更加全面可靠的科學依據。
采用SPSS 17.0軟件進行分析,具體步驟如下。
(1) 根據文獻15報道結果,選取水質評價指標,包括:總硬度、溶解性總固體、硫酸鹽、氯化物、氨氮和錳。
(2) 對數據標準化處理,消除指標間數量級和量綱影響。
(3) 采用Kaiser-Meyer-Olkin (KMO)檢驗統計量和Bartlett球形度檢驗判斷指標間的相關性,以確定原始變量是否適合進行因子分析。當KMO值大于0.5時,可進行因子分析。Bartlett球形度檢驗對應的顯著性小于0.05時,原始變量間存在相關性,可進行主成分分析。
(4) 確定主成分個數。一般選取累計方差貢獻率大于80%,特征值大于1的主成分。
(5) 根據計算結果,確定主成分Fi的表達式。
(6) 計算主成分分值,綜合得分越高,表明水質越差,從而給出不同監測斷面水質排名。
對數據進行標準化處理,能夠消除原始數據數量級和量綱不同的影響,結果如表1所示。
如表2所示,6項水質指標相關系數可以通過相關分析法獲得。兩指標的相關性越強,則其相關系數絕對值越大。相關系數的正或負,說明兩個指標之間存在正或者負相關關系。由表2可知,指標之間相關系數絕對值大部分均在0.5以上,說明各指標相關性較高,存在信息重疊,原始變量適于做因子分析。變量相關性檢驗是主成分分析前提,地下水KMO和Bartlett檢驗結果如表3所示。由表3分析可知,地下水KMO檢驗度量值大于0.5,Bartlett球形檢驗顯著性小于0.05,表明原始變量間存在相關性,適合做主成分分析。

表1 標準化后數據

表2 相關系數矩陣

表3 KMO和Bartlett檢驗結果
特征值用于衡量成分對指標變量影響力大小,特征值小于1,說明主成分的解釋力度不夠。主成分的方差及方差貢獻如表4所示。由表4分析可知,特征值大于1的有2個成分,累積的方差占比為96.464%,即可用2個主成分替代全部6個水質指標,其包含信息量可以解釋監測指標表征的絕大部分信息,可利用其進行地下水水質的評價研究。

表4 解釋的總方差
提取方法:主成分分析
監測水質指標與主成分的相關程度可用初始因子載荷矩陣系數表征,可以解釋各個主成分變量的變異情況。其中,正或負值分別表示水質指標與主成分之間呈正或負相關;其絕對值越接近1,表明相關程度越高,該指標越容易成為評價地下水水質的主要指標。地下水主成分初始因子載荷矩陣如表5所示。主成分1在總硬度、溶解性固體和硫酸鹽等3個變量上具有高載荷,表明主成分1主要反映這3個指標的信息;主成分2在錳上具有高載荷,表明主成分2主要反映錳的信息。

表5 主成分初始因子載荷矩陣
將主成分初始因子載荷矩陣中數據除以主成分對應特征值平方根,獲得主成分相對應的特征向量,即每個指標相應的系數,與標準化的后的數據ZXi相乘,即可得出主成分F1和F2相應的表達式。根據初始特征值方差的百分比λ1和λ2,進而獲得F值表達式。F1、F2和F相應的表達式如下所示:
F1= 0.465ZX總硬度+ 0.465ZX溶解性固體+ 0.464ZX硫酸鹽
F2= 0.775ZX錳
F= [λ1/(λ1+λ2)]F1+ [λ2/(λ1+λ2)]F2
由上述公式,獲得地下水水質主成分F值,結果見表6。根據F值越大,水質污染越嚴重進行不同采樣點水質排名,由優至劣依次為封丘縣(10#)-原陽縣(15#)-衛輝市(4#)-封丘縣(27#)-長恒縣(36#)-長恒縣(15#)-獲嘉縣(19#)。

表6 F值綜合得分

表7 不同水質評價模型預測結果比較
在文獻15使用熵權集對分析法預測7個采樣點水質結果中,按照水質級別可以分為3類,其中水質最好的采樣點為封丘縣(10#),水質II級;其次是原陽縣(15#)和衛輝市(4#),水質Ⅲ級;最差的是封丘縣(27#)、獲嘉縣(19#)、長恒縣(15#)和長恒縣(36#),水質均為V級。水質排名由優至劣依次為封丘縣(10#)-原陽縣(15#)/衛輝市(4#)-封丘縣(27#)/獲嘉縣(19#)/長恒縣(15#)/長恒縣(36#)。本研究采用主成分分析法預測7個采樣點水質優劣排名為封丘縣(10#)-原陽縣(15#)-衛輝市(4#)-封丘縣(27#)-長恒縣(36#)-長恒縣(15#)-獲嘉縣(19#)。封丘縣(10#)在2個預測模型中均排名第1,說明該點水質相對最好。在熵權集對分析法中列為水質III級的原陽縣(15#)和衛輝市(4#),無法通過該模型進一步判斷水質優劣,但是通過主成分分析法預測后發現原陽縣(15#)要比衛輝市(4#)水質相對好一些。同理,在熵權集對分析法中列為水質V級的封丘縣(27#)、獲嘉縣(19#)、長恒縣(15#)和長恒縣(36#),也可通過主成分分析法對該4個采樣點水質進一步判斷其優劣順序,結果為封丘縣(27#)-長恒縣(36#)-長恒縣(15#)-獲嘉縣(19#)(表7)。
由上述分析可知,采用主成分分析法和熵權集對分析法對新鄉市7個采樣點水質預測結果非常吻合。熵權集對分析法是一種新型的處理模糊性和不確定性的數學模型,該模型通過計算評價因子與水質之間的聯系度達到對地下水水質做出評價,預測結果可靠,但該模型不能區分同一級水質優劣,為了解決該問題,有必要引入主成分分析法。該方法通過降低數據維度,篩選出主要因子,克服了主觀選取評價因子帶來的不利影響。主成分分析法達到對同一級水質按照污染程度排序,更好地區分了水質優劣,使評價結果趨于客觀合理。盡管主成分分析法無法直接獲得水質類別,但結合熵權集對分析法后,不僅可以獲得水質類別,還能夠針對同一級水質進行水質排名,使結果更加詳實。以上分析說明,主成分分析法和熵權集對分析法兩種模型結合使用后預測結果要比單一預測模型更加全面可靠。
本研究運用主成分分析法對新鄉市地下水水質主要影響指標進行了分析,并對水質進行了綜合評價,結論如下。
(1) 針對新鄉市7個地下水水質監測斷面,主成分分析法指出,可將6個水質指標綜合為2個主成分進行解釋,解釋率為96.464%。其中,第1主成分貢獻率為74.838%,第2主成分貢獻率為21.626%,第1主成分控制指標為總硬度、溶解性固體和硫酸鹽,第2主成分控制指標為錳。主成分分析法預測水質由優至劣順序為封丘縣(10#)-原陽縣(15#)-衛輝市(4#)-封丘縣(27#)-長恒縣(36#)-長恒縣(15#)-獲嘉縣(19#)。
(2) 本研究使用的主成分分析法和文獻中使用的熵權集對分析法對新鄉市7個地下水水質排名預測結果非常吻合。主成分分析法有效彌補了熵權集對分析法無法區分同一級水質優劣的缺陷,說明兩種模型結合使用后綜合預測結果要比單一預測模型更加可靠。