鄭 飛,彭佳紅
(湖南農業大學信息科學技術學院,湖南 長沙 410128)
洞庭湖為湖南省第一大湖,隨著自然和人為因素的影響,湖泊已面臨著諸多水環境問題。水質評價是水環境質量評價的重要內容之一,它為水資源的綜合利用及水域污染預防提供依據。目前常用的水質評價方法有簡單指數法、綜合污染指數法、模糊數學法等,但不能有效提取現實污染因子。以洞庭湖已開展的一系列水質環境監測、水資源保護研究工作等作為基礎,采用主成分分析法對洞庭湖水質情況進行評價。主成分分析法(PCA)是一種將多位因子納入統一系統中進行定量,從而分析出關鍵的影響因子,屬于較為完善的多元統計分析方法。
根據入湖口、湖體、出湖口三個方面,將洞庭湖劃分為14個監測斷面,即4個入湖口斷面、9個湖體斷面和1個出湖口斷面;根據洞庭湖14個監測斷面2006年的數據,監測指標共有32個,選取其中污染物指標13個,包括高錳酸鹽指數、化學需氧量(COD)、五日生化需氧量、氨氮(NH3-N)、總磷(以P計)、砷、汞、鎘、鉻(總六價)、石油類、陰離子表面活性劑、硫化物、糞大腸菌群。
主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。它是一種數學變換的方法,把給定的一組相關變量通過線性變換轉成另一組不相關的變量,這些新的變量按照方差依次遞減的順序排列。在數學變換中保持變量的總方差不變,使第一變量具有最大的方差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關,稱為第二主成分。依次類推,P個變量就有P個主成分。
主成分分析法的主要目的是希望用較少的變量去解釋原來資料中的大部分變量,將我們手中許多相關性很高的變量轉化成彼此相互獨立或不相關的變量。通常是選出比原始變量個數少,能解釋大部分資料中的變異的幾個新變量,即所謂主成分,并用以解釋資料的綜合性指標。
根據主成分分析原理,利用軟件SPSS17.0對洞庭湖各斷面水質污染指標進行處理,具體計算步驟如下。
(1)對原始數據進行標準化處理。
(2)求相關系數矩陣。
(3)求解特征向量和特征值。
(4)計算主成分的貢獻率和累計貢獻率。

表1 特征值與方差貢獻表
從表1中可以看到,前四個特征值得累計貢獻率達到了84.151%,根據累計貢獻率大于80%,所以選擇前四個主成分進行分析;因子載荷矩陣,每一個載荷量表示主成分與對應變量的相關系數,如表2所示。

表2 旋轉前的載荷因子矩陣
然后將四個因子載荷矩陣輸入到SPSS數據編輯窗口,采用公式對數據進行處理,得到相對應的特征向量t1,t2,t3,t4,如表3所示。

表3 特征向量矩陣
(5)求各主成分得分并計算綜合得分,各斷面綜合得分如圖1所示。

圖1 各斷面水質綜合得分
將特征向量與標準化后的數據相乘,就可以得到各個主成分得分y1、y2、y3、y4,求綜合得分還需使用綜合評價函數,y1、y2、y3、y4前的系數是主成分的方差貢獻率。
(1)通過對選取一個、二個、三、四個主成分進行綜合評價的結果與單因子評價結果進行比較得出前四個主成分累計方差貢獻率達84.151%,基本保留并反映了原有變量的有效信息。
(2)根據對各斷面的污染指標體系進行分析,主要污染因子有:高錳酸鹽指數、化學需氧量、五日生化需氧量以及氨氮;進而對數據進一步處理得到各斷面的主成分得分以及綜合得分,與全國平均水平比較,得分越高,說明污染程度越嚴重,反之越輕;從上述結果可以看出,污染較嚴重、水質較差的斷面有:萬子湖、東洞庭湖、坡頭、目平湖、洞庭湖出口以及樟樹港;污染一般、水質一般的斷面有:岳陽樓、橫嶺湖、沙河口、漉角以及南嘴;污染較輕、水質較好的的斷面有:虞公廟、小河嘴以及萬家嘴。
(3)根據上述結果,對水質污染較嚴重的斷面采取措施,加強污染治理,改善水質環境。
[1]方紅衛,孫世群,朱雨龍等.主成分分析法在水質評價中的應用及分析[J].環境科學與管理,2009,(12).
[2]朱星宇,陳永強.SPSS多遠統計分析方法及應用[M].北京:清華大學出版社,2011.
[3]馬 虹.主成分分析法在水質綜合評價中的應用[J].江西:南昌工程學院學報,2006.
[4]李 俊,盧文喜等.主成分分析法在長春市石頭口門水庫水環境質量評價中的應用[J].節水灌溉,2009,(1):15-21.
[5]閆霏霏,楊瑞琰.洞庭湖上監測斷面的水質綜合評價和趨勢分析[J].人民長江,2007,(11).
[6]楊詩君,李廣源.洞庭湖水環境質量評價及水環境容量分析[J].水文,2006,(10).