【摘要】本文通過對巢湖東半湖六個監測斷面2006年~2010年水質監測數據,利用SPSS軟件對其進行主成分分析,將9個評價指標轉化為公因子,根據因子得分表達式揭示各個監測斷面水質參數特征。
【關鍵詞】SPSS;巢湖東半湖;公因子
巢湖是我國五大淡水湖之一,處于安徽省江淮丘陵的中部,自然條件得天獨厚。它東西綿延一百八十里,環湖四百余里,占巢湖市、廬江、肥東、肥西和合肥四縣一市境地。其水質富營養化早已成為不爭的事實。本文著重分析巢湖東半湖例行監測的六個斷面從2006年~2010年水質年均值,揭示出各個監測斷面水質參數特征,為巢湖治理與管理提供參考。
1.理論
在現實水質分析中,存在大量實測且有代表性的數據,這些數據在帶來現象有關信息的同時,也給數據分析帶來了一定困難,另一方面,眾多變量之間可能存在著相關性,實測數據包含的信息有一部分可能是重復的。主成分分析就昌在盡可能不損失信息或少損失信息的情況下,可以通過變量變換的方法將眾多線性相關的指標轉換為少數線性無關的指標,在保證信息比較完整的情況下實現對數據的降維,便于進行評價從分析。
2.水質數據分析
2.1 樣本分析
如表1所示,本文采用2006~2010年巢湖東半湖湖區六個監測點位的數據,利用SPSS來分析。具體監測項目為:pH值、溶解氧、高錳酸鹽指數、化學需氧量、五日生化需氧量、氨氮、總磷、總氮、氟化物、糞大腸菌群數。
為了使不同監測項目之間具有可比性,對原始數據時行標準化處理,轉化成無量綱的污染指數,換算公式為:
為標準化數據;為監測項目的實測值;監測項目的評價標準值。本文評價標準值采用地表水三級評價標準。
通過對標準化矩陣(如表2所示)分析,在表4上半部相關系數矩陣中,相關系數較大,且下半部對應的概率均小于0.05,表明污染物之間存在著顯著的相關性。結果如表3、表4所示。
2.2 KMO抽樣適度測定值與Bartlett球形檢驗值
Bartlett球形檢驗的概率值為0.000,即否定相關矩陣為單位陣的零假設,從而認為各污染物之間存在著顯著相關性。這與表4中的結果相一致。同時KMO值為0.526,大于度量標準值0.5,據此可認為原數據可用于因子分析。進一步分析公因子方差提取,即初始變量的共同度,結果見表6所示。
2.3 因子的共同度
表6第二列為初始共同度,全部為1,第三列為提取特征值的共同度。溶解氧的共同度為0.855,可認為溶解氧提取的4個公共因子能夠解釋溶解氧方差的85.5%。因此,總氮與BOD5、高錳酸鹽指數3個指標提取特征值的共同度相對高,這三個指標的信息保留也就相對完整,而氨氮共同度相對低些,信息缺失相對也多些。
2.4 因子分析的總方差解釋
由表7可知,第一個因子特征值為2.907,對應的方差的%值為32.300,也就是說明第一個因子特征值解釋了9個原始變量總方差的32.300%;同理第二個因子特征值解釋了總方差的23.662%。前四個因子累計方差貢獻率為82.978%且其對應的特征值均大于1。從第五個因子開始特征值變化趨緩(見圖1),故選取4個公因子分析是能夠代表全部變量,具有代表性,如圖1所示。
3.結論
通過對巢湖東半湖2006年~2010年湖區六個監測斷面水質數據采用主成份分析法,初步判明中廟水質在六個監測斷面水質中最差,所受污染最為嚴重。其次為中垾。反倒是靠近巢湖市的兩個監測斷面水質明顯好于其它斷面水質。也符合這兩處作為巢湖飲用水水源地的實際。
參考文獻
[1]吳智洋,張志強,謝寶元,等.基于SPSS的山東棗莊小沙河水質分析[J].黑龍江農業科學,2011(2):48-51.
[2]魏善發,基于SPSS軟件分析上海市金山區地表水污染特征[J].中國環境監測,2013(2):75-81.
[3]談適.基于主成分分析及聚類分析的太湖水質評價應用與解析[J].應用方法論,2011(23):105-106.
[4]高芮,范志慶,黨鳳花,等.安徽省巢湖市環境質量報告書(2006~2010年度)[R].巢湖:原巢湖市環境保護局,2011:85-86.
[5]郝黎仁,樊元,郝哲歐,等.SPSS實用統計分析[M].北京:中國水利水電出版社,2003.