盧小燕
(哈爾濱師范大學(xué),黑龍江省普通高等學(xué)校地理環(huán)境遙感監(jiān)測重點(diǎn)實(shí)驗(yàn)室)
松花江哈爾濱段為哈爾濱市生活生產(chǎn)排放污水的受納水體,沿此江段的中游段分布著多家處理哈市市政排污和企業(yè)排污的污水處理廠以及其它排污口.由于松花江哈爾濱段水體環(huán)境作為哈市市民生存的基本環(huán)境,其擔(dān)負(fù)著向哈市市民提供生活用水和生產(chǎn)用水的重任,因此確保此江段水質(zhì)達(dá)標(biāo)和對此江段進(jìn)行水質(zhì)評價(jià)具有重大意義.現(xiàn)今常用水質(zhì)評價(jià)方法有:主成分分析法(PCA法)、污染超標(biāo)倍數(shù)法、單因子評價(jià)指數(shù)法、綜合水質(zhì)指數(shù)法、分級加權(quán)平均法[1]、模糊綜合評價(jià)法[2]、灰色系統(tǒng)理論法和人工神經(jīng)網(wǎng)絡(luò)法[3]等.在這些水質(zhì)評價(jià)方法中,PCA法是將多維因子進(jìn)行降維處理并得到貢獻(xiàn)率較大的能夠代表眾多因子的主成分因子后而進(jìn)行定量綜合評價(jià)的一種方法.相較于其它方法,PCA法的優(yōu)勢有:數(shù)據(jù)處理更具客觀性[4]、具有最大限度減少原始數(shù)據(jù)信息損失和簡化數(shù)據(jù)結(jié)構(gòu)[5]等.該文依據(jù)這幾種方法的特點(diǎn),在保證客觀實(shí)際的基礎(chǔ)上,選用PCA法對松花江哈爾濱段進(jìn)行水質(zhì)評價(jià)研究.
PCA法是一種能夠?qū)Χ嗑S水質(zhì)評價(jià)因子進(jìn)行降維技術(shù)處理的數(shù)學(xué)統(tǒng)計(jì)方法,可對斷面進(jìn)行污染程度分級和確定主要水污染成分,其基本原理[8-9]為:設(shè)有n個(gè)水樣,每一水樣共有p個(gè)描述性指標(biāo)變量,進(jìn)而得到一個(gè)n×p階的水質(zhì)數(shù)據(jù)矩陣:

對原始變量X1,X2,…Xp簡化為新綜合變量Z1,Z2,…,Zm(m≤p),獲取這兩種變量的線性組合.新綜合變量的表達(dá)式為:

式中的為Mmp為各主要成分的載荷值.由上述公式得到的各新綜合變量分別稱為原始變量的第1~m個(gè)主要成分,其中,Z1方差百分比>Z2方差百分比>…>Zm方差百分比.
PCA 法分析步驟為[8-10]:
(1)根據(jù)研究需要進(jìn)行水質(zhì)評價(jià)斷面和水質(zhì)污染指標(biāo)的選取;
(2)對個(gè)別逆向的水質(zhì)污染指標(biāo)進(jìn)行倒數(shù)變換處理;
(3)對經(jīng)變換處理后的指標(biāo)數(shù)據(jù)和其它指標(biāo)數(shù)據(jù)統(tǒng)一進(jìn)行標(biāo)準(zhǔn)化,從而避免不同指標(biāo)間量綱的干擾;
(4)計(jì)算各水質(zhì)污染指標(biāo)的相關(guān)矩陣;
(5)計(jì)算獲取第1~m個(gè)主要污染成分的初始特征值、方差百分比、累積方差百分比以及初始因子載荷矩陣;
(6)求算提取出來的主成分的載荷值;
(7)根據(jù)相應(yīng)的主成分函數(shù)式,計(jì)算出提取出來的主成分的等分和綜合得分情況;
(8)對斷面進(jìn)行水質(zhì)污染程度的分析評價(jià).
該文水質(zhì)評價(jià)區(qū)域?yàn)樗苫ń枮I段,全長466 km.此江段多分汊、沙洲和江心灘地,河段比降約為0.5‰ ~10‰[6],平均江寬和水深分別為377 m、4.45 m,屬于平原型寬淺河道,其中阿什河和河長大于300 km的呼蘭河為其一級支流.松花江哈爾濱段徑流量年內(nèi)分配極不均勻[7],徑流的年際變化與降水年際變化基本上相似:8月份最大,2月份最小,分別占年徑流量的18% 和3%.同時(shí),松花江哈爾濱段冰封期較長,約為130~140 d,期內(nèi)徑流量和河流流速均較小,為枯水期.
該文水質(zhì)監(jiān)測斷面確定為哈爾濱市環(huán)境監(jiān)測中心站的例行監(jiān)測斷面:朱順屯、阿什河口內(nèi)、阿什河口下、呼蘭河口內(nèi)、呼蘭河口下和大頂子山6個(gè)監(jiān)測斷面,具體分布見圖1.所用原始數(shù)據(jù)為哈爾濱市環(huán)境監(jiān)測中心站提供的2014年上半年冰封期(1月 ~2月)的八個(gè)水質(zhì)污染指標(biāo):BOD5(X1)、NH3-N(X2)、CODCr(X3)、TN(X4)、TP(X5)、高錳酸鹽指數(shù)(X6)、石油類(X7)、DO(X8).

圖1 監(jiān)測斷面示意圖
2.3.1 原水質(zhì)監(jiān)測數(shù)據(jù)標(biāo)準(zhǔn)化處理
首先對逆向的水質(zhì)污染指標(biāo)DO進(jìn)行倒數(shù)變換處理,然后對 BOD5、NH3-N、CODCr、TN、TP、高錳酸鹽指數(shù)、石油類和經(jīng)變換處理后的DO數(shù)據(jù)統(tǒng)一進(jìn)行標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化結(jié)果見表1.
2.3.2 相關(guān)性分析
利用 SPSS17.0(中文版)計(jì)算 BOD5(X1)、NH3-N(X2)、CODCr(X3)、TN(X4)、TP(X5)、高錳酸鹽指數(shù)(X6)、石油類(X7)、DO(X8)八個(gè)水質(zhì)污染指標(biāo)的相關(guān)系數(shù)矩陣,對它們的初始特征值、方差百分比、累積方差百分比進(jìn)行分析,并根據(jù)累計(jì)方差百分比確定主要成分的數(shù)目.具體見表2、表 3.
從松花江哈爾濱段2014年1~2月的水質(zhì)污染指標(biāo)數(shù)據(jù)的相關(guān)性分析可以看出:一月和二月的相關(guān)系數(shù)范圍分別在0.522~0.991和0.387~0.997之間,絕大部分水質(zhì)污染指標(biāo)具有較強(qiáng)的相關(guān)性質(zhì),證明本研究方法適用;一月份NH3-N和TN、二月份NH3-N和石油類的相關(guān)性最強(qiáng),分別高達(dá) 0.991、0.997.
SPSS17.0(中文版)均從表3中自動從每個(gè)月中提取出了m=2個(gè)主成分.其中:一月份第1、2 主成分的特征值(6.762、1.055)和二月份第1、2 主成分的特征值(6.869、1.087)均滿足大于1的原則;一月份第1、2主成分方差百分比分別為 84.522%、13.193%,累積方差百分比達(dá)到97.715%,二月份第1、2主成分方差百分比分別為,85.863%、13.585%,累積方差百分比達(dá)到99.448%,均滿足累積方差百分比大于85% 的原則,說明它們已經(jīng)較高程度的包含了8個(gè)水質(zhì)污染評價(jià)指標(biāo)的全部信息,且包含信息量最大的第1主成分對松花江哈爾濱段上半年冰封期(1~2月)的水質(zhì)變化的影響最顯著.

表1 數(shù)據(jù)標(biāo)準(zhǔn)化

表2 相關(guān)系數(shù)矩陣

表3 特征值和解釋的方差
2.3.3 初始因子載荷值和主成分載荷值的確定
上述提取的兩個(gè)主成分的初始因子載荷值可由SPSS17.0(中文版)直接運(yùn)行獲取,見下表4.從表中可以看出:一、二月份第1主成分分別與石油類、BOD5的相關(guān)系數(shù)最大,一、二月份第2主成分分別與CODCr、石油類的相關(guān)系數(shù)最大.

表4 初始因子載荷矩陣
主成分載荷值在SPSS17.0(中文版)中輸入以下公式并直接運(yùn)行確定,輸出結(jié)果見表5.

式中Vm和λm分別表示第m主成分的初始因子載荷值和初始特征值,其中m=1、2.

表5 主成分載荷值
根據(jù)PCA法的原理及主成分載荷值得到相應(yīng)的主成分函數(shù)式和綜合評價(jià)函數(shù)式如下:

式中的r1和r2分別代表第1、2主成分的方差百分比.
2.3.4 水質(zhì)綜合評價(jià)結(jié)果
根據(jù)主成分函數(shù)式和綜合評價(jià)函數(shù)式,計(jì)算出六個(gè)評價(jià)監(jiān)測斷面和整個(gè)松花江哈爾濱段的2014年1~2月水質(zhì)污染綜合得分(見表6),并對其水質(zhì)污染程度給予定量描述,污染的嚴(yán)重性隨著得分的增大而增大,可對水質(zhì)評價(jià)樣點(diǎn)的污染程度進(jìn)行分級[2-3].

表6 各監(jiān)測斷面水質(zhì)評價(jià)結(jié)果
由表6水質(zhì)評價(jià)結(jié)果可以看出,2014年1~2月松花江哈爾濱段的水質(zhì)污染程度排序分別為:阿什河口內(nèi) >呼蘭河口內(nèi) >大頂子山>呼蘭河口下 >阿什河口下 >朱順屯、阿什河口內(nèi) >呼蘭河口內(nèi) >呼蘭河口下 >大頂子山 >阿什河口下 >朱順屯.從第1主成分得分排名看,2014年1~2月均為阿什河口內(nèi)的得分遠(yuǎn)大于剩余5個(gè)監(jiān)測斷面,表明1月該斷面處的水質(zhì)因子石油類、高錳酸鹽指數(shù)和NH3-N含量相對較高,2月該斷面處的水質(zhì)因子CODCr、BOD5和高錳酸鹽指數(shù)含量相對較高;從第2主成分得分排名看,2014年1~2月均為呼蘭河口內(nèi)的得分最高,表明1月該斷面處CODCr污染較重,2月該斷面處高錳酸鹽指數(shù)污染較重.監(jiān)測斷面的實(shí)際監(jiān)測數(shù)據(jù)也證實(shí)了基于PCA法得到的分析結(jié)果較真實(shí)地反映了松花江哈爾濱段的實(shí)際狀況,沿此江段的中游段的阿什河口內(nèi)斷面和呼蘭河口內(nèi)斷面附近分布著多家處理哈市市政排污和企業(yè)排污的污水處理廠以及其它排污口.
該文借助SPSS17.0(中文版)軟件,并采用PCA法對2014年1~2月松花江哈爾濱段6個(gè)例行監(jiān)測斷面的水質(zhì)特征進(jìn)行了評價(jià)分析.對評價(jià)結(jié)果分析得出:
(1)從原始水質(zhì)監(jiān)測數(shù)據(jù)中分別提取出了1月份累積方差百分比為97.715% 的2個(gè)因子和2月份累計(jì)方差百分比為99.448%的2個(gè)因子,經(jīng)分析識別得到松花江哈爾濱段這兩個(gè)月的2個(gè)主成分因子:1月份——石油類、高錳酸鹽 指 數(shù) 和 NH3-N,CODCr、BOD5;2 月 份——CODCr和 BOD5,高錳酸鹽指數(shù)、TP.
(2)在2014年上半年冰封期內(nèi)(1~2月),阿什河口內(nèi)和呼蘭河口內(nèi)污染比較嚴(yán)重,這一結(jié)果與研究流域內(nèi)的實(shí)際排污情況相吻合,說明PCA法一種能夠有效對松花江哈爾濱段水質(zhì)進(jìn)行綜合評價(jià)的方法.
(3)在整個(gè)水質(zhì)綜合評價(jià)的過程中,PCA法能夠確定造成2014年上半年冰封期內(nèi)(1~2月)水體污染的主要成分,從而在盡量減少原始信息損失的同時(shí)使水質(zhì)評價(jià)的數(shù)據(jù)結(jié)構(gòu)得到了簡化,以及確保了評價(jià)結(jié)果的客觀性.
[1] 伊元榮,海米提·依米提,王濤,黃景炎,胡小韋,古麗格娜.主成分分析法在城市河流水質(zhì)評價(jià)中的應(yīng)用[J].干旱區(qū)研究,2008,25(4):497-501.
[2] 王艾,馮少元,鄭艷俠.主成分分析法在溫榆河水質(zhì)評價(jià)中的初步應(yīng)用[J].北京水務(wù),2011(2):49-52.
[3] 萬金保,曾海燕,朱邦輝.主成分分析法在安樂河水質(zhì)評價(jià)中的應(yīng)用[J].中國給水排水,2009,25(16):104-108.
[4] 魯斐,李磊.主成分分析法在遼河水質(zhì)評價(jià)中的應(yīng)用[J].水利科技與經(jīng)濟(jì),2006,12(10):660-662.
[5] 王群妹,梁雪春.基于主成分分析的水質(zhì)評價(jià)研究[J].水資源與水工程學(xué)報(bào),2010,21(6):140-154.
[6] 宋連彬,趙廣忠,鞠貴權(quán).松花江哈爾濱段水文監(jiān)測斷面分析[J].黑龍江水利科技,2011,39(2):15-16.
[7] 宋小燕,穆興民,高鵬,等.松花江哈爾濱站近100年來徑流量變化趨勢[J].自然資源學(xué)報(bào),2009,24(10):1803-1809.
[8] 吉祝美,方里,張俊,等.主成分分析法在SPSS軟件中的操作及在河流水質(zhì)評價(jià)中的應(yīng)用[J].中國給水排水,2012,25:68-73.
[9] 鄒海明,蔣良富,李粉茹.基于主成分分析的水質(zhì)評價(jià)方法[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2008,38(8):85-90.
[10]劉小楠,崔巍.主成分分析法在汾河水質(zhì)評價(jià)中的應(yīng)用[J].中國給水排水,2009,25(18):105-108.