王 暄
(新疆巴州水利水電勘測設計院,新疆庫爾勒 841000)
水質評價是水環境管理和決策的重要組成部分。水質評價結果通常由多個非線性指標決定,僅依據某項指標得出的評價結論往往不相容,因此需建立多因素評價體系的水質評價模型。目前,關于水質評價方法主要有均值法[1]、灰色聚類法[2]、模糊綜合評判法[3]、物元可拓法[4]等,從不同方面研究水質評價方法,各有優缺點。均值法忽略了各指標的重要程度的差異,灰色聚類法、模糊綜合評判法、物元可拓法在指標權重獲取方面受到樣本容量的限制,因而對評價結果產生一定的影響。本文采用投影尋蹤模型(Projection Pursuit Model,簡稱PPM),確定樣本投影過程中的最佳投影方向并進行線性投影,客觀確定各因子的權重,將高維數據轉化為一維空間的綜合投影值,從而實現水質的綜合評價。
投影尋蹤方法的基本思想是:利用計算機技術,把高維數據通過某種組合,投影到低維(1~3維)子空間上。然后通過優化投影指標函數,求出能反映原高維數據結構或特征的投影向量,在低維空間上對數據結構進行分析,以達到研究和分析高維數據的目的。其建模過程包括如下步驟:
(1)評價指標值的歸一化
設研究方案集為:

其中:x*(i,j)為第i個方案第j個評價指標值;n,p分別為方案的數目和評價指標的數目。

對越小越優型評價指標可采用如下進行極值歸一化處理:

式中:xmin(j)、xmax(j)分別為方案集中第j個評價指標的最小值和最大值。通過式(1)和式(2)得到的x(i,j)統一為[0,1]區間上的評價指標。
(2)構造投影指標函數
PP模型就是把 p維數據 {x(i,j)|j=1,2,…,P}綜合成以a=(a(1),a(2),…,a(p))為投影方向的一維投影值。
然后根據 {z(i)|i=1,2,…,n}的一維散布圖進行方案優選,式(3)中a為單位長度向量。
在綜合投影值時,要求投影值z(i)的散布特征應為:局部投影點盡可能密集,最好凝聚成若干個點團;而在整體上投影點團之間盡可能散開。基于此,投影指標函數可構造為:


式中:Sz為投影值z(i)的標準差,Dz為投影值z(i)的局部密度,即

式中:Ez為系統 {z(i)|i=1,2,…,n}的均值;R為局部密度的窗口半徑,它的選取既要使包含在窗口內的投影點的平均個數不能太少,避免滑動平均偏差太大,又不能使它隨n的增大而增加太高,R可以根據試驗來確定,一般可取值為0.1Sz;距離rij=|z(i)-z(j)|;u(R-rij)為為一單位階躍函數,當t≥0時其函數值為1,當t<0時其函數值為0。
(3)優化投影指標函數
當方案集給定時,投影指標函數Q(a)只隨投影方向a的變化而變化。不同的投影方向反映不同的數據結構特征,最佳投影方向就是最大可能暴露高維數據某類特征結構的投影方向。通過求解投影指標函數最大化問題可估計最佳投影方向,即:

這是一個以 {a(j)|j=1,2,…,P}為優化變量的復雜非線性優化問題,用常規優化方法處理較困難。模擬生物優勝劣汰規則與群體內部染色體信息交換機制的加速遺傳算法是一種通用的全局優化方法,用它來求解上述問題十分簡便和有效。
(4)分類
把由步驟3求得的最佳投影方向a*代入式(3)后即得各方案的投影值z*(i),顯然z*(i)值越大對應的方案i越優。對z*(i)值從大到小排序,最大的z*(i)值所對應的方案i就是最優方案。
本文運用投影尋蹤模型,根據文獻[6]數據,對河流水質進行綜合評價。
根據該河流實際情況選擇評價指標為:高錳酸鹽指數(CODMn)、化學需氧量(COD)、氨氮(NH3-N)、揮發酚和總磷(TP)五個指標作為評價因子(見表1)。水質評價標準采用《地表水環境質量標準》(GB3838-2002)。各個采樣點的污染指標實測值見表2。

表1 地表水水質分級標準 mg/L

表2 賈魯河主要污染物檢測值 mg/L
根據(1)~(9)式,得出最佳投影方向:=(0.411 6,0.208 9,0.591 6,0.023 3,0.660 6),把分別乘以表3 中各指標優度值,即得各方案的投影值(見表3)以及水質類別臨界點投影值(見表4)。

表3 各樣本評價指標優度值

表4 水質類別臨界點投影值
根據各監測斷面的投影值可得水質的優劣排序(見表3),其評價結果與文獻[6]的評價結果基本一致,但投影尋蹤評價直接采取各樣本的原始數據進行分析,結果更為合理。
(1)將多維數據轉化為一維指標值時,可能會造成部分數據之間所隱含信息的丟失,對結果產生一定的影響,因此應選擇合適的數據處理方法。
(2)投影尋蹤模型將指標體系(高維數據)投影到一維子空間上,建立投影尋蹤模型,通過運算,尋找最佳投影方向,形成評價指標值,按大小進行排序。避免了模糊綜合評判、理想解法等方法指標賦權的干擾,克服了傳統方法的不足。
(3)最優投影值能夠在一定程度上反映水體各評價指標影響程度的大小。同時,計算簡單可行。模型準確反映了水體質量等級與投影值之間的非線性對應關系,等級劃分界限清晰,為地表水質量評價研究領域提供了新的思路和方法。
[1]王娟,高原.水環境質量評價3種方法的應用對比[J].工業安全與環保,2007,33(2):16 -17,64.
[2]王洪梅,盧文細,辛光,等.灰色聚類法在地表水水質評價中的應用[J].節水灌溉,2007(5):20-22.
[3]仲少云,王慶,金秉福.模糊綜合評判法在芝罘灣水質評價中的應用[J].海洋湖沼通報,2007(2):57-61.
[4]孫秀玲,馬惠群,曹升樂.改進的可拓方法及其在水質評價中的應用[J].人民黃河,2006,28(7):30 -31,37.
[5]李祚泳.投影尋蹤技術及其應用進展[J].自然雜志,1997,19(4):224-227.
[6]穆征,王方勇,李靜,等.基于模糊綜合評價模型的河流水質綜合評價[J].水力發電,2009,35(4):11-13.