賈 超,袁 涵,楊 晟,張建配,陳 陽,朱恒華
(1.山東大學土建與水利學院,山東 濟南 250061;2.山東大學海洋研究院,山東 青島 266237;3.山東省地質調查院,山東 濟南 250000)
區域階段性水環境綜合評價中,水質監測值與分級標準均為區間數[1],兩者之間具有模糊的非線性關系。由于數據類型的限制,傳統評價法中的綜合指數評價法、灰色關聯度法、Topsis法、模糊綜合評價法等[2]難以對區間數型水質進行評價,使區間數型水質評價成為一個難點。一種常規做法是將該時期內的多個時間段監測的平均值代替區間數進行評價[1,3],但這種處理并非合理。因此,在不少學者將區間數型多屬性決策理論引入到區間數型水質評價中,推動了區間數型水質評價理論的發展。文獻[1,3-5]都不同程度地對區間數型水質的評價研究進行了探索突破,但或多或少都存在計算復雜或與其他方法不易結合等問題。
目前,對區間數型水質評價方法的研究尚未形成統一的認識,有必要進一步對區間數型水質的評價方法進行探討分析。在多屬性決策評價中,兩個方案的貼近程度可以用屬性相關測度的度量值來描述[6],當越多的屬性相關測度相似,則兩個方案就越貼近。Spearman秩相關系數是非參數統計理論中常用的評價系數,適用于同一研究中兩個方案在相同屬性(方案屬性個數≥4)下的一致性評判[6-8],故當兩個方案的Spearman秩相關系數越大,則可以判定,兩個方案的接近程度越大。因此,借鑒目前關于Spearman秩相關系數在多屬性決策問題[9]及區間數理論中的研究成果[6],嘗試將Spearman秩相關系數和區間數型水質評價問題結合,通過將水環境質量標準與擬評價水質監測樣本構建成區間數表示的方案集,并借鑒灰色關聯法確定相對最佳方案。根據相關屬性計算各方案與相對最佳方案的Spearman秩相關系數,由模式識別確定擬評價水質的等級,從而構建一種基于區間數型多屬性決策理論及統計學原理[2-10]的區間數型水質評價的新模型。
定義1:隨機樣本X=(x1,…,xn)按隨機變量取值大小進行排列的先后次序(x(1),x(2),…,x(N))稱為隨機樣本X的秩次[9]。記另一樣本Y=(y1,…,yn)的秩次為(y(1),y(2),…,y(N)),則樣本X與樣本Y的Spearman秩相關系數為
(1)
式中,di=x(i)-y(i)為秩次差;i=1,…,n,n為序列長度。
顯然,Spearman秩相關系數滿足:①rs(X,Y)=rs(Y,X);②rs(X,Y)|≤1;③若rs(X,Y)=1,則X與Y正相關;④若rs(X,Y)=-1,則X與Y負相關。
(2)
式中,當j=1,di=R(aL)-R(bL);當j=2,di=R(aR)-R(bR)。
顯然,Spearman秩相關系數滿足:①rs-ce(A,B)=rs-ce(A,B);②rs-ce(A,B)|≤1;③若rs-ce(A,B)=1,則A與B正相關;④若rs-ce(A,B)=-1,則A與B負相關。
設待評價區有m個水質斷面(監測站點),s個標準評價等級(水質量標準等級通常為5個等級),n個水質評價指標,則區間數初始評價矩陣A為
(3)

目前關于區間數型屬性值規范化的研究較多,目前常用的區間數型屬性值規范化方法有向量規范化法、比重變換法、極差變換法、指數函數法、誤差傳遞法等[10],為便于對區間端點值為0的區間數屬性值規范化,同時將效益型指標和成本型指標趨同化處理,通常采用極差變換法對區間數型指標進行處理。效益型區間數屬性規范化,即

(4)
成本型區間數屬性規范化為

(5)
將初始評判矩陣A采用式(4)和式(5)進行規范化即可得到標準規范化矩陣
(6)
水質監測具有時序性,對時長跨度不大的研究區域,水質指標的監測值在一定范圍內保持穩定狀態,可以根據水質監測數據進行各指標對水質等級評價貢獻的量化。即,確定各指標的權重。常用指標權重的確定方法有主觀評價法(如AHP)、客觀評價法(如熵權法、超標指數法)、組合權重法以及變權理論等[11]。權重確定的方法選取在一定程度上代表了研究者對研究問題的認識和理解,相關方法在不同參考文獻[4,12,15-16]中均有體現,本文不再贅述。

表1 監測斷面部分水質監測結果及地表水環境質量標準
根據各指標屬性的權重向量W,建立加權規范化矩陣
(7)

(8)

根據式(8)確定相對最佳方案,由式(4)計算加權規范化矩陣C中s個標準方案、m個水質斷面與相對最佳方案的Spearman秩相關系數,得到s個標準方案、m個待評價水質斷面的Spearman相關系數向量矩陣r=[rk1-ce,rk2-ce,…,rks-ce,…,rk,s+m-ce],根據各方案與相對理想方案的Spearman秩相關系數,進一步計算可得到m個待評價水質斷面與s個標準方案的相對海明(hamming)距離
d(R,j)=|rkR-ce-rkj-ce|
(9)
則,最小相對海明距離對應的類別即為評價水體的水質質量級別。
研究數據來源于2006年渾河沈陽東陵大橋監測斷面的部分實測水質數據[1],相關數據見表1。
由步驟2.1及表1中最小值和最大值構造區間數矩陣。
根據表1的數據,耗氧量x1為效益型指標,由步驟2.2采用式(4)計算,其余指標采用式(4)可計算得到規范化評價矩陣,并采用權重向量[2]:
W=[0.209,0.133,0.174,0.143,0.005,0.094,0.035,0,0,0.27,0,0.064,0.118]
由步驟2.2~2.4可得到加權規范化矩陣:


由步驟2.4中式(8)及加權規范化矩陣可確定相對最佳方案為:
CL*=[0.063 9,0.115 3,0.139 3,0.121 5,0.005,0.050 1,0.033 3,0,0,0.026 7,0,0.062 7,0.117 4]
CR*=[0.209,0.133,0.174,0.143,0.005,0.094,0.035,0,0,0.027,0,0.064,0.118]。
根據式(2),得到各方案的Spearman相關系r,以等級Ⅰ的區間數型水質數據為例計算等級Ⅰ與理想方案的Spearman相關系數(見表2)。
由式(2)可以計算得到rⅠL-ce=0.994 5;同理,求得rⅠR-ce=1,則rⅠ-ce=0.997 3。參照等級Ⅰ與相對最佳方案的Spearman相關系數計算,得到各方案與相對最佳方案的左、右Spearman相關系數(見表3)。
由表3得到各方案與相對最佳方案的Spearman秩相關系數矩陣則,待評價監測段與地下水標準等級之間的秩相關系數海明(hamming)距離為:d(Ⅰ,監測段)=0.148 4;d(Ⅱ,監測段)=0.107 2;d(Ⅲ,監測段)=0.090 7;d(Ⅳ,監測段)=0.055;d(Ⅴ,監測段)=0.240 8;由計算結果排序判定渾河沈陽東陵大橋斷面水質為Ⅳ類。


表2 等級Ⅰ和A*左區間的Spearman秩相關系數

表3 方案集與相對最佳方案的Spearman秩相關系數

表4 不同方法下本案例的計算結果對比
基于集對分析聯系數的模型[2](方法1)、基于區間數貼進度的模型[13](方法2)與本文構建的模型(方法3)在本實例上的計算結果對比見表4。
由表4可知,3種評價方法評價結果相近,其中本模型(方法三)的評價級別為Ⅳ類水,要比方法一、方法二得到的評價結果高1個級別,本模型的水質評價結果更偏劣類水;從排序結果上分析,方法三和方法二排序一致性較高,評價結果均偏好Ⅱ~Ⅳ類,水質類別更偏離最劣(Ⅴ類水)和最優(Ⅰ類水),而方法一評價結果偏好Ⅰ~Ⅲ類。同時由圖1分析,6個監測期13個監測因子中近50%的監測因子實測濃度處于Ⅰ類水,Ⅱ類水和Ⅲ類所占比例較少;監測期T1~T4內,13個監測因子中近40%的監測因子實測濃度處于Ⅳ類水和Ⅴ類水界限范圍內;監測期T5~T6內,近20%的監測因子實測濃度處于Ⅳ類水和Ⅴ類水界限范圍內。根據實測數據統結果顯示,6個時期內高錳酸鉀指數、化學需氧量、生化需氧量、揮發酚及大腸桿菌等指標監測值均在Ⅳ~Ⅴ類,所占權重分別0.133、0.174、0.143、0.064、0.118,權重占比較大。對比水環境質量標準,方法二和方法三的排序結果更為準確。將實測水質數據和標準進行對比分析,監測斷面在6個監測時期內的高錳酸鉀指數、化學需氧量、生化需氧量、揮發酚及大腸桿菌等指標監測值均在Ⅳ~Ⅴ類,其余指標監測值多在Ⅰ~Ⅱ類;方法三的水質評價為Ⅳ類較為合理。

圖1 13個指標監測值隸屬各類水的個數百分率比較
方法三與其他評價方法得到的評價結果存在差異的主要原因:一方面是該模型在數據處理中為使效益型指標和成本型指標趨同化,采用了極差規范化處理;另一方面是模型采用的評價原理不同,但評價結果均是客觀有效的。
(1)階段性區域水環境評價中,以區間數表示多時段的水質監測結果,一方面可以有效避免了因采用平均值替代導致的水質數據利用不足;另一方面,可以對多時段水質監測結果的水質評價進行簡化。
(2)Spearman秩相關系數具有明確的統計學意義,可以比較同一研究對象的不同方案的接近程度,將其應用于多屬性方案決策中可以使問題簡化,具有計算意義明確,計算過程簡單等優點。
(3)將統計學思想融入到區間數型水質量綜合評價中,根據構建的方案集與相對最佳方案的Spearman秩相關系數大小進行方案優劣排序,進而避開了區間數無法直接進行比較的難點,簡化了區間數型水質的評價過程,在某種意義上擴充了區間數型水質評價的處理。實例驗證,并與區間數集對分析法和區間數貼近度法比較表明,該模型處理區間型水質評價問題是客觀有效的。