劉玉東
(新疆塔里木河流域希尼爾水庫管理局,新疆 庫爾勒 841000)
基于相關分析與粗糙集理論的區域水資源承載力評價
劉玉東
(新疆塔里木河流域希尼爾水庫管理局,新疆 庫爾勒 841000)
本文圍繞區域水資源承載力指標體系的初始、優化和評價檢驗三個構建過程,針對構建中的指標信息重復和干擾問題,提出基于相關分析與粗糙集 Horafa屬性約簡算法相結合的指標體系優化,并采用灰色系統理論與粗糙集耦合的評價方法對優化結果進行評價。以新疆和田地區為例,從水資源系統、社會系統、經濟系統和生態環境系統四個方面,構建由 16項指標組成的初始水資源承載力評價體系,通過篩選得到由 10項指標構成的優化ISAWRCC,進而對這兩套指標體系進行評價。結果表明:相關分析與粗糙集 Horafa屬性約簡算法相結合的指標信息優化方案是可靠的;篩除重復和干擾指標信息,簡化了繁雜的指標體系,降低了后續評價的計算復雜度,并且信息篩選后的優化水資源承載力評價體系比初始體系評價結果更合理。
水資源;承載力;評價體系;分析;灰色系統理論
水資源承載力是區域可持續發展戰略的重要組成部分,區域水資源承載力評價對于區域社會經濟的持續發展、生態環境的良性循環具有重要意義。水資源承載力評價指標體系(Indicators System for Assessment of Water Resources Carrying Capacity,ISAWRCC)的構建則是水資源承載力評價的核心內容之一,但關于如何構建 ISAWRCC尚未形成一致觀點。目前,ISAWRCC構建的常見方法大致有:①從理論探討入手構建指標體系,如基于協調論、和諧論和可持續發展理論的內容,以水資源、社會經濟和生態環境等系統為準則層,從水資源可供性、開發利用效率、合理配置程度和管理能力等方面選擇評價因子;②結合固定模型,劃分體系結構及選取評價指標,如 PSR模型或DPSIR模型;③通過指標歸類處理或指標使用頻度統計,確定體系準則,選取高頻指標參與評價,如以總量、比例、強度和效益四類指標構建ISAWRCC。
本文基于ISAWRCC構建的一般方法與步驟,圍繞初始、優化和評價檢驗三個過程構建ISAWRCC;針對常用篩選方法的不足,提出相關分析與粗糙集Horafa屬性約簡算法相結合的優化方案,進行水資源承載力評價指標的篩選;并采用灰色系統理論與粗糙集耦合的評價方法,對指標篩選后的優化結果進行檢驗。以新疆和田地區 2005年至2012年8年的基礎數據為樣本,進行ISAWRCC構建研究,以期為 ISAWRCC構建提供科學合理的方法和指導。
1.1 初始ISAW RCC
依據理論分析和專家經驗,建立初始ISAWRCC,這一過程主要涉及體系結構確定、指標選取和指標內涵界定三方面內容。體系結構確定,即通過理論分析設計指標體系的層次和準則,形成構建ISAWRCC的結構框架;指標選取,是在把握區域水資源特性及數據現實性的基礎上,依據相關理論及專家經驗選取參評指標;指標內涵界定,指遵循通用性和科學性原則,對各項指標所表征的實際意義給出明確規定,且界定各項指標對于評價目標的“正負”向類型,即數據的方向。
1.2 優化ISAW RCC
針對指標信息的重復和干擾,應用適當的數學方法進行指標篩選,有助于簡化繁雜的指標體系,提高評價結果的精確度。其中,粗糙集可有效處理數據不確定性,刪除冗余信息,與數理統計法相比,具有魯棒性好、靈活性強的優點,而相關分析能發掘數據間隱含的線性關系,揭示重復指標。本文擬將相關分析與粗糙集屬性約簡法結合,應用到ISAWRCC構建中,以避免信息重復和干擾。
1.2.1 相關分析
若兩組指標數據相關系數的絕對值越大,則它們的相關程度越高,反之獨立性越強。設Rij是第
i、j項指標的相關系數,xki為數據無量綱化后第k個評價對象的第 i項指標,且第 i項指標的數據平均值為,則第 i項與第 j項指標的相關系數表示為:

相關系數絕對值|Rij|衡量了第 i項與第 j項指標數據的線性相關程度,對相關關系的顯著性檢驗通常有臨界值法和方差分析檢驗法,這里采用臨界值法,結合相關系數顯著性檢驗表,確定高度線性相關的臨界值。臨界值法中,通過比較 |Rij|和臨界值 r(α,n-2)的大小判定線性關系的顯著性,其中 n為樣本個數,α為顯著性水平。為在避免指標誤刪的前提下發掘高度相關的指標,確定當顯著性水平達0.01,即 |Rij|≥r(0.01,n-2)時,可以判定第 i項與第j項指標數據高度線性相關。
1.2.2 Horafa屬性約簡算法
粗糙集理論常利用二維信息表來描述一個知識系統,描述對象的指標稱為屬性。粗糙集屬性約簡是在保留關鍵信息的前提下對數據進行化簡并求得知識的最小表達,常見的屬性約簡法可歸納為:上、下近似集法;區分矩陣法;屬性重要性法。其中,Horafa算法是基于區分矩陣并以屬性加權頻度為啟發信息的屬性約簡法。該算法擺脫了對原數據表的依賴,結合反映區分矩陣特性的屬性加權頻度進行計算,使得約簡更加靈活。此外,Horafa算法以屬性加權頻度為指標選取的第二參考信息,而屬性加權頻度刻畫了屬性重要性,若屬性重要性越大,則輸出信息越多、作用越顯著,因此該算法優先選取重要度大的指標參與評價,在一定程度上確保了參評指標有顯著作用。
1.2.3 基于相關分析與粗糙集的ISAWRCC優化
將相關分析與粗糙集Horafa屬性約簡算法相結合,以篩除初始ISAWRCC中的重復和干擾信息,步驟如下:
(1)數據無量綱化處理。這里采用極值無量綱化法,對于“正向”類型的指標用公式 Yi=(ximin xi)/(max xi-m in xi)進行無量綱化,對于“負向”類型的指標則采用公式Yi=(max xi-xi)/(max xi-min xi)無量綱化。
(2)利用相關分析篩選高度線性相關指標。得到 n項底層指標的 n×n階相關系數矩陣,依據相關系數顯著性水平α的檢驗臨界值,并結合理論分析篩選重復指標,由于無量綱數據均已轉化為正方向,因此當相關系數為正時是真相關。
(3)無量綱數據離散化處理。采用等距離劃分法將連續型數據化為 n個等級,如用等級 1、2、3和 4分別代表[0,0.25)、[0.25,0.5)、[0.5,0.75)和[0.75,1]區間上的值。
(4)約簡冗余性干擾信息。基于離散化數據表,構造區分矩陣,結合粗糙集 Horafa屬性約簡算法,約簡冗余指標,最終得到信息篩選后的優化ISAWRCC。
1.3 評價檢驗
指標體系優化結果的評價檢驗是確定優化方案是否科學合理的必要過程。基于優化ISAWRCC的指標數量少而初始 ISAWRCC指標數量多的特點,并考慮客觀賦予指標權重、避免過多主觀影響的重要性,這要求所采用的評價方法必須對指標數量改變不敏感,且充分滿足指標權重賦予客觀的要求。灰色系統理論的灰色關聯度評價法,不僅適用于大樣本數據量,而且適用于小樣本數據量,并依據數據變化發展的狀態和趨勢客觀賦權;而粗糙集賦權法將指標權重轉化為屬性重要度,通過屬性重要度的計算和分析客觀確定指標權重。因此,本文將灰色關聯度評價法與粗糙集的屬性重要度賦權法耦合,對初始ISAWRCC和優化ISAWRCC兩套指標體系進行評價,這避免了由于賦權主觀或指標數量改變對評價結果造成的影響,該方法計算過程如下:
(1)設水資源承載力評價指標的最優參考序列x0={x0i}(i=1,2,…,n),即無量綱化后的分量值均為1,此時的區域水資源承載力到理想化的最優狀態。令水資源承載力評價指標的比較序列 ui={uij}(i=1,2,…,m;j=1,2,…,n),即第 i個評價對象第 j項指標的無量綱值。
計算比較序列與最優參考序列的絕對差列:

(2)根據絕對差列,可得兩級最大差 Δ(max)為1和兩級最小差 Δ(min)為 0,取分辨系數ρ= 0.5(0<ρ<1),則第 i個評價對象與最優參考序列的關聯系數為:

(3)采用加權平均法,計算各評價對象與參考序列的關聯度,即第 i個評價對象的綜合評價值,計算模型為:

式中:Wk為指標 k的權重。
(4)利用粗糙集屬性重要度賦權法確定指標k的權重 Wk。粗糙集理論中,知識是一種對信息系統的分類能力,其屬性重要度的計算可依據屬性依賴性或信息熵,其中基于信息熵的屬性重要度通過從屬性集中去掉一屬性后對系統分類能力的影響來測度,定義如下:
在信息系統 S=(U,R)中,U為評價對象組成的論域,R為屬性集合,則知識 Xi輸出的信息熵大小為:

式中:p(Xi)為區分矩陣中知識的概率分布,則對于信息系統 S=(U,R),指標 r∈R的重要度表示為:

由此可見,該評價方法利用灰色關聯度和指標屬性重要度組合賦權,計算簡單易行,所得評價值的大小客觀地反映了水資源承載力的優劣。
2.1 建立初始ISAWRCC
根據文獻數據資料,新疆和田地區水資源承載力體系包括 4個方面、16項指標。4個方面包括水資源系統、社會系統、經濟系統和生態環境系統。其中水資源系統包括人均水資源量(C1,m3)、水資源開發利用率(C2,%)、單位面積水資源量(C3,萬m3·km-2)與供水模數(C4,萬 m3·km-2)這4項指標;社會系統包括人口密度(C5,人·km-2)、人口自然增長率(C6,‰)、城鎮化率(C7,%)、農村飲用水不安全率(C8,%)4項指標;經濟系統包括人均 GDP產值(C9,元)、GDP年增長率(C10,%)、耕地灌溉率(C11,%)與第一產業占GDP比例(C12,%)這 4項指標;生態環境系統包括林 草 地 覆蓋 率 (C13,%)、生態 環境 用水 率(C14,%)、地下水開采率(C15,%)與工業廢水處理率(C16,%)這 4項指標。和田地區水資源承載力評價指標體系詳見表1。

表1 和田地區水資源承載力評價體系
2.2 優化ISAW RCC
根據文獻數據資料,借助 SPSS統計分析軟件,對表1中的 16項評價指標進行相關分析,得到描述各指標間相關程度的 16×16階相關系數矩陣。本實例指標的樣本個數 n=8,當顯著性水平 α= 0.01時,顯著性臨界值 r(0.01,6)=0.8343,因此當相關系數 Rij≥0.8343時,判定第 i項指標與第 j項指標為真高度相關。根據相關系數法,剔除C1、C2與 C9這3項評價指標。
在相關分析剔除了 3項重復指標的基礎上,應用Horafa屬性約簡算法進一步優化指標體系,對剩余的 13項指標進行知識約簡,以篩除冗余性指標,得到各準則層信息系統的最小知識表達,以該最小信息系統反映本準則層的特征。首先將無量綱數據等距離劃為“1,2,3,4”四個等級,用 Visual C+ +6.0編程實現區分矩陣的構造算法,依據所構造的區分矩陣及Horafa算法流程進行冗余分析。通過粗糙集的約簡分析,篩除了 3項冗余性干擾指標(C6、C13與 C16),得到如表 2所示的約簡后保留屬性集結果。最終,以此約簡后保留屬性集構成新疆和田地區優化ISAWRCC。2.3 評價檢驗

表2 約簡后的和田地區水資源承載力評價體系
應用灰色關聯度與粗糙集屬性重要度耦合的評價方法,分別對新疆和田地區初始ISAWRCC和優化ISAWRCC這兩套指標體系進行水資源承載力評價,以檢驗和分析該指標優化結果是否科學合理,評價結果如表 3所示。
2.4 結果分析
從表 3可知,不同年份研究區水資源承載力均穩定在Ⅱ級,兩套指標體系評價結果基本吻合。對評價結果橫向對比可知,與初始 ISAWRCC相比,優化ISAWRCC中的指標不存在高度相關指標和冗余指標。高度相關指標重復反映了評價信息,使同一指標數據的趨勢在綜合評價結果中得到線性增強或減弱,而通過優化的指標體系,確保了指標獨立性,避免了重復信息參評。此外,優化ISAWRCC剔除了冗余指標,這改變了權重的賦予狀況,使重要指標獲得了更大權重。

表3 和田地區初始ISAWRCC和優化ISAWRCC評價結果
因此,可以確定和田地區優化 ISAWRCC比初始ISAWRCC評價結果更加合理,這說明通過相關分析和粗糙集進行指標體系的優化,篩除重復和干擾信息,既減少了參評指標,又得到了更合理的結果。
(1)將定性與定量分析有機結合,提出了圍繞初始、優化和評價檢驗三個過程進行 ISAWRCC構建的方法。
(2)提出了相關分析與粗糙集屬性約簡法相結合的方法,篩除指標體系中的重復和干擾信息,實現了 ISAWRCC的優化。其中,基于相關分析剔除了高度線性相關的重復指標,通過粗糙集Horafa算法進一步約簡冗 余性干 擾信息,并 一定程度上確保了參評指標對評價結果有顯著作用,解決了指標信息重復和干擾問題;在此基礎上,基于對指標數量改變不敏感,及對指標賦權客觀的需求,采用了灰色關聯度與粗糙集屬性重要度耦合的評價方法,進行優化結果的評價檢驗,為ISAWRCC的構建提供了科學合理的方法和指導。
(3)通過新疆和田地區的實例研究表明,基于相關分析與粗糙集 Horafa屬性約簡算法相結合的指標信息優化方案是可靠的,篩除重復和干擾信息,簡化了繁雜的指標體系,降低了后續評價的計算復雜度,并且信息篩選后的優化 ISAWRCC比初始ISAWRCC評價結果更合理。 參考文獻
[1]宋松柏,蔡煥杰.水資源可持續利用指標體系及評價方法研究[J].水科學進展,2003,14(05):647-652.
[2]左東啟,戴樹聲.水資源評價指標體系研究[J].水科學進展,1996,7(04):367-373.
[3]稅偉,張啟春.當代美國地理學與可持續發展的理論、實踐[J].地理與地理信息科學,2004,20(04):56-60.
[4]黃初龍,章光新.中國水資源可持續利用評價指標體系研究進展[J].資源科學,2006,28(02):33-40.
[5]金菊良,丁晶.區域水資源可持續利用系統評價的插值模型[J].自然資源學報,2002,17(05):610-615.
[6]鄒積君,劉志文.區域水資源可持續利用指標體系的設計及評價方法研究[J].干旱區資源與環境,2003,17(01):37-40.
[7]楚文海,吳曉微.西南巖溶地區水資源可持續利用評價[J].資源科學,2008,30(03):150-156.
[8]李魏武,陶濤,鄒鷹.太湖流域水資源可持續利用評價研究[J].環境科學與管理,2012,37(01):85-89.
[9]劉恒,耿雷華.區域水資源可持續利用評價指標體系的建立[J].水科學進展,2003,14(03):265-270.
[10]吳湘婷.區域水資源可持續利用水平評價指標體系研究[J].人民黃河,2007,29(06):31-33.
[11]崔東文,郭榮.基于 GRNN模型的區域水資源可持續利用評價[J].人民長江,2012,43(05):26-31.
[12]馮海霞.基于 PSR概念模型的水資源可持續利用指標體系研究[J].水資源研究,2002,23(02):13-17.
[13]周豐,郭懷成.濕潤區湖泊流域水資源可持續發展評價方法[J].自然資源學報,2007,22(02):290-301.
[14]鐘定勝,孫亞梅,張宏偉.水資源可持續開發的綜合評價指標體系研究與應用[J].天津工業大學學報,2005,24(02):65-70.
[15]吳雪梅.基于PSO-PPE模型的和田水資源承載力評價[J].干旱地區農業研究,2014,32(02):28-233.
TV211.1
A
1672-2469(2015)08-0057-04
DO I:10.3969/j.issn.1672-2469.2015.08.019
劉玉東(1974年—)男,技術員。