李 乾,李 彬,劉婷婷,薛曉燕
(1.華北水利水電大學,河南鄭州450011;2.中國水電顧問集團元江開發有限公司,云南昆明650051)
可拓聚類方法在水庫移民后期扶持效果評價中的應用
李 乾1,李 彬2,劉婷婷1,薛曉燕1
(1.華北水利水電大學,河南鄭州450011;2.中國水電顧問集團元江開發有限公司,云南昆明650051)
在分析影響水庫移民生產生活水平多種因素的基礎上,結合移民實際生活狀況,選取敏感性評價指標,應用物元和可拓集合理論建立移民生活水平評價的可拓聚類分析模型,將移民生活水平劃分為貧困、溫飽、小康、富裕和最富裕5個等級,通過可拓聚類分析得到水庫移民生活水平評價結果。河南省某2個縣實例分析表明,可拓聚類方法應用于水庫移民生活水平評價中是可行的,評價結果是合理的、有效的。
水庫移民;生產生活水平;可拓聚類方法;聚類分析;物元模型
在移民后期扶持政策實施監測評估中,監測評估人員通常根據人均純收入、生活消費支出、家電擁有量等單個量化指標做出評價,但指標的多樣性、復雜性會影響評價結果的準確性和合理性。可拓聚類分析是以物元理論和可拓學為基礎,以物元變換成定性工具,關聯函數定為定量工具,并采取定性和定量相結合的方法進行評估,保證評價結果的準確性和合理性。
本文從后扶政策實施對移民生活水平影響程度的角度,結合監測評估調查問卷設計指標,構建了移民生產生活水平評價的指標體系,并采用可拓聚類分析方法,以物元變換為定性工具,使所調查指標能高效利用,從而確保獲得科學、合理的評價結果。
可拓聚類分析方法首先通過聚類分析約簡屬性與劃分集合P的子集,構造它們的經典域物元與節域物元,同時確定待測物元。選用比重權數方法與主觀經驗方法確定權重系數,之后再根據關聯函數值來確定待測樣本隸屬哪一個子集,從而可得到聚類分析結果。
1.1 確定經典域和節域
設Ii(i=1,2,…,m)是p的m個子集,Ii?P,對于待測地點p∈P,然后判斷p屬于哪個子集Ii,并計算p屬于任一子集Ii的程度。設Ri(i=1,2,…,m)為m個同征物元,便可建立m個同征物元體,組成同征物元陣。令
式中,C1,C2,…,Cn為Ii的n個不同的特征;而Xi1,Xi2,…,Xin分別為Ii關于特征C1,C2,…,Cn的取值范圍,即經典域并且有Xij=〈aij,bij〉,(j=1,2,…,n)。為表示特征C1,C2,…,Cn的取值范圍,引入節域的概念,即


待測樣本形成的物元Rx為
式中,x1,x2,…,xn分別是待測樣本的n個因子觀測值。
確定關聯函數值待測樣本各類影響因子與各類關聯度Ki(xj)為
(1)
式中,ρ(xj,Xij)=|xj-(aij+bij)/2|-(bij-aij)/2;|Xij|=|aij-bij|;ρ(xj,Xpj)=|xj-(apj+bpj)/2|-(bpj-apj)/2(j=1,2,…,n;i=1,2,…,m)。
把實變函數中的距離概念拓展為距概念,將點與區間的位置關系采用定量的形式以精確刻畫。當點在區間內時,經典數學體系認為點與區間的距離為0。而可拓集合利用距的概念,通過用距的取值不同來表示點在區間內的各個位置的不同。在距的基礎上建立相應關聯函數,將“具有性質I”的事物從定性的描述拓展為 “具有性質的程度”的量化描述。
1.2 權系數的確定
待測樣本歸屬于哪一類,需要根據待測樣本影響程度的不同,以權系數表示各類的重要程度,在[0,1]區間內取值。一般情況下,可根據實際采用比重權數、專家評價、層次分析等方法來確定權系數。本文選用比重權數法。
比重權數方法是根據某個指標,以所有被評價對象觀測值的比重大小來確定的一種數量權數,采用該指標的比重差異信息不同來衡量其重要性的大小。對每個要進行判別的類來說,待測樣本每一個因子的權系數λij都是由其與之相對應的特征經典域的最大值的比值所占這一類中各個因子,與其相對應的特征值經典域的最大值的比值之和的比例來確定。即
(2)
式中, j為因子,j=1,2,…,n;i為類別,i=1,2,…,m。
待測樣本p為i類等級的隸屬度為
(3)
式中,Ki(p)為待測樣本各個指標關于各個等級的關聯程度在考慮指標重要程度情況下的組合值。
根據最大關聯原則來確定所屬類別,若Ki=maxKi(p),i=1,2,…,m,則可判定樣本p屬于i類。
目前,全國都在積極開展后期扶持政策實施監測評估工作。結合具體工作實踐,本文選取了河南省的2個重點監測評估縣進行實例分析,以驗證可拓聚類方法在水庫移民后期扶持效果評價中的適用性。
2.1 指標選擇與等級劃分
以河南省2012年2個移民后扶監測評估縣為例,根據系統性、科學性、可操作性等原則建立生產生活水平指標體系。結合移民生產生活水平具體情況,將生活水平評估指標從高到低水平依次劃分為一級(最富裕)、二級(富裕)、三級(小康)、四級(溫飽)、五級(貧困)等5個等級。
結合該縣水庫移民的實際情況,影響生產生活水平的主要因素有土地資源擁有量、水利配套設施、居住水平、基礎設施水平、教育醫療、經濟收入水平等。本文選取人均耕地面積C1、耕地產量水平C2、可灌溉比例C3、人均住房面積C4、基礎設施水平C5、衛生醫療水平C6、義務教育普及率C7、人均純收入C8、恩格爾系數C9作為評價指標。具體情況見表1。

表1 水庫移民生活水平評價指標及劃分標準

表2 待測物元影響因子的取值
選取的指標包括定量和定性指標,定量指標通過實際統計分析得出,如人均純收入C8根據2012年國家貧困線為2 300元,2012年的河南省農村人口人均純收入為7 525元,全國農村人口人均純收入為7 917元建立物元模型。對于定性指標,如基礎設施水平,結合調查當地移民對其滿意度所占比例分為5個等級:一級為非常滿意人數占90%以上,二級為滿意人數在70%~90%之間,三級為基本滿意人數在50%~70%之間,四級為不滿意人數在30%~50%之間,五級為不做評價人數在0%~30%之間。
2.2 可拓物元模型的建立
根據移民生活水平等級劃分,建立物元經典域一級R1、二級R2、三級R3、四級R4和五級R5。從表1可以看出,影響等級取值和生活水平的最高級與最低級相對應的為大于或小于某個值,這就給可拓聚類的分析帶來了不方便。根據大量實踐和文獻資料分析,將指標影響等級的最大值與最小值的取值論域來進行處理。待測物元影響因子的取值見表2。則經典物元為




根據關聯函數定義,計算待測樣本對于5個等級的綜合關聯度,即隸屬度。將各個等級的隸屬度進行比較,隸屬度最大的等級記為待測點的生產生活水平等級。選擇以第1個待測樣本數據1為例,運用公式(1)計算待測樣本與各類關聯度矩陣K
式中,K11=-1.350、K12=-0.9、K13=0.5、K14=-0.329、K15=-0.375、K16=0.2、K17=0.1、K18=-0.473、K19=-0.238;K21=-1.525、K22=-0.85、K23=-0.2、K24=-0.117、K25=-0.2、K26=-0.25、K27=0.25、K28=-0.370、K29=0.09;K31=-2.050、K32=-0.550、K33=-0.1、K34=0.325、K35=0.5、K36=0.25、K37=-0.167、K38=-0.032、K39=-0.030;K41=0、K42=0.45、K43=0.25、K44=-0.216、K45=-0.2、K46=-0.1、K47=-0.5、K48=0.06、K49=-0.273;K51=0.323、K52=-0.500、K53=-0.250、K54=-0.347、K55=-0.429、K56=-0.357、K57=-0.643、K58=-0.340、K59=-0.418。
根據公式(2),計算各類別對應的每個因子的權系數λij(i=1,2,…,5,j=1,2,…,9)
式中,λ11=0.054、λ12=0.072、λ13=0.110、λ14=0.093、λ15=0.110、λ16=0.100、λ17=0.137、λ18=0.087、λ19=0.238;λ21=0.061、λ22=0.073、λ23=0.116、λ24=0.119、λ25=0.116、λ26=0.107、λ27=0.145、λ28=0.092、λ29=0.170;λ31=0.063、λ32=0.081、λ33=0.097、λ34=0.134、λ35=0.130、λ36=0.119、λ37=0.162、λ38=0.095、λ39=0.118;λ41=0.057、λ42=0.093、λ43=0.100、λ44=0.150、λ45=0.133、λ46=0.122、λ47=0.166、λ48=0.107、λ49=0.072;λ51=0.047、λ52=0.082、λ53=0.105、λ54=0.142、λ55=0.139、λ56=0.128、λ57=0.174、λ58=0.144、λ59=0.039。
2.3 計算待測樣本對各類的關聯度
根據公式(3),計算出待測樣本p對各類別i=1,2,…,5之關聯度Ki(p):K1(1)=-0.454 6、K2(1)=-0.225 4、K3(1)=-0.079 7、K4(1)=-0.100 5、K5(1)=-0.383 7。根據最大關聯原則Ki=maxKi(p)確定所屬類別,得出待測點1生產生活水平屬于三級(小康)。
同理,可計算出待測點2的關聯度Ki(p):K1(2)=-0.418 4、K2(2)=-0.073 9、K3(2)=-0.039 9、K4(2)=-0.230 5、K5(2)=-0.527 0,得出待測點2生產生活水平也屬于三級(小康)。
2.4 結果分析
(1)從計算結果可以看出,待測樣本1中關聯度K3(1)與K4(1),兩者絕對值為0.02,表明該監測評估縣移民的生產生活剛從溫飽到小康,后期扶持效果良好。
(2)比較2個監測評估縣的第3級關聯度K3(2)=-0.039 9>K3(1)=-0.079 7,說明待測點2的生產生活水平比待測點1要高,與監測評估實際調查情況相符,說明該方法用來評價分析水庫移民后扶實施效果是可行的。
水庫移民后期扶持監測評估涉及經濟、社會、環境等多個方面,本文采用可拓聚類方法對水庫移民后期扶持效果評價是可行的。在等級取值與生活水平的最高級和最低級對應的是大于或小于某個數值時,文中采用指標影響等級的最大值和最小值作為取值論域的處理方法,對其實用性尚需進一步研究及改進。
[1]蔡文, 楊春燕, 林偉初. 可拓工程方法[M]. 北京: 科學出版社, 1999.
[2]蔡文. 物元模型及其應用[M]. 北京: 科學技術文獻出版社, 1999.
[3]唐志航. 可拓數據挖掘方法及其應用研究[D]. 上海: 東華大學博士學位論文, 2009.
[4]鄭茂杰. 煤與瓦斯突出預測及應急響應機制研究[D]. 北京: 中國礦業大學, 2009.
[5]李臨杰. 移民生產生活水平監評指標體系構成研究[J]. 人民黃河, 2003, 25(12): 39- 41.
[6]胡寶柱, 宋向陽, 趙靜. 水利工程移民后期扶持研究[J]. 海河水利, 2004(5): 7- 10.
(責任編輯 楊 健)
Application of Extension Clustering Method in the Evaluation of Reservoir Resettlement Post Supporting Effect
LI Qian1, LI Bin2, LIU Tingting1, XUE Xiaoyan1
(1. North China University of Water Resources and Electric Power, Zhengzhou 450011, Henan, China;2. HydroChina Yuanjiang Development Co., Ltd., Kunming 650051, Yunnan, China)
Based on the influence factor analyses of resettlement living level and combined with the actual living conditions of resettlement, the sensitive index are chosen to evaluate resettlement productivity and living standard. Then the extension clustering model for evaluating the resettlement productivity and living standard is established with the matter element and extension theory. The resettlement living levels are divided into five grades of poverty, hunger, well-off, wealthy and richest, and a life evaluation result of reservoir resettlement is got by extension clustering analyses. Taking two counties in Henan Province as example, the results show that the application of extension cluster method in reservoir resettlement living level evaluation is feasible and the results are reasonable and effective.
reservoir resettlement; productivity and living standard; extension clustering method; clustering analysis; matter element model
2015- 04- 17
河南省高校科技創新團隊支持計劃(14IRTSTHN028);河南省基礎與前沿技術研究項目(122300410029);河南省教育廳青年骨干教師資助項目(2013GGJS-086)
李乾(1986—),男,河南虞城人,助教,碩士,主要從事工程管理、水庫移民等方面的教學和研究工作.
D632.4
A
0559- 9342(2015)08- 0005- 04