朱 達,唐 亮,謝啟偉,馬 梅,饒凱鋒
1 湖北大學數學與統計學院,武漢 430062 2 中科水質(無錫)環境技術有限公司,無錫 214024 3 北京工業大學經濟管理學院數據挖掘實驗室, 北京 100124 4 中國科學院大學資源與環境學院,北京 100049 5 中國科學院生態環境研究中心中國科學院飲用水科學與技術重點實驗室,北京 100085 6 中國科學院生態環境科學研究中心環境水化學國家重點實驗室,北京 100085
我國是一個缺水嚴重的國家。雖然淡水資源總量占全球水資源的6%,居世界第五位,但人均只有2100m3,僅為世界平均水平的1/4[1],是全球13個人均水資源最貧乏的國家之一。與此同時我國還存在水資源分布極不均勻的情況,大量淡水資源集中在南方,北方僅為南方水資源的1/4。可見,人多水少、水資源時空分布不均[2]仍是中國的基本國情和水情,要想解決我國水資源短缺與經濟社會可持續發展之間的矛盾,只有提高水資源的利用效率,才能從根本上解決水資源危機。
21世紀是“城市的時代”。目前,全世界超過一半的人口生活在占全球面積不到4%的城市中,隨著全球城市化的發展,到2030年,我國城市人口將超過9億,新增的用水需求將主要集中在城市。然而我國城市卻普遍缺水,幾乎所有省會城市都缺水,從整體上來看全國660座城市中有400多座城市缺水,三分之二的城市存在供水不足,缺水嚴重的城市達110個之多,現如今水資源供需矛盾已成為制約城市發展的一個關鍵因素[3]。本文依據數據包絡分析方法,分析各省會城市水資源消耗與經濟產出情況,以期為各大城市制定貼合實際的用水制度,實現資源和經濟社會的可持續發展提供定量依據。
現有文獻通常采用模糊綜合評價法[4- 5]、層次分析法[6- 7]、數據包絡分析法[8- 9]、隨機前沿法[10]等對水資源效率進行評價。其中數據包絡分析(Data Envelopment Analysis,DEA)是一種綜合考慮決策單元(Decision Making Unit,DMU)投入產出相對效率的評價方法,由于該方法無需考慮投入與產出之間的函數關系,也不用考慮投入產出量綱和數量級上的差異,而是直接通過投入與產出之間的加權和之比,來實現有效計量決策單位的投入產出效率,從而成為廣泛用于決策單元效率分析的一種方法。
采用DEA方法研究水資源效率的文獻有很多。例如,張家瑞等[11]基于CCR模型,對滇池流域水污染防治績效進行了評估;賀桂珍等[12]從績效審計的觀點出發探討了太湖周邊6市環保局于2001—2005年間執行太湖水污染防治“十五”規劃的相對效率;石廣明等[13]結合Malmquist指數,動態研究了1999年至2005年我國31個省、市、自治區工業用水效率情況;陳磊等[14]針對兼具復雜內部結構和非期望要素的生產系統,提出了基于合作博弈的兩階段模型,并對中國各地區工業生產系統水環境效率進行了評價分析;Wang等[15]提出了具有不良產出的DEA方法,并利用DEA-tobit模型對我國30個省份用水效率進行了研究。
然而上述文獻雖然從DEA模型或時間維度上對水資源效率進行了不同角度的探究,但對于初始的投入產出指標體系卻沒有給出量化解釋,缺乏說服力。由于DEA結果嚴重依賴于分析中使用的輸入輸出變量集,而合理的指標體系應統籌兼顧定性(現實意義)與定量(實驗認證)兩個方面。Niranjan等[16]總結了8種量化選擇的方法并用蒙特卡洛模擬重點比較了其中四種方法的優缺點:包括效率貢獻測度[17]、主成分分析法[18]、回歸分析法[19]、Bootstrap方法[20]。其中效率貢獻測度與回歸分析法的結果易受到變量間多重共線性的影響;主成分分析法一般僅取兩個主成分即可代表原始變量85%以上的信息,這與實際的DEA模型不符;Bootstrap方法因其檢驗程序的復雜性導致軟件計算時間過長,不符合一般應用需求。此外這些方法還有一個共同的缺點:即每次僅測試一個變量的重要性,沒有考慮變量之間的組合影響,這可能會使變量選擇結果不穩定。本文采用Li等[21]提出的AIC變量選擇法建立科學的指標體系,其優勢在于考慮了投入產出間的所有變量組合,結合AIC優化準則[22],剔除了投入產出內部信息冗余的變量,其結果具有穩定性與有效性。
本文旨在運用DEA方法評價中國省會城市水資源效率問題,并從各地方經濟水平與水資源環境兩個角度出發提供細節性節水建議。其創新點在于引入了AIC變量選擇方法,從定性與定量兩個角度構建了合理的指標體系,且結合香農熵指數[23]彌補了變量選擇帶來的識別能力問題。下圖1為具體分析框架。

圖1 省會城市水資源效率分析框架Fig.1 Analysis framework of water resource efficiency in provincial capitals
2.2.1傳統DEA模型:CCR模型
數據包絡分析是Charnes等[24]提出的用來評價同類部門或單位相對有效性的決策方法,以DEA中具有代表性的規模報酬不變、輸入為導向的模型CCR為例。假定有n個獨立的DMU,并且每個DMUj(j∈N={1,2,…,n})消耗m種投入xij(i∈M={1,2,…,m})得到s種產出yrj(r∈S={1,2,…,s})。
(1)
式中,μr和νi分別是附加到第r個輸出和第i個輸入的未知乘數,E0(M,S)是DMU0考慮到初始輸入變量集M和輸出變量集S的最優效率,若E0(M,S)=1,則稱DMU0為DEA有效。如果在目標函數與第一個約束左側加入一個任意的μ0值,模型(1)將會變成規模收益可變的BCC(由Banker R D,Charnes A,Cooper W W提出)模型[25]。
2.2.2AIC變量選擇
Akaike基于極大似然估計理論首先制定了AIC信息準則[22],用于不同變量間統計模型的比較,且規定AIC值越小說明模型越好。Li等[21]將AIC準則代入CCR模型中,將CCR效率得分看作因變量,輸入與輸出變量看作自變量,得到如下線性回歸方程(2)式。
(2)

AIC(P,Q)=-3ln[MLE(P,Q)]+2(|P|+|Q|)
(3)
式中,ln[MLE(P,Q)]是基于模型(2)極大似然估計的自然對數變換,|P|和|Q|分別表示為子集P與Q中的變量個數。事實上,2(|P|+|Q|)可以理解為AIC變量選擇的懲罰項,其選擇的變量越多,識別能力越弱,AIC(P,Q)值越小,模型冗余信息越少,模型越顯著。
2.2.3香農熵指數提高識別能力
將輸入子集P和輸出子集Q的不同組合數設為K,則K=(2p-1)(2q-1),設第k個變量組合為Mk,模型集合為Ω={M1,M2,…,Mk}。基于Mk定義DMUj的效率得分(CCR模型條件下)為Ek,j=1,…,n,k=1,…,K。計算模型(1)K次,可得到如下效率矩陣[Ejk]n×k:
(4)
計算綜合效率得分步驟[23](模型5)如下:
①基于模型(1)計算所有可選擇的變量組合的效率矩陣[Ejk]n×k

(5)
④計算Mk組合中的多樣化程度(區分能力),dk=1-fk,k=1,2,…,K


綜合考慮社會、經濟、生態、環境與數據可得到性等因素的影響,分別從農業指標、工業指標、生活指標以及社會指標來對2016年我國31個省會城市的水資源效率情況進行評價,具體指標體系[9- 14,26]見表1。數據來源于《中國城市統計年鑒》以及各地方水利局水資源公報。

表1 初始輸入輸出指標體系
基于這篇文章研究的是用水效率問題,用水量是必不可少的輸入指標,考慮到農業、工業、生活是三個截然不同的經濟過程,選擇在輸入指標中固定選入農業、工業與生活用水量指標,得到初始輸入集合M與輸出集合S的不同組合數為:K=(22-1)(26-1)=189。由于篇幅有限,我們以AIC值的升序排列后選取了前10位變量組合列表(見表2),其中“0”、“1”分別表示該變量“未選入”與“選入”變量組合。
顯然,組合M1包含變量X1—X5、Y2—Y6時,獲得最小的AIC估計值(-49.4962),這說明此時組合內冗余信息最少,變量的重要性程度最高,模型效果最好。同時觀察輸入指標X4—X5與輸出指標Y1—Y3的選取,發現“都選”普遍比“只選一個”的AIC值要小,說明它們對變量體系效率值的聯合影響是大于自身的獨立影響的,這也呼應了產出變量Y1、Y2、Y3與投入變量X1、X2、X3之間相互匹配的實際經濟含義。
根據上表2中組合M1,得到了AIC變量選擇后的輸入輸出指標體系。圖2、圖3、圖4反映的是中國各省會城市投入與產出間的對比關系。
從生活用水上來看,北京、上海、重慶的用水量較大,西北地區與部分西南地區城市用水量很少,其余城市生活用水量差距并不明顯,這主要與城市常住人口有關,其生活用水量與勞動力基本呈現正比關系;從工業用水量來看,上海、南京、重慶等地消耗最為明顯,東南地區與成都等地工業用水量普遍較大,而西北地區與部分西南地區城市工業用水量極少,這與當地工業發展水平與經濟技術條件是相匹配的;從農業用水量來看,哈爾濱與烏魯木齊位居前列,而東南地區與西南部分地區農業用水量也相對較高。總體而言,整體耗水量大的城市集中在中國東南部與重慶、成都等城市,在這些城市中,經濟更加發達,固定資產投入較高,人口密度較大,水資源也相對較為豐富,因此用水量也隨之增加。

表2 AIC變量選擇結果
X1:農業用水量(100 million cu.m);X2:工業用水量(100 million cu.m);X3:生活用水量(100 million cu.m);X4:勞動力(Ten thousand people);X5:固定資產(100 million yuan);Y1:農、林、牧、漁業總產值(100 million yuan);Y2:工業總產值(100 million yuan);Y3:生活污水集中處理率(%);Y4:人均GDP(100 million yuan);Y5:地方財政一般預算內收入(100 million yuan);Y6:居民平均工資(yuan);AIC:赤池信息準則(Akaike information criterion),用于衡量統計模型擬合優良性

圖2 各省會城市用水量Fig.2 Water consumption of provincial capitals
圖3與圖4分別代表用水指標與社會指標投入產生的經濟效益,其中,從農、林、牧、漁業總產值來看,重慶、成都的產值較高,而哈爾濱與烏魯木齊的農業產值卻與其農業用水投入量不相匹配,這說明落后的經濟市場與技術水平可能導致水資源的大量浪費;從工業總產值與地方財政一般預算內收入來看,依次為北京、天津、上海、重慶四地遙遙領先于其他城市,且東南地區的財政收入與工業總產值普遍比西北地區與西南部分地區城市要高出很多,這與城市實際經濟水平是相吻合的;從生活污水集中處理率來看,南京、南寧、西寧這三個城市顯著低于其他城市,說明當地政府對于居民生活用水保障以及城市污水處理不夠重視,這可能會造成當地生活用水污染與水資源的極大浪費;從居民的平均工資來看,除北京、上海、拉薩外,其他城市差距并不明顯,這里應注意西北地區及拉薩、昆明、貴陽等西南地區城市,雖然這些城市GDP普遍不高,但其人均居民工資卻一直處于全國中游以上的水平。

圖3 用水指標輸出效益Fig.3 Output benefit of water consumption index

圖4 社會指標輸出效益Fig.4 Output benefit of social indicator
綜合考慮圖2、3、4,相比于北京、天津的投入產出數據,重慶、成都具有典型的高投入、低產出的特點,這些特點也可以從相對較低投入的城市南寧、西寧等城市看出。此外,也存在如拉薩、銀川、海口等地相對較低投入,較高產出的城市。
以表2中組合M1選定的輸入輸出指標體系,計算31個主要城市的綜合效率,且通過模型(5)計算綜合效率得分(CES)并排序,同時,為了進一步分析,采用有序聚類分析的方法按照人均GDP的高低將我國31個省會城市分為三類:經濟發達地區、中等發達地區、欠發達地區;根據人均水資源量的多少分為五類:極度缺水(<500m3/a)、重度缺水(500—1000m3/a)、中度缺水(1000—2000m3/a)、輕度缺水(2000—3000m3/a)、暫不缺水(>3000m3/a)(依據國際公認的缺水指標),得到表3。

表3 我國31個省會城市的水資源利用效率
CCR效率:由Charnes A,Cooper W W, Rhodes E X[24]提出的傳統DEA模型效率值;CES:綜合效率得分(Comprehensive efficiency score)[23]
4.3.1水資源投入產出分析
(1)從綜合效率的角度來看,共有19個城市的水資源投入產出達到最佳狀態,占比61.29%,而其他非DEA有效的城市水資源效率也均在0.7以上,分析其原因:一方面,AIC變量選擇時會剔除掉變量組合中信息冗余的變量,得到顯著有效的最優變量組合,所以各大城市的效率值普遍提升;另一方面,DEA模型中當選入模型變量增多時,會使DMUs的效率值增高,從而擴展出一類有效的決策單元,導致辨識能力降低。在這種情況下,很難對各大城市的水資源效率進行合理有效的比較與評估。
(2)從CES得分的角度來看,31個城市CES效率得分大致服從正態分布,且形成了一個完整的排名,有效的將各城市水資源效率區分開來。其中絕大多數城市的CES得分都在0.6以下,最高效率值為0.8244,相比于CCR模型,效率值普遍下降。分析其原因:CES得分考慮了變量指標體系的所有組合的效率值,而不是單指表2中輸入輸出,其結果更具有穩定性且更加困難達到DEA有效(當且僅當某決策單元在所有變量組合中均為DEA有效時,此決策單元CES得分才為1)。因此,以CES得分進行水資源效率的比較與評估將更具有可行性與合理性。

表4 CES得分排名與對應經濟水平
(3)從CES得分排名與經濟水平的角度來看(表4),排名前10的城市中,既有經濟發達的城市,如北京、天津、上海;也有經濟中等發達的城市,如太原、沈陽;還有經濟欠發達的城市,如海口、拉薩,在11—20與21—31的排名范圍內也近乎均勻的涵蓋了這三種經濟水平,這說明了一個城市水資源利用效率的高低與經濟發展水平可能沒有必然的聯系。

表5 CES得分排名與對應缺水情況
(4)從CES得分排名與缺水狀況的角度來看(表5),極度缺水的城市CES排名往往靠前,水資源較豐富的城市CES得分排名反而靠后。如南寧市2016年人均水資源量達1620m3/a,居省會城市第6位;重慶市每平方公里水面積居全國第一,人均水資源居省會城市第5位;南昌市全市水域面積達2204.37km2,占29.78%,在全國省會以上城市中排進前三位。而南寧、重慶、南昌市CES得分排名分別位列倒數第一、二、三位,這說明南寧、重慶、南昌等地雖然具有得天獨厚的豐富水資源,但其投入并未帶來相應的產出,可能存在大量的浪費現象。相反在極度缺水城市中,如北方地區北京、石家莊,西北地區銀川、蘭州等地區雖然常年缺水,但其水資源利用效率卻比重慶、長沙等地要高,說明這些缺水地區均很重視水資源的高效利用,真正做到了用好每一滴水。這也與清華大學國情研究中心課題組的研究結論不謀而合[27]。他們認為,水資源可獲得性與水資源利用效率成反比關系,越是易于獲取且水資源豐富的地區,水資源利用效率越低;而在水資源匱乏的地區,水資源獲取難度越大,取水成本越高,水資源利用效率越高。
4.3.2提高水資源利用效率的對策建議
(1)同經濟條件的城市中,用水效率較低的城市應向CES得分靠前的城市學習
經濟發達的城市如武漢、長沙等地可向北京、天津學習,充分利用自身經濟與技術人才優勢,開發新型節水設備,學習國外先進滴灌養殖技術,給予企業單位節水減排等政策與技術支持;中等發達地區如南昌、成都等地可向濟南、太原學習,采取經濟發展與節水減排并行政策,結合自身產業優勢,著重發展當地高產低耗企業;經濟欠發達地區如西寧、蘭州等地區可以向拉薩、海口學習:如拉薩針對其發達的支柱產業農牧業,采用符合其降雨條件的滴灌農業與旱地農業相結合的方法,通過農藝節水、生理節水、管理節水、工程節水等方法實現了低投入,高產出的節水農業生產鏈。
(2)同水資源條件的城市中,用水效率較低的城市也應向CES得分靠前的城市借鑒經驗
對于水資源儲量較豐富的城市,如長沙、福州等地,應向拉薩、海口地區學習優秀的農牧業與水產養殖業節水技術,建立起良好的節水機制,盡可能減少水資源的無效投入,同時,應考慮如何將自身優勢轉化為產出。一方面可以考慮加大水產養殖、水力發電、旅游文化等方面的投入與利用,優化產業結構,另一方面應保護好水質,減少污染,加強水資源的開發管理力度。
對于水資源稀缺的城市如石家莊、成都、西安等地,應向北京、天津學習如何開源節流、治理同行。一方面要積極尋找優質水源,如南水北調工程、海水淡化技術、雨水收集技術、污水處理再循環技術等,同時也要積極向民眾宣傳節水意識、可以適當提高水價或采用階層水價、控制公共場所用水量、減少景觀用水、提高水資源的重復使用率等;另一方面應加強水資源的統一管理,對水資源儲量的評估、水質的檢測、水資源的開發監控等工作,應由各市政府牽頭,水利局負責、質檢局、財務局、公安局等部門通力合作,依據《中華人民共和國環境保護法》、《中華人民共和國水污染防治法》等相關法律條例,保證水資源的合理開發,限制水資源的不合理利用,減少對水資源的污染。
(3)各大城市要加強交流,建立城際對口幫扶體系,取長補短,互通有無。經濟發達或水資源豐富的城市應從大局長遠發展考慮,踴躍提供經濟欠發達城市財力與技術支持,并積極響應國家“南水北調”工程,齊心協力,攜手并進,共同解決我國水資源短缺這一可持續發展難題。
鑒于大部分文獻在變量選擇體系方面的缺失以及傳統模型在效率識別能力上的不足,本文采用了AIC變量選擇方法以及香農熵指數選擇了合適的變量指標體系并提升了傳統模型的識別能力,給出了31個省會城市水資源利用效率的完整排名,并對其進行了分析與評價。從方法的選用上來看,AIC變量選擇法、數據包絡分析與香農熵指數正好可以實現優劣勢互補,三種方法結合使用是文章的一個創新點,不僅充分考慮了大量的輸入輸出變量,使得分析更加貼合實際,分析結果有理可依,同時AIC準則得到的變量指標體系也極好的符合了實際水資源利用效率的含義,最后香農熵指數法彌補了AIC準則帶來的傳統DEA模型識別力差的問題。文章最后給出了相應的結論和建議,從城市經濟水平與水資源情況兩個角度建立了城際學習體系,對各大城市部門制定符合實際的水資源戰略與政策,優化自身產業結構,同時加快科技節水步伐,減少環境污染,實現資源和經濟社會的可持續發展具有現實的指導意義。