周振民,管 財,范 秀,李延峰(.華北水利水電大學,鄭州 4500;.新鄉市大功引黃工程管理處,河南 新鄉 453300)
眾所周知,21世紀被稱為“水的世紀”,水危機已成為繼能源危機之后,人類面臨的又一難題,水資源匱乏已成為關系到經濟可持續發展、世界貧困人口生存乃至世界和平與安全的重大問題。應對水危機、解決水問題,關鍵在于做好水務系統的管理工作,研究水務系統、掌握水務系統發展現狀以及存在的問題、制定科學合理的發展戰略,從而實現人、水、經濟社會和諧發展的目的。城市水務系統包括水資源環境、水源、供水、用水、排水、水處理與回用,以及相關的資源管理和產業管理,其主要任務是為城市水資源開發、利用、配置、節約和保護提供科學的管理和服務[1]。目前,有關水務系統評價的方法主要有主成分分析法、熵值法[2]、層次分析法等,這些方法都存在一些問題,比如主成分分析法要求前幾個主成分的累計貢獻率必須達到一個較高的水平,層次分析法指標選取受人為干擾性大等,而本文采用了投影尋蹤聚類模型分析法,可以克服上述兩個方法的弊端,從而更科學地構建水務系統綜合評價模型指標體系,建立投影尋蹤目標函數,從而用遺傳算法求得最優解,進而得到鄭州市水務系統評價等級為Ⅱ級。
投影尋蹤方法最早由美國科學家Kruscal 提出并使用,他把一組高維數據投影到低維數據空間,發現了數據的聚類結構,進而解決了化石分類問題。Tukey和Friedman教授在1974年發現了一種把局部的凝聚程度和整體散度結合的新指標,用于聚類模型分析,并首次提出了投影尋蹤的概念,并于1976年編制了計算機圖像系統。
在此之后,投影尋蹤模型計算方法在理論和應用領域取得了長足進展,Friedman等學者于1981年提出了投影尋蹤分類模型、投影尋蹤回歸模型和投影尋蹤密度函數估計。1985年Huber對前人的成果進行了歸納和總結,發表了關于投影尋蹤的綜合性論文,并初步建立了投影尋蹤模型在統計學中的獨立運用體系。至此投影尋蹤模型開始在實踐中的大規模應用。目前投影尋蹤模型主要用于以下3個方面:投影尋蹤回歸模型、投影尋蹤聚類分析和投影尋蹤學習網絡。
投影尋蹤聚類方法主要用于將模型中的高維數據投影到低維空間中,即1~3維的可視空間,然后通過數學計算,優化反映數據聚類程度的一個指標,得到若干個投影方向,在這多個投影方向中找到最優的投影方向。在這個投影方向下,投影到低維空間的點能夠最直接地反映高維空間散點數據的特征,這樣我們就可以通過研究低維數據結構特征,學習和掌握高維數據空間的特征。所以說投影尋蹤模型方法的關鍵就是找到最佳投影方向,這正是該模型研究者們一直研究的重點。本文采用的是一種全局優化方法——遺傳算法(Genetic Algorithm ,GA)來計算最佳投影方向,該方法不是把優化區域劃分為若干個小區域,在小區域上求最優解,而是根據目標函數反映在低維空間結構上的特征,在整個優化域內求最優解,所以不會錯失任何最優解[3]。
1.2.1評價指標歸一化處理
由于評價指標種類多,而各指標的量綱又存在差別。因此,為了消除各指標的量綱影響,并統一各指標取值的變化區間,在建立模型之前首先需要將指標分成越大越優型和越小越優型兩種類型,對指標數據進行歸一化處理。歸一化處理的方法不同,對投影尋蹤模型有一定的影響,本文采用常規的處理方法加以處理[4]。
各指標值用樣本{x*(i,j)|i=1,2,…,n,j=1,2,…m}表示,其中x*(i,j)為第i個樣本第j個指標值,n、m分別為樣本的個數(樣本容量)和指標的數目。為消除量綱和指標值的變化范圍對結果的影響,應用下式進行極值歸一化處理:
步驟1:對于越大越優的指標
(1)
對于越小越優的指標
(2)
式中:xmax(j)、xmin(j)分別為第j個指標值的最大值和最小值;x(i,j)為指標特征值歸一化的序列。
1.2.2線性投影
投影尋蹤中投影的目的是尋求能夠最大限度地反映樣本數據結構特征、最能夠充分挖掘樣本數據信息的最優觀察角度,即最佳投影方向。其實質就是通過投影的方法、把高維數據所反映的信息投影到一維空間里,這樣處理的結果非常形象、直觀,也便于使用常規的數學方法對高維數據進行處理和分析[5]。
1.2.3構造投影指標函數
構造投影指標函數F是投影尋蹤計算過程中的關鍵步驟。水務系統評價主要是對樣本進行級別判斷,通常采用分類指標來構造投影指標函數,即投影特征值在低維空間散布的類間距離與類內密度同時達到最大值。
投影尋蹤聚類模型方法就是把p維數據{x(i,j)|i=1,2,…,p}綜合成以a={a(1),a(2),a(3),…,a(p)}為投影方向的一維投影值z(i)。

(3)
式中:a(j)為投影向量。
根據投影函數的特性,要求投影值z(i)的散布特征向量應為:局部投影點盡可能密集,盡可能凝聚成若干個點團,但整體上投影點團之間盡可能散開。因此,投影指標函數可以表達成
F(a)=SzDz
(4)
式中:Sz為投影值z(i)的標準差;Dz為投影值z(i)的局部密度。即
(6)
式中:E(z)為序列{z(i)|i=1,2,…,n}的平均值;R為局部密度的窗口半徑(密度窗寬),其值可以根據試驗來確定;r(i,j)表示樣本之間的距離,r(i,j)=|z(i)-z(j)|;u(t)為一單位階躍函數,當t≥0時,其值為1,當t<0時,其函數值為0。
1.2.4優化投影指標函數
對于給定指標的樣本集,投影指標函數值只隨投影方向的變化而改變。不同的投影方向必然反映出不同的數據結構特征,其中,可能最大限度暴露高維數據特征結構的投影方向就是最佳的投影方向。相關研究表明,當投影指標函數F=Fmax(a)取得最大值時,就得到投影指標函數F(a)的最佳投影方向。即:
最大化目標函數
maxF(a)=ZzDz
(7)
約束條件
(8)
這是一個以{a(j)|j=1,2,…,p}為優化變量的復雜非線性優化問題。利用遺傳算法與MATLAB工具箱中的直接搜索工具箱求最優解,用MATLAB代碼編寫適應度函數,在MATLAB中以M文件的形式存儲適應度函數,方便直接搜索工具箱的調用,在MATLAB中運行所編寫的投影尋蹤模型程序,求得該水務系統評價模型的最優解。
1.2.5用遺傳算法求最優投影方向
在投影尋蹤模型中,最關鍵的一個環節就是尋求該模型的最佳投影方向,本文采用的是基于生物進化理論的全局優化方法——遺傳算法。遺傳算法最早由美國Holland教授于20世紀60年代提出,經過幾十年的發展,Goldberg于80年代對該方法進行了系統的歸納總結,形成了遺傳算法的基本框架,其主要步驟包括:選擇(Selection)、交叉(Crossover)和變異(Mutation)[6]。然后模擬生物界對變異的數據進行篩選,找到初次優化的變異數據,如此進行多代的交叉、變異和重組,找到最優解。該方法能夠避免諸多優化方法的缺點,使投影目標函數能夠在可行域內實現最優,該方法是一種有效確定最佳投影向量的算法。
鄭州市北臨萬里黃河,西靠中岳嵩山,東南接黃淮海大平原,屬北溫帶季風氣候,年平均氣溫14.3 ℃,平均降水量640.9 mm。境內大小河流35條,分屬于黃河水系和淮河水系,其中流經鄭州段的黃河長150.4 km,,鄭州市土地面積7 446 km2,市區面積1 010.3 km2,常駐人口866萬人,人均GDP 47 608元/人,建城區面積343 km2。
經過多年的不懈努力,鄭州市水務建設取得了很大的成績,基本滿足了城市供水的需求,尤其是水務一體化改革之后,水務局履行了水務一體化管理職責。水務系統與日常生活息息相關,對于社會各個子系統的正常運轉起到積極的推動作用,水務系統的綜合評價是對于我們現階段水務系統建設的一次系統研究分析,并且對于以后的城市水務系統的發展方向有一定的指引作用[7]。水務工程是保障城市安全有序發展的重要基礎設施,城市水務工程體系的建設水平要和當地的社會經濟發展速度相適應,要根據現狀條件下的工程建設和運行情況,分析城市防洪排澇、供水、節水、污水收集處理、污水回用、水生態環境建設等工作對社會經濟發展的影響。
本文采用如下技術路線進行了水務系統評價研究。首先,明確本論文研究的目的,結合研究目標,構建水務系統評價指標體系,然后進行鄭州市水務系統的數據收集與處理,進而選擇投影尋蹤聚類模型評價方法進行評價,最后得綜合評價。

圖1 研究技術路線圖Fig.1 The skechmap of research
統籌考慮水務系統的各個子系統,選取各子系統的代表性指標,進而構建合理的水務系統指標評價體系。構建水務系統評價指標要遵循以下原則:
(1)綜合性。指標選擇時,要從城市的特點及水環境要素等方面綜合考慮,不要求對城市水務的各個要素進行細致的分析。
(2)代表性和導向性。選取的指標要能反映城市水務系統的綜合質量狀況,即所選指標要能反映城市水體的水質情況、防洪情況、供水情況、再生水水利用情況,以及城市水務系統的變化趨勢等,為城市水務的管理者提供決策的依據。
(3)可操作性。指標數據應容易獲得,并且真實可靠,指標須有一定切實可行的量化方法可以利用,指標體系的指標條目數量應當適中,過多在評價中難以實施,過于簡化又不能說明問題,更無法得到正確的評價結果。
城市水務系統是城市涉水事務的各個子系統的綜合,各個子系統之間既相互聯系又相互制約。城市水務系統是以工程建設為主的傳統工程水利逐步向以資源優化配置和環境生態平衡為主要目標的資源水利轉變的結果[8]。從城市水務的系統功能上來說,城市水務系統包括水資源環境、水源、供水、用水、排水、水處理與回用,以及水務系統管理。其主要任務是為城市水資源開發、利用、治理、科學配置、節約和保護提供核心的技術支撐[9]。
結合城市水務的系統特征,從技術的層面劃分為9個子系統,城市防洪系統、城市節水系統、城市供水系統、城市排水系統、城市中水回用系統、城市污水系統、城市水生態環境系統、水務管理系統及社會環境系統[10-15]。
運用投影尋蹤模型,對樣本數據進行處理,根據水務系統的評價等級分類,將水務系統評價等級分為Ⅰ、Ⅱ、Ⅲ、Ⅳ 4個等級,依次為優良、良好、及格和差。
在MATLAB中優化該目標函數,計算得到如下結果,見表2。
計算最佳投影方向向量a*=(-0.010 17,0.046 171,0.498 364,0.349 984,0.011 902,0.152 378,0.136 069,0.186 38,0.043 024,0.306 349,0.194 764,0.190 925,0.624 06),Ⅰ、Ⅱ、Ⅲ、Ⅳ級的各標準樣本對應的投影特征值Z*j分別為:2.730 198 947,1.698 662 714,0.861 438 824,0。即水務系統評價等級標準樣本的投影特征值向量z=(2.730 198 947,1.698 662 714,0.861 438 824,0)。
將最佳投影方向向量值和各投影方向特征值代入式(3)得到鄭州市水務系統評價模型的投影特征值Z*j=1.819 078。繪制水務系統等級值Z*j與投影特征值之間的關系圖,并根據曲線圖建立水務系統評價等級判別函數y=P(z),即投影尋蹤等級評價模型。

表1 鄭州市水務系統評價指標及單項指標標準Tab.1 The evaluation indexes of water system and single standard index in Zhengzhou

表2 投影尋蹤模型單項指標最佳投影方向分量Tab.2 The single index best projection direction component for projection pursuit model
首先繪制各等級標準樣本對應的投影特征值Z*j與水資源承載能力間的關系圖(圖2),然后根據關系圖變化趨勢建立投影尋蹤等級評價函數y=P(z)。

圖2 投影特征值與水務評價等級擬合圖Fig.2 Relationship between eigenvalue and the evaluation of water systems
從表3可以看出,投影特征值與擬合評價模型等級平均絕對誤差為8.35×10-5,平均相對誤差為6.298 7%。顯然,該模型誤差較小,精確度高,因此該模型可用來評價鄭州市的水務系統現狀。

表3 投影尋蹤模型評價結果誤差分析Tab.3 The error analysis of the projection pursuit grad evaluation model
將鄭州市水務系統評價投影特征值代入擬合等級函數y=0.042 5x2-1.115 4x+ 3.792 2得到y=1.184 051 1,該值接近評價等級的第Ⅱ級,因此鄭州市的水務系統等級為Ⅱ級。當前水務系統處于良好狀態。
城市水務系統是一個復雜的大系統,包含一個區域的所有涉水事務,并在不斷地發展和完善,因此,對于水務系統的研究仍需不斷的深入。本文在充分考慮鄭州市水務系統影響因素的基礎上,以鄭州市城市防洪系統、城市節水系統、城市供水系統、城市排水系統、城市再生水利用系統、城市污水系統、城市水生態環境系統、水務管理系統、社會系統等9個系統為評價基礎,全面系統的分析當前鄭州市水務系統建設運行狀況,取得了如下結論。
(1)采用系統分析模型,將水務系統看做一個完整的、開放的巨系統加以研究。通過研究水務系統的各個子系統,并加以凝練和總結,提出了一個有代表性的評價指標來概括該子系統,加深了對水務系統內涵的認識,為科學的分析城市水務系統的組成提供了一定的依據。
(2)結合鄭州市水務系統的具體情況,篩選了13項具體評價指標,包括城市防洪標準、排澇標準、工業用水重復利用率、工業萬元產值取水量、城市人口用水普及率、人均水資源量、排水管網密度、再生水利用率、污水處理率、生態環境用水占比、水務一體化管理水平、環境投資占GDP比重、城市化率。這些指標能夠基本概括鄭州市的水務發展核心要素。
(3)在建立水務系統評價指標體系的基礎上,首次將投影尋蹤模型應用于水務系統的綜合評價,并運用遺傳算法對目標函數進行優化,最后得到具體的評價結果。結果顯示,目前鄭州市社會環境系統、城市節水系統、城市水環境系統建設方面存在不足,需要作為當前水務系統建設的重點內容。本次系統評價為政府相關決策部門提供了一種可參考的依據,有利于對目前水務系統建設的薄弱環節進行改進,進而使鄭州市的水務系統建設得到全面的發展。
□
[1] 謝京.城市水務大系統分析與管理創新研究[D].天津:天津大學,2007.
[2] 方國華,程發順,黃顯峰,等. 基于熵值法的徐州市水利水務現代化評價研究[J]. 水資源與水工程學報,2014,(6):34-38.
[3] 付 強. 投影尋蹤模型及其在水文水資源系統分析中的應用[J]. 黑龍江水專學報,2008,(4):80-85.
[4] 馬 峰,王 千,藺文靜,等. 基于指標體系投影尋蹤模型的水資源承載力評價——以石家莊為例[J]. 南水北調與水利科技,2012,03:62-66.
[5] 萬中英,廖海波,王明文. 遺傳-粒子群的投影尋蹤模型[J]. 計算機工程與應用,2010,20:210-212,240.
[6] 甄偉平.投影尋蹤模型在生態系統評價中的應用[D]. 蘭州:蘭州大學,2011.
[7] 張海濤,謝新民,楊麗麗. 水利現代化評價指標體系與評價方法研究[J]. 中國水利水電科學研究院學報,2010,(2):107-113.
[8] 生春新. 泰州水生態工程可持續發展研究[J]. 江西建材,2014,20:118.
[9] 吳季松,石玉波,李硯閣.水務知識讀本[M].北京:中國水利水電出版社,2003.
[10] 程曉冰. 我國水務管理20年回顧與展望[J]. 水資源管理.2015,(11).
[11] 劉大根. 北京市“十三五”時期水務發展規劃編制的思考與建議[J]. 中國水利,2015,(11):18-20.
[12] 邵益生. 城市水系統控制與規劃原理[J]. 城市規劃,2004,(10):62-67.
[13] 陳益明,劉坤,鄭濤,徐竟成. 城市污水回用現狀及發展趨勢[J]. 凈水技術,2003,(5):34-36.
[14] 夏岑嶺.城市防洪理論與實踐[M].合肥:安徽科學技術出版社,2001.
[15] 林洪孝.城市水務系統與管理[M].北京:中國水利水電出版社,2009.