丁相毅,石小林,凌敏華,黃 澤,安 琪,劉思然
(1.中國水利水電科學研究院水資源研究所,北京 100038; 2.鄭州大學水利科學與工程學院,河南 鄭州 450001;3.吉林大學新能源與環境學院,吉林 長春 130012)
供水管網健康狀態評價結果是城市供水管網維護更新的重要理論依據,而評價指標的確定和指標數據的收集是評價過程中的關鍵,對于提高評價結果的科學性和準確性起到了重要作用。城市供水管網系統是一個構件繁多、結構復雜、工況時刻都在變化且充滿不確定性的龐大系統,用一兩個指標難以科學全面地評價其健康狀態,但如果指標選擇過于復雜,又會使得數據處理變得混亂與困難[1]。在供水管網健康評價指標的研究當中,國際水協會(IWA)和美國自來水廠協會(AWWA)推薦用供水設施漏失指數(infrastructure leakage index, ILI)作為最合適和最實用的性能指標來表征真實漏失量(物理漏失量)[2];Pelletier等[3]研究了供水管道10年來的破損記錄,將每年水管破裂的數量作為管網結構狀態的指標;張現國等[4]通過比較國際水協、世界銀行、澳大利亞、葡萄牙以及我國現行的漏損水量評價指標,分析供水管網漏損影響因素,探討了漏損評價指標的篩選;余鵬鈞[5]通過對南方某市的管道健康影響因素的分析,開展了南方某市供水管網健康評價指標體系的構建研究;代煥芳[6]建立了用于評價供水管網漏失水平的指標——背景漏失指數(background losses index, BLI)并對其實用性進行了驗證;王旭冕等[7]利用統計學知識,建立了由方差分析、綜合評價指標分析和極大不相關分析組成的三步篩選法篩選參與聚類分析的指標,剔除了對聚類分析產生干擾的重復、多余或片面指標。總體來說,目前對供水管網健康狀態評價指標的代表性和敏感性研究較少,因此本文對供水管網健康狀態評價指標進行貢獻度分析及敏感度分析,遴選出代表性強、敏感度較高的指標,以期為供水管網健康狀態評價指標體系的建立和指標數據收集等基礎工作提供借鑒和參考。
1.1.1供水管網健康狀態評價指標選取
根據供水管網健康概念和內涵,綜合考慮管網健康狀態的影響因素[8],對比分析國內外大量的相關文獻[3-8],并結合我國供水管網運行實際情況,根據選取指標的代表性、完備性、相對獨立性和可操作性的原則,初步篩選了20個指標構成初選評價指標體系,其中管網靜態結構指標12個、水力指標5個、水質指標3個。然后根據供水管網維修情況概率統計并結合專家主觀判斷,最終確定11個供水管網健康狀態評價指標,其中供水管網靜態結構影響因素7個,供水管網水力和水質影響因素分別有2個,具體見圖1。

圖1 供水管網健康狀態評價指標體系
1.1.2供水管網靜態結構指標數據來源
本文以浙江省云和縣供水管網為研究實例,數據源于云和縣水利局和云和縣供排水公司提供的2017年云和縣供水管網基本屬性情況統計資料、2010—2017年云和縣供水管網維修情況統計資料、2017年云和縣部分供水管道水力、水質監測數據資料、2017年云和縣供水管網CAD圖等。其中,部分供水管網靜態結構影響指標數據需依據相關資料運用專家打分的方法獲得[9-10],共邀請8位專家對管材、接口形式、地面荷載、內外襯層這4個指標按供水管網健康程度進行評分,設定其評分最高值為1,即供水管網健康狀態最優;最低評分為0,即供水管網健康狀態最差。專家評分匯總情況見表1。

表1 專家評分匯總
1.1.3供水管網水力、水質指標數據來源
真實的供水管網是一個非常復雜且龐大的系統,管網水力、水質數據的采集具有極大的困難性。本文根據云和縣供水管網基本屬性情況統計資料、2017年云和縣部分供水管道水力、水質監測數據資料和云和縣供水管網CAD圖等基礎資料,按照一定的概化原則,對云和縣供水管網進行管段概化、節點合并等處理,省略了對水力、水質條件影響較小的管線,保留DN100以上的主要干管,最后運用EPANET軟件建立供水管網微觀模型,建立供水管網拓撲結構(圖2),模擬得到供水管網水力、水質數據。云和縣供水管網水力、水質數據指標樣本數為108,概況見表2。
因子分析可將具有錯綜復雜關系的變量綜合為數量較少的幾個因子,用以展現原始變量與因子之間的相互關系[11]。然后將相關性較強的幾個變量歸在同一個類中,每一類賦予新的名稱成為一個因子,用于反映事物的一個方面或者一個維度[12]。本文使用因子分析原理中因子對原資料信息的解釋性的含義,即,因子方差越大,該因子對整個樣本的貢獻度越大、解釋力度越強,通過計算因子得分和因子方差貢獻率確定各評價指標對供水管網健康狀態的貢獻度大小。該方法的步驟為

圖2 云和縣供水管網拓撲結構

表2 云和縣供水管網水力、水質指標概況
步驟1將逆向指標數據添加負號進行正向化處理[13],在此基礎之上建立原始數據矩陣。設有n根管道作為樣本,每根管道有p個指標,這樣就構成了一個n×p階的矩陣Xn×p。
步驟2數據標準化。由于不同的評價指標常常具有不同的單位,為了消除量綱和數量級的影響,需要對原始指標進行標準化處理[14],得到標準化后的各指標數據矩陣X′,計算公式為
(1)

步驟3計算(X′ij)n×p的相關系數矩陣R。
步驟4用雅克比方法求相關系數矩陣R的特征值(λ1,λ2,…,λp)和相應的特征向量αi=(αi1,αi2,…,αip),其中i=1,2,…,p。
步驟5計算因子方差貢獻率。因子方差貢獻率的計算公式為
(2)
因子累計方差貢獻率的計算公式為
(3)
式中m為p個指標經過降維后的因子個數。
步驟6計算旋轉后的因子荷載矩陣。當初始因子在原變量上的載荷值都相差不大,各因子的典型代表變量不突出時,容易使因子的意義含糊不清,不便于對因子進行解釋[15]。為了便于對實際問題進行分析,需要進行旋轉使因子載荷矩陣中載荷的絕對值向0和1兩個方向分化,從而更清楚地解釋因子的含義。因子旋轉一般采用方差最大化正交旋轉[16-17]。
步驟7計算因子得分。計算公式為
Fj=βj1X′1+βj2X′2+βj1X′2+…+βjpX′p
(j=1,2,…,m)
(4)
式中:Fj為各因子得分;β為各因子得分系數矩陣。
步驟8計算各指標貢獻度和綜合得分。由因子得分系數的含義可知,因子得分系數是樣本中各個指標對因子的貢獻,而方差貢獻率是因子對所有樣本方差的代表。因此,因子得分系數與相應方差貢獻率的乘積即為各指標在樣本中的貢獻[18],然后再對其進行歸一化處理。計算公式為
(5)
式中wi為第i個指標的貢獻度。
根據因子得分和因子方差貢獻率計算綜合得分:
|Z|=|F|×|e|
(6)
式中:|Z|為樣本綜合得分矩陣;|F|為因子得分矩陣;|e|為因子方差貢獻率矩陣。
敏感性分析亦稱敏感度分析[19],研究如何將模型結果的不確定性分配到不同的模型輸入參數中,從而篩選出引起模型結果不確定性的主要影響因素,識別和選擇關鍵控制參數,該方法一般用于投資項目評價時分析不確定性因素對項目經濟效益指標的影響程度和敏感性程度。分析影響程度的大小稱為該屬性的敏感性系數[20],敏感性系數絕對值越大,說明該屬性對模型輸出的影響越大[21]。目前,分析敏感性的方法有局部分析法、全局分析法、定性方法和定量方法[22]。本文利用非參數統計方法計算敏感性系數(敏感度),公式為
(7)
式中:SRCi為第i個指標評價敏感度;σi和σy分別為第i個指標因子和樣本綜合得分的標準方差;bi則為y關于x的回歸系數。

表3 SPSS軟件計算結果
在進行因子分析前,首先要檢驗指標變量因子是否適合做因子分析[23]。本文利用SPSS26.0軟件對11個供水管網健康評價指標進行KMO檢驗和Bartlett球形檢驗,檢驗結果表明,抽樣適度的KMO測定值為0.659,Bartlett球形檢驗顯著性為0.000。根據Kaiser常用度量標準,當KMO值高于0.6時,整個樣本就可以做因子分析,同時Bartlett檢驗的Sig即p值接近于0,遠小于顯著水平0.05,因此拒絕Bartlett球形檢驗的0假設,該樣本數據適合做因子分析[24]。
利用SPSS軟件計算樣本數據旋轉后的特征值與因子累計方差貢獻率,結果見表3,可見,提取的4個因子旋轉后的特征值均大于1,累計方差貢獻率達到了76.226%,說明提取出來的4個因子可以反映11個指標當中76.226%的信息量,雖然沒有大于80%的傳統經驗值,但超過了75%,總體上因子分析的結果還是可以接受的。
為使各指標更好地解釋因子,使得各因子的典型代表指標更加突出顯示,利用SPSS軟件中方差最大化法對因子荷載矩陣進行旋轉并按照從大到小的順序進行排序,結果見表4。查找相關系數顯著性檢驗表,可以看出在0.01顯著性水平上,相關系數絕對值大于0.25,就可以認為此相關系數在0.01水平上顯著。為科學起見,本文以荷載度0.5以上為提取依據,對4個因子當中原始指標進行歸納分析,發現因子1包括覆土厚度、接口形式和管徑3個指標,其中覆土厚度對因子1的相關度最大且達到了0.932,相對而言,其他兩個指標對因子1的相關度就比較小,由荷載矩陣含義可知,該指標與因子1越密切,對因子1的代表性越高,所以因子1可以命名為外部環境對管道靜態結構的影響;因子2包括管齡、內外襯層、地面荷載和管材,整體而言,管齡、內外襯層和管材都是反映管道內部靜態結構的情況,所以因子2可以命名為管道內部靜態結構影響因素;因子3包括節點水齡、余氯、節點壓力與服務最低壓力比值,整體而言,節點水齡和余氯反映的是管道內水質的情況,所以因子3可以命名為水質影響因素;因子4包括節點流量與總流量比值,該指標反映的是管道內水壓的情況,所以因子4可以命名為水力影響因素。
根據式(4)和式(5),計算各個指標對于整個樣本的貢獻度并進行排序,具體結果見表5。由貢獻度的含義可知,貢獻度越大,該指標對于整個樣本評價時就越重要,當累積貢獻度越大,則說明選取的系列評價指標對于提高樣本綜合評價結果的全面性和合理性就越好。由表5可見,內外襯層和管徑貢獻度排名靠前,說明這兩個指標對供水管網健康狀態的評價非常重要;還發現內外襯層、管徑、節點流量與總流量比值、余氯、節點壓力與服務最低壓力比值、覆土厚度、管材、管齡累計貢獻度達到0.80,反映出這8個指標能比較全面和合理地解釋供水管網的健康狀態,所以在管網健康狀態評價時這8個指標屬于必選的評價指標,然后再根據實際情況在這8個指標的基礎之上增加其他合適的指標,使累積貢獻度盡可能接近1。從因子命名角度分析,上述8個指標在4個因子當中均有體現,而且在建立的供水管網健康狀態評價指標體系的三大影響因素里均有所表征,說明這8個指標能夠對供水管網健康狀況做一個基礎且相對全面的解釋,因此將上述8個指標作為基礎必選的評價指標是科學合理的。同時,也反映出單從供水管網靜態結構影響因素、管網水力影響因素或管網水質影響因素出發建立供水管網健康狀態評價指標體系,并不能很好地詮釋供水管網的實際健康狀況,而應該同時考慮供水管網靜態結構影響因素、管網水力影響因素和管網水質影響因素,建立“三位一體”(管內-管道-管外)的供水管網健康狀態評價指標體系。

表4 旋轉后的因子荷載矩陣

表5 貢獻度計算結果
根據式(4)和式(6)計算管道綜合得分,利用SPSS26.0軟件確定綜合得分關于各個指標的回歸系數,最后根據式(7)計算各個指標的敏感度并按照從大到小的順序進行排序,計算結果見表6。由表6可見,余氯和節點流量與總流量比值敏感度排名靠前,說明在這11個指標當中,余氯和節點流量與總流量比值對供水管網健康影響程度較大。為提高評價結果的準確性,應該提高這兩個指標的數據精確度。分析兩個指標數據來源可以發現,余氯屬于水質影響因素,節點流量與總流量比值屬于水力影響因素,而管網水力、水質指標數據均源于EPANET軟件建模模擬所得,因此,盡量減小模型誤差將是提高管網健康評價結果準確性的關鍵。

表6 敏感度計算結果
由于貢獻度和敏感度屬于不同的領域范疇,不宜直接從計算結果的大小做對比分析。本文著眼于排名結果的變化情況,通過分析各個指標貢獻度和敏感度排名的變化來研究各個指標對供水管網健康狀態的代表性和敏感性。根據各個指標貢獻度和敏感度排名結果(表5、表6),可見,有6個指標貢獻度排名和敏感度排名均在前8位,分別是內外襯層、管徑、節點流量與總流量比值、余氯、覆土厚度、管齡,除節點壓力與服務最低壓力比值排名差異大以外,其余評價指標排名差值均在4及以內,排名差異屬于可接受范圍,因此可以認為指標貢獻度越大,其對應的敏感度一般也偏大。節點壓力與服務最低壓力比值貢獻度排名雖較靠前,但是它的敏感度排名卻處于最末,說明該指標在允許的范圍內變化對供水管網健康狀態評價結果影響程度較小,但是如果該指標過小,滿足不了用戶對于用水水壓的需求,如果指標過大,則容易發生爆管,因此,該指標對于供水管網健康狀態的表征又顯得非常重要。
本文運用統計學的方法,把11個供水管網健康狀態評價指標劃分為4層,即外部環境對管道靜態結構影響因素、管道內部靜態結構影響因素、水質影響因素、水力影響因素;分析了各個指標對于整個樣本的貢獻度大小,提取出了8個最為重要和基礎的指標,分別是內外襯層、管徑、節點流量與總流量比值、余氯、節點壓力與服務最低壓力比值、覆土厚度、管材、管齡;在此基礎上分析了各個指標敏感度,篩選出了貢獻度和敏感度排名均在前8位的6個指標,分別是內外襯層、管徑、節點流量與總流量比值、余氯、覆土厚度、管齡。為提高評價結果的科學性和準確性,貢獻度前8位的指標應該作為基礎的必選指標,并且應盡量提升內外襯層、管徑、節點流量與總流量比值、余氯、覆土厚度、管齡數據的精度。