鄭茂輝,劉少非,,柳婭楠,李浩楠
(1.同濟大學 上海防災救災研究所,上海 200092;2.同濟大學土木工程學院,上海 200092)
隨著城市地下管道設施規模的不斷擴大和服役年限的增長,管道老化和運行安全問題得到越來越多的研究和關注[1-2]。城市排水管道狀況評價是制定管網養護計劃和修復計劃的重要依據,也是城市安全監管的重要內容之一。
排水管道狀況包括結構性狀況和功能性狀況兩方面,它們分別描述管道內部結構性缺陷類型、等級,以及管道過流受阻等水力狀況[3]。CCTV(closed circuit television,管道內窺檢測)是目前國內外排水管道檢測評估先進、有效的技術手段,其關鍵內容就是對管道影像數據信息的判讀,包括確定內部缺陷種類、位置表述、等級和狀況評估計算。由于CCTV檢測成本高昂,通常只是針對城市特定區域或運行年限較長的排水管道設施。而對于其他缺乏檢測資料的城市管道網絡,其健康狀況診斷和病害趨勢預判等則亟待更多深入的研究。近些年,國內外學者采用隨機統計和機器學習方法研究建立了多種管道狀況模型,如多元回歸模型[4-6]、馬爾科夫鏈模型[7-9]、神經網絡模型[10-12],等等。鑒于管道老化因素眾多、過程復雜,數據驅動的神經網絡模型無需深入理解老化機理,只要通過數據樣本監督學習即可建立管道狀況同相關特征變量的關聯模式,無疑具有更好的適用性和應用前景[10]。
極限學習機(extreme learning machine,ELM)是Huang等[13]基于廣義逆矩陣理論提出的一種單隱含層前饋神經網絡的監督型學習算法。本文充分利用ELM計算速度快、泛化性能好的特點,將粒子群優化(particle swarm optimization,PSO)[14]方法與其相結合,選擇最優的網絡參數,建立一個適用于城市排水管道狀況評價的分類器模型,并以上海市洋山港保稅區排水管網為例進行實證研究,驗證模型方法的合理性。
設n、L、m分別為輸入層、隱含層和輸出層的節點數。給定N組任意的樣本(xi,ti)∈Rn×Rm,ELM算法的輸出函數可以表示為

式中:g(x)為激勵函數;wi=[wi1wi2…win]T,表示隱含層第i個神經元與輸入層的連接權值;βi=[βi1βi2…βim]T,表示隱含層第i個神經元與輸出層的連接權值;bi是隱含層神經元的閾值;wi·xj表示wi和xj的內積。
假定訓練樣本數量N與隱含層神經元節點數L相等,則對于任意給定的βi和wi,ELM能零誤差逼近學習樣本[13],即

將其以矩陣形式表達為

其中

對ELM的網絡訓練等價于如下優化問題:

當g(x)無限可微時,隨機給定網絡參數wi和bi,ELM模型訓練過程可看作求解線性系統Hβ=T關于的最小二乘解

式中:H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
ELM模型隨機生成輸入權值矩陣和隱含層神經元的閾值,無需迭代調整就可以解析計算得出網絡輸出值。不過參數隨機產生使結果存在一定的隨機性[15],容易產生較差的分類效果。本文結合PSO算法,優化ELM網絡參數wi和bi,以改善ELM算法輸出權值βi不穩定的缺點。
PSO算法是一種模擬鳥群覓食行為的群體智能優化算法,其核心是粒子更新速度和位置,即

式中:pi表示粒子的個體最優位置;gi表示搜索到的群體最優位置;ωmax和ωmin分別為慣性權重的最大值和最小值;c1和c2均為學習因子,也稱為加速常數;r1和r2為[0,1]范圍內的均勻隨機數;tmax和t分別為最大迭代次數和當前的迭代次數。
將ELM輸入權值wi和隱含層神經元偏置bi作為PSO算法的粒子,以極限學習機訓練集的均方根誤差作為適應度函數,計算每個粒子的適應度值,通過比較不斷更新粒子的速度和位置,直至達到最小誤差或最大迭代次數,得到經過PSO優化的ELM網絡參數。
影響排水管道結構性狀況的因素較多。為了簡化網絡模型,根據文獻[6],選取管材、管齡、管徑、埋深、管長、坡度和所在道路類型7項影響因素,作為管道結構性狀況評價的輸入向量,以CCTV檢測結果中管道修復指數(RI)所對應的結構性狀況等級作為網絡輸出,利用PSO-ELM算法建立分類器,通過樣本數據訓練學習確定影響因素與結構性狀況之間的非線性關系。表1給出的管道修復指數及其對應的結構性狀況等級、修復建議[3]。其中,等級Ⅰ(RI≤1)表示基本完好,等級Ⅱ(1<RI≤4)表示輕微破壞,等級Ⅲ(4<RI≤ 7)表示中等破壞,等級Ⅳ(RI>7)表示嚴重破壞。
根據上述輸入、輸出向量建立排水管道結構性狀態評價的PSO-ELM網絡拓撲模型,并在Matlab R2016b軟件平臺中實現。模型仿真時將采用試驗方法設定不同的神經元節點數L和激勵函數g(x),對標準ELM和PSO-ELM模型訓練測試結果進行比較分析。

表1 管道修復指數與等級劃分Tab.1 Pipeline rehabilitation index(RI)
混淆矩陣分析方法是評價分類器性能好壞最直接有效的方法。假定nij表示被分類為j類的i類樣本數,則分類準確率以正確分類的樣本數與總樣本數N的比值來表示

定義Ri是第i類樣本的查全率

定義G為樣本所有類別查全率的幾何平均值

指標G適于評價不平衡數據集上分類器性能,其基本思想是使每一分類正確率盡可能大的同時,保持各類之間的平衡。
以上海市浦東新區洋山港保稅港區公共排水管道為例,采用標準ELM模型以及優化后的PSOELM模型開展試驗研究,預測、判定排水管道結構性狀況等級。
試驗區基礎數據包含兩部分:一是排水管道GIS(地理信息系統)數據,包含管材、管齡、管徑、埋深、管長、坡度和所在道路類型等模型輸入的特征數據;二是試驗區2018年10月份排水管道CCTV檢測數據,檢測管道里程20.3 km。基于管段唯一性標識建立GIS數據和CCTV檢測數據對應關系,提取有效樣本數據共559條,采用4折交叉驗證法將樣本集平均分為4份,每次驗證抽取1份作為測試集,余下3份作為訓練集,重復進行4次,取4次測試驗證結果的平均值作為模型的誤差估計。另外,為避免各指標量綱和數量級不同造成的不平衡性,采用最大最小法對原始數據進行了量綱一化處理,使得處理后的數據分布范圍在[0,1],公式如下:

式中:x為實測值;xmin為樣本數據的最小值;xmax為樣本數據的最大值。
利用標準ELM構建管道狀態分類評價模型時,僅需要設定隱含層神經元節點數L和激勵函數g(x)的構造形式就可以求算輸出權值矩陣。實際工程應用中隱含層神經元節點數L一般遠小于樣本數N,L過小網絡預測誤差較大,L過大則會增加模型預測的時間、空間成本,容易出現過擬合現象。圖1給出sigmoid、sin和hardlim 3種常見激勵函數下隱含層神經元節點數L對分類器能力的影響。其中,sigmoid函數和sin函數的分類器性能接近,L增至300時分類準確率相對較高,約為60%。因此,對于未優化的ELM管道狀況分類評價模型,激勵函數選擇整體性能較優的sigmoid函數,隱含層神經元節點數L設定為300。

圖1 3種激勵函數下隱含層節點數對ELM分類性能的影響Fig.1 Effect of number of hidden nodes on ELM performance in different activation functions
為方便比較,同樣選擇sigmoid激勵函數,對PSO-ELM分類器性能進行仿真分析。經測試比較,設定PSO種群數m=40,c1=c2=1.5,ωmax=0.95,ωmin=0.4,tmax=200。如圖2所示,L=70時,PSOELM分類準確率約為61%;L=130時,分類準確率達到90%以上。可見,采用PSO優化ELM的網絡參數,能夠以更少的隱含層神經元節點獲得更高的分類準確率。需要說明的是,在復雜性程度上PSOELM比標準ELM增加了網絡參數尋優的步驟,但PSO算法可以較為快速地獲取到最優參數,能夠有效避免ELM可能存在的結果不穩健的缺點。

圖2 PSO-ELM隱含層節點數影響Fig.2 Effect of number of hidden nodes on PSO--ELM performance
通過多次試驗后,確定PSO-ELM和ELM的隱含層神經元節點數分別為130和300時分類效果最佳。如表2所示,經PSO優化ELM網絡參數后,不光分類準確率P顯著提升,G數值也由58.36%增至91.0%。通常,城市排水管道的結構性狀況是非均衡分布的,除了整體準確率,不同分類準確度、查全率及相互之間的平衡也是分類器的重要評價指標。

表2 PSO-ELM和ELM模型分類性能比較Tab.2 Comparison of performance of PSO-ELM and ELM
表3以混淆矩陣形式給出PSO-ELM和ELM在測試集上的分類結果對比。其中,結構性損壞比較嚴重的Ⅲ類管道樣本17條,PSO-ELM準確預測15條,查全率88.2%;Ⅳ類管道樣本23條,準確預測21條,查全率91.3%。ELM分類器的相應查全率則分別為64.7%和43.5%。結果可見,相比較ELM,PSOELM對于非均衡數據集顯然具有更優的分類預測能力。

表3 分類結果混淆矩陣Tab.3 Confusion matrix for PSO-ELM
圖3給出了測試集上逐個樣本的PSO-ELM分類結果與實測值的對照。結果也表明,PSO-ELM具備較高的分類精度和擬合能力,能夠較好滿足排水管道結構性狀況評價的應用要求。

圖3 PSO-ELM分類測試結果Fig.3 Predicted versus observed result for PSO-ELM
(1)提出了PSO-ELM排水管道結構性狀況評價模型,采用PSO算法優化ELM輸入連接權值和隱含層偏置,避免參數隨機初始化造成的分類結果不穩定、準確率偏低的弊端。
(2)利用CCTV檢測樣本集對PSO-ELM、ELM進行仿真測試,試驗結果表明,PSO-ELM能夠以較少的隱含層神經元節點達到更高的分類精度,提高了ELM模型的擬合能力。
(3)本文為城市排水管道結構性狀況評價提供了一個新型的數據驅動的建模方法,具有較好的可行性和適用性。后續將利用更多的樣本數據訓練優化模型,進一步提高預測精度和泛化能力。