張洪奎 陳井軍 劉瑞哲
(中國(guó)石化銷售有限公司華中分公司 湖北武漢 430023〕
管道是成品油安全、經(jīng)濟(jì)的輸送方式之一,但由于外部環(huán)境、管材腐蝕、第三方施工和打孔盜油等因素影響,近幾年,我國(guó)油氣管道事故時(shí)有發(fā)生,環(huán)境污染、人員傷亡后果嚴(yán)重,引起公眾對(duì)油氣管道安全性的關(guān)注[1]。
隨著科學(xué)技術(shù)水平的提高,如何充分利用種類繁多的數(shù)據(jù),實(shí)現(xiàn)管道發(fā)生泄漏后的快速、準(zhǔn)確預(yù)警,成為油氣管道企業(yè)保障管道運(yùn)行安全的重要研究課題[2]。
聚類本質(zhì)上是一種分組方法,分組是使組內(nèi)對(duì)象的相似度盡可能高,而不同組間的相似度盡可能低[3]。因此,也可以將聚類定義為:對(duì)不同對(duì)象的集合進(jìn)行分組的過程。劃分聚類的算法需要提前指定聚類數(shù)目或中心,通過反復(fù)的迭代運(yùn)算來(lái)降低目標(biāo)函數(shù)的誤差值,當(dāng)目標(biāo)函數(shù)收斂至一定精度要求時(shí)得到相應(yīng)的聚類結(jié)果[4]。典型的劃分方法包括:K-means(K均值)聚類和K-medoids(K中值)聚類[5]。
離群點(diǎn)挖掘又稱作異常檢測(cè),目的是發(fā)現(xiàn)與其他對(duì)象不同的對(duì)象。離群點(diǎn)挖掘技術(shù)本質(zhì)上與聚類技術(shù)類似,那些沒有被聚類的點(diǎn)即是離群點(diǎn)[6]。由于泄漏檢測(cè)的原理是通過壓力的異常波動(dòng)來(lái)判斷是否發(fā)生泄漏及泄漏的位置,那么基于聚類的離群點(diǎn)挖掘技術(shù)就為泄漏檢測(cè)提供一種新的技術(shù)可能性[7]。
在輸油管道的正常運(yùn)行中,受泵流量不穩(wěn)定波動(dòng)的影響,各站壓力在無(wú)工況調(diào)整時(shí)是不斷波動(dòng)的,波幅大小不等。通過聚類進(jìn)行離群點(diǎn)挖掘可以發(fā)現(xiàn)并找出正常波動(dòng)中微小的異常波動(dòng),然后將上下站壓力的離群點(diǎn)進(jìn)行對(duì)比,并根據(jù)壓力在管道流體中的傳播速度算出最可能發(fā)生泄漏的位置。
在成品油管道正常輸送的過程中,壓力一直有小幅波動(dòng)。因此,需要在壓力小幅波動(dòng)中找到其中的異常波動(dòng),并且在第一時(shí)間發(fā)出預(yù)警信號(hào)。采用聚類技術(shù),可以按照以下順序篩選出壓力異常波動(dòng)的點(diǎn):
(1)選取某時(shí)長(zhǎng)的壓力數(shù)據(jù)(每秒取樣一次)為一個(gè)離群數(shù)據(jù)集,一般不少于60s(具體的時(shí)長(zhǎng)選取可以根據(jù)管道長(zhǎng)度等因素進(jìn)行相應(yīng)調(diào)整)。
(2)對(duì)該數(shù)據(jù)集的所有對(duì)象按K均值法進(jìn)行聚類,然后刪除最后一個(gè)數(shù)據(jù)再次按K均值方法進(jìn)行聚類。
(3)將兩次聚類的結(jié)果相減得到該數(shù)據(jù)集最后一個(gè)數(shù)據(jù)的離群點(diǎn)得分。
(4)每一個(gè)點(diǎn)都與前59個(gè)點(diǎn)(共60個(gè)點(diǎn),60s的壓力數(shù)據(jù))作為一個(gè)數(shù)據(jù)集計(jì)算它的離群點(diǎn)得分,這樣可以在每秒采樣后得到一個(gè)新的離群點(diǎn)得分。
(5)將得到的離群點(diǎn)得分與前面的數(shù)據(jù)對(duì)比(相除)得到離群系數(shù),這里采用與前60s離群點(diǎn)得分最大值進(jìn)行相除的方法。
(6)根據(jù)以往經(jīng)驗(yàn)選取2作為閾值,即若該點(diǎn)的離群點(diǎn)得分大于前60s離群點(diǎn)得分的最大值的2倍時(shí)產(chǎn)生報(bào)警。
在壓力異常波動(dòng)的情況下,泄漏檢測(cè)算法需要在第一時(shí)間發(fā)出相應(yīng)的警報(bào)信號(hào),以提醒調(diào)度員核實(shí)驗(yàn)證管道是否發(fā)生了泄漏。選取某日某管道某站收球時(shí)的壓力曲線進(jìn)行驗(yàn)證,該壓力曲線如圖1所示。從圖1可以明顯看出在收球前就產(chǎn)生了相應(yīng)的壓力小幅波動(dòng),在收球過程中發(fā)生了比之前小幅波動(dòng)更明顯的大幅波動(dòng),這種異常波動(dòng)具有與管道發(fā)生泄漏時(shí)的異常波動(dòng)類似的特性。某管道某站的壓力曲線見圖1所示。

圖1某管道某站的壓力曲線
按照前文的4個(gè)步驟用MATLAB對(duì)相應(yīng)的壓力數(shù)據(jù)點(diǎn)進(jìn)行聚類處理,得到壓力數(shù)據(jù)的離群系數(shù),這里同樣取2作為離群系數(shù)的閾值,得到的結(jié)果如圖2所示。從圖可以看到,當(dāng)?shù)谝淮螇毫?圖2中線條)發(fā)生異常小幅波動(dòng)時(shí),該算法產(chǎn)生了第一個(gè)超過閾值的離群點(diǎn),此時(shí)發(fā)出第一次預(yù)警;當(dāng)兩次壓力大幅波動(dòng)時(shí),該算法也可準(zhǔn)確判斷并給出了另外兩個(gè)超過閾值的離群點(diǎn),發(fā)揮了相應(yīng)的預(yù)警作用。某站對(duì)壓力數(shù)據(jù)進(jìn)行聚類處理的結(jié)果見圖2所示。

圖2某站對(duì)壓力數(shù)據(jù)進(jìn)行聚類處理的結(jié)果


圖3對(duì)某站進(jìn)站壓力數(shù)據(jù)進(jìn)行聚類處理的結(jié)果
為了進(jìn)一步驗(yàn)證算法的有效性,筆者在該壓力曲線后人為加入兩階段的壓力下降點(diǎn),第一階段是壓力平緩下降(每秒下降0.002 MPa),第二階段是壓力快速下降(每秒下降0.004 MPa),用來(lái)測(cè)試該算法對(duì)壓力平穩(wěn)后的波動(dòng)是否敏感。測(cè)試結(jié)果如圖4所示,在壓力平緩下降階段,產(chǎn)生了一個(gè)超過閾值的離群點(diǎn),表明算法已經(jīng)檢測(cè)到壓力的異常波動(dòng)了。同樣,在壓力快速下降的開始階段,再次產(chǎn)生了一個(gè)超過閾值的離群點(diǎn),表明該算法對(duì)壓力的快速下降同樣有效。

圖4加入壓力下降點(diǎn)后進(jìn)行聚類處理的結(jié)果
(1)傳統(tǒng)壓力報(bào)警檢測(cè)精確度只能達(dá)到0.01MPa/s,聚類算法將精確度提高到0.002 MPa/s,因此基于聚類壓力檢測(cè)報(bào)警的檢測(cè)范圍更精確,對(duì)于壓力的異常波動(dòng)更敏感。
(2)基于聚類算法的反應(yīng)迅速,從圖2和圖4可以看出,該算法的反應(yīng)速度在1s以內(nèi),即檢測(cè)到壓力異常變化就立即產(chǎn)生報(bào)警訊息。
(3)基于聚類算法在保證檢測(cè)精度高的同時(shí)也有效地避免了誤報(bào)的情況,在壓力平穩(wěn)波動(dòng)的狀態(tài)下的誤報(bào)率較低。
(4)該算法只會(huì)對(duì)一段時(shí)間內(nèi)最大的波動(dòng)敏感,在一定程度上排除了報(bào)警技術(shù)對(duì)同一壓力波動(dòng)反復(fù)報(bào)警的情況。
(5)基于聚類算法可以方便地推廣到二維和多維空間,即可以通過壓力、流量、溫度等多種因素綜合判斷泄漏的情況,并且可以方便地通過對(duì)相關(guān)參數(shù)的優(yōu)化調(diào)整實(shí)現(xiàn)該檢測(cè)算法更優(yōu)越的表現(xiàn)。
通過基于聚類的離群點(diǎn)檢測(cè)算法建立泄漏檢測(cè)系統(tǒng),檢測(cè)范圍更精確,對(duì)壓力的異常波動(dòng)更敏感,反應(yīng)速度更迅速,同時(shí)也有效避免了誤報(bào)和對(duì)同一壓力波動(dòng)反復(fù)報(bào)警的情況。雖然該算法的相關(guān)參數(shù)還有待調(diào)整優(yōu)化,但該算法可更為方便地推廣到二維和多維空間,即通過壓力、流量、溫度等多種綜合因素判斷泄漏情況,表現(xiàn)出了不同于傳統(tǒng)泄漏檢測(cè)算法的適應(yīng)能力和擴(kuò)展?jié)摿Α?/p>