孫啟昌,易亞男
(1.中石化石油工程設計有限公司,山東東營 257026;2.樸牛(上海)科技有限公司,上海 200241)
管道的腐蝕、焊口缺陷、外力作用等很多種情況都會導致管道泄漏。相較于長輸管道和燃氣管道,高含硫氣田酸氣集輸管道具有H2S 含量高、管道并行交叉多、內檢測受限、第三方破壞風險高等特點[1-2]。酸性氣體的泄漏極易造成周邊人員傷亡,因此對酸性氣體管道的實時健康監控勢在必行。
現代管道監測系統集成了電子技術、傳感技術、精密技術、光學技術、計算機及其軟件技術、信息處理技術、通信技術等[3]。光纖傳感技術起源于上世紀六七十年代,當光纖受到外界因素變化的影響,會引起光強度、光相位等的變化,因此光纖傳感技術被廣泛應用于各種管道的運行狀態監控[4-5]。
針對上述酸性氣體管道健康監控問題,采用小波包分解提取能量特征,并用神經網絡作為分類器的方法,能夠很好地區分不同的信號,并用大量的測試數據驗證了模型的可靠性。
DAS 系統基于相干瑞利散射原理,利用光纖對聲音(振動)敏感的特性,當外界振動作用于傳感光纖時,光纖的折射率、長度將產生微小變化,導致光纖內傳輸信號的相位變化,通過檢測振動前后信號的相位變化,即可實現振動事件的探測,并具備多振動事件同時精確定位的功能[6-8],該技術被廣泛應用在健康監測領域[9-10]。試驗中當氣體管道發生損壞時,管道內外的壓力差使管道破損處的氣體發生振動,導致光纖發生相應的相變,從而達到監測定位的需求。
所用酸性氣體管道為H2S 氣體管道,考慮到H2S泄漏會對實驗人員以及環境造成損害,氮氣和H2S氣體的密度接近,在發生泄漏時的聲學特征相似,且氮氣較為環保,因此在設計試驗時,將H2S 氣體換成了氣體密度接近的氮氣。
分別采集酸性氣體管道在三種狀態下的信號,分別是無擾動的正常狀態下的正常信號、管道泄漏狀態下的泄漏信號、基于挖掘機挖掘的第三方入侵狀態下的第三方入侵信號,三種信號的標簽分別為1、2、3。試驗采用樸牛(上海)科技有限公司研發的HiFi-DAS 分布式光纖傳感器,采樣率為4 000 Hz,0.5 m一個通道,共120個通道。圖1所示為HiFi-DAS系統原理框圖。圖2-4為三種信號的差分信號波形圖。

圖1 HiFi-DAS系統原理框圖

圖4 第三方入侵信號差分波形圖
從三種差分信號波形圖可知,當管道發生擾動時,其差分信號的幅值明顯增大,但泄漏信號和第三方入侵信號的差分信號波形圖無明顯的區別。
酸性氣體管道一般為埋地管道,在內外壓差的作用下,其產生的聲音信號為非線性、非平穩信號。為了確保能夠提取到在復雜背景環境下的有效信息,采用小波包分解方法對采集到的三種差分信號進行分析。
小波包分解在分析非平穩信號方面具備優勢,其自適應能力可以將信號分解到合適的頻段,達到時頻分辨效果[11-12]。采用小波包三層分解,分解樹圖如圖5 所示。

圖5 小波包分解樹圖
信號經過小波包分解之后,各個子頻攜帶了原始信號的能量。提取小波包分解的第三層各個子頻的能量作為特征。提取的三種不同工況的典型樣本的特征如表1 所示。

表1 小波包分解第三層能量
將表1 的數據以折線圖形式展現,如圖6 所示。

圖6 小波包分解第三層能量折線圖
觀察圖6 可發現,正常信號在整個頻率范圍內能量都比較穩定,波動較小。泄漏信號和第三方入侵信號在低頻段能量較小,高頻段能量較大。但泄漏信號在E3-6頻段達到能量最大值,在E3-7頻段能量下降。將第三層小波包分解的能量組成特征向量T=[E3-0,E3-1,E3-2,E3-3,E3-4,E3-5,E3-6,E3-7]。三種信號在不同的頻段有不同表現,可據此特征向量進行模式識別。
觀察圖6 可發現,特征向量中的特征并不是每個都對分類有作用的。特征向量中存在相關特征,也存在無關特征,因此需要對特征向量中的特征進行選擇,減少特征既可加快訓練速度,也減少了模型的復雜度,避免過擬合,提高模型的泛化能力[13-14]。
用卡方檢驗的方法對特征進行選擇。卡方檢驗的思想是通過觀察值和理論值之間的偏差來判斷理論值的正確率。以觀察值與期望的差距構建統計量:
其中,Ai表示觀察頻數(即觀察值),Ni表示期望頻數,x為卡方值,k為特征總數。
據此方法對上述特征向量T=[特征0,特征1,特征2,特征3,特征4,特征5,特征6,特征7]中的八個特征進行篩選,得出八個特征的得分和P-values,如圖7 所示。得分越高,該特征越重要,P-values 值越小,該特征越重要。

圖7 卡方檢驗的特征選擇結果
圖7(a)中特征0 的得分最高,對應特征向量中的E3-0;特征1 得分最低,特征1 到特征7 得分依次遞增。圖7(b)中特征1 的P-values 值遠大于其余七個特征,剩余七個特征的P-values 值較接近于1。綜上所述,八個特征中,特征1 是無關特征,其余七個特征為相關特征。刪除特征1 后,重新組成新的特征向量T=[E3-0,E3-2,E3-3,E3-4,E3-5,E3-6,E3-7],使用新的特征向量進行模式識別。
BP 神經網絡是一種多層的前饋網絡。這種網絡通過信號的正向傳播以及誤差的反向傳播兩個過程來對數據進行訓練[15-16]。諸多學者證明,只需一個包含足夠多神經元的隱層,多層前饋網絡就能以任意精度逼近任意復雜度的連續函數。文中選擇三個隱藏層的神經網絡結構。
BP 神經網絡將數據分為訓練集和測試集,三種信號分別選取9 000 個樣本并提取其特征向量作為訓練集,1 000 個樣本提取特征作為測試集。由于是分類任務,使用準確率和損失函數來展示訓練過程,損失函數使用的是交叉熵損失函數。BP 神經網絡訓練過程可視化如圖8 所示。

圖8 BP神經網絡結果評價
從圖8 可以看出,BP 神經網絡模型訓練集分類的準確率達到了99.5%,訓練損失為0.559,且測試集準確率較穩定,損失函數的值也較低。
為驗證該模型的泛化能力,三種信號分別重新采集1 000 個樣本進行分類測試。圖9 為驗證樣本的混淆矩陣。

圖9 驗證集混淆矩陣
觀察圖9 可發現,3 000 個樣本分類準確率為97%,異常狀況檢出率為99.4%。正常信號分類錯誤25 個;泄漏信號分類錯誤30 個;第三方入侵信號分類錯誤34 個。在驗證樣本上,三種信號分類準確率較高,誤報率較低,可認為該分類模型可用于酸性氣體管道的健康監控。
針對非線性、非平穩的聲音信號,提出基于小波包分解的能量特征提取,并用卡方檢驗的方法挑選相關特征,具有較高的區分度,為快速準確地檢測出管道是否正常運行奠定了基礎。所用的三個隱藏層結構的BP 神經網絡也能夠較好地適用于酸性氣體管道聲音信號的模式識別,在測試集上三種信號的分類準確率也達到99.5%。該方法在驗證樣本中三種信號分類準確率達到97%以上,誤報率均在4%以下,表現略差于測試集,考慮是訓練樣本較少的原因,后續可增加訓練樣本數量。
文中采用的光纖與管道之間的距離是固定的。后續可增加不同鋪設距離、不同鋪設角度對采集信號的影響,進而確定出較適合酸性氣體管道健康監控的光纖傳感器鋪設方法。