孫磊峰,張姝慧,時二偉
(國家管網西部管道蘭州輸氣分公司,甘肅 蘭州)
分布式光纖振動傳感系統對油氣管道沿線的振動信號進行采集分析,能夠作為油氣管道安全監測的重要手段。油氣管道的敷設環境復雜多樣,在途徑公路以及人員活動頻繁的區段,光纖振動傳感系統極易受到強噪聲背景、多源干擾及未知地埋條件的影響,系統對目標事件檢測識別的準確率成為制約其規模及應用的最大技術瓶頸。
油氣管道光纖振動信號分析,通常采用的方法為設計時域和頻域特征計算方式,再利用計算的特征數值進行模式識別[1-2],然而對于不同區域的光纖振動信號采用固定的人工設計特征計算方式,缺乏一定的靈活性。本文對油氣管道周邊常見的威脅信號和非威脅信號進行了分析,并對基于機器學習模型的多維信號檢測識別算法進行了探究。
在油氣管道周邊存在的各類挖掘動土施工都可能對油氣管道造成破壞,威脅油氣管道的安全。而常見的干擾源主要有:公路、鐵路、農耕機械作業,分析收集到的各種振動信號樣本庫,對單個探測單元接收的一維信號進行時域和頻域的分析比對,可以看出,其主要可以包含的振動模式有“沖擊”模式和“機械振動”模式。“沖擊”模式指時域信號具有明顯的規律性,“機械振動”模式指時域信號振動幅值相對其鄰近點區域較大但不具有規律性;而從頻域觀察,“沖擊”模式和“機械振動”模式均具有高頻成分明顯提升的特點。不同類別的振動信號,其模式構成可做如下概括,見表1。
通過對數據庫的分析比對發現,挖掘機作業、破路機作業與火車經過、重型車輛行駛、工廠作業、農耕機械作業、農田灌溉機械等信號均包含“沖擊”模式和“機械振動”模式;人工挖掘與放牧動物群經過等信號主要包含“沖擊”模式;挖溝機作業、破路機作業、盾構機作業主要包含“機械振動”模式。對管道和其伴行光纖真正具有威脅性的幾種作業行為,主要為多種機械作業行為,其振動信號所包含的模式成分并不一致,而幾種干擾信號卻含有與挖掘作業信號相似的激勵成分。因此,如果僅僅依靠對單個監測單元信號提取固定的人工設計的特征參數,是很難對干擾振動進行有效區分的,所以,需要利用時間和空間上的信號分布做出更為嚴密的模型進行分析判斷,再結合深度學習算法,提高監測系統的識別和報警效果。
依據分布式光纖振動傳感系統的每個探測單元各自的一維信號提取的人工設計特征,當管道周邊出現新的振動源或者地理環境發生變化時,可能需要進行特征提取方式的再次設計,對于區分管道周邊出現的各種威脅性和非威脅性的振動源,缺乏一定的靈活性,需要進一步結合深度學習算法,對振動信號進行類型識別。從時間維度而言,應從傳統人為經驗的特征提取方式到深度學習網絡特征提取方式進行探究。從時頻、時空等多維度信息而言,可從基于機器學習模型的多維信號檢測識別算法進行探究。
卷積神經網絡CNN 廣泛應用于圖像處理領域,而分布式光纖振動傳感系統的每個探測單元采集的振動信號,實質上為1D 信號。目前研究中,對1D 信號如語音、振動信號進行處理分析時,主要有三種思路[3-5]:一是將1D 信號通過某種變換轉化為圖像,如將原始光纖振動信號進行短時傅里葉變換得到時頻圖,再利用CNN 對時頻圖進行學習和分類;二是利用1D-CNN 處理振動信號,直接輸入1D 數據,基于1D-CNN 神經網絡,對一維的光纖振動數據進行特征的提取和類型的識別;三是結合CNN 與BiLSTM 網絡,先用1D-CNN提取時間序列的信號特征,再利用BiLSTM 網絡實現信號分類。
本文基于從多個現場應用項目長期運行收集和整理得到的信號樣本數據庫,對以上三種CNN 應用思路進行探究,并從識別準確性和計算性能等方面進行了比較。
時頻分析計算步驟:
(1) 對于單個光纖監測單元的振動探測信號,以長度為256 的窗函數,重疊數據點數200,按時間順序進行滑動截取;
(2) 對于每次窗口中截取得到的數據序列,依次進行快速傅里葉變換(fft),并記錄本次計算得到的頻譜數據序列;
(3) 將窗口滑動過程中每次計算得到的頻譜數據序列,進行拼接,得到時頻分析矩陣,時頻分析矩陣的橫軸為頻率,縱軸為時間。
經過以上計算步驟,將振動信號時頻圖作為原始的輸入圖片,輸入到LeNet-5 卷積神經網絡,采用LeNet-5 卷積神經網絡進行信號區塊的模式識別。
CNN 可以很好地識別出數據中的簡單模式,然后使用這些簡單模式在更深的層中生成更復雜的模式。本文采用的1D CNN 模型描述如下:
輸入數據:原始數據采樣率400 Hz,每條樣本記錄時長為20 s,數據經過解調預處理后,每條數據樣本中包含有8 000 個采樣點,得到一個8 000×1 的矩陣。
第一個1D CNN 層:卷積核大小設置為400,濾波器數量設置為80。輸出矩陣7 601×80。
第二個1D CNN 層:卷積核大小設置為400,濾波器數量設置為80。輸出矩陣7 202×80。
第一個池化層:池化層大小設置為5,步幅stride設置為1。輸出矩陣1 440×80。計算區域中的最大值作為池化后的值,即最大池化層。
第三個1D CNN 層:卷積核大小設置為720,濾波器數量設置為60。輸出矩陣721×60。
第四個1D CNN 層:卷積核大小設置為720,濾波器數量設置為60。輸出矩陣2×60。
第二個池化層:池化層大小設置為2,步幅stride設置為1。輸出矩陣1×60。計算區域中的平均值作為池化后的值,即平均池化層。
Dropout 層:比率設置為0.6,輸出矩陣1×60。
Softmax 層:將長度為60 的向量降為長度為12 的向量,因為此時有12 種事件類別需要進行識別。
結合CNN 與BiLSTM 的網絡,提出了一種基于CNN-BiLSTM 的分布式光纖振動傳感時空信號特征提取與識別方法。CNN 網絡從一維時序光纖振動信號中自動提取和生成模式特征,BiLSTM 網絡結合時序振動模式特征的空間分布信息,對分布式光纖振動傳感系統采集的激勵振動信號進行類型識別。
CNN 與BiLSTM 網絡結合的分布式光纖振動信號特征提取和模式識別的方式,在有效利用了分布式光纖振動信號空間維度信息的同時,能夠自適應的提取到光纖振動信號的模式特征,避免了人工設計固定特征計算方式復雜度高、靈活性低的問題,對于處在不同的土質、濕度、埋深等地理環境的光纖振動信號,都能夠進行有效的特征提取以及類型識別,在工程應用中,能夠有效的降低在工程部署實施階段的系統配置復雜度,并能夠在長期運行階段,根據新出現的各種外界激勵,加入系統的訓練樣本數據庫,進行持續的自適應優化,確保油氣管道安全監測系統的監測效果,具有明顯的技術優勢。
基于從多個現場應用項目長期運行收集和整理得到的信號樣本數據庫,使用十折交叉驗證方法,對上述三種算法模型進行測試,其分類準確性統計如圖1 所示。基于CNN 的振動信號時頻圖特征提取和識別準確率約為91.1%,基于1D-CNN 的振動信號特征提取與識別準確率約為95.5%,基于CNN-BiLSTM 的時空信號特征提取與識別準確率約為95.6%。三種模型的識別準確率均>90%,1D-CNN 和CNN-BiLSTM 的識別準確率相近,均高于CNN-時頻圖方法。

圖1 三種模型十折交叉驗證正確率統計
不同模型識別單個振動信號樣本的平均計算耗時如圖2 所示。基于CNN 的振動信號時頻圖特征提取和識別平均計算耗時約0.010 2 s,計算數據為每個振動信號樣本中具有最大幅值的探測單元數據;基于1D-CNN 的振動信號特征提取與識別平均計算耗時約0.005 6 s,計算數據為每個振動信號樣本中具有最大幅值的探測單元數據;基于CNN-BiLSTM 的時空信號特征提取與識別平均計算耗時約0.006 3 s,計算數據為每個振動信號樣本中幅值超過全體數據中值的探測單元數據。其中,CNN-時頻圖方法計算耗時最長,CNN-BiLSTM 比1D-CNN 模型的運行時間略長,但三者均滿足實時監測的要求。

圖2 三種模型計算耗時統計
本文對油氣管道周邊常見的威脅信號和非威脅信號進行了分析,并對基于機器學習模型的多維信號檢測識別算法進行了探究。由于管線周邊出現的信號源復雜多樣,僅依靠對單個監測單元信號提取人工設計的特征參數很難對具有威脅性的振動源進行有效區分,利用深度學習算法模型,自動提取振動信號特征,對振動信號的時間和空間特征分布進行更為靈活和嚴密的分析,避免人工設計的固定特征對不同的環境自適應差的問題,進一步提升信號特征信息提取的全面性、有效性。并基于從多個現場應用項目長期運行收集和整理得到的信號樣本數據庫,對CNN-時頻圖方法、1D-CNN 和CNN-BiLSTM 等三種CNN 應用思路進行了探究,并從識別準確性和計算性能等方面進行了比較。經過測試結果的統計分析,三種模型的識別準確率均>90%,1D-CNN 和CNN-BiLSTM 的識別準確率相近,均高于CNN-時頻圖方法。在計算耗時方面,CNN-時頻圖方法計算耗時最長,CNN-BiLSTM比1D-CNN 模型的運行時間略長,但三者均滿足實時監測的要求。