











摘要:為準確識別油氣管道的缺陷類型,分析缺陷漏磁信號特征對識別精度的影響,建立了基于PCC-LPSO-BP的油氣管道缺陷識別模型。采用皮爾遜相關系數法(PCC)分析了缺陷漏磁信號特征量與缺陷尺寸間的相關程度,建立了混沌映射和萊維飛行改進的粒子群優化后的BP神經網絡識別模型即LPSO-BP模型,采用評價指標綜合比較了模型的識別效果,分析了該識別模型對各缺陷類型的識別精度以及各特征量對識別結果的影響。研究結果表明:LPSO-BP模型相較于BP模型識別精度提高了7.47%,且在現有的數據范圍內對表面剝落和裂紋的識別率達到了100%。研究結果對油氣管道缺陷識別量化具有一定的參考價值。
關鍵詞:漏磁信號;缺陷識別;皮爾遜相關系數;LPSO-BP模型
中圖分類號:TE973" " " " "文獻標志碼:A" " " " doi:10.3969/j.issn.1001-3482.2024.04.001
Research on Classification and Identification of Oil and Gas Pipeline Defects Based on PCC-LPSO-BP
HUANG Shutong,JIA Xiaoli
(College of Mechanical and Transportation Engineering,China University of Petroleum,Beijing 102249,China)
Abstract: In order to accurately identify the defect type of oil and gas pipeline and analyze the influence of the defect magnetic flux leakage signal characteristics on the identification accuracy,and the oil and gas pipeline defect identification model based on PCC-LPSO-BP was established.The Pearson correlation coefficient (PCC) method was used to analyze the degree of correlation between the characteristics of the defect magnetic flux leakage signal and the defect size,the BP neural network detection model (LPSO-BP model) optimized by particle swarm optimization based on chaos mapping and Levy flight improvement was established,the detection performance of the model was comprehensively compared by using the evaluation index,the detection accuracy of the model for each defect type and the influence of each characteristic on the detection result were analyzed.The results show that the recognition accuracy of LPSO-BP model is increased by 7.47% compared with BP model,and the recognition rate of surface spalling and cracks reaches 100% within the existing data range.The research results have a certain reference value for the identification and quantification of oil and gas pipeline defects.
Key words: magnetic flux leakage signal;defect identification;pearson correlation coefficient;LPSO-BP mode
油氣管道的完整性對其安全、穩定運行至關重要,而管道缺陷是影響管道完整性的重要因素[1-3]。因此,對管道缺陷的有效識別,有利于后續對管道運行情況和是否需要修復進行科學評價和分析。
無損檢測技術是目前管道檢測的必要手段,漏磁檢測因其有著對管道內部環境要求低、無需耦合劑、檢測速度快等特點,成為最常用的檢測技術。
近年來,隨著人工智能技術的飛速發展,機器學習在油氣行業的應用價值逐漸提高,主要體現在數據處理和決策制定等方面,推動了油氣行業的持續、高效發展。在漏磁缺陷識別方面,Mohamed等[4]提出了一種基于決策樹的方法用于缺陷分類;趙翰學等[5]利用梯度提升決策樹對缺陷信號特征量進行了分類識別;Tu等[6]提出了基于多特征融合和多機器學習模型集成的缺陷識別模型,解決了模型抗干擾能力弱的問題。以上學者的研究存在特征量較少或對某一類缺陷類型識別精度較低以及模型易陷入局部極值等問題。
本文研究主要集中在特征提取、特征選擇、搭建分類模型等方面,采用混沌映射和萊維飛行策略對粒子群算法進行改進,利用改進的粒子群優化的BP神經網絡(Logistic mapping and Lévy Flight Particle Swarm Optimization-back propagation,LPSO-BP)算法對漏磁缺陷進行分類識別,同時考慮各特征量對識別結果的影響,采用皮爾遜相關系數(Pearson Correlation Coefficient,PCC)分析特征量和與缺陷尺寸的相關程度,將LPSO-BP算法識別結果與多種機器學習模型的識別結果進行對比,分析了該識別模型對各缺陷類型的識別精度以及各特征量對識別結果的影響。研究結果可為漏磁缺陷識別方法提供參考。
1 模型原理
1.1" BP神經網絡模型
BP神經網絡作為目前應用比較廣泛的多層前饋神經網絡之一,有著較強的非線性映射能力,網絡結構如圖1所示,包括輸入層、隱含層和輸出層,每個節點都是一個神經元[7-8]。BP神經網絡分為前向和反向傳播過程,數據從輸入端輸入后,乘以對應權值再加和,將結果作為輸入在激活函數中計算,然后將計算結果作為輸入傳遞給下一個節點,直到得到最終輸出結果,其中激活函數通常選擇sigmoid函數;反向傳播過程是整個網絡中最重要的部分,能夠根據網絡的誤差,更新輸入層的權值、隱含層的權值和偏置[9]。采用BP神經網絡進行預測時,理論上只含一層隱含層的BP神經網絡即可擬合出任意連續函數,只有當函數不連續時,才需要增加隱含層的層數,而隱含層的節點個數可由經驗公式決定,其經驗公式如式(1)所示。
l=+a(1)
式中:l為隱含層節點個數;m為輸入層節點個數;n為輸出層節點個數;a為1~10之間的整數。
1.2 PSO模型
粒子群算法是一種受群集行為啟發的經常用作優化算法的計算技術。粒子群中所有粒子都在一個D維空間進行搜索,假設有n個粒子,則粒子i的位置可以表示為:Xi=(Xi1,Xi2,...,XiD)(i=1,2,...,n),速度可以表示為:Vi=(Vi1,Vi2,...,ViD)(i=1,2,...,n) [10-11]。粒子i的位置和速度更新公式分別如式(2)~(3)所示[12]。
Vit+1=ωtVit+c1r1(pbestt-Xti)+
c2r2(gbestt-Xti)(2)
Xit+1=Xti+Vit+1(3)
式中: Vit是第t次迭代粒子i的速度,通常速度會被限制在[-Vmax,Vmax];Xti是第t次迭代粒子i的位置,c1、c2是學習因子也稱為加速度常數,r1、r2是[0,1]之間的兩個隨機數,以增加搜索的隨機性,ω是慣性權重,調節對解空間的搜索能力,pbestt,gbestt分別為粒子i的最佳適應度值的位置和全局粒子的最佳適應度值的位置。
由于粒子群算法種群分布有很強的不確定性,容易發生早熟收斂,陷入局部極值等,本文引入Logistic混沌映射和萊維飛行機制對粒子群算法進行改進,模型結構如圖2所示。
采用混沌變量對粒子群群體進行隨機初始化,增加粒子群體的多樣性,且利用混沌映射的特性可對算法初始化進行優化搜索,使其跳出局部最優解,并保持群體的多樣性。Logistic映射的定義形式如下[13]:
Xn+1=μXn(1-Xn),Xn∈(0,1)(4)
式中: μ為分支函數,且當3.569 945 6μ≤4時,Logistic映射才具有混沌性質。
通過引入萊維飛行的思想,利用萊維分布對粒子群個體位置進行調整來更新粒子狀態,可以提高搜索精度,幫助粒子群個體跳出局部最優。萊維分布是一種具有長尾分布特性的隨機分布,可以在搜索空間中產生更大的步長,可以增加全局搜索能力。萊維分布被定義為[14]:
LPSO-BP模型流程如圖3所示。
1.3 皮爾遜相關系數(PCC)
由于漏磁信號數據中可提取特征較多,本文采用皮爾遜相關系數法對多個特征進行分析,根據特征量與缺陷尺寸之間相關系數的大小判斷各參數間的關聯強弱,皮爾遜相關度等級如表1所示。皮爾遜相關系數是衡量兩個變量相關程度的一種統計學方式,用協方差與方差的商來表示[15],如式(6)所示。
2 數據獲取及特征提取
2.1 數據獲取
由于管道漏磁檢測實驗準確系統的數據不易獲取,本文漏磁信號數據通過COMSOL軟件建立缺陷檢測仿真模型獲得,為驗證所建模型的準確性,通過實測信號與模擬信號進行對比,其中實測信號來源于Usarek等公開的漏磁檢測原始信號[16-17],經過處理之后得到深度為2 mm裂縫缺陷的實測信號,實驗信號與模擬信號的對比結果如圖4所示。由圖4可知,本文模擬信號與參考文獻[17]中實驗信號數值基本相符,且曲線變化趨勢一致,由此表明本文所建模型可靠性較高,結果可信。
本文所建模型中金屬損失缺陷類型包括凹坑、穿孔、表面剝落、周向裂紋和軸向裂紋,得到的缺陷漏磁信號數據共180組。由于缺陷漏磁信號的周向分量沒有明顯的信號特征,因此本文選取徑向分量信號和軸向分量信號進行研究,部分漏磁信號如圖5所示。
2.2 特征選擇及特征參量提取
在對缺陷漏磁信號的軸向分量和徑向分量進行預處理后,提取出每個分量的特征,包括峰谷值、峰谷間距、信號波形面積、信號能量共8個特征,如圖6。
1) 峰谷值: 軸向分量的Bx和徑向分量的Bz。
2) 峰谷間距:包括軸向分量的Dx和徑向分量的Dz。
3) 信號面積:包括軸向分量的Sx和徑向分量的Sz。
4) 信號能量:包括軸向分量的Ex和徑向分量的Ez。公式為:
E=B2(7)
3 結果分析
首先對所提取特征量與缺陷尺寸間的相關性進行分析,確保提取特征量與缺陷尺寸具有強相關性;然后分別將提取特征量和缺陷類型作為模型輸入和輸出,利用評價指標對比了本文缺陷識別模型與其余5種模型的識別結果;最后對本文的缺陷識別模型識別結果做具體分析,如圖7所示。
3.1 皮爾遜相關系數分析
將缺陷的軸向尺寸參數和徑向尺寸參數作為參考數列,軸向分量和徑向分量的8個特征量作為比較數列,分別計算各特征量與缺陷軸向、徑向尺寸參數的相關程度,結果如圖8所示。由圖8可知,按照皮爾遜相關系數的相關度等級,8個特征與缺陷尺寸參數的相關程度均為強相關,且兩個分量的峰谷值、峰谷間距特征量與缺陷尺寸的相關性最大,波形面積和信號能量特征量與缺陷軸向、徑向尺寸均有一定的相關性,與軸向尺寸的相關性略低。因此,由以上分析可知,本文所提取的特征量均可作為缺陷識別的輸入以提高結果的可信度。
3.2 多模型比較分析
首先,將數據庫中的缺陷樣本按7∶3的比例隨機分為訓練樣本和測試樣本。為了檢驗不同模型的分類效果,本文采用準確率、精準率、召回率和F1分數來評估分類模型。準確率表示預測正確的樣本數與總樣本數的比值;精準率表示被預測為正的樣本中實際為正的樣本的概率;召回率表示實際為正的樣本中被預測為正樣本的概率;F1分數表示精準率和召回率的加權調和平均,分別如式(7)~(10)所示。
Accuracy = (7)
Precision = (8)
Recall = (9)
F1-score = (10)
式中:TP為預測正確的正類樣本數;TN為預測正確的負類樣本數;FP為預測錯誤的正類樣本數;FN為預測錯誤的負類樣本數。
為了驗證LPSO-BP模型的準確性和可靠性,將其與K最近鄰算法(k-Nearest Neighbor,KNN)、決策樹(Decision Tree,DT)、支持向量機(Support Vector Machine,SVM)、BP神經網絡、PSO-BP神經網絡5種機器學習方法進行對比。使用的六個分類模型的測試結果如圖9所示,LPSO-BP的四項評價指標均為最高且均超過96%,其次是SVM模型,識別率和召回率均超過了94%。BP模型的識別準確率與KNN模型相同,但召回率、精準率和F1分數略低于KNN模型,說明BP模型的錯誤識別樣本較為分散,而KNN模型錯誤識別的樣本集中在一種或幾種缺陷類型。LPSO-BP模型相較于BP模型和PSO-BP模型,準確率分別提高了7.47%、3.77%,這是因為BP神經網路模型的初始權值和閾值都是隨機生成的,不一定是最佳值且容易陷入局部最優解,還容易出現過擬合的情況,經過改進的粒子群算法優化之后,幫助BP模型尋找到最優的權值和閾值,使得輸入與輸出之間有更完美的映射關系,以此提升了預測精度。
3.3 LPSO-BP模型的應用
為了評估LPSO-BP模型對不同類型缺陷的識別能力,在20個粒子迭代100次的基礎上連續進行多次識別測試。如圖10所示為不同類型缺陷的樣本識別結果的評價指標。不同缺陷類型樣本識別結果的精準率、召回率和F1分數均在0.8以上,總體評價指標均超過0.95,且表面剝落、周向裂紋和軸向裂紋的精準率、召回率和F1分數均達到1,說明LPOS-BP模型對缺陷的識別效果整體較好,且容易識別表面剝落、周向裂紋和軸向裂紋缺陷,對凹坑和穿孔型缺陷的識別能力稍遜于前者。
模型的識別精度與數據樣本的質量也有很大關系,因此不同的參數在算法識別中可能具有不同的重要性。為了分析輸入的特征類型對識別精度的影響,將8種特征量視作4種,即將軸向分量和徑向分量所提取的相同名稱的特征量視作同一特征量,得到峰谷值、峰谷間距、波形面積和信號能量4種特征量,對4種特征量進行參數排列,構建了15種參數組合形式,如圖11所示,其中類別1表示組合中包含此特征量,類別0表示組合中不包含此特征量。
使用LPSO-BP模型訓練不同的特征量組合,以獲得不同特征量模型的分類性能,每組模型測試重復5次。如圖12所示為識別結果的箱線圖和平均準確率變化曲線。Y表示具有此類特征量的組合識別精度,N表示沒有此類特征量組合的識別精度。由圖12可知,不同特征量組合的識別準確率為72.7%~98.8%,且輸入特征量包含峰谷值時,識別準確率最高可達到98%以上。值得注意的是,在四個特征量中,只有峰谷間距特征量被包含在組合中的識別精度均值低于不包含的識別精度均值,這是因為當輸入特征值只有峰谷間距時,模型對缺陷的識別精度不足60%,導致包含峰谷間距組合的識別精度均值
較低,說明峰谷間距特征量不適合作為識別模型的單特征量輸入。除此之外,不包含峰谷值或波形面積特征量組合的模型識別精度均值最低,相較于包含峰谷值或波形面積特征量的組合,模型識別精度均值降低超過10%,說明峰谷值和波形面積對缺陷識別起著至關重要的作用。
如圖13所示為LPSO-BP模型識別結果與輸入特征量數量間的關系。由圖13可知,隨著輸入特征量數量的增加,識別精度從不足80%逐步提高到96.82%,同時識別結果的分布范圍逐步減小。由以上分析可知,所有特征量對模型識別結果均有影響,樣本中包含的特征量類型越多,越有利于模型識別,且識別結果越穩定。
4 結論
本文提出了一種基于LPSO-BP的管道缺陷分類識別模型,通過引入混沌映射和萊維飛行策略,改進了PSO算法。利用仿真模擬獲取了缺陷漏磁信號,將本文的模擬信號與文獻[17]實驗信號進行對比表明了模擬信號的可信度,分別將缺陷漏磁信號的特征量、缺陷類型作為作為模型的輸入和輸出對管道缺陷識別模型進行訓練,得到了模型對缺陷的識別結果,得到以下結論:
1) 通過PCC分析方法可知,缺陷漏磁信號軸向分量和徑向分量的峰谷值、峰谷間距、波形面積和信號能量特征量均與缺陷尺寸參數強相關,且峰谷值、波形面積和信號能量特征量與缺陷徑向尺寸相關性較大,峰谷間距特征量與缺陷軸向尺寸相關性較大,該結論對缺陷識別與量化均有一定的參考意義。
2) 利用機器學習技術對缺陷進行分類是一種高效的方法,當使用從原始信號中提取的特征進行訓練時,將LPSO-BP模型與5種機器學習模型進行對比,其識別結果的準確率、精準率、召回率和F1分數均優于其余5種模型,尤其相較于BP模型識別精度提高了7.47%,表明LPSO-BP模型對數據的處理能力和模型的泛化能力更強。
3) LPSO-BP模型對缺陷識別精度整體較高,5種缺陷類型的識別評價指標均超過80%,且更容易識別表面剝落、周向裂紋和軸向裂紋缺陷,對凹坑和穿孔缺陷的識別精度有待提高。
4) 不同特征量作為輸入對LPSO-BP模型的識別精度有較大影響,尤其是峰谷值和波形面積兩個特征量,有峰谷值或波形面積特征量作為輸入相較于沒有的識別精度提升近10%,且隨著輸入特征量的增加,模型的識別精度和穩定性均呈上升趨勢。
參考文獻:
[1] Lang X,Han F.MFL Image Recognition Method of Pipeline Corrosion Defects Based on Multilayer Feature Fusion Multiscale GhostNet[J].IEEE Transactions on Instrumentation and Measurement,2022,71: 1-8.
[2] 馬云路,鄭堅欽,梁永圖.基于特征提取的輸油管道泄漏系數預測[J].中國安全生產科學技術,2022,18(10):130-135.
[3] Parlak B O,Yavasoglu H A.A Comprehensive Analysis of In-Line Inspection Tools and Technologies for Steel Oil and Gas Pipelines[J].Sustainability,2023,15(3): 2783.
[4] Mohamed A,Hamdi M S,Tahar S.Decision tree-based approach for defect detection and classification in oil and gas pipelines[C]//Proceedings of the Future Technologies Conference (FTC) 2018: Volume 1.Springer International Publishing,2019: 490-504.
[5] 趙翰學,張咪,郭巖寶,等.基于機器學習的管道金屬損失缺陷識別方法[J].石油機械,2020,48(12):138-145.
[6] Tu F M,Wei M H,Liu J.A coupling model of multi-feature fusion and multi-machine learning model integration for defect recognition[J].Journal of Magnetism and Magnetic Materials,2023,568: 170395.
[7] Zhang J,Hou X,Liu S,et al.New Data-Driven Method for In Situ Coalbed Methane Content Evolution: A BP Neural Network Prediction Model Optimized by Grey Relation Theory and Particle Swarm[J].Energy amp; Fuels,2023,37(14): 10344-10354.
[8] 楊彩霞,張錦,陶志勇,等.基于PSO改進BP神經網絡算法的金屬表面缺陷分類[J].制造業自動化,2018,40(7):5-7.
[9] 陳超,張興媛,陸思燁.基于優化BP神經網絡激光超聲表面缺陷識別[J].激光與光電子學進展,2021,58(22):505-515.
[10] Shami T M,El-Saleh A A,Alswaitti M,et al.Particle swarm optimization: A comprehensive survey[J].IEEE ccess,2022,10: 10031-10061.
[11]" Gong Y J,Li J J,Zhou Y,et al.Genetic learning particle swarm optimization[J].IEEE transactions on cybernetics,2015,46(10): 2277-2290.
[12]" 吳遠燈,劉少胡,馬衛國.基于GRA-PSO-BP的連續管疲勞壽命預測研究[J].中國安全生產科學技術,2023,19(6):135-142.
[13]" 王娟,秦江濤.混沌映射與t-分布變異策略改進的海鷗優化算法[J].計算機應用研究,2022,39(01):170-176+182.
[14]" 鄭潔鋒,占紅武,黃巍,等.Lévy Flight的發展和智能優化算法中的應用綜述[J].計算機科學,2021,48(2):190-206.
[15]" 陶洋,祝小鈞,楊柳.基于皮爾遜相關系數和信息熵的多傳感器數據融合[J].小型微型計算機系統,2023,44(5):1075-1080.
[16]" Usarek Z,Chmielewski M,Piotrowski L.Reduction of the velocity impact on the magnetic flux leakage signal[J].Journal of Nondestructive Evaluation,2019,38: 1-7.
[17]" 劉真偉,韓文花,楊婷.一種快速計算二維缺陷漏磁場的有限元建模和求解方法[J].儀器儀表學報,2023,44(2):192-202.
收稿日期: 2023-12-12
基金項目: 國家自然科學基金(11872377,11402309);中國石油大學(北京)自然科學基金(2462020XKJS01)。
作者簡介: 黃書童(1997-),男,博士研究生,主要從事石油管道檢測相關研究,E-mail :260376884@qq.com。
通信作者: 賈曉麗(1980-),女,教授,主要從事智能機器人及檢測技術、智能傳感與驅動相關研究,E-mail :xljia@cup.edu.cn。