










摘 "要""為解決油田注水管網泄漏診斷機器學習方法準確率不高的問題,基于數據驅動模型結合遷移學習的思路,提出一種油田注水管網泄漏診斷方法。研究結果表明:通過Epanet軟件可在已知故障數據的基礎上對泄漏故障進行模擬以實現數據增強;經過遷移學習的預訓練和二次訓練后,對數據驅動模型的準確率進行對比,5種模型中CNN卷積神經網絡模型為最佳解決方案,其注水管網泄漏診斷準確率可達94.12%。
關鍵詞""注水管網 "泄漏診斷 "數據驅動模型 "遷移學習 "卷積神經網絡 "數據增強
中圖分類號""TQ055.8+1""""""""""""""""""文獻標志碼 "A""""""""""""""""""文章編號 "0254-6094(2024)06-0000-00
DOI:10.20031/j.cnki.0254-6094.202406005
油田注水管網是油田注水系統中連接注水站、配水間和注水井的紐帶,一旦管網節點發生泄漏,將造成油井欠注,直接影響油田生產,同時也會給環保帶來巨大壓力。在人工排查方法存在定位不明確、效率低下的背景下,文獻[1~3]通過建立漏損定位模型,以不同的優化算法對漏損定位模型進行求解,得到了漏損點大致位置;文獻[4,5]采用不同降噪算法對城市供水管網中傳感器的壓力波進行分析,極大地縮小了漏損檢測區域。但上述方法需要大量的傳感器實時監測,對于油田注水管網系統而言,會極大地增加油田的生產成本。近年來,隨著計算機算力的提升和人工智能數據驅動模型的發展,文獻[6~8]提出了通過收集泄漏故障數據后訓練數據驅動模型從而對供水管網、供熱管網進行漏損定位診斷的方法,但是該方法需要大量的訓練數據才能保證診斷精度;文獻[9~11]通過搭建實驗臺模擬故障,收集實驗數據,較好地實現了數據增強,但是其實際應用的準確率不高,無法滿足油田注水管網漏損診斷準確率達85%的需求。
為此,筆者提出一種以實測數據為基礎,以模擬數據集實現少量實驗數據的數據增強技術,并基于數據驅動模型加遷移學習的方法提升油田注水管網泄漏診斷精度。該方法通過導入有限的油田注水系統實際數據進行二次訓練后,可用于油田注水管網的精確泄漏診斷。
1 "技術路線
基于數據驅動模型加遷移學習的油田注水管網泄漏診斷方法的技術路線如圖1所示。首先搭建多源環狀注水系統實驗臺,設置最佳壓力檢測點,然后進行泄漏實驗并收集實驗數據,將實驗數據劃分為訓練集和測試集。接著,通過Epanet軟件模擬實驗泄漏,獲取模擬數據集。通過模擬數據對模型進行遷移學習預訓練,使得模型學習到最基本的管網泄漏診斷機理,然后用實驗數據對模型進行遷移學習二次訓練,微調模型的權重參數。最后對預訓練模型和二次訓練后的模型進行測試。
根據測試結果,如果遷移學習二次訓練后的模型的準確率低于、等于或者沒有遠遠高于預訓練模型的準確率,則說明該方法不合適或需要改進;如果二次訓練后的模型的準確率遠高于預訓練模型的準確率且符合工程要求,則說明遷移學習成功。
2 "實驗數據和模擬數據集的獲取
2.1""模擬實驗臺的構建
搭建管網泄漏模擬實驗臺,節點布置如圖2所示。該實驗臺體現了油田常用的多源環狀注水系統結構。該模擬注水系統由2個注水站、12口注水井和連接管線組成。注水站提供水源和壓力,配水間分配水源,注水井用水。其中,節點1~12為注水井節點,節點13、14為注水站節點,節點15~31為實驗時的泄漏節點。
圖3為注水系統實驗裝置實物圖,其中注水站由離心泵和儲水桶組成,離心泵額定功率890"W,揚程70"m,額定流量8.0"L/min,儲水桶容量20"L。注水井的模擬主要由減壓閥和開關組成,用于實現注水井所需的流量和壓力,每個注水井配備一個壓力檢測表,量程為0.0~0.4"MPa。管網分為上下兩層:上層為注水管網,每段管線主要由兩段長為0.15"m、內徑為15"mm的304不銹鋼管,一個三通雙開關分水閥和一個4分外絲活接組成,其中三通雙開關分水閥長為0.10"m、內徑為15"mm,用于模擬管段的泄漏;下層管網為回水管網,用于收集實驗用水,避免水資源的浪費。
2.2""基于Epanet的注水系統模擬
為避免小型模擬實驗系統的局部水頭損失對實際注水系統流動和水力特性的影響,將局部水頭損失等效為一定長度管道的沿程水頭損失,計算式如下:
其中,
為等效長度,d為鋼管內徑,
為局部阻尼系數,g為重力加速度,C為海曾-威廉粗糙系數,l為謝才系數。
表1為部分管段的局部阻尼系數和等效長度。
2.3""壓力監測點的設定
油田注水系統相對龐大,節點眾多且連接復雜,工業場景中并不可能在每個節點上都布置壓力傳感器。實際上,傳統的壓力布置點方法是根據人工經驗進行布置的,往往不能反映整個管網的運行狀態。文中通過引入影響系數模型[12]對注水系統進行模擬壓力監測。影響系數模型如下:
其中,
和
為節點
流量變化前節點
與節點
的壓力值;
和
為節點
流量變化后節點
與節點
的壓力值;
為節點
流量變化時對節點
的影響大小。
利用MATLAB語言和開源工具箱Open"Water"Analytics對Epanet軟件進行二次開發,通過編寫代碼求解影響系數矩陣,設置節點變化的流量為總流量的2%。得到的前4個最佳壓力檢測點依次為節點10、節點11、節點7、節點2。
2.4""實驗數據與模擬數據的收集
開展泄漏實驗時,設置管段泄漏節點的流量分別為1.0、2.0、2.5、3.0 L/min,共17個管段,可收集泄漏數據68組,加上一組沒有泄漏點的正常數據共計69組。將泄漏流量為2.5"L/min的17組數據作為測試數據。
在實驗數據的基礎上采用Epanet軟件仿真管網泄漏,每個泄漏節點的流量設置為0.5、1.0、1.5、2.0、2.5、3.0、3.5"L/min。總計得到泄漏實驗數據119組及1組正常實驗數據,實現了泄漏數據集的數量增強。
3 "模型訓練與測試結果對比分析
3.1""模型遷移學習的預訓練
將模擬數據集按103:17的比例分為訓練集和驗證集。由于BP神經網絡具有較強擬合能力和多信息處理能力[13~16],Resnet系列是遷移學習常用的模型[17~19],CNN卷積神經網絡具有特征提取功能[20~24],因此筆者選擇BP神經網絡、Resnet18、Resnet34、Resnet50和CNN卷積神經網絡模型5種模型分別進行預訓練,然后通過實驗數據進行測試。其中,損失函數選擇交叉熵損失函數,反向傳播選擇Adam優化器。
圖4為不同模型的遷移學習預訓練效果。從圖4a可以看出,訓練集的損失值起初正常收斂,到后期有發散的跡象;驗證集的損失值起初有收斂趨勢,但后期逐漸發散,且逐漸升高;這表明BP神經網絡可以擬合出注水管網泄漏診斷的內在機理,后期發散是因為BP神經網絡擬合了訓練數據中其他雜質機理,導致其出現了過擬合現象。從圖4b~d可以看出,Resnet系列預訓練模型的損失值基本沒有收斂,這是因為Resnet系列模型較大,油田注水管網級別的數據對驅動Resnet系列模型作用有限,導致其收斂效果不理想。從圖4e可以看出,不論是訓練集還是驗證集的損失值都趨于收斂,表明CNN卷積神經網絡已經學到了注水管網漏損診斷的內在機理。結合BP神經網絡的預訓練結果可以得出:CNN卷積層發揮了作用,將數據的漏損診斷機理特征進行了準確篩選和提取,避免了BP神經網絡的過擬合現象。
3.2""模型遷移學習的二次訓練和測試
保存預訓練模型,利用實驗數據進行遷移學習的二次訓練,促進模型的權重參數被動微調,使得計算模型具有更好的泛化性能,模型的權重參數更加貼合真實數據。
圖5為不同模型的二次訓練效果。從圖5a~d可以看出,BP神經網絡模型和Resnet系列模型的損失值均沒有收斂。從圖5e可以看出,CNN卷積神經網絡模型的二次訓練損失值起初很大但是很快收斂且后期平穩無波動,大約在100個訓練周期后損失值收斂到最小值。
模型準確率Precision計算式如下:
其中,TP為正確檢測出的泄漏管段個數,FP為檢測錯誤的管段個數。
5種模型的預訓練和二次訓練所得準確率結果對比如圖6所示。分析可知,對于注水管網實際工程問題的學習,由于工程實際可獲取的故障數據有限,導致5種模型的準確率不高;部分模型通過模擬數據增強后準確率依然不高,但是將增強后的故障數據結合遷移學習思想進行二次訓練,可使模型權重參數得到微調,模型準確率得到了顯著提升。從圖6可以看出,CNN卷積神經網絡模型經過遷移學習后,其準確率提升了18倍左右,表明CNN卷積神經網絡經過遷移學習后解決了數據之間的內在差異性影響,可充分發揮Epanet模擬數據對少量稀疏故障數據的增強作用,是一種針對油田注水管網泄漏診斷的行之有效的方法。
4 "結束語
針對油田注水管網泄漏診斷面臨的低數據、差異化特點,提出了一種基于數據驅動模型加遷移學習思想的漏損診斷方法,該方法采用Epanet模擬數據實現數據增強,利用遷移學習的思想解決模擬數據、實驗數據與真實數據之間存在的差異,從而提升泄漏診斷準確率。研究結果表明,單一數據訓練的機器學習模型效果普遍不佳,常用的BP神經網絡、Resnet18、Resnet34、Resnet50和CNN卷積神經網絡5種數據驅動模型的預訓練準確率均不超過11.80%。Epanet軟件是一種對稀疏數據實現數據增強的方法,但會帶來一定的數據差異化影響;采用遷移學習進行二次訓練,使預訓練模型的權重參數微調,可以很好地解決數據差異的影響。經過預訓練和二次訓練后,5種模型中只有CNN卷積神經網絡模型學習到了注水管網漏損診斷的內在機理,且二次訓練后效果提升明顯,準確率高達94.12%。這一方法可用于油田注水管網的日常維護診斷,且隨著故障數據的積累,可以獲得更好的訓練效果。
參 "考 "文 "獻
[1] 黃新敬,燕育培,裴連軍,等.基于最短路徑規劃的供熱管網泄漏定位方法[J].儀器儀表學報,2023,44(8):164-172.
[2] 楊桃.基于機器學習的供水管網爆管診斷方法研究與實現[D].重慶:重慶大學,2021.
[3] 王顯赫.油田注水管網漏損診斷及定位研究[D].大慶:東北石油大學,2019.
[4] 高含.城市多源大型供水管網泄漏檢測方法研究[J].科學技術創新,2023(6):93-96.
[5] 陳京鈺,馮新,肖詩云.一種基于壓力測點報警等級的供水管網泄漏區域識別方法[J].給水排水,2022,58(10):173-179.
[6] 劉杰,朱正偉.基于稀疏輕量卷積神經網絡的管道泄漏檢測[J].電子測量技術,2022,45(19):131-135.
[7] 馬廣興,曲波,常琛,等.基于CNN的供熱管道泄漏識別方法研究[J].電子測量技術,2022,45(16):34-41.
[8] 杜永峰,段鵬飛,趙秉旭,等.基于CABC-BP模型的供熱管網泄漏診斷研究[J].廣西大學學報(自然科學版),2023,48(4):835-846.
[9] 吳磊.油田注水系統仿真模擬與智能診斷評價[D].大慶:東北石油大學,2021.
[10] 李杰.油田注水管網系統可視化診斷決策技術研究[D].大慶:東北石油大學,2023.
[11] 馮彬.注水管網優化及漏損診斷[D].武漢:長江大學,2023.
[12] 楊啟航,周艷,吳水波,等.供水管網壓力監測點優化布置方法[J].給水排水,2022,48(4):113-118.
[13] 王琳竣.基于神經網絡的油藏自動歷史擬合方法研究[D].西安:西安石油大學,2023.
[14] 侯國鑫,劉梅清,梁興,等.基于神經網絡的軸流泵性能曲線擬合研究[J].中國農村水利水電,2020(8):102-104.
[15] 高振耀,叢曉明.結合BP神經網絡優化GNSS高程擬合[J].青海科技,2023,30(3):83-90.
[16] WU L J,CAO Y H,ZHANG Z X.Analysis and prediction of China’s future pension industry based on fitting algorithm and BP"neural network[J].Journal of Physics:Conference Series,2021,1952(4):042141.
[17] LIU S P,TIAN G H,XU Y.A novel scene classification model combining ResNet based transfer learning and data augmentation with a filter[J].Neurocomputing,2019,338:191-206.
[18] ANSARI N,FAIZABADI A R,MOTAKABBER S M A,et al.Effective pneumonia detection using ResNet based transfer learning[J].Test Engineering and Management,2020,82:15146-15153.
[19] LIU Y B,LI J,LI Q J,et al.Transfer learning with inception ResNet-based model for rolling bearing fault diagnosis[J].Journal of Advanced Mechanical Design,Systems,and Manufacturing,2022,16(2):1-19.
[20] WU J,LI J,REN Q.Application of artificial intelligence image recognition technology based on faster-RCNN in automatic inspection of power transmission and transformation[J].Journal of Physics:Conference Series,2022,2306(1):012006.
[21] DIAO Z,YAN J,HE Z,et al.Corn seedling recognition algorithm based on hyperspectral image and lightweight-3D-CNN[J].Computers and Electronics in Agriculture,2022,201:107343.
[22] LI Z Y,WU Q M,YANG S M,et al.Diagnosis of rotor demagnetization and eccentricity faults for IPMSM based on deep CNN and image recognition[J].Complex amp; Intelligent Systems,2022,8(6):5469-5488.
[23] ARVIND S,TEMBHURNE J V,DIWAN T,et al.Improvised light weight deep CNN based U-Net for the semantic segmentation of lungs from chest X-rays[J].Results in Engineering,2023,17:100929.
[24] YANG Y,YANG S,LI C,et al.Recognition of plasma discharge patterns based on CNN and visible images[J].IEEE Access,2021,9:67232-67240.
(收稿日期:2024-01-15,修回日期:2024-11-11)
基金項目:國家自然科學基金區域創新發展聯合基金重點支持項目(批準號:U21A20104)資助的課題;大慶石油管理局項目(批準號:2022SWX191)資助的課題;臺州市科技計劃項目(批準號:23gyb10)資助的課題。
作者簡介:劉書張(1996-),碩士研究生,從事注水系統節能優化的研究。
通訊作者:張艷(1981-),高級工程師,從事油氣田地面工程方面的研究工作,yandxx@hotmail.com。
引用本文:劉書張,張艷,申建非,等.基于數據驅動模型加遷移學習的油田注水管網泄漏診斷方法[J].化工機械,2024,51(6):000-000.