侯佐新 袁樹文



摘要:海下油井油產量預測在開發調整和優化中繼續發揮著越來越重要的作用;但海下油井的加固會進一步影響油產量預測。研究建立注氣效應的長短期記憶(LSTM)神經網絡模型,預測已有機材料環氧樹脂乳液加固渤海碳酸鹽巖儲層的生產性能;將該模型的計算結果與傳統儲層數值模擬(RNS)在相同條件下進行了對比。結果表明,LSTM所需的CPU負載僅為4%,LSTM方法的總 CPU時間和綜合計算功耗分別僅占 RNS的10.43%和36.46%。LSTM方法在計算方面具有顯著優勢,為人工智能在油氣開發中的應用提供了新的方向。關鍵詞:長短期記憶;神經網絡;海下油井;油產量預測
中圖分類號:TE33+1.1;TP39??????? 文獻標志碼:A???????? 文章編號:1001-5922(2023)03-0178-05
Research? on? oil production prediction? of offshore? oil wells based? on? long? and? short? termmemory neural network
HOU Zuoxin,YUAN Shuwen
(China Oilfield Services Co.,LTD.,Tianjin 300457,China)
Abstract: Oil production prediction of subsea oil wells continues to play an increasingly important role in develop- ment adjustment and optimization. However,the reinforcement of offshore oil wells will further affect the oil produc- tion forecast. The long short memory(LSTM)neural network model of gas injection effect is established to predict the production performance of Bohai carbonate reservoir reinforced with organic epoxy resin lotion. The calculation results of this model were compared with the traditional reservoir numerical simulation(RNS)under the same con- ditions. The results showedthat the CPU load required by LSTM was only 4%. The total CPU time and comprehen- sive computing power consumption of LSTM method only accounted for 10.43% and 36.46% of RNS respectively. LSTM method had significant advantages in calculation. It provides a new direction for the application of artificial intelligence in oil and gas development.
Keywords: short-term memory;neural network;shipbuilding industry;oil well
海下固井作業對油氣井建設很重要,其根本目的是實現層間密封,支撐和保護套管,防止壓力差[1]。油井水泥是固井材料的主要成分,但由于凝固后脆性,直接用于固井時無法抵抗井下應力損傷。因此,往往需要添加改性材料來改善水泥漿的性能。一些研究表明,用高分子有機材料制備水泥漿有助于增強油井水泥的抗應力能力,實現長期密封[2]。聚合物乳液有機材料是油井水泥中最常用的聚合物之一。在水泥漿中加入丁苯乳液、乙烯醋酸乙烯共聚物乳液等聚合物有機乳液,由于聚合物的作用,水泥漿的力學性能和耐久性可以得到顯著提高[3-4]。聚合物乳液對水泥漿性能的改性機理主要是聚合物膜的形成以及膜與水泥水化產物的緊密結合。聚合物有機乳液水泥固化后,聚合物橋接層間晶體并將這些水合晶體結合在一起[5]。此外,提高了改性水泥的內聚力,形成了更具凝聚力的微觀結構,減少了水泥基體內部的微裂紋數量。而環氧樹脂乳液是一種聚合物有機乳液,無需穩定劑即可應用于水泥基復合材料。有機材料環氧樹脂乳液在水下混凝土領域有著廣泛的應用。但目前已有結果表明,對油井進行加固時,會進一步影響油井產油量預測,加固材料會阻礙油氣的傳輸。因此,亟需改進目前的產量預測模型,以適用于有機材料環氧樹脂乳液加固油井的情況。
神經網絡(NN)僅在各層間建立權重關系,其僅對一個輸入進行獨立的處理,而前者與后者則是完全無關的[6]。在實際應用中,某些任務需要能夠更好地處理序列信息。遞歸神經網絡(RNN)和NN之間的最大區別是層中神經元之間建立的加權連接。與基本的NN相比,它可以處理序列變化的數據。長短期記憶(LSTM)是對RNN結構的改進,主要是為了解決長序列訓練過程中梯度消失的問題,使循環神經網絡具有更強更好的記憶性能。簡單地說,LSTM在更長的時間序列情況下優于RNN。利用LSTM解決石油上游時間序列問題已經進行了大量研究。成功建立了雙特征LSTM模型來預測考慮關閉期的頁巖氣產量,這比單特征案例更準確[7]。建立了一個深度全連接神經網絡模型來預測6個月和18個月的累計石油產量[8]。利用LSTM建立了一個預測模型,用于預測水飽和度分布,壓力分布和產油量[9]。
上述大多數基于神經網絡的應用程序只考慮生產數據,較少考慮從氣體噴射到生產的注氣效應。基于此建立了考慮注氣效應的LSTM模型,用于碳酸鹽巖儲層的產油/水/氣生產和 GOR預測,一個比傳統 RNS方法更準確的預測模型。并進一步將LSTM方法的預測準確性與實際數據和 RNS 結果進行比較,研究成果可為海下油井產能預測提供參考。
1 模型建立和LSTM算法
遞歸神經網絡(RNN)用于處理序列數據,與一般神經網絡相比,它可以處理數據的順序變化[12]。 RNN可以將當前隱藏層的輸出轉換為下一個隱藏層的輸入,與當前信息與下一個任務相關聯[13]。RNN可以處理任何長度的輸入,但RNN只對短期信息敏感,難以解決“長期依賴”的問題。
LSTM是Hochreiter&Schmidhuber于1997首先提出的一種能夠解決“長時間依賴性”的 RNN[14]。標準RNN重復模塊的結構非常簡單,只有1個tanh層。與RNN相比,LSTM的內部結構更復雜,由4個神經網絡層組成,包括細胞狀態、輸入門、遺忘門和輸出門。LSTM由這3個控制器仔細調節,以刪除或添加信息到細胞狀態。
W和b定義為這些參數的權重矩陣和偏置矩陣,下標f、i、o 分別表示遺忘門、輸入門和輸出門,如下:
LSTM的第1部分是“忘記門”[15]。這部分主要側重于選擇性地忘記上1個時間步長(t-1)的信息。簡而言之,它忘記了不重要的信息并記住了重要的信息。此步驟由關閉狀態gmoid層實現:
式中:fi 表示忘記門;σ表示1個S型激活函數,其輸出范圍為0到1;σ計算方法由σ(x)=(1+e-x)-1計算得到。“1”表示“保持一切事物的完整”;而“0”表示“完全刪除所有內容”;Xt在時間步長t 處輸入,在時間步長ht-1 處輸出;Wf和bf 分別為遺忘門的權重矩陣和偏差矩陣。
“輸入門”決定了我們想要在當前時間步長(t)的單元格狀態中存儲哪些新信息,輸入門分為S形層和 tanh層。關閉狀態gmoid層要求輸入門決定應更新的內容,如式(3)所示;tanh層創建一個新的候選值的向量,可以將其添加到單元格狀態中,如式(4)所示。
式中:it是輸入門;bi是輸入門的偏差矩陣。
式中:Ct是新候選值的向量;tanh(x)為雙曲切線激活函數,其輸出范圍為-1~1,由式(5)給出。然后,根據上述步驟,將之前的單元格狀態更新為當前的單元格狀態,如下所示:
“輸出門”階段將確定什么將被視為當前單元狀態的輸出。這個輸出會根據單元格的狀態而定.首先,執行1個gmoid層,確定了要輸出哪個單元的單元狀態。然后,用 tanh 把單元格狀態(從-1到1)和用gmoid柵極的輸出相乘,這樣就可以僅輸出所需要的值。
式中:σt 為輸出門;Wo 和bo分別為輸出門的權值矩陣和偏置矩陣;ht是當前單元格狀態的輸出值,也是下一個狀態的輸入值。此外,整流線性單元(ReLU)也是神經網絡中常用的激活函數,由式(9)給出:
2 模型驗證和評價結果
以2個完整的環氧樹脂乳液加固油井為例,進一步展示LSTM模型對油/水/氣/GOR預測的驗證和評價結果。
2.1 模型預測性能驗證
如果模型的訓練性能良好,但預測效果較差,很明顯該模型必須進行調整。本文旨在利用RNS軟件預測在相同條件下(相同的GIR和IP)下具有相同井型的目標生產商的產量。此外,還使用了過去4000 d 的數據進行了歷史擬合,并預測了未來500 d的數據。最后,將對RNS和LSTM的性能進行詳細的比較,包括模型訓練時間、預測時間和預測精度。
2.2 LSTM模型訓練性能
損失函數曲線通常用于評估模型訓練性能。可以通過監測損失函數曲線的收斂趨勢來確定模型是否達到了最佳狀態。其中P-73與P-59為2個不同的生產廠商。圖1為2個目標生產者模型的損失函數曲線與迭代的關系。
從圖1可以看出,P-73曲線在達到280迭代時收斂,下降趨勢在280~500個迭代相對穩定;而P-59損失曲線在200個迭代后逐漸穩定下來。
2.3 預測結果以及LSTM和RNS的比較
在獲得優秀的訓練模型后,需要分析這些模型在后500 d的預測結果。圖2為11個變量LSTM模型的實際日產油量和預測結果。根據圖2中的比較結果,結果表明偏差低,平臺產量與實際值一致。
通過計算實際值和預測結果之間的 RMSE、 MAE 和R2,可以定量分析11個變量LSTM模型的性能。總體來看,模型預測結果的準確率相對較高,可以接受。在水平比較中,P-59具有最佳的預測性能,RMSE 和 MAE 最低,R2最高。相比之下, P-73的預測性能相對較差。P-59在150~350 d內的預測日油率曲線與實際曲線有很大偏差。P-73在300~500 d 的預測曲線與實際曲線不匹配。總之,LSTM模型的精度相當不錯,并且顯示出相當可接受的預測偏好。
盡管LSTM模型表現出良好的性能,但仍存在一些問題。且生產者的關閉受到許多因素的控制,例如 GOR限制、WC限制、全球原油價格、資源國政策的調整、國際政治因素等。還如,根據資源國的政策,如果GOR高于5000 scf/bbl或WC高于50%,生產廠將被關閉。此外,在全球原油價格過低的時期,例如2020年,一些生產商將關閉生產廠以降低開發成本。因此,關閉狀態(SI)是一個人工控制的特征變量,未來我們無法知道它的趨勢,因此在這種情況下使用關閉狀態(SI)作為LSTM模型的輸入變量是不合理的。同樣,節流圈尺寸也是一個人工控制的特征變量。上述相關性分析表明,節流圈尺寸(CS)與油/水/氣速率具有較強的相關性,且生產率受節流圈尺寸變化調節。在LSTM預測過程中,雖然我們可以人為地設定節流圈尺寸的值,但RNS無法表征節流圈尺寸的影響。
在油藏產量預測領域,為了公平比較 LSTM和 RNS的預測性能,我們排除了2個特征變量“SI”和“CS”,并將11個變量 LSTM 模型簡化為9個變量LSTM模型。簡化后的模型更符合油田的實際生產開發條件。
去掉變量SI后,LSTM模型無法表征生產者的開關狀態,預測結果是一條沒有零值的連續曲線。另一方面,RNS預測使用目標生產商的預定BHP和THP 以及噴油器的實際 GIR和 IP。這2種預測方法的輸入特征變量相同,因此可以比較2種方法的預測結果。
P-73的LSTM結果可以更好地適應實際曲線的波動,而RNS結果只是1條水平直線。這2種方法在 P-59中的結果顯示出相似且良好的性能。同樣, LSTM方法在GOR上的性能也優于RNS方法。
2.4 模型精度與計算時間
精度和計算時間是評價模型性能的2個重要指標。傳統的RNS軟件在扇區模型中計算速度非常快,但計算整個儲層模型需要大量的時間。在研究中,RNS 方法基于一個完整的儲層組成模型,共4233600個網格280 mm×240 mm×63 mm和9個組件。LSTM型號和 RNS型號都是在專業工作站上執行的,主要規格是2×Intel?Xeon?Gold 5120 CPU @2.20 GHz,128 GB DDR4內存,和帶有16 GB GPU內存的NVID- IA?Quadro P5000顯卡。LSTM和RNS的計算時間和計算功耗,具體如表1所示。
得益于高性能顯卡的支持,2種方法的計算速度得到了極大的提升。由表1可以看出,LSTM訓練過程的CPU時間消耗為452.30 s,RNS的CPU時間消耗為4100.62 s。LSTM所需的CPU負載僅為4%,因為63%的GPU負載和15742 MB的GPU內存使用加速了訓練過程。RNS的訓練過程需要CPU支持和GPU支持,因此消耗70.9%的CPU負載、23955 MB內存、98%的 GPU負載和16089 MB的GPU內存。預測過程的計算時間和算力消耗與訓練過程相似,具體結果如表2所示。
總體而言,LSTM比RNS消耗更少的時間和算力, LSTM的總訓練和預測時間僅占RNS的10.43%。除使用的GPU內存外,LSTM方法的其他參數均小于RNS 方法。LSTM的綜合算力消耗僅為RNS的36.46%。這表明LSTM方法在計算方面具有巨大的優勢。
3 討論
研究的目的是建立一種新的方法,以獲得更準確的儲層油產量預測。RNS是一種常見的自下而上的建模和預測方法,在前期地質研究中需要大量的工作。而且,地質研究存在很大的不確定性,地質學家幾乎不可能完全了解儲層[18]。基于神經網絡的預測方法是一種數據驅動的自上而下的建模方法,其輸入數據全部為來自油田的實際數據。RNN算法可以對數據序列(尤其是時間序列數據)進行建模。LSTM 算法是一種特殊的 RNN。LSTM可以克服 RNN無法解決的梯度消失和爆炸問題[19-20]。與傳統方法(RNS 和DCA)相比,LSTM方法可以基于高質量的數據基礎獲得更準確的預測結果。
這項研究的主要優點:用于模型訓練和測試的所有數據都是來自渤海碳酸鹽巖儲層的實際生產數據。希望通過這項研究將LSTM神經網絡方法擴展到實際的儲層管理和開發中。研究成功開發了長短期記憶神經網絡模型,用于預測碳酸鹽巖儲層的每日油氣/水/氣速率和生產者GOR數據,展示了LSTM神經網絡方法從數據處理到模型評估的全過程。
4 結語
(1)篩選出合適的特征變量,建立9變量LSTM預測模型,并對模型超參數進行優化。雖然SI和CS的相加可以大大降低預測結果的誤差,但這2個變量的值無法提前獲得,不能作為模型的輸入變量;
(2)在性能預測方面,LSTM 方法比傳統 RNS 具有巨大的優勢,LSTM 所需的模型訓練時間為26.95 s;
(3)LSTM 模型實現了對石油、天然氣產量和 GOR的準確預測,并具有已知的噴油器性能效應。與傳統的生產預測方法相比,LSTM方法作為一種數據驅動方法,可以避免傳統方法難以解決的問題,如儲層異質性引起的模型不確定性。這種方法使油藏工程師和決策者能夠提前獲得生產者的準確績效,為人工智能在油氣開發中的應用提供了新的方向。
【參考文獻】
[1] 薛亮.均質油藏水驅油物理模擬驅替規律實驗分析[J].粘接,2021,45(3):132-136.
[2] 楊見,何寅,王振齊.塔中奧陶系油源巖碳、硫同位素對比分析[J].粘接,2020,41(4):37-39.
[3] 甄榮,邵哲平,潘家財.基于AIS數據的船舶行為特征挖掘與預測:研究進展與展望[J].地球信息科學學報,2021,23(12):2111-2127.
[4] 周瑋辰,韓震,張雪薇.基于融合U-Net及ConvLSTM的海面高度異常預報方法研究[J].海洋通報,2021,40(4):410-416.
[5] 趙洪濤,李金澤,楊毅,等.基于長短期記憶神經網絡的油井產液量和含水率預測方法[J].石油地質與工程,2022,36(5):75-80.
[6] 李彥普.基于長短期記憶神經網絡的油井產量預測方法研究[J].化工管理,2022(20):61-64.
[7] 郝江.超親油疏水中空纖維膜凈化液壓油穩定運行工藝研究[J].粘接,2022,49(2):53-56.
[8] 焦衛華,李艷,吳利超,等.低滲透油田剩余油開采再處理技術研究與應用[J].粘接,2021,47(9):146-150.
[9] 吳松平,王天一.基于神經網絡和遷移學習的視頻人體行為識別[J].智能計算機與應用,2021,11(12):153-157.
[10] 張剛,王維釗,閆建偉.基于氣驅提高頁巖原油采收率技術分析[J].粘接,2020,44(12):127-131.
[11] 薛亮,顧少華,王嘉寶,等.基于粒子群優化和長短期記憶神經網絡的氣井生產動態預測[J].石油鉆采工藝,2021,43(4):525-531.
[12] 殷啟帥,楊進,曹博涵,等.基于長短期記憶神經網絡的深水鉆井工況實時智能判別模型[J].石油鉆采工藝,2022,44(1):97-104.
[13] 韓益東,尹洪軍,徐國涵,等.基于機器學習的高含水期油井產量預測方法[J].河南科學,2022,40(10):1569-1575.
[14] 馮寧,張乃祿.基于改進卷積神經網絡的油井動液面監測系統故障診斷[J].石油工業技術監督,2021,37(9):37-41.
[15] 張立婷,李世超,曾鵬,等.基于均值濾波和BP神經網絡的功圖量油技術[J].油氣田地面工程,2018,37(8):83-86.
[16] 李虎.基于改進BP神經網絡的油井流入動態研究[J].復雜油氣藏,2011,4(3):71-75.
[17] 張蕾,竇宏恩,王天智,等.基于集成時域卷積神經網絡模型的水驅油田單井產量預測方法[J].石油勘探與開發,2022,49(5):996-1004.
[18] 馬承杰.基于循環神經網絡的油藏產量預測方法[J].內蒙古石油化工,2021,47(5):108-112.
[19] 張曉,盧昕,周玲,等.基于神經網絡的示功圖液量測量技術的研究與應用[J].化工技術與開發,2019,48(5):69-73.
[20] 劉寶軍.基于 CNN 卷積神經網絡的示功圖診斷技術[J].西安石油大學學報(自然科學版),2018,33(5):70-75.