馮 鋼,管 桐,燕 云,李 軒,王曉波,馬 丹
(1.西安中控天地科技開發有限公司,陜西西安 710016;2.華北油田工程技術研究院,河北任丘 062550;3.中國石油長慶油田分公司伴生氣綜合利用項目部,陜西西安 710000)
油井產量是認識油藏生產動態、評價油田開采狀況、編制油田開發規劃、開發方案設計與調整、改善油井工作制度等決策問題的基礎和依據,而且油井產量可以用來反映油井的生產能力、評估抽油設備的工作狀態和措施作業的效果水平,只有對油井產量科學可靠的提前預知,才能實現對油井中的措施工作進行高效科學部署,對油井生產工作量進行合理匹配,確保油井安全可靠的生產運行和規劃目標的實現。
目前國內油田單井計量以罐車單量、三相分離計量撬、稱重式計量儀、三相流量計等為主,存在著占地面積大、建設投資費用高、人工巡井工作量大、單量不及時、與當前智能化發展不匹配等問題[1-4]。針對電潛泵、電潛螺桿泵等其他無桿泵舉升方式的單井在線計量技術有壓差分析法[6]、泵特性曲線法[7]、系統損耗分析法、轉速法[8]、IPR 曲線擬合法[9](表1),這些技術應用過程中存在基礎數據獲取難、現場應用局限大等一系列問題,很難進行推廣應用,而電潛泵、電潛螺桿泵等無桿采油技術是一種高效智能舉升工藝,是解決井眼軌跡復雜、管桿偏磨嚴重、液量變化幅度大油井的有效采油技術手段[10]。由于其安全性好、維護工作量小等優點,逐漸代替傳統抽油機在各油田開始規模應用,但還沒有與之相配套的單井在線虛擬計量技術。

表1 無桿泵井計量技術對比分析
本文針對現有電潛泵、電潛螺桿泵等無桿泵井在線計量技術的局限性[11],根據無桿泵井歷史數據、靜態數據和設備數據,消除不同井型、電機功率等影響因素,建立無因次關鍵參數,利用皮爾遜(Pearson)相關系數分析方法,分析了無桿泵井屬性數據與產液量的關聯性,根據隨機森林特征選擇方法進行數據降維確定主控參數,定量研究無桿泵井生產數據變化規律與產液量之間的關系,選用XGBoost 模型建立了一種廣泛應用時序數據學習和預測的無桿泵井產液量預測模型,并結合現場實際生產數據與IPR 曲線擬合法、電參分析法進行對比分析,優選大數據產液量計算方法,更深層次挖潛動態數據之間的變化規律,可實時預測無桿泵井產液量并超前預警,使無桿泵井的計量方式轉向虛擬計量,填補了無桿泵井在線有效計量方法的技術空白,實現對油田產量流動情況進行在線實時監測,從而幫助技術人員診斷無桿泵舉升設備工況和合理選擇調參時機,盡可能避免油井減產,實現了無桿泵井參數優化決策由傳統的業務驅動向數據驅動的轉變。
IPR 曲線即流入動態曲線,是描述油井產量與井底流壓的關系曲線,曲線形態與驅動類型、油藏壓力、油層物性及流體性質有關。按經典的油井流入特性理論,油井流壓越低,產量越高。由于地層內油、氣、水三相流動的復雜性,精確建立流動系數的解析函數表達式難度較大,本文根據劉東升等[12]已建立的飽和油藏和非飽和油藏IPR 曲線通式(圖1、圖2),利用測點擬合法與最小二乘法,建立待定影響系數的回歸方程,同時利用最優化方法求解非線性回歸方程的最優解,確定IPR 曲線通式的影響系數。在此基礎上,建立特定生產環境下油井流入特性曲線,結合缺失產量條件下的油井生產數據,對缺失數據進行數據增強。

圖1 飽和油藏的IPR 曲線

圖2 不飽和油藏的IPR 曲線
其中:qD=qo/qm,pD=pf/pr
式中:qo-油井產量,m3/d;qm-流壓為0 時的產量,m3/d;pr-原始地層壓力,MPa;pf-井底流壓,MPa。
針對電潛螺桿泵井在供液條件,電機效率等運行情況相同或相近的條件下,電潛螺桿泵機組的耗能應當與其舉升的液量成正比[13]。但在現場實際的工況及測量時,受制于運行轉速、供液能力、下泵深度的不同以及其對泵效的影響,計量結果顯示產液量和耗電量無明顯相關性(圖3、圖4)。

圖3 產液量與耗電量關系散點圖

圖4 單位轉速及沉沒壓力下,產液量與耗電量關系散點圖
本文將耗電量及產液量單位化,即將其轉化為單位轉速及沉沒壓力下的耗電量和產液量,結果顯示二者具有較強的正相關性。
(1)參數單位化:計算單位沉沒壓力及轉速下的有功電量及產液量。
式中:Qu,Eu-單位化后的有功電量及產液量;Q,E-有功電量及產液量;n-轉速;ps-沉沒壓力。
(2)公式回歸:對單位化后的有功電量及產液量進行擬合,獲得回歸公式Qu=f(Eu)。
式中:f(Eu)-單位化有功電量與單位化產液量間的函數關系式。
(3)產液量預測:依據有功電量以及回歸后的公式預測產液量。
根據無桿泵井歷史數據、靜態數據和設備數據,利用皮爾遜(Pearson)相關性分析和隨機森林特征選擇分析無桿泵井屬性數據與產液量的關聯性,確定主控參數,定量研究無桿泵井生產數據變化規律與產液量之間的關系,利用XGBoost 預測模型建立了無桿泵井產液量計算模型。
影響電潛螺桿泵井產液量的因素很多,主要受油藏和舉升設備的影響,包括:油井靜態數據(油藏巖石物性、井眼軌跡等);生產動態數據(時間、油壓、套壓、轉速、泵入口壓力、泵入口溫度、含水率、井液黏度、動液面等);設備工況數據(生產時長、電流、電壓、有功功率、功率因數、耗電量)等[14-15]。為消除不同井型、電機功率等影響因素,本文將耗電量、產液量、功率、電流單位化,即將其轉化為單位轉速及沉沒壓力下的結果,同時,引入油套壓差(油壓-套壓)和無因次深度(沉沒度/泵深)特征參數,豐富模型特征參數(表2)。

表2 電潛螺桿泵井特征參數計算
為了能夠精確的了解影響電潛螺桿泵日產液量的主要特征參數,本文采用Pearson 相關系數分析11 項特征參數變量間的相關性,選用隨機森林特征選擇方法對數據進行降維和生產特征分析[14,16]。
基于Pearson 相關系數分析和隨機森林特征選擇方法計算得到無桿泵井相關特征之間的關聯關系見圖5、圖6。一般認為Pearson 兩變量相關性系數的絕對值小于0.3 時為弱相關,由圖5 可以看出,功率因數、單位耗電量、無因次深度特征在相關性算法下的絕對值均小于0.3,結合圖6 單位耗電量對單位產液量的影響極大,同時無因次產液量與單位產液量計算都為目標值(產液量),綜合考慮,選擇單位產液量、單位耗電量、單位有功功率、單位電流、單位平均電流、無因次電流、無因次平均電流、無因次有功功率、無因次深度作為特征值,其中單位產液量為目標預測值。

圖5 Pearson 相關系數分析

圖6 單位產液量與其他特征參數重要性排序
為定量描述電泵井產液量與生產參數之間的關系,選取某區塊10 口電潛螺桿泵井作為產液量預測的研究對象,收集整理每口井2022 年1 月到12 月的生產日數據,如泵入口壓力、油壓、套壓、轉速、三相電流、三相電壓、有功功率等共16 項屬性數據,利用本文特征參數選擇方法對關鍵參數進行單位化處理,并按照7∶2∶1 的比例將處理后的日度數據劃分為訓練集(迭代訓練模型)、驗證集(確定模型網絡結構或者控制模型復雜程度的超參數)和測試集(應用訓練好的模型測試模型性能),利用Python 平臺中的XGBoost 庫構建電潛螺桿泵產液量預測模型。預測模型初始化參數為:學習率為0.1,樣本采樣比率0.7,樹最大深度5,模型迭代訓練400 次,優化器采用Adam 函數優化權重,損失函數選用均方差(MSE),其余參數采用默認值。模型訓練過程中訓練集及驗證集損失函數和準確率隨訓練次數的變化過程見圖7、圖8。

圖7 損失函數變化過程

圖8 準確率變化過程
從圖7 和圖8 對比分析,XGBoost 預測模型的損失函數隨著迭代次數的增加而逐漸減小并趨于0,準確率隨著迭代次數的增加而逐漸增大并趨于100,且訓練集與驗證集的損失函數非常接近,說明XGBoost預測模型沒有出現過擬合或欠擬合的現象,模型具有較好的泛化能力,可用于電潛螺桿泵井產液量預測。
為驗證對比不同計量算法的有效性與性能優越性,對某區塊10 口電潛螺桿泵井2023 年1 月的生產數據進行不同虛擬計量方法準確性驗證,結果見表3。與實際產液量相比,IPR 曲線計產平均全天誤差為0.40 m3/d,平均誤差率為6.47%;電參分析法平均全天誤差為1.23 m3/d,平均誤差率為5.67%;大數據計產平均全天誤差為0.07 m3/d,平均誤差率為2.66%。

表3 不同虛擬計量方法與油井實際產液量對比結果
已知W10 井油藏的地層壓力為4.56 MPa,飽和壓力為9.35 MPa,生產井段362.00~1 297.00 m,下泵深度326.88 m,利用該井歷史數據計算IPR 曲線影響系數A1為0.23,A2為-8×10-15,qm為9.36 m3/d,單位化后的有功電量及產液量擬合結果為Qu=0.402 2Eu-0.003(R2=0.919 3),利用該井2023 年1 月生產數據進行計產結果與實際產液量對比分析,其中IPR 曲線計產平均誤差為3.55%,電參計產平均誤差為2.31%,XGBoost 計產平均誤差為1.05%(圖9~圖11)。

圖9 W10 井IPR 曲線

圖10 W10 井單位化產液量與單位化耗電量關系

圖11 W10 井不同虛擬計量方法與油井實際產液量對比曲線
已知W3 井油藏的地層壓力為4.56 MPa,飽和壓力為9.35 MPa,生產井段472.0~1 271.0 m,下泵深度411.31 m,利用該井歷史數據計算IPR 曲線影響系數A1為0.20,A2為2×10-14,qm為28.68 m3/d,利用其歷史數據計算IPR 曲線Q0max為28.68 m3/d,單位化后的有功電量及產液量在該井生產情況下并不具備線性關系(圖13),無法進行關系式擬合,利用該井2023 年1 月生產數據進行計產結果與實際產液量對比分析,其中IPR 曲線計產平均誤差為3.84%,XGBoost 計產平均誤差為1.28%(圖12~圖14)。

圖12 W3 井IPR 曲線

圖13 W3 井單位化產液量與單位化耗電量關系

圖14 W3 井不同虛擬計量方法與油井實際產液量對比曲線
由10 口無桿泵井現場試驗數據可以看出,大數據計量誤差均在±5%以內,計量結果優于IPR 曲線與電參分析法計產,且大數據計產方法相比于IPR 曲線的特定生產環境要求和電參計產線性關系要求,更好的掌握了日產液量的變化趨勢和前后關聯性,能夠準確計算無桿泵井的日產液量變化情況,并結合未來生產數據可逐步加強數據樣本集。因此,大數據產液量計產模型可精確應用于油田無桿泵井產液量計算應用。
(1)針對無桿泵井現場實際應用過程中受制于運行轉速、供液能力、下泵深度的不同以及其泵效的影響,將耗電量、產液量、功率、電流轉化為單位轉速及沉沒壓力下的結果,同時,引入油套壓差和無因次深度特征參數,建立無因次關鍵參數。
(2)與IPR 曲線擬合法、電參分析法進行對比分析,基于大數據的產液量預測模型預測誤差在±5%以內,解決了現場針對電潛泵、電潛螺桿泵等無桿采油方式無有效單井在線計量方法的難題,填補了技術空白。
(3)實現無桿泵井在線計量、數據自動遠傳,能簡化油田集輸工藝,減少現場員工巡井工作量,降低地面建設費用和生產運行成本。