崔博宇,董易凡,楊圣方,劉博卿
中國石油長慶油田蘇里格南作業分公司(陜西 西安 710018)
水力壓裂優化是一項包含巖石力學、流體力學、工程學和數據科學等多方面學科的復雜課題[1]。鑒于蘇里格南的大規模、工廠化作業模式產生了超過1 300 個層位的優質壓裂數據。其大數據量的特點不僅為機器學習提供了“原材料”,而且變量少的特點又減輕了機器學習的工作量,因此理論上存在基于機器學習進行壓裂優化的可能性。數據預處理和建模分析等機器學習均是應用Python 語言[2]完成。
基于機器學習的壓裂優化設計思路:將壓后產量假設作為儲層儲能和壓裂作業兩項自變量相互作用的因變量表現。通過機器學習分析這三項歷史數據,建立數據模型[3],從而在一定條件下通過優化壓裂施工參數,增加提高壓后產能的可能性。
本次研究的數據預處理包括從收集的1 347 個層位數據中去除了不具有代表性、數據量過少的層位(盒7 和山2)和壓裂方式(水平井壓裂和Hi-Way壓裂)。處理后的1 219 個層位數據包括659 個盒8層位和560個山1層位的井叢井壓裂。
1.1.1 垂深對比
通過數據分析及綜合比較發現盒8層位的儲層深度要比山1 層位淺。其中盒8 層位的垂深主要集中在(3 500±70)m。山1 層位的垂深主要集中在(3 570±70)m。
1.1.2 孔隙度
綜合比較盒8 層位和山1 層位的孔隙度,數值近似相等,且分布集中。盒8 層位的孔隙度主要集中在7.0%±1.6%。山1 層位的孔隙度主要集中在6.7%±1.4%。
在東莞石排鎮產業現有資源的基礎上,建立東莞石排鎮各類企業之間的密切聯系,形成企業的核心價值。并在政府宏觀調控的政策下構建核心服務體系,形成區域較高的核心能力。并構建完善的培育機制,構建石排鎮強大的核心團隊。
1.1.3 滲透率
綜合比較盒8 層位和山1 層位的滲透率數值近似相等,且分布集中。盒8 層位的滲透率主要集中在(0.109±0.06)×10-3μm2。山 1 層位的滲透率主要集中在(0.105± 0.04)×10-3μm2。
1.1.4 砂體厚度
綜合比較知,盒8 層位要比山1 層位的砂體厚度厚。盒8層位的砂體厚度主要集中在6.5~15.3 m。山1層位的砂體厚度主要集中在5.3~13.0 m。
1 219 個層位包括 659 個盒 8 層位和 560 個山 1層位的壓裂數據,其用支撐劑設計體積、支撐劑施工體積、壓裂液設計體積、壓裂液施工體積、前置液設計體積、前置液施工體積6 個重點變量描述壓裂信息。通過數據可視化后,發現支撐劑體積和壓裂液體積呈現近似線性關系,如圖1(a)所示;如圖1(b)所示,支撐劑體積和前置液體積呈現近似線性關系。山1和盒8層位均呈類似規律。
產量數據通常包含投產前的無阻流量(AOF)和投產后一段時間內的累計產量。由于一口井可能存在多個層位,一口井的壓后產量無法簡單地和每一層的儲層和壓裂數據建立變量聯系,因此產量數據的選擇難度非常大。但單層位井,每口井只有一層,則壓后產量和儲層與壓裂數據建立的聯系是準確的。

圖1 壓裂信息層位對比
在選擇機器學習輸入產量數據上,鑒于準確性和實驗性考慮,選擇投產前158 口單井單層的無阻流量作為最終輸入數據。盒8層位的動態無阻流量數值平均值介于(5~22)×104m3/d。山1 層位的動態無阻流量數值平均值介于(5~21)×104m3/d。盒8 層位的無阻產量平均值要高于山1層位的產量平均值(表1)。

表1 蘇里格南層位無阻產量信息
模型變量的選擇處理。從收集的1 219 個層位壓裂數據中,通過數據特征排序得出,在以壓后產量無阻流量為因變量的條件下,經過機器學習中的變量排序,以信息增益率為指標[5],支撐劑體積和砂體厚度分別以0.05 和0.046 的得分排在前兩位,因此選用該兩項變量作為模型應用的自變量。從而將原始數據盡可能簡化成易分析、可解讀的三維數據。通過數據預處理,最終確定建立壓裂優化模型的變量組合:自變量X為砂體厚度,單位m;支撐劑體積Y,單位m3;因變量壓后產量Z,單位103m3/d。
數據模型的算法:首先應用降維算法將預處理得到的3 維數組降維成2 維,分析出2 維數據關系后,再將數據升維成3維數組,最后利用回歸算法得到的3維數組方程進行變量優化。
其中降維和升維的工作均在Python 中運用模型參數主向量PCA/主成分分析實現[6]。降維后的2維數組通過數據可視化分析發現,PCA和AOF的關系呈開口向下的拋物線關系,即在一定條件下,PCA的取值有最大值。當PCA取最大值時,對應的砂體厚度和支撐劑體積即為壓裂優化的優選參數。為了獲得PCA的最優值,利用無阻流量將2 維數據升維成新的3維數據。
升維后的3 維數據應用線性回歸求解后,得到線性回歸方程式:

式中:Vprop為支撐劑體積,m3;Hnet為砂體厚度,m;PCA為模型參數主向量。
最終求解出的回歸方程,即為壓裂優化方程。結合圖2 的主向量與無阻流量選擇曲線圖,可以畫出優化曲線,其含義是在已有數據訓練的模型下,模擬結果解釋為在儲層厚度一定的情況下,支撐劑體積和壓后產能表現呈現開口向下的拋物線關系,即當支撐劑體積在設計條件允許的情況下,盡可能地靠近頂點,可以增加提高產能的可能性。過少的支撐劑體積可能不利于壓后產量表現,而過多的支撐劑體積則可能不會增加壓后產量表現。

圖2 主向量與無阻流量選擇曲線圖
圖3 為砂體厚度和支撐劑體積的優化曲線圖。結合回歸公式可知,當PCA= 5 時,拋物線達到頂點,此時的最優支撐劑體積與砂體厚度的關系(圖3中紅色實線)為:Vprop=0.32×Hnet+36.69。
當PCA= -5 時,其位于拋物線頂點的左側,此時的支撐劑體積與砂體厚度的關系(圖3 中綠色虛線)為:Vprop=0.32×Hnet+28.99。
當PCA=15 時,其位于拋物線頂點的右側,此時的支撐劑體積與砂體厚度的關系(圖3中藍色虛線)為:
Vprop=0.32×Hnet+44.39
在壓裂施工中,如果在壓裂設計條件允許的情況下,結合砂體厚度,可以適當調整砂量。當設計的砂量使PCA落在頂點左側時,可以適當加大砂量,以達到獲得最優PCA的目的;當設計的砂量使PCA落在頂點右側時,可以適當減小砂量,以達到獲得最優PCA的目的。

圖3 壓裂參數優化圖
考慮到實際情況下的最優值會和理論最優值有差距,但是從優化的角度,提供若干個支撐劑體積設計參數后,結合砂體厚度,通過與對應的PCA理論值比較,可以提供設計支撐劑體積使PCA處于上升通道(拋物線頂點左側)還是下降通道(拋物線頂點右側)。因此優化的空間即為讓設計值落在藍色虛線和綠色虛線之間,并盡可能地靠近紅線,即為模型給出的最優設計。
以砂體厚度10 m 為例說明壓裂優化模型的意義,如圖4所示。結合線性方程可知,砂體厚度由模型給出的加砂量為40 m3時,PCA=5達到最優。
當砂量為32 m3時,對應的PCA值為-5,結合砂體厚度和壓裂設計等因素后,應適當增加支撐劑體積。
當砂量為48 m3時,對應的PCA值為15,結合砂體厚度和壓裂設計等因素后,應適當減少支撐劑體積。

圖4 機器學習模型應用示意圖
在假設壓后產量是砂體厚度和支撐劑體積兩項自變量相互作用的因變量表現的條件下,應用機器學習算法可以實現壓裂設計優化方案。
1)在儲層厚度一定的情況下,支撐劑體積和壓后產能表現呈開口向下的拋物線關系。
2)當設計支撐劑體積在模型給出的最優值左側時,設計條件允許的情況下,增加支撐劑體積,可以增加提高產能的可能性。
3)當設計支撐劑體積在模型給出的最優值右側時,代表過多的支撐劑體積可能不會增加壓后產量表現,應適當減少設計支撐劑體積。
4)機器學習模型是以158口單井單層的投產前無阻流量作為因變量,模型在投產后累計產量為因變量的情況仍需繼續研究。
5)機器學習的壓裂參數優化是建立在單一模型的基礎上,其他算法下的機器學習模型仍需繼續研究,以作為最終的優化模型投入實際生產。