商永濤,林新宇,李相亮,李 輝
(中海油服油田生產研究院,天津 300459)
目前傳統壓裂施工參數優化過程繁瑣、求解困難;同時油田領域測試數據正以井噴般的速度增長,但大量的數據并沒有給石油技術人員提供有用的指導信息。隨著大數據時代的來臨及數據挖掘技術在工業領域的普及,使得通過數據挖掘技術輔助壓裂優化成為一項極具研究價值的任務。
臨興神府致密氣區塊位于鄂爾多斯盆地晉西撓褶帶西北緣,沉積條件復雜,主力氣層主要為二疊系石千峰組的千五段、上石盒子組、下石盒子組、山西組和太原組等,單井氣層總厚度在27.4~109.6 m,平均為45.2 m。儲層主要表現為橫、縱向非均質性強、連續性差,低孔、低滲,自然產能很低或基本無產能。截至2020 年勘探探明地質儲量超2 200×108m3,但目標區塊儲層為辮狀河沉積,河道窄,砂體展布情況辨識困難,需借助鉆井、壓裂識別;單層控制儲量低,需要長水平段、較多裂縫、較長裂縫來提高產能,亟需尋求一套科學經濟有效的開發方式,將儲量變為產量,以實現非常規油氣的快速發展。
臨興神府致密氣田的有效開發,水平井分段壓裂是一項重要手段。工程質量和工程效率是各項作業的首要保證,隨著鉆井作業的持續增加,在已基本摸清目前地層地質條件的基礎上;對單井易漏失層、易坍塌層和異常地層進行精確研究和大數據分析,通過優化水平井井身結構,達到節約成本、降低鉆井投資的目的。針對性的優化壓裂液性能等多種工藝措施,可實現致密氣藏的高效開發,其分段壓裂工藝技術及壓裂液體系得到進一步探索和完善,達到了推廣的條件。
通過不斷探索、科研攻關及實踐,逐步形成了一系列適合臨興神府區塊致密氣藏開發的壓裂參數優化關鍵技術。臨興神府致密氣水平井高效壓裂技術的研究和應用,解決了工區致密氣藏“低孔、低滲、低壓、低溫”難題,提高了致密氣藏儲量動用程度和采收率。在技術創新、經濟效益及推廣應用方面具有重大價值及意義,有效解決了臨興致密氣田開發難題,填補了中海油陸上致密氣田開發的技術空白,推廣應用價值高,可用于晉西、神府區塊的后續大規模開發,對中海油四海低孔低滲油氣藏可提供全新的經濟有效的開發方案。
隨著大數據的發展,油氣行業數據不斷地擴大,應用大數據分析可以更快的獲取得到信息。通過對壓裂生產中大數據的分析研究,實現壓裂井綜合分析、產能預測,為壓裂工藝提供更準確的決策依據,達到壓裂施工降本增效的目的。工藝參數的優化也決定了壓裂效果,壓裂效果會受到儲層滲透率、孔隙度、儲層壓力、儲層巖石力學性質等儲層參數的影響,還會受到壓裂工藝參數的影響。通過產能預測模型,計算與評價不同尺寸和導流能力的裂縫對產能帶來的影響,不斷實現對裂縫參數的優化。
本研究基于收集的瑪湖地區壓裂水平井數據,通過缺失值填補、異常值識別和數據縮放等預處理工作提高數據質量;基于隨機森林算法分析了影響水平井壓裂效果的主控因素,建立各項特征參數與最終可采儲量(Estimated Ultimate Recovery,EUR)之間的數學模型,從而實現水平井的壓裂參數定量優化,達到針對性地指導壓裂方案設計的目的。
森林隨機算法是一種簡單靈活的機器學習算法,森林學習能夠進行準確性和穩定的預測[1]。隨機森林優勢在于可用于分類,也可以用于回歸預測。
本算法中隨機森林構建的流程如下:
(1)從數據集中隨機選出m 個樣本,構成一個訓練集A,其余作為測試集B,再從訓練集A 中采用自助采樣法進行T 次采樣,形成T 個采樣集。
(2)對于T 個采樣集建立含有T 棵回歸樹的隨機森林模型進行訓練,各個模型的節點參數可由網格搜索方法進行優選得到。靜態產量預測屬于回歸問題,最終的預測結果可由各決策樹模型的回歸結果之和平均得到。
常用的回歸模型評價指標有均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)。各指標的大小隨著業務不同而不同,不具有普遍可讀性,因此采用決定系數R2方法作為隨機森林的評價指標,即:

式中:Ya-實際值;Yp-預測值;Ym-平均值。
分母部分表示原始數據的離散程度,分子部分表示預測數據與原始數據的誤差,二者相除可以消除原始數據離散程度的影響。一般來說,R2的取值范圍為[-∞,1],越接近1,表明模型對變量的解釋能力越強,擬合效果越好。在上述理論的基礎上構建用于產量預測的灰色關聯投影-隨機森林算法模型(見圖1)。

圖1 產量預測算法流程
優選適合鄂爾多斯盆地頁巖油水平井EUR 計算評價方法,分析關鍵影響因素與EUR 敏感性關系,編制頁巖油水平井EUR 計算評價分析模塊,并集成到地質工程一體化支持決策系統平臺,為頁巖油水平井體積壓裂方案優化提供指導依據[2-4]。收集基礎參數、改造參數、改造強度參數、生產參數等數據,利用EUR 計算及相關性分析結果為依據,采用數據挖掘方法建立EUR 預測模型,利用模型進行EUR 預測及參數優化(見圖2)。

圖2 壓裂參數分析模型建立
甜點識別及儲層分類包括地應力分析、儲層分類識別等功能[5-7]。
(1)地應力分析:基于測井曲線,以先進完善的橫波計算技術及模擬正交偶極應力差的計算方法為核心,計算巖石力學參數及地應力參數。
(2)儲層分類識別:基于甜點判識業務規則及算法,實現工程、地質甜點和儲層分類的快速、準確求取。
工程甜點的相關參數包括:脆性礦物含量、泥質含量、斷裂韌度、脆性指數、楊氏模量、泊松比、弱層理面、微裂縫數量、最大及最小水平主應力、應力差異系數、孔隙壓力梯度、破裂壓力和埋藏深度等。
為了準確獲得脆性指數、楊氏模量、泊松比、最大及最小水平主應力、應力差異系數、破裂壓力,對相關參數的計算公式進行了研究。并基于公式進行了相關參數的計算,以支撐工程甜點判識方法和標準的制定研究。根據儲層物性及黏土礦物含量特征,確立分類標準(見表1)。

表1 儲層分類標準匯總表
目前業內公認的影響壓裂施工效果的參數主要有楊氏模量、泊松比、水平最大主應力、水平最小主應力、破裂壓力、應力差異系數、脆性指數等參數,故可通過相關參數與能夠表征工程甜點的參數建立擬合公式。
工程甜點好壞的直接影響便是壓裂后產量的差異,一般認為工程甜點發育的井段,壓裂效果相應會好,從而可以得到更好的產量。根據產液量與壓裂液、砂量等進行數據交會圖的繪制,發現隨著壓裂液和加砂量的增加,水平井產量也呈現明顯的上升趨勢,其中建立擬合公式的相關性較好,因此可嘗試將壓裂液量和加砂量作為工程甜點的表征參數,用壓裂液量和加砂量與巖石力學、地應力等相關參數建立關系來反映這些參數與工程甜點的相關性(見圖3)。

圖3 EUR 相關性分析結果圖
從圖3 中可以看出,工程影響因素中,參與相關性分析影響因素共4 個,與產能相關系數最高為水平段長(0.39),最低相關系數為用液強度(0.14)。以壓裂產量作為目標值,計算各個地質因素與產量的關聯度,結果(見圖4)。

圖4 關聯度計算結果
根據計算結果,地質因素中,滲透率、密度與產量的關聯度最高,主壓裂液量與產量的關聯度最低。
長慶油田鄂爾多斯南部盆地的致密油儲集層物性差,主要采用“長井段水平井+體積壓裂”開發模式,改變原有儲層環境,導致公式法、驅油效率法及相滲法不再適用于本區塊研究。壓裂測試井信息(見表2)。

表2 壓裂測試井參數表
通過文獻調研、現場調研及算法優選,建立適合鄂爾多斯盆地已壓裂的頁巖油水平井的EUR 計算評價方法。結合現場實際壓裂后油藏開發狀況,遞減法預測EUR 更適合于長慶油田鄂爾多斯南部盆地的致密油藏(見表3、圖5)。

圖5 優選EUR 評價方法過程圖

表3 推薦算法規則
指數遞減,產量與時間關系如下:

式中:Q-遞減階段t 時刻的產量,m3/d;Qi-遞減階段開始時(t=0)的產量,m3/d;D-月遞減率,小數。
雙曲遞減,產量與時間關系如下:

式中:Di-遞減開始時間的瞬時遞減率,小數;n-遞減指數,0~1。
調和遞減,產量與時間關系如下:

對于壓裂參數優化涉及的因素權重設計(見表4)。

表4 各影響因素權重設計表
采用指數遞減、雙曲遞減、調和遞減3 種遞減方式進行壓裂產能預測(見表5)。

表5 L-28 井壓后產能預測
在石油領域,據統計目前國際石油公司75%的信息化投入與大數據有關,按照行業數據評估,經過大數據分析優化,石油公司至少可以提高8%的產量和6%的采收率?;跈C器學習的壓裂參數優化方法軟件設計了數據管理、甜點識別、相關性分析、智能建模、關鍵參數優選及方案自動生成等功能模塊。內置工程甜點判識、水平井壓裂分段和射孔簇位置優化的最新規則及算法,實現壓裂甜點、水平井壓裂射孔簇位置的快速、準確判識,有效提高壓裂設計方案的完整性和可行性。