宋歌
本文以儲集層含油氣作為研究對象,用機器學習為基于測井解釋的儲層評價提供了一種自動有效的方法,提出了測井儲層評價的機器學習框架,并在2個測井數據集上對其性能進行了驗證。實驗結果表明,測井解釋結論與試油結果一致,與傳統的評價方法相比,該方法效率高,為石油勘探開發大數據平臺的建設提供了參考。
儲層評價的基本思路是充分利用測井資料等多種資料,對儲層特性進行評價,如含油性評價、儲層分類、儲層參數預測和產能估算等。隨著測井資料的不斷積累,勘探開發的重要難點是如何更加充分地挖掘和分析地質數據。機器學習提供了一種新的有效方法,被認為是石油勘探開發領域十大技術之一,被成功地應用于油藏實時動態監測、石油工程工作最佳實踐識別以及油藏描述酬等領域,這些非線性方法優于線性統計分析技術,在石油勘探開發中得到了廣泛應用。在測井解釋方面,機器學習的優點是不需要事先具備巖石物理機制等專業知識,只需要少量的背景知識,直接從地質資料中構建模型。機器學習中的分類技術是儲層評價中最密切相關的工作,廣泛應用于巖性識別、沉積相劃分、儲層參數預測和油氣水層識別等。本文分析了基于測井解釋的儲層評價流程,提出了一套基于機器學習的測井儲層評價框架。
地球物理測井是利用物理原理解決地球物理問題的一種方法。利用儲層電化學性質、傳導特性、聲學特性和放射性等來預測地球物理參數,主要有數據采集和測井解釋兩大任務。
儲層評價的主要任務是利用測井原始資料對儲層的孔隙度、含油飽和度和巖性特征等進行綜合評價。測井原始數據主要包括電位曲線(SP)、伽馬曲線(GR)、電阻率曲線(RT,RI,RXO、密度測井(DEN)、聲波測井(AC)和補償中子測井(CNL)等測井曲線,除原始測井數據外,還采集了關鍵井的實驗數據。對于關鍵井,不僅要進行綜合錄井采集原始資料,還要進行取芯井巖石樣品的實驗。通過對非臨界井的孔隙度和滲透率等實驗數據的分析,得到巖性和含油性質。
機器學習提供了一種新的有效方法。在測井儲層評價中,孔隙度、滲透率及飽和度等參數的計算,與監督學習中的回歸任務相對應。油層識別、巖性識別和沉積相劃分對應監督學習中的分類任務。油氣勘探開發專家在計算完儲層參數后,結合計算結果和給出最終評價結論。這完全取決于專家經驗,而機器學習為儲層測井評價提供了一種自動、數據驅動的方法。
屬性選擇
由于輸入數據的維數比傳統方法高得多,可能導致數據擬合過度,建模時需要進行特征選擇。測井解釋常用的特征選擇方法有交會圖法、相關分析法和專家經驗法。特征選擇有嵌入方法、過濾方法和包裝方法3種工作模式。特征選擇是嵌入式算法的一部分。濾波方法是一種獨立于分類器的方法,如基于相關性的特征選擇。
模型優化
不同算法的性能在很大程度上取決于模型參數的設置。因此有必要對模型進行優化。在大多數情況下,設置參數只能依靠經驗或對比實驗,對模型參數優化的研究也很少。一種有效的方法是K交叉驗證和網格搜索相結合。K交叉驗證:訓練數據集將被拆分為個大小相同的獨立文件。選擇-1作為訓練數據集,其余作為測試數據集。建模過程將重復次,并選擇次迭代后的MSE平均值來估計預期的泛化誤差。
模型評估
由于鉆井取心的成本很高,因此很少有可用于訓練的數據。模型評估應采用交叉驗證,除了對分類器進行評價外,還需要進行統計檢驗。
新區塊、新層儲層評價一直面臨新的問題,不同的預測建模方法難以從理論上分析其優缺點,只能通過實驗來確定其適用性。比較了前面提到的框架與傳統的儲層測井評價方法在2種測井數據上的性能,訓練數據集由盆地致密砂巖巖心測井曲線和數據組成,分類標簽為含油氣評價結果,算法用Python語言開發。
(1)儲層參數預測對于第一個數據集,回歸任務是由MRA構造的,因為通常是一個線性問題。由于第二個數據集的非線性,采用了LSSVM,用F檢驗驗證方程的有效性,t檢驗驗證方程系數的有效性。對于修正后的最終模型,第一個數據集的F檢驗P值為4.645E-08,第二個數據集的F檢驗P值為6.996E-07,這表明回歸模型是有效的。
(2)基于機器學習的儲層測井解釋,使用支持向量機、決策樹、貝葉斯、人工神經網絡(ANN)對預測模型進行訓練,并使用十折交叉驗證對模型進行驗證。
總之,機器學習提供了多種建模方法,擴展了儲層評價方法,使分析不僅可以進行預測,而且可以發現新的知識。特別是面對大數據的挑戰,在面臨新問題的同時,快速給出解決方案。為了提高效率,建議開發與現有測井解釋評價軟件相結合的機器學習軟件,不斷豐富算法庫,為解決這一問題提供最佳方案。