












關鍵詞:TOC含量,敏感參數,卷積神經網絡,波形指示模擬
0 引言
頁巖氣是重要的非常規油氣資源,儲存于富有機質頁巖中,可作為傳統石油和天然氣的接替資源。頁巖有機碳含量(TOC)是評估頁巖氣資源潛力和開發可行性的關鍵指標之一,因此開展TOC預測對頁巖氣儲層評價至關重要。
傳統的TOC預測方法主要包括地球化學實驗方法、常規測井模型法、數學統計法和經驗公式法[1]。其中:①地球化學實驗方法能夠精確測定TOC,但成本高昂且難以精細表征頁巖TOC的空間分布特征[2]。②常規測井模型法主要是根據總有機碳含量與其他測井數據之間的響應特征構建TOC計算模型[3]。譚佳靜等[4]基于不同巖石類型對測井參數的響應特征建立自然伽馬能譜測井模型,運用釷/鈾比對TOC進行擬合。③數學統計法利用數學統計方法處理分析測井資料,建立統計模型預測TOC[5]。何沂等[6]使用主成分分析法提取測井資料的主要成分,并將其作為支持向量機的輸入參數進行模型訓練,以提升預測精度。該方法通過對大量樣本進行分析,可準確地計算TOC并進行儲層評價,但當樣本較少時容易出現過擬合現象。④經驗公式法主要是基于經驗公式來計算有機碳含量的方法[7]。陳祖慶等[7]通過建立密度和TOC之間的最佳擬合方程得到了計算TOC的經驗公式,并以疊前反演得到的密度體為基礎,在四川盆地焦石壩地區實現TOC定量預測。在前人提出的ΔlogR法用于計算TOC基礎上[8],周純潤等[1]基于ΔlogR-GR法對四川盆地東南部茅口組進行烴源巖評價,通過分析茅口組測井響應特征,疊合ΔlogR法與自然伽馬法TOC計算結果,有效提高TOC計算的精度和可靠性。
總體來說,地球化學實驗方法測定TOC需要測試巖樣,而巖樣數量稀少、難以獲取,無法實現區域的TOC評估;常規測井模型法只適用于利用測井資料進行井位處的TOC計算;數學統計法適用于埋藏淺、構造相對簡單的地層,對于埋深較大、厚度較小、構造相對復雜的深層頁巖儲層,很難有效實現復雜地質條件下頁巖儲層TOC的三維空間定量預測;經驗公式法僅局限于特定區域和條件,忽視了多因素的復雜交互,且對數據的依賴可能導致預測可靠性下降。
隨著人工智能的發展,基于數據驅動的深度學習方法廣泛應用于地球物理勘探,包括波形初至拾取、地震去噪、波阻抗反演及地震屬性分析等。深度神經網絡(DeepNeuralNetwork,DNN)能夠自動提取數據的深層特征,憑借其強大的非線性擬合能力[9],常被用于儲層參數預測。Zhang等[10]利用深度編碼器—解碼器神經網絡挖掘了測井曲線與TOC之間的復雜非線性關系。卷積神經網絡(ConvolutionalNeuralNetwork,CNN)作為深度神經網絡的一種,是目前解決地球物理問題最有前景的方法之一。許多基于CNN學習類方法已應用于地震數據處理、解釋,如插值、去噪、波阻抗反演、層位追蹤等[11]。由于其在特征提取方面的優勢,常應用于挖掘和映射測井曲線與TOC之間的多尺度非線性特征[12]。Asante‐Okyere等[13]利用頁巖礦物組成和測井數據建立用于預測TOC的深度卷積神經網絡模型,通過對礦物和TOC進行相關性分析,選取與TOC相關性高的礦物成分含量作為CNN的輸入用于實現TOC預測。然而,該類方法主要集中于學習目標層的測井響應特征,實現了基于測井資料井點處的TOC定量預測,但無法實現井位之間區域的TOC預測。王惠君等[14]以鄂爾多斯盆地杭錦旗地區上古生界泥質烴源巖為研究對象,通過將敏感測井參數輸入CNN模型實現了基于測井資料的TOC預測,并結合沉積微相完成TOC平面圖,但該方法適用橫向連續性強的地層,對于構造復雜、厚度薄的頁巖儲層仍存在難點。
針對頁巖儲層厚度薄、井間樣本數據缺乏等問題,本文基于敏感參數和TOC的相關性,提出了利用CNN定量預測TOC的方法。首先,結合研究區的地質情況,對測井資料與巖心TOC數據進行相關性分析并利用波形指示模擬技術獲取頁巖儲層的高精度三維敏感參數數據集,然后以此作為CNN模型的輸入;其次,在CNN模型結構中,將輸入的敏感參數歸一化后排列成一維網格狀數據輸入,并利用兩層卷積層和池化層進行特征提取及降維處理;最后,由全連接層對預測結果進行輸出,實現TOC三維預測。實際應用表明本文方法在頁巖薄儲層TOC預測方面具有優勢。
1 方法原理
1.1 敏感參數優選
選取鉆井資料齊全、有巖心實測TOC資料和相關測井資料的X1井、X2井,兩口鉆井共有263個實測巖心樣本資料。測井系列包括聲波時差(AC)、中子孔隙度(CNL)、密度(DEN)、自然伽馬(GR)、電阻率(RT)、鉀含量(K)、鈾含量(U)等。由于有機質的密度低于造巖礦物,隨著頁巖中有機碳含量的增加,頁巖密度逐漸降低。頁巖中含有大量的黏土礦物,如高嶺石、水云母等,這類礦物對陽離子吸附力強,可吸附很多放射性強的物質。頁巖形成過程往往伴隨著有機質的富集,在還原環境下促使鈾元素被有機質吸附,故鈾含量可有效表征TOC。而自然伽馬測井能夠反映地層中鈾、釷、鉀等放射性核素的含量變化,亦能作為關鍵評價指標。此外,TOC在一定程度上會對巖石某些物性參數產生重要影響,因此測井參數與TOC存在一定關聯。本文對巖心實測TOC數據與測井參數進行交會分析和相關性分析(圖1),其中r為相關系數,計算公式為
式中:n為樣本數量;xi和yi分別為兩個變量的第i個觀測值;-x和-y分別為兩個變量的平均值。
由圖1可見,各測井參數與TOC之間的相關系數平均絕對值在0.75以上。因此,本文選取了AC、DEN、CNL、GR、K、U等六種與TOC具有較強相關性的參數進行后續的研究。
圖2為X1井測井曲線圖。由圖2可見,龍馬溪組高TOC區域主要集中于龍一1亞段,高TOC區域測井曲線特征表現為低密度、高聲波時差、低中子孔隙度、高自然伽馬、高鈾、低鉀含量。
1.2 構建CNN模型
CNN是一種特殊的前饋人工神經網絡,主要用于處理和分析具有網格結構的數據,尤其是在數字圖像處理領域。CNN的結構與大多數神經網絡模型類似,包括輸入層、隱含層和輸出層。輸入層接收網格狀數據并將其傳遞到后續層,隱含層包括卷積層、池化層、激活層、丟棄層、全連接層等。
CNN的核心是卷積層,其內部存在多個卷積核,可利用卷積運算對輸入數據進行特征提取。在卷積層中,每個濾波器都在輸入的網格數據中滑動,通過計算濾波器與輸入數據的點積,從而提取出數據的特征。
池化層能夠減少特征圖的維度,降低空間不變性[15]。在經過卷積層的特征提取后,獲得的特征圖規模較大,計算過程較為復雜。因此,需要池化層對特征圖進行降維,可減少模型參數量、降低特征圖大小,從而降低計算難度,降低過擬合風險。池化有最大池化、平均池化、隨機池化等,其中最大池化是從激活映射的每個子矩陣中取最大值,并形成一個單獨的矩陣;平均池化是取子矩陣中所有元素的平均值。一般來說,在全連接層中,上一層的神經元與下一層的神經元具有完全連接性,能夠將卷積輸出的二維特征圖轉化為一維向量。在連接層之間存在丟棄層,其在收集神經元的訓練階段隨機丟棄神經元,不僅能夠減少全連接層的參數數量,還能夠防止網絡出現過擬合現象[16]。
本文建立的CNN預測模型包括輸入層、隱含層、輸出層(圖3)。由圖3可見,輸入層輸入敏感測井參數數據,并對其進行歸一化處理,用于消除敏感屬性與TOC含量之間的量綱差異并加速神經網絡的訓練,提高網絡的泛化性能[17]。網絡結構中隱含層部分由兩個“卷積層—池化層—激活層”、一個丟棄層和全連接層組成,其中卷積層的卷積核為3×1,池化層為2×1的平均池化核,步長為1。最后,通過全連接層進行回歸輸出。經反歸一化后得到預測TOC數據[18-20]。
CNN模型的訓練樣本由實測巖心TOC數據與前述優選的敏感測井參數組成,并按照7∶3劃分為訓練集和測試集。經訓練集數據訓練后,由測試集數據進行檢驗。當模型的測試標準準確率gt;95%時,認為該模型訓練完畢,且預測擁有較高準確性。準確率計算公式為
式中:yi為預測值;yi為真實值;M為樣本個數。
1.3 波形指示模擬技術
傳統地質統計學反演方法依賴有限樣本表征儲層空間變化程度,然而樣本點分布不均會顯著降低模擬精度[21]。并且,地質統計學基于變差函數研究空間信息的變化特征并不能準確地反映儲層沉積相的空間變化,導致模擬結果隨機性強[22]。地震波形指示反演技術不同于傳統地質統計方法,應用地震波形描述儲層橫向變化,通過馬爾科夫鏈蒙特卡洛隨機模擬算法模擬地震波形,進行初始模型調整,直至反演結果與地震信息、測井曲線結構吻合度達到最高。其基本思想為:以地震資料和測井資料之間的相似性為基礎,地震波形橫向變化代替變差函數,以地震波形相似性為指示因子,驅動井間寬頻測井曲線的模擬[22],獲取高頻成分,實現高分辨率反演。
波形指示反演的結果可分為低頻、中頻、高頻三個部分。反演結果的低頻部分來源于測井低頻信息;中頻部分來自于地震信息經道積分、稀疏脈沖反演等反演得到的結果;而通過高頻隨機模擬得到的高頻部分反演結果極大地提高了反演結果的分辨率。因此,其反演結果具有分辨率高、隨機性小、適用性強的特點。
波形指示模擬技術原理與波形指示反演技術基本相似,但波形指示模擬的結果不僅僅局限于波阻抗,還包括對儲層特征進行表征的彈性參數等[23]。通常情況下,傳統地震反射系數僅反映波阻抗信息,不能通過地震資料的“計算”來獲得其他測井曲線數據[22]。而波形指示模擬技術利用相似地震反射結構的巖性曲線進行對比,綜合考慮彈性參數等多方面信息,從而更全面地描述地下結構特征。
地震波形指示模擬技術根據波形相似性和距離來優化統計樣本。首先,按照地震波形特征對已知井的特征曲線進行分析,優選與井旁地震道關聯度高的井樣本組成樣本集;然后,提取樣本集中井的低頻部分用于建立初始模型;最后,聯合似然函數分布和先驗概率分布得到的后驗概率分布,以此不斷進行模型參數擾動,直至得到符合條件的反演結果。最佳截止頻率是波形指示模擬的關鍵參數,波形指示模擬具有低頻確定、高頻隨機的特點,因此,設置合適截止頻率對反演結果準確性有重要意義。在設置頻率過程中,計算不同頻率下預測點和其他井的波形相似性,擬合相關曲線,當相關性不隨著頻率變化并趨于穩定時,此時頻率為最佳截止頻率[24]。
1.4 TOC預測
圖4為TOC預測流程圖。首先,通過測井資料與實測TOC數據的相關性分析選取出TOC敏感測井參數,并利用敏感參數與實測TOC數據進行CNN模型的構建、訓練與驗證;然后,利用測井資料與地震資料制作合成地震記錄和井震標定,并利用波形指示模擬選取的敏感參數(AC、DEN、CNL、GR、K、U)為特征曲線進行三維反演;最后,將反演得到的三維敏感參數數據經過歸一化后,排列成1×6的網格狀數據輸入預先訓練好的CNN模型中,處理后將輸出結果反歸一化,可得到對應的三維TOC預測數據。
由于CNN模型預測精度受輸入的敏感參數數據約束,因此本文采用波形指示模擬技術獲取的三維高精度敏感參數數據作為驅動數據,可實現TOC的高精度三維預測。
2 地質模型實驗
設計一個薄層疊置模型檢驗本文方法的TOC預測有效性,地質模型參考四川盆地南部某工區龍馬溪組儲層參數與地質資料,并建立A、B、C三口偽井(圖5)。A、B、C三口偽井有AC、DEN、CNL、GR、K、U等測井曲線以及實測TOC,其中測井參數值為工區TOC預測區域測井曲線的平均值。川南研究區地震資料地震波的主頻為30Hz,分辨率極限為30m。由圖5可見,地層中發育兩套4m厚的薄層,兩套薄層縱向部分重疊,夾層厚度4m,頂底板圍巖厚度30m(圖5a)。地質模型參數見表1。利用模型的速度和密度獲取反射系數模型,然后與30Hz的零相位雷克子波進行褶積得到地震正演波形剖面,在地震記錄中添加高斯白噪聲來模擬地下環境(圖5b)。
對偽井的測井曲線進行預處理和時深標定后,依據合成的地震記錄建立簡單初始模型后進行波形指示模擬反演TOC敏感參數,波形指示模擬截止頻率設置越高,反演結果分辨率越高,但結果準確性卻不斷下降。由圖6可見,反演的敏感參數能夠區分薄層,但DEN、GR、K的反演結果在模型兩側存在些許誤差,沒有識別出單個薄層,但整體與地質模型參數較為吻合。
獲取預測樣本后,本文利用Matlab構建并訓練CNN模型。在訓練CNN模型時,由地質模型準確的TOC樣本與測井曲線組成的訓練樣本進行訓練。當訓練和驗證數據集的準確率都超過95%時,該模型損失較少,訓練結束。當CNN模型訓練結束后,其中每個層的參數都是固定的。利用波形指示模擬獲取的敏感參數歸一化后組成網格數據集輸入CNN模型,并將模型輸出反歸一化后可得到預測的TOC(圖7)。由圖7可見,TOC預測結果能夠識別出地質模型薄層疊置結構,由于多敏感參數的融合,減弱了波形指示模擬的不確定性。因此,本文方法對于薄儲層的TOC預測有較大優勢,具有可行性。
3 實際資料應用
研究區位于四川盆地南部,目的層為志留系龍馬溪組,是中國最重要的頁巖氣富集層位之一。研究區龍馬溪組埋深在4000m左右,為海相沉積。目標層的頁巖氣層具有厚度較小、埋藏較深、構造復雜等特點,優質儲層精細預測和評價難度大、勘探開發成本高[25-26]。而TOC是優質頁巖儲層預測和評價的重要指標之一[27]。為此,利用本文方法開展研究區龍馬溪組TOC的精細預測,為頁巖儲層預測和評價提供定量的指標。
選取研究區兩口資料齊全的鉆井X1、X2。依據兩口鉆井的實測巖心TOC數據以及測井曲線組建樣本數據集對CNN模型進行訓練及測試(圖8)。由圖8可見,訓練集和測試集結果準確率分別為99.92%、99.86%,表明利用該模型進行單井的TOC預測準確率高,預測效果好,預測模型可靠性高。
本文在相同樣本基礎上,分別利用BP神經網絡和多元回歸分析法對X1井樣本進行預測驗證,結果如圖9所示。由表2可見,CNN預測效果最好,相關系數達到0.97,且平均絕對誤差和均方根誤差皆小于0.3%,其次為多元回歸法和BP神經網絡法。因此,利用CNN模型進行研究區TOC預測,其結果優于BP神經網絡和多元回歸法,預測準確性高。
本文的TOC敏感參數主要通過波形指示模擬獲得。利用研究區疊后地震資料和優選的對TOC敏感的測井資料進行波形指示模擬,可得到各敏感參數數據體。圖10為龍一段的反演剖面圖,反演的TOC敏感參數體包含AC、DEN、CNL、GR、K、U等參數。由圖10可見,波形指示模擬反演得到的敏感參數數據與測井曲線基本吻合。由表3可見,多數參數反演結果符合率超過80%。表明反演結果整體滿足實驗要求。
將波形指示模擬獲得的AC、DEN、CNL、GR、K、U輸入訓練好的CNN模型,對全區TOC進行預測。圖11為研究區鉆井實測TOC與預測TOC的對比。由表4可見,其中X1井和X2井TOC預測值與實測值的相關系數分別為0.9107和0.8874,均方根誤差和平均絕對誤差均小于0.6%,說明該方法預測準確度高。
由圖12可見,研究區龍馬溪組龍一段TOC主要呈現下高上低的特點,其中下部區域TOC大部分大于2%,橫向連續性較好。圖13為研究區龍一1亞段下部TOC預測平面圖。由圖13可見,TOC整體大于2%,其中西南部分TOC較高,達到4%。X1井處預測TOC為1.757%,實測TOC為1.939%,絕對誤差為0.182%;X2井處預測TOC為2.942%,實測TOC為3.289%,絕對誤差為0.347%。因此,本文方法能夠精細化預測頁巖TOC的空間分布特征,具有一定可靠性。
4 結論
(1)針對頁巖儲層三維TOC定量預測問題,本文提出了一種基于卷積神經網絡并結合波形指示模擬的高分辨率反演實現頁巖TOC高精度三維定量預測的方法。
(2)通過優選對頁巖TOC敏感的測井參數,利用CNN建立測井參數與TOC之間的映射關系,并結合波形指示模擬對研究區進行敏感參數的高分辨率反演。最后,以反演參數數據為特征輸入,實現三維高精度頁巖TOC的定量預測。
(3)薄層疊置模型的試驗表明利用波形指示模擬的高分辨率反演結果能夠有效提高TOC預測的分辨率。而多敏感參數的融合輸入能夠提高模型的泛化性。四川盆地南部龍馬溪組頁巖實際應用結果顯示,本文方法在TOC的三維預測中,準確率和分辨率均較高,表明了該方法的應用效果良好。
(4)該方法只適用于測井參數與TOC之間存在較強響應的地區,對于地下巖性復雜、電性特征混亂的區域仍需要進一步的研究。