許鑒源, 趙軍龍, 白 倩, 黃千玲
1. 西安石油大學(xué) 地球科學(xué)與工程學(xué)院, 陜西 西安 710065; 2. 陜西省油氣成藏地質(zhì)學(xué)重點(diǎn)實(shí)驗(yàn)室, 陜西 西安 710065
測井流體識別是以測井資料為主要依據(jù), 對儲集層巖性、 物性及儲層流體情況進(jìn)行有效的刻畫研究。目前, 巖性測井系列(自然電位、 自然伽馬)、 孔隙度測井系列(聲波、 密度、 中子)、 電阻率系列(雙側(cè)向、 微電阻率、 方位電阻率及陣列感應(yīng)) 以及工程測井系列(井徑、 井斜方位) 是致密砂巖儲層主要的測井識別系列[1], 由于地下地質(zhì)對象的隱蔽性和復(fù)雜性, 以及地球物理測井(測井) 資料信息的處理及解釋是以巖石物理機(jī)理模型為基礎(chǔ), 需要許多先驗(yàn)條件, 這些測井方法雖然各有所長, 但在實(shí)際情況中單獨(dú)使用某類測井方法會造成解釋結(jié)果的多解性及不確定性問題, 難以準(zhǔn)確識別出地層的流體性質(zhì)[2,3]。 傳統(tǒng)的巖心觀測法因有限的巖心, 而僅能反映井眼附近區(qū)域的流體分布情況, 但該方法識別效果較為準(zhǔn)確。雖然目前儲層流體是可以通過新的特殊測井方法獲得較為準(zhǔn)確的識別, 但受限于成本及特殊測井方法在老井中采集資料困難等原因, 導(dǎo)致特殊測井方法沒有大規(guī)模普及使用, 因此主要識別流體的測井方法還是依賴于常規(guī)測井資料[4]。 其中曲線重疊法和流體識別因子交會圖法是流體識別工作中應(yīng)用比較多的兩種能對儲層流體進(jìn)行直觀快速識別的定性方法, 任培罡等[5]基于雙孔隙度重疊法, 構(gòu)建了流體識別因子—孔隙度交會圖進(jìn)行流體識別取得了不錯的應(yīng)用效果。
隨著物探智能化水平的提高發(fā)展, 將機(jī)器學(xué)習(xí)的算法與測井響應(yīng)特征研究綜合起來, 進(jìn)行海量測井?dāng)?shù)據(jù)的加工、 挖掘和利用, 最終完成測井解釋取得了較好的效果[6]。 趙倩[7]建立了以流體特征作為參數(shù)的決策樹模型, 并與傳統(tǒng)地球物理圖版結(jié)合有效解決了圖版法的不確定性問題; 廖廣志等[8]對壓汞毛管壓力數(shù)據(jù)使用主成分分析、 灰色關(guān)聯(lián)分析、 智能聚類和因子分析等數(shù)據(jù)挖掘算法進(jìn)行深度分析, 對比預(yù)測結(jié)果和測井解釋反映的孔滲特征發(fā)現(xiàn)兩者一致性較高;易軍等[9]以鄂爾多斯盆地致密砂巖儲層為研究對象,提出一種基于改進(jìn) ADASYN (Adaptive Synthetic Sampling Technique) 數(shù)據(jù)增強(qiáng)的致密砂巖儲層流體識別集成學(xué)習(xí)方法, 提出的方法的試氣平均準(zhǔn)確率為91.1%; 何健等[10]為了提高儲層流體識別的精度與可靠性, 選擇隨機(jī)森林算法結(jié)合地震資料識別儲層流體, 該算法減弱了單一流體識別因子所引起的多解性; 羅剛等[11]針對儲集層流體識別任務(wù), 采用卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)分別表征測井曲線時序特征以及多條測井曲線之間的相互關(guān)聯(lián)關(guān)系, 克服了儲層流體識別任務(wù)中的各種問題。
考慮到機(jī)器學(xué)習(xí)算法中的隨機(jī)森林算法引入了隨機(jī)性不容易過擬合、 能夠有效的在大數(shù)據(jù)集上運(yùn)行及訓(xùn)練速度快等特點(diǎn), 魏佳明和韓家新[12]利用隨機(jī)森林算法預(yù)測儲層孔隙度; 任雄風(fēng)等[13]利用隨機(jī)森林算法預(yù)測濁積巖儲層厚度; 李文斌等[14]使用隨機(jī)森林回歸分析預(yù)測了巖體結(jié)構(gòu)面粗糙度系數(shù); 王民等[15]建立了基于隨機(jī)森林算法的巖相識別模型,有效解決了巖相類別不均衡的分類問題, 確定了有利巖相分布, 為后續(xù) “甜點(diǎn)” 提供支持; 聶云麗等[16]采用隨機(jī)森林機(jī)器學(xué)習(xí)方法結(jié)合多元信息,避免了單顆決策樹過擬合的缺陷, 有效完成頁巖氣“甜點(diǎn)” 預(yù)測。 本文在前人研究成果的基礎(chǔ)上, 針對鄂爾多斯盆地M 區(qū)塊長3 儲集層開展流體識別研究,基于收集到的研究區(qū)測井資料、 地質(zhì)資料進(jìn)行流體預(yù)測, 以提高流體性質(zhì)識別的準(zhǔn)確性。
前人對于利用常規(guī)測井資料識別流體性質(zhì)提出了許多方法, 如測井參數(shù)曲線重疊法中的雙孔隙度曲線重疊法、 三孔隙度曲線重疊法和徑向電阻率比較法,交會圖法中的電阻率—孔隙度交會圖、 電阻率—聲波時差交會圖、 Hingle 圖版等流體定性識別方法。 定量評價有基于阿爾奇公式的計算方法、 基于Biot-Gassmann 理論的定量計算方法、 利用ΔlgR 計算公式判別含油氣性等。
徑向電阻率法是直觀定性識別油層的重要方法,泥漿侵入使得井眼附近的巖層電阻率發(fā)生變化, 從電阻率徑向變化特征將泥漿侵入造成徑向電阻率不同的情況分為兩類(以淡水泥漿為背景): 一是增阻侵入, 當(dāng)?shù)貙又性辛黧w的電阻率比較低時, 電阻率較高的泥漿濾液侵入后造成侵入帶巖石的電阻率升高, 表現(xiàn)為Rxo〉Rt, 即當(dāng)深探測電阻率低于淺探測電阻率時, 判別此處為地層水礦化度較高的水層;二是減阻侵入, 當(dāng)?shù)貙又性辛黧w的電阻率比較高時, 泥漿濾液侵入后造成侵入帶巖石的電阻率降低,表現(xiàn)為Rxo〈Rt, 即當(dāng)深探測電阻率高于淺探測電阻率時, 判別此處為地層水礦化度不高的油層。 將電阻率特征法識別流體性質(zhì)應(yīng)用于本研究區(qū)儲層, 其結(jié)果與試油結(jié)論對比見圖1, 針對本地區(qū)五口井使用電阻率特征法開展流體性質(zhì)識別, 識別效果均表現(xiàn)較差。

圖1 DG-02 井電阻率特征法識別流體性質(zhì)成果圖Fig.1 Results of resistivity characterisation of well DG-02 to identify fluid properties
造成深淺探測電阻率差異識別流體類型效果較差的現(xiàn)象是由于低孔低滲砂巖儲層流體的測井響應(yīng)特征差異不明顯、 研究區(qū)儲層是低電阻率油層, 造成電性曲線劃分油水層困難, 甚至無法劃分出油層和水層。
用于表示地層的測井參數(shù)和其他參數(shù)之間關(guān)系的圖即為交會圖。 交會圖的可應(yīng)用場景豐富, 如收集資料時可以檢查測井曲線質(zhì)量, 進(jìn)行測井資料預(yù)處理時的曲線校正, 測井解釋過程的鑒別地層礦物成分、 識別地層孔隙流體類型、 評價地層等, 因此交會圖成為了測井分析工作者實(shí)用、 強(qiáng)勁的工具。
研究區(qū)塊地質(zhì)構(gòu)造復(fù)雜, 油水層測井響應(yīng)特征不明顯, 難以準(zhǔn)確區(qū)分流體性質(zhì)。 在前人研究的基礎(chǔ)上, 結(jié)合當(dāng)前區(qū)塊儲層特征與四性關(guān)系使用交會圖版開展流體性質(zhì)識別。 交會圖圖版是用來表示給定巖性的兩種測井參數(shù)關(guān)系的解釋圖版, 它們是根據(jù)測井響應(yīng)關(guān)系建立的解釋圖版, 是測井解釋與數(shù)據(jù)處理的依據(jù)。 由于經(jīng)研究區(qū)塊的油層中泥質(zhì)含量較大,ΔGR可以反映地層中泥質(zhì)含量,Rwa囊括了儲層孔隙空間、 電阻率、 油層和水層的“線索”, 所以建立Rwa-ΔGR交會圖來反映地層流體情況, 見下圖2。 其中,

圖2 Rwa-ΔGR 交會圖Fig.2 Rwa-ΔGR meeting plates
式中:ΔGR-自然伽馬相對值, API;GR-自然伽馬實(shí)測值, API;GRmax-自然伽馬最大值, API;GRmin-自然伽馬最小值, API;Rwa-視地層水電阻率,Ω·m;φ-孔隙度,%;Rt-原狀地層電阻率, Ω·m。
油層的視地層水電阻率Rwa為高值, 且油層Rwa遠(yuǎn)大于水層, 因此油層和水層可以準(zhǔn)確劃分出來。 大部分油層與油水有明顯界限能夠較好的區(qū)分, 但有一小部分油層與油水同層相互重疊, 不易區(qū)分。 大部分水層與油水同層交織在一起, 無法準(zhǔn)確劃分出界線,由交會圖可得下表所示的流體性質(zhì)識別的劃分依據(jù)如下表1。

表1 流體性質(zhì)劃分依據(jù)表Table 1 Table of fluid properties classification basis
地層的含油氣性是巖層含油(氣) 飽和度定量描述, 含油飽和度是表征儲層含油性好壞的重要參數(shù)。飽和度是儲層定量評價、 區(qū)分流體性質(zhì), 劃分油水層等過程的重要指標(biāo)。 一般情況下含油飽和度與含水飽和度是互補(bǔ)關(guān)系(Sw+So= 1), 因此確定了含水飽和度也就知道了含油飽和度, 由此對儲集層含油水性質(zhì)做出評價。
眾多學(xué)者采用了體積模型與電阻率并聯(lián)概念及Archie 公式, 建立了不同的解釋模型, 得出的不同泥質(zhì)砂巖電阻率和含水飽和度公式如下表2 所示。

表2 常用飽和度計算公式Table 2 Common saturation calculation formulae
本研究區(qū)層段流體類型主要分為三類: 油層、 油水同層、 水層。 水層:Sw〉70%; 油水同層: 70%〉Sw〉50%; 油層:Sw〈50%, 應(yīng)用Archie 公式, 并且參考同一地理位置、 類型相差不大油藏的經(jīng)驗(yàn)公式對本區(qū)含油飽和度進(jìn)行計算, 劃分油水層成果如圖3 所示,結(jié)果符合率約為72.95%。

圖3 DG-02 井飽和度結(jié)論劃分流體性質(zhì)成果圖Fig.3 Map of the results of the classification of fluid properties by saturation conclusion for well DG-02
隨機(jī)森林算法的基本單元是決策樹, 通過集成學(xué)習(xí)的思路將眾多弱決策樹結(jié)合匯集成“森林”, 并對Bagging 算法進(jìn)行了改進(jìn)[17]。 相比于傳統(tǒng)決策樹在選擇劃分n個屬性是在當(dāng)前結(jié)點(diǎn)的屬性集合中選擇一個最優(yōu)屬性; 隨機(jī)森林是對基決策樹的每個結(jié)點(diǎn)都會先從該結(jié)點(diǎn)的屬性集合中隨機(jī)選擇一個包含m個屬性的子集, 再從m個屬性的子集中選擇一個最優(yōu)屬性進(jìn)行劃分[18]。
為了減少訓(xùn)練樣本規(guī)模不同造成的影響, 隨機(jī)森林采用的是自助采樣法為基礎(chǔ)的 “自助法”(boostrap) 重采樣技術(shù), 即對給定包含n個樣本的數(shù)據(jù)集K進(jìn)行采樣產(chǎn)生數(shù)據(jù)集K’, 每次隨機(jī)從K中挑選一個樣本放入K’ 中, 然后再將該樣本重新放回原始數(shù)據(jù)集K中, 因此下一次采樣過程中該樣本仍然有幾率被抽中[19]。 這樣進(jìn)行n次有放回采樣后就得到了包含n個樣本的數(shù)據(jù)集K’。 樣本在n次采樣過程中始終不被采到的概率為取極限得到:
即通過自助法重采樣技術(shù)初始數(shù)據(jù)及K中約有36.8%的樣本未出現(xiàn)在采樣數(shù)據(jù)集K’ 中, 這些數(shù)據(jù)被稱為袋外數(shù)據(jù)[20]。 基于自助法生成的k個決策樹即為森林。
另外隨機(jī)森林的優(yōu)勢包括以下幾方面: 一是人為干擾較少。 隨機(jī)森林算法在構(gòu)建流體識別因子的過程中能夠自動依據(jù)測井?dāng)?shù)據(jù)的樣本特點(diǎn)來確定分裂特征, 不需要人為干預(yù)對數(shù)據(jù)進(jìn)行預(yù)處理, 從而減少了人為干擾。 二是它可以處理大量的輸入變數(shù); 三是特征屬性突出。 隨機(jī)森林算法在隨機(jī)選取特征屬性進(jìn)行分裂的過程中, 可以通過比較訓(xùn)練集中各特征屬性之間的屬性值大小建立相互的影響關(guān)系, 再通過該關(guān)系衡量特征屬性的“價值”, 進(jìn)而為研究人員利用何種特征屬性進(jìn)行流體識別提供參考依據(jù)。
隨機(jī)森林是用bootstrap 方法構(gòu)建k個不同的訓(xùn)練數(shù)據(jù)集, 對于每個訓(xùn)練集, 構(gòu)造一顆決策樹, 對于每一個節(jié)點(diǎn), 隨機(jī)選擇m個特征, 決策樹上每個節(jié)點(diǎn)的決定都是基于這些特征確定的。 根據(jù)這m個特征, 計算其最佳的分裂方式。 最終決策一般通過投票來獲得, 投票最多的為預(yù)測結(jié)果[21]。 隨機(jī)森林模型識別流體性質(zhì)的流程圖見圖4。

圖4 隨機(jī)森林算法流程圖Fig.4 Flow chart of the random forest algorithm
基于收集到的測井資料, 將與流體類型具有較高相關(guān)關(guān)系的自然伽馬(GR)、 自然電位(SP)、 地層真電阻率(Rt)、 聲波(AC)、 密度(DEN)、 中感應(yīng)電阻率(RILM) 作為流體識別的特征參數(shù), 試油結(jié)論視為真值(1 代表油層, 2 代表油水同層, 3 代表水層), 在Python 環(huán)境下構(gòu)建基于隨機(jī)森林算法的流體識別模型, 修改模型各參數(shù)配置。
對于本模型參與訓(xùn)練的輸入特征曲線重要度如圖5 所示, 自然伽馬的權(quán)重影響因子為7.8%, 自然電位的權(quán)重影響因子為15.5%, 地層真電阻率的權(quán)重影響因子為35.4%, 聲波的權(quán)重影響因子為14.9%, 密度測井的權(quán)重影響因子為9.8%, 中感應(yīng)電阻率的權(quán)重影響因子為16.6%。 因此可見, 地層真電阻率是流體識別的最重要的影響因素, 余下測井曲線數(shù)據(jù)對隨機(jī)森林識別流體模型的重要性從大到小依次為: 中感應(yīng)電阻率、 自然電位、 聲波、 密度測井、 自然伽馬。地層真電阻率與中感應(yīng)電阻率是評價儲層含油性的指標(biāo), 聲波時差與密度測井代表著孔隙空間, 自然電位與自然伽馬則是反映了巖性, 其重要度與實(shí)際情況基本一致, 該結(jié)果提示在判別流體類型時應(yīng)該多注意對地層電阻率以及自然電位和聲波測井?dāng)?shù)據(jù)的收集與關(guān)注。

圖5 輸入特征重要性分析圖Fig.5 Input feature importance analysis diagram
檢驗(yàn)隨機(jī)森林模型識別效果如圖6, “1” 代表油層, “2” 代表油水同層, “3” 代表水層。 圖中綠色為實(shí)際試油結(jié)論, 紅色為隨機(jī)森林模型預(yù)測儲層油水情況。 預(yù)測結(jié)果與試油結(jié)論基本一致, 預(yù)測成功率較高, 模型正確率達(dá)90.47%。

圖6 隨機(jī)森林模型檢測圖Fig.6 Random forest model detection map
1) 常用流體識別方法在M 區(qū)塊長3 低孔低滲儲集層中并未取得較好識別效果, 可能是由于研究區(qū)儲層包含低電阻率油層, 且徑向電阻率曲線對比法識別流體性質(zhì)僅關(guān)注了電阻率特征單一因素, 無法滿足日趨復(fù)雜的實(shí)際流體情況, 導(dǎo)致應(yīng)用效果差。 交會圖版法可以基本準(zhǔn)確識別出油層與水層差別, 但對于區(qū)分性質(zhì)接近的水層與油水同層還需要進(jìn)一步研究。
2) 基于常規(guī)測井?dāng)?shù)據(jù)對M 油田低孔低滲儲層使用隨機(jī)森林方法進(jìn)行流體識別, 相較于徑向電阻率法與交會圖版法等傳統(tǒng)地球物理解釋方法無法融匯多信息的欠缺, 隨機(jī)森林方法規(guī)避了只分析單一信息的的不足, 結(jié)果更加真實(shí)可靠, 準(zhǔn)確率高, 且方法簡便易于操作, 在研究區(qū)內(nèi)取得了較好的識別效果。
3) 運(yùn)用隨機(jī)森林算法識別流體性質(zhì), 只是智能算法與地球物理科學(xué)結(jié)合解決地質(zhì)問題中的一種方面, 但這一方法的實(shí)現(xiàn)為進(jìn)一步針對低孔低滲儲層特性實(shí)現(xiàn)智能算法解決其他地質(zhì)問題提供了思路。