周雪 張珊珊 李祿勝 李玉蓉 柳偉明 趙曉亮 董鵬
1. 延長(zhǎng)油田股份有限公司志丹采油廠;2. 中國(guó)石油大學(xué)(北京)油氣資源與探測(cè)國(guó)家重點(diǎn)實(shí)驗(yàn)室
實(shí)際油藏非均質(zhì)性強(qiáng),油藏產(chǎn)能主控因素較難確定,因此也造成優(yōu)勢(shì)儲(chǔ)層難以判別[1]。目前,對(duì)于優(yōu)勢(shì)儲(chǔ)層的評(píng)價(jià)需要基于地震資料及測(cè)井資料等的深入研究[2-4],以及基于儲(chǔ)層巖心實(shí)驗(yàn)[5],難以推廣到預(yù)測(cè)整個(gè)油藏中優(yōu)勢(shì)儲(chǔ)層的平面分布[6],且不能兼顧井的實(shí)際生產(chǎn)情況,導(dǎo)致預(yù)測(cè)精度較低。
隨著算法以及算力的提升,應(yīng)用機(jī)器學(xué)習(xí)自動(dòng)進(jìn)行優(yōu)勢(shì)儲(chǔ)層判別成為可能。目前,主要以有監(jiān)督的機(jī)器學(xué)習(xí)算法來進(jìn)行自動(dòng)優(yōu)勢(shì)儲(chǔ)層判別。該方法使用地震數(shù)據(jù)、測(cè)井?dāng)?shù)據(jù)、巖性數(shù)據(jù)等,通過人工識(shí)別出優(yōu)勢(shì)儲(chǔ)層數(shù)據(jù)作為樣本來訓(xùn)練機(jī)器學(xué)習(xí)模型[1,7-9]。
然而,該方法首先需要人工為數(shù)據(jù)集標(biāo)定標(biāo)簽,提高了應(yīng)用門檻。此外,這些方法一般基于單井剖面進(jìn)行優(yōu)勢(shì)儲(chǔ)層評(píng)價(jià),無法確定全區(qū)的優(yōu)勢(shì)儲(chǔ)層分布。因此,筆者提出一種基于單分類支持向量機(jī)(OCSVM)[10]的全區(qū)儲(chǔ)層評(píng)價(jià)方法,該方法所使用的數(shù)據(jù)為三維地質(zhì)模型數(shù)據(jù)體。由于單分類支持向量機(jī)屬于無監(jiān)督算法,在實(shí)際訓(xùn)練過程中,無需專業(yè)人員對(duì)地震、測(cè)井等數(shù)據(jù)進(jìn)行優(yōu)勢(shì)儲(chǔ)層的標(biāo)簽標(biāo)定,僅需人為指定出高產(chǎn)井,并使用該井井周的三維地質(zhì)模型數(shù)據(jù)作為訓(xùn)練樣本。模型訓(xùn)練完成后,即可在全區(qū)范圍內(nèi)檢測(cè)高產(chǎn)區(qū)域,為后續(xù)井位部署及調(diào)整、油藏開發(fā)方案設(shè)計(jì)提供明確的參考標(biāo)準(zhǔn)。
在實(shí)際油田開發(fā)過程中,高產(chǎn)井?dāng)?shù)量較少,如何利用高產(chǎn)井所處的地質(zhì)信息來尋找出油藏中類似的區(qū)域分布對(duì)布井及開發(fā)有重要現(xiàn)實(shí)意義。該問題可看作只有一類樣本的新穎性檢測(cè)問題。將高產(chǎn)井近井地質(zhì)信息作為正樣本,通過檢測(cè)油藏中是否有類似特點(diǎn)的儲(chǔ)層以獲得較高的產(chǎn)量。本文使用單類支持向量機(jī)對(duì)儲(chǔ)層的地質(zhì)信息進(jìn)行檢測(cè),以獲得可能為高產(chǎn)區(qū)的優(yōu)質(zhì)區(qū)域平面分布來確定優(yōu)勢(shì)儲(chǔ)層。OCSVM是一種無監(jiān)督算法[11],已廣泛用于異常檢測(cè)及入侵檢測(cè)領(lǐng)域[12-14]。它學(xué)習(xí)一個(gè)決策函數(shù)來進(jìn)行新穎性檢測(cè),將新數(shù)據(jù)分類為與訓(xùn)練集相似或不同的數(shù)據(jù)。該算法尋找一個(gè)超平面使得正例盡可能遠(yuǎn)離原點(diǎn),預(yù)測(cè)則是用這個(gè)超平面做決策,該超平面被稱為決策邊界。若樣本落在決策邊界正方向,即認(rèn)為是正樣本,反之為負(fù)樣本,如圖1。

圖1 OCSVM分類問題Fig. 1 Classification of OCSVM
OCSVM的目標(biāo)函數(shù)為

為求解該問題,首先引入拉格朗日函數(shù)

式中,xi為樣本數(shù)據(jù);v為平衡參數(shù),是一待優(yōu)化超參數(shù);ξi為松弛變量,用于控制模型的擬合程度,其值越大,模型越傾向于欠擬合;Ns為樣本個(gè)數(shù); Φ為向特征空間映射的函數(shù);w和 ρ分別為特征空間超平面法向量和偏移量;α ,β為拉格朗日因子。
Φ(x)可 以使用核函數(shù)K(xi1,xi2)計(jì)算內(nèi)積

令Lp對(duì)w,ξ,ρ的偏導(dǎo)分別為0并代入式 (1),并將Φ(x)的內(nèi)積寫為核函數(shù)形式,可對(duì)原問題的對(duì)偶形式化簡(jiǎn)為

求得α,即可確定OCSVM模型。
由此,可通過決策函數(shù)判斷樣本是否屬于正例,如式(5),

若f(x)>0,則表示該樣本落在決策邊界正方向,判定為正例,反之為負(fù)例。可以看出,決策函數(shù)值表征了樣本在投影空間到原點(diǎn)的距離,其值越大,表明該樣本越接近正例樣本。
本文中,所使用的核函數(shù)為高斯核函數(shù),如式(6)。

式中,σ為徑向基半徑,其值大小表示樣本對(duì)其他樣本的影響程度,為待優(yōu)化超參數(shù)。
假設(shè)某區(qū)塊有生產(chǎn)井Ns口,該區(qū)小層數(shù)Nl層,地質(zhì)屬性特征Nf個(gè),則樣本集可表示為

在輸入OCSVM模型之前,對(duì)樣本集數(shù)據(jù)進(jìn)行歸一化

其中

最后,在特征維度按層對(duì)樣本張量進(jìn)行拼接后獲得二維輸入數(shù)據(jù)

式中,上標(biāo)i表示第i口井,上標(biāo)j表示第j個(gè)地質(zhì)屬性,下標(biāo)k表示第k小層。
對(duì)于式(4)的優(yōu)化問題,同時(shí)求解出所有 α是較為困難的,因此,Platt提出了序列最小優(yōu)化算法SMO算法[15]來高效求解式(4)。SMO算法采用了一種啟發(fā)式的方法,其基本思想是每次選出兩個(gè)α進(jìn)行優(yōu)化并固定其他的 α值。重復(fù)此過程,直到達(dá)到終止條件即可得到優(yōu)化結(jié)果。
為了評(píng)價(jià)模型質(zhì)量并優(yōu)選模型,構(gòu)建了決策函數(shù)值與產(chǎn)量的相關(guān)性系數(shù)作為評(píng)價(jià)指標(biāo),如式(10)所示。

式中,f(xi) 為 樣本i的決策函數(shù)值,(xi)為樣本決策函數(shù)值的均值,QCi為樣本i的累積產(chǎn)量,QˉCi為樣本平均累積產(chǎn)量。
Cor越接近1,表示決策函數(shù)值與累積產(chǎn)量越正相關(guān),這表明隨著累積產(chǎn)量的增加,決策函數(shù)值將相應(yīng)地增加,其相關(guān)性越強(qiáng),所訓(xùn)練的模型越能更好地將正樣本分離;Cor越接近?1,表示決策函數(shù)值與累積產(chǎn)量越負(fù)相關(guān),表明模型學(xué)習(xí)到了錯(cuò)誤的特征,無法使得正樣本遠(yuǎn)離投影空間原點(diǎn);Cor越接近0,表示決策函數(shù)值與累積產(chǎn)量越無關(guān)。為確定最優(yōu)模型,可使用相關(guān)性系數(shù)Cor作為評(píng)價(jià)指標(biāo),對(duì)模型超參數(shù),如徑向基半徑和平衡參數(shù)進(jìn)行優(yōu)化。通過調(diào)整超參數(shù),獲得使相關(guān)性系數(shù)Cor最大的模型作為最優(yōu)模型,進(jìn)而對(duì)全區(qū)地質(zhì)特征樣本的決策函數(shù)進(jìn)行計(jì)算來確定優(yōu)勢(shì)儲(chǔ)層區(qū)位,圖2為本文中優(yōu)勢(shì)儲(chǔ)層評(píng)價(jià)流程。

圖2 基于單分類支持向量機(jī)的優(yōu)勢(shì)儲(chǔ)層評(píng)價(jià)流程Fig. 2 Favorable reservoir evaluation process based on OCSVM
一非均質(zhì)黑油油藏?cái)?shù)值模型如圖3所示,模型網(wǎng)格維度為26×26×5。生產(chǎn)井受平面非均質(zhì)性和縱向非均質(zhì)性的影響。

圖3 案例數(shù)值模型Fig. 3 Numerical model of the case
本文選區(qū)的地質(zhì)屬性特征為滲透率對(duì)數(shù)、飽和度和孔隙度,即Nf=3。小層數(shù)為5,即Nl=5。每小層的屬性如圖4所示。生產(chǎn)井20年累積產(chǎn)量如圖5所示,可以看出PR1、PR9、PR7產(chǎn)量顯著較低,因此將其從樣本集中剔除。使用其余井的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,即Ns=6。從圖5中井周地質(zhì)特征可以看出,對(duì)于非均質(zhì)儲(chǔ)層,僅通過對(duì)比地質(zhì)特征平均值不能有效地篩選出高產(chǎn)區(qū)域,應(yīng)當(dāng)結(jié)合地質(zhì)屬性的分布特征進(jìn)行綜合判斷。基于單分類支持向量機(jī)的優(yōu)勢(shì)儲(chǔ)層評(píng)價(jià)方法,可以對(duì)地質(zhì)屬性的分布特征進(jìn)行有效利用,提高了優(yōu)勢(shì)儲(chǔ)層判別準(zhǔn)確度及速度。

圖4 案例數(shù)值模型小層地質(zhì)屬性平面分布圖Fig. 4 Distribution plane of subzone geological attributes in the numerical model of the case

圖5 生產(chǎn)井累積產(chǎn)量及近井地質(zhì)特征分布柱狀圖Fig. 5 Cumulative production of production well and distribution column of geological characteristics near the well
為了確定最優(yōu)OCSVM模型以對(duì)全區(qū)儲(chǔ)層進(jìn)行評(píng)價(jià),使用相關(guān)性系數(shù)Cor作為OCSVM模型得分指標(biāo),對(duì)模型超參數(shù)徑向基半徑和平衡參數(shù)進(jìn)行優(yōu)化。由圖6可以看出,最優(yōu)徑向基半徑為0.01,最優(yōu)平衡參數(shù)為0.1。基于最優(yōu)OCSVM模型,使用式(5)計(jì)算樣本的決策函數(shù)值后,繪制其與產(chǎn)量的散點(diǎn)圖,如圖7所示,使用式(10)計(jì)算其相關(guān)性為0.9764,說明決策函數(shù)通過地質(zhì)信息可以較好地反映產(chǎn)量大小。

圖6 OCSVM模型超參數(shù)優(yōu)化結(jié)果Fig. 6 Optimization result of super parameters of OCSVM model

圖7 累產(chǎn)量與決策函數(shù)關(guān)系圖Fig. 7 Relationship between cumulative production and decision function
基于訓(xùn)練好的OCSVM模型對(duì)整個(gè)儲(chǔ)層進(jìn)行評(píng)價(jià),將平面上每個(gè)網(wǎng)格作為一個(gè)樣本,因此,該模型一共可產(chǎn)生26×26=676個(gè)樣本。為每個(gè)樣本計(jì)算決策函數(shù)值,并繪制等高線,如圖8所示。

圖8 決策函數(shù)等高線Fig. 8 Contour of decision function
為了進(jìn)一步測(cè)試模型的可靠性,沿模型的對(duì)角線選取3個(gè)典型樣本進(jìn)行日產(chǎn)量對(duì)比,如圖9所示,可以看出在決策函數(shù)等高線較大的位置,井的產(chǎn)量也較高。表1總結(jié)了井點(diǎn)處樣本和測(cè)試樣本的決策函數(shù)值。

圖9 測(cè)試樣本日產(chǎn)量圖Fig. 9 Daily production of test samples

表1 樣本的決策函數(shù)值Table 1 Decision function value of samples
(1)基于高產(chǎn)井的井周地質(zhì)特征,采用單類支持向量機(jī)模型對(duì)其學(xué)習(xí)并使用決策函數(shù)來評(píng)價(jià)全區(qū)的地質(zhì)模型數(shù)據(jù),獲得優(yōu)勢(shì)儲(chǔ)層平面展布圖。結(jié)果表明,展布圖與產(chǎn)量有著明顯的相關(guān)性,證明該評(píng)價(jià)方法的有效性。
(2)建立了基于單類支持向量機(jī)模型的優(yōu)勢(shì)儲(chǔ)層評(píng)價(jià)方法,該方法由于無需人為給定標(biāo)簽,使得該方法兼顧了易用性與準(zhǔn)確性,為確定全區(qū)高產(chǎn)區(qū)域分布提供了有力工具。