




































摘要:精細儲層描述一直是非常規油氣資源開發和生產的重點,但常規測井曲線的縱向分辨率難以滿足對厘米級甚至毫米級儲層的有效識別。針對這一問題,本文以集成機器學習技術為核心,從多視多尺度的角度出發,提出了一種兩級知識遷移的測井曲線大尺度差異超分辨方法提高測井曲線的縱向分辨率,實現低成本情況下的儲層精細描述;選取地層反映較好的微球電阻率、自然伽馬、聲波時差曲線作為目標曲線,實現高分辨成像電阻率曲線信息到目標測井曲線映射模型的構建,進而實現目標測井曲線的大尺度差異超分辨,并將超分辨結果與不同超分辨方法進行對比。結果表明,本文方法得到的超分辨曲線與真實高分辨曲線相關系數大于0.9,與對比方法相比提高了3.6%~16.0%,均方誤差
、均方根誤差、平均絕對誤差、平均絕對百分比誤差、對稱平均絕對百分比誤差
分別降低了28.9%~90.8%、15.7%~69.8%、24.4%~74.7%、25.0%~74.2%、25.2%~77.4%。本文方法能夠在一定程度上實現現有常規測井曲線的毫米級超分辨處理,得到的超分辨曲線能夠大致地捕捉到地層的變化,降低了精細儲層有效識別問題的難度。
關鍵詞:
精細儲層描述;測井曲線;集成機器學習;大尺度;超分辨
doi:10.13278/j.cnki.jjuese.20230352
中圖分類號:P631.8
文獻標志碼:A
Large-Scale Difference Super-Resolution of Logging Curves Based on Integrated Machine Learning
Cao Zhimin"1, 2, Ding Lu2, Han Jian1, 2, Hao Lechuan3, 4
1. NEPU Sanya Offshore Oil amp; Gas Research Institute, Sanya 572024, Hainan, China
2. School of Physics and Electronic Engineering, Northeast Petroleum University, Daqing 163318, Heilongjiang, China
3. Postdoctoral Work Station, Daqing Oil Field, Daqing 163318, Heilongjiang, China
4. Postdoctoral Mobile Station, Northeast Petroleum University, Daqing 163318, Heilongjiang, China
Abstract:
Fine reservoir description has always been the focus of development and production of unconventional oil and gas resources, but the vertical resolution of conventional logging curves is difficult to satisfy the
effective identification of thin layers at centimeter or even millimeter scale. Aiming at this problem, this paper proposes a two-level knowledge migration super-resolution method for large-scale difference in logging curves to improve the vertical resolution of logging curves, thus realizing high-resolution target reservoir fine description in low-cost cases, using integrated machine learning as the basic tool and the perspective of multi-view and multi-scale as the core. The microsphere resistivity, natural gamma ray, and acoustic time difference curves with better formation response are selected as the target curves, and the construction of a mapping model from the information of high-resolution imaging resistivity curves to the target logging curves is realized, which in turn realizes the large-scale difference super-resolution of target logging curves , and the super-resolution results are compared with different super-resolution methods. The results show that the correlation coefficients between the super-resolution curves obtained by the method of this paper and the real high-resolution curves are greater than 0.9, which are improved by 3.6% to 16.0% compared with the comparison methods, and the mean square error,
the root mean square error, the mean absolute error, the mean absolute percentage error, the symmetric mean absolute percentage error
are reduced by 28.9% to 90.8%, 15.7% to 69.8%, 24.4% to 74.7%, "25.0% to 74.2%, and 25.2% to 77.4% , respectively. Therefore, the method of this paper is able to largely realize the millimeter-level super-resolution processing of the existing conventional logging curves, and the obtained super-resolution curves are able to roughly capture the formation changes, which alleviates the difficulty of the problem of effective identification of fine reservoirs.
Key words:
fine reservoir description; logging curves; integrated machine learning; large-scale; super-resolution
0"引言
石油被稱為“工業血液”,是工業生產中最重要的燃料資源之一,也是目前世界上最重要的能源之一,占據世界能源總消耗量的33%左右。隨著油氣勘探目標的變化,傳統的構造性油氣藏勘探已逐漸轉為巖性油氣藏、裂縫油氣藏和隱蔽油氣藏等更加復雜的油氣藏勘探,非常規油氣資源已成為全球勘探開發的主要目標[1]。非常規油氣藏通常需要采取大規模的增產措施或者是特殊的開采技術和開采工藝來獲取經濟油氣流量的油氣藏[2],這使得生產過程比傳統的開采更加困難,勘探開發成本比常規油氣藏高得多。為了持續推動非常規油氣資源的開發和生產,對精細儲層描述工作的要求也在不斷提高。因此,精細儲層描述的準確性一直是相關領域研究的重點。
提高測井數據的分辨率是精細儲層描述工作中的一個重要環節。為了增強測井數據的分辨率,可以從以下兩個方面進行努力:一是通過研究新的測井探測儀器和改進測量技術,提高測井數據采集系統的靈敏度和分辨能力,從而獲得縱向分辨率高的測井資料[3];二是采用數據處理技術,對已采集到的測井數據進行更精細的處理和解釋,并通過應用先進的數據處理算法和模型,進一步提煉和提高數據的分辨能力,使測井曲線既具有較大的探測深度又具有較高的縱向分辨率[4]。雖然前者是最有效的方法,但需要大量人力、物力、財力及時間的投入,并且這種方法無法充分利用現有的測井數據資料。相比之下,研究和開發用于提高測井曲線分辨率的處理技術不需要大規模的設備更新或深入的技術改進,不僅可以最大程度地利用現有的測井資料,還可以更快地獲得準確的地下信息,被認為是一種投資回報快、成本較低的途徑[5]。
早在1980年,Conaway[6]率先提出了用于提高測井曲線縱向分辨率的反褶積技術。1986年,Lyle等[7]提出了一種基于卡爾曼濾波的反褶積算法,應用于提高聲波時差和自然伽馬測井曲線的分辨率,并取得了良好的效果。1991年,Mitchell等[8]提出了一種匹配分辨率的方法,通過匹配濾波與非線性擬合組合,將已知的測井曲線數據與具有更高分辨率的測量數據進行匹配,從而提高測井曲線的縱向分辨率。1998年,王祝文等[9]提出了“反褶積-開窗”法,有效地提高了碳氧比能譜測井曲線的分辨率,使其能夠更準確地判別油層和水層之間的區別,增強了碳氧比能譜測井技術在油氣勘探中的應用能力。2004年,馮國慶等[10]基于小波變換在時間域和頻率域都有良好的局部化性質,可以聚集到信號任意細節的特點,采用Mallat方法對測井曲線進行分解和重構,重構后的測井曲線可以顯著提高縱向分辨率。2010年,Myrontsov[11]提出了電感測井方法,根據線性多爾理論框架內測量的視電阻率,利用卷積型第一類弗雷德霍姆方程的解法確定電阻率,提高了電阻率測井曲線的縱向分辨率。2013年,Bagheripour等[12]使用巖石物理核磁共振測井數據,將其中一半的中值數據點使用普通克里金技術構建地質統計模型,其余的數據點用于評估所構建模型的性能,使測井分辨率提高了兩倍。2019年,Zhang等[13]運用一種深度學習輔助的彈性全波形反演的策略,利用測井數據以及其他地球物理數據(如井下記錄)進行速度估計,從而提高分辨率。2021年,Zhang等[14]提出了“數字巖心”新算法,該方法結合了礦物學和沉積學信息,生成了地層礦物學高分辨率測井信號,可以達到精細薄層描述的目的。
常規測井曲線的分辨率通常為0.125 m左右,但對于精細儲層描述工作,特別是頁巖油的勘探開采工作來說,這樣的分辨率往往達不到要求。為了有效實現精細儲層的識別及精確定位,往往需要以巖心提取或高分辨率成像電阻率測井等高成本方式進行。然而,面對復雜多變的國際油價異常波動,降本增效已成為行業發展的必然趨勢。因此,需要尋求一種更為經濟高效的方法來提升測井曲線的分辨率。為此,建立可測高分辨數據與常規測井數據間的大尺度非線性映射關系顯得尤為重要。一旦這種映射關系得以確立,便可以利用它來對常規測井曲線進行大尺度差異超分辨處理,從而提高曲線的分辨率,實現儲層精細描述的目的。集成機器學習為此類問題的解決提供了強大的工具。與傳統的數據處理方法相比,集成機器學習具有諸多優勢,它能夠自動地從海量數據中學習和挖掘潛在的非線性關系,避免了繁瑣的人工建模過程。同時,集成機器學習具有出色的泛化能力,可以處理各種復雜多變的數據,提高了模型的適用性和準確性。此外,通過集成多個機器學習模型的預測結果,可以進一步減少預測誤差,提高超分辨處理的精度和穩定性。
基于此,本文以集成機器學習為基本工具,采用基于兩級知識遷移的研究策略,并結合多視聯合挖掘的方法,充分利用多種插值方法和非線性映射模型提取測井數據中隱含的精細儲層結構信息,旨在實現常規測井曲線大尺度差異超分辨處理,進行相關關鍵技術攻關。
1"基本理論
1.1"埃爾米特插值
對于給定的插值節點x0, x1, …, xn,插值函數p(x)在這些節點上與被插函數f(x)具有相同的函數值,即p(xi)=f(xi)(i=0, 1, ..., n),并且在某些或所有節點上,不僅是函數值,而且是導數值,甚至是高階導數值都相等的插值問題被稱為埃爾米特(Hermite)插值[15]。設f∈cn[a,b],x0,x1,…,xn為[a, b]上的不同節點,則f[x0, x1, …, xn]是其變量的連續函數,埃爾米特插值多項式中的n階重節點的均差為
f[x0,x1,…,xn]=
limx1→x0x2→x0"xn→x0f[x0,x1,…,xn]=1n!f(n)(x0)。(1)
由式(1)與泰勒多項式可得出埃爾米特插值多項式為
Pn(x)=f(x0)+f(x0)(x-x0)+…+ f(n)(x0)n!(x-x0)n。(2)
1.2"二次樣條插值
對于給定區間[a, b],劃分a=x0lt;x1lt;…lt;xn-1lt;xn=b,若函數S(x)滿足:在每個小區間[xk, xk+1](k=0, 1, …, n-1)上是二次多項式;在每個內部節點xk(k=0, 1, …, n-1)上具有一階連續導數;在節點xk上給定函數值yk=f(xk)(k=0, 1, …, n),并成立S(xk)=yk(k=0, 1, …, n),則稱S(x)是f(x)在[a, b]上關于劃分a=x0lt;x1lt;…lt; xn-1lt;xn=b的二次樣條插值函數[16]。在區間[x0, x1]上,已知S(x0)=y0,S(x1)=y1且S′(x0)=y′0,可得
S(x)=y1-y0-h0y′0h20(x-x0)2+y′0(x-x0)+y0。(3)
式中,hi=xi+1-xi(i=0, 1, …, n-1)。此時y′1=S′(x1)=2(y1-y0)h0-y′0,再由S(x1)=y1,S(x2)=y2得到區間[x1, x2]內的二次插值函數,以此類推可推導出區間[xi, xi+1](i=0, 1, …, n-1)內二次樣條插值函數的表達式為
S(x)=yi+1-yi-hiy′ih2i(x-xi)2+y′i(x-xi)+yi。(4)
1.3"三次樣條插值
對于給定區間[a, b],劃分a=x0lt;x1lt;…lt;xn-1lt;xn=b,若函數S(x)滿足:1)在每個小區間[xk, xk+1](k=0, 1, …, n-1)上是三次多項式;2)在每個內部節點xk(k=0, 1, …, n-1)上具有二階連續導數;3)在節點xk上給定函數值yk=f(xk)(k=0, 1, …, n),并成立S(xk)=yk(k=0, 1, …, n),則稱S(x)是f(x)在[a, b]上關于劃分a=x0lt;x1lt;…lt; xn-1lt;xn=b的三次樣條插值函數[17]。以區間[xk, xk+1]為例,S(xk)的二階導數值為S″(xk)=Mj(j=0, 1, …, n),則該區間上S(x)的三次樣條插值表達式為
S(x)=Mj(xj+1-x)36hj+Mj+1(x-xj)36hj+(yj-Mjh2j6)xj+1-xhj+(yj+1-Mj+1h2j6)x-xjhj(j=0,1,…,n-1)。(5)
令μj=hj-1hj-1+hj、λj=hjhj-1+hj、dj=6f[xj-1,xj,xj+1],可得
2λ000μ1μ12λ10000μn-12λn-1λn00μn2M0M1Mn-1Mn=d0d1dn-1dn。 (6)
求解矩陣(6),代入式(5)中得到每個小區間上的三次樣條插值的表達式[18]。
1.4"分段線性插值
假定區間[a, b]上的連續函數f(x)在節點a=x0lt;x1lt;…lt;xn-1lt;xn=b上的函數值為f(xk)=yk(k=0, 1, …, n),則可以得到n+1個數據點(xk, yk)。連接相鄰點(xk, yk)和(xk+1, yk+1)得到n條線段,這些線段組成一條折線,該折線對應的函數稱為分段線性插值函數[17],記作S(x):
S(x)=y0x-x1x0-x1-y1x-x0x1-x0,x∈[x0,x1];y1x-x2x1-x2-y2x-x1x2-x1,x∈[x1,x2];""""""yn-1x-xnxn-1-xn-ynx-xn-1xn-xn-1,x∈[xn-1,xn]。(7)
1.5"徑向基函數插值
徑向基函數Φ(·)=φ(‖·‖)(‖·‖表示歐式距離)以空間距離r為基本變量。在d維歐氏空間中,對于一組位置不同的中心點X={xc1, xc2, …, xcn}Rd以及對應的標量值gc1, gc2, …, gcn,給定的基函數φ(x)找到連續函數
f(x)=∑γiφx-xci,(8)
且滿足
f(xck)=∑γiφxck-xci=gck(k=1,2,…,n) (9)
的過程被稱為徑向基函數插值[19]。式中,γi為插值系數。
1.6"SVR
支持向量回歸(support vector regression, SVR)是一種用于解決回歸問題的機器學習算法,它基于支持向量機(support vector machine, SVM)的原理,但在目標函數和約束條件上有所不同[20-21]。SVR通過最大化間隔ε找到一個決策邊界,在決策邊界內盡可能多地將樣本點位于間隔內,以實現對樣本點的回歸預測,這些位于間隔之內的樣本點被稱為非支持向量;與SVM相比,SVR注重決策邊界內的點,而SVM注重分離超平面外部的點。SVR的優化目標為
minω,ξi,ξ*i12
‖ω‖2
+Q∑ni=1(ξi+ξ*i)
s.t.yi-ωφ(xi)-b≤ε+ξi,i=1,2,…,n;-yi-ωφ(xi)+b≤ε+ξ*i,ξi≥0,ξ*i≥0。 (10)
式中:ω為權重系數;ξi和ξ*i為松弛變量;Q為懲罰因子;b為偏差。從式(10)中可以看出,當樣本點位于間隔ε內時,不會計算其損失,只有當樣本位于間隔外才會計入其損失。
SVR的結構示意圖如圖1所示。
1.7"隨機森林
隨機森林(random forest, RF)是一種集成學習算法,通過隨機的方式構建一個森林,森林由多棵決策樹組成,每棵決策樹之間都是相互獨立的。RF的基本原理[22]為:
1)使用Bootstrap重采樣方式從訓練數據集中隨機有放回地(即可重復抽樣)取出m個數據集,得到m個訓練子集;
2)每個訓練子集都訓練1棵決策樹,如此重復,得到構成RF的m棵決策樹;
3)在每棵決策樹的生成過程中,每個節點的特征劃分會在一個隨機選擇的特征子集上進行,通常使用基尼系數或均方誤差等指標來選擇每個節點的分裂特征和分裂點;
4)每棵決策樹的預測結果取均值就是RF的最終預測結果。
RF的結構示意圖如圖2所示。
1.8"LSTM
長短期記憶(long short-term memory, LSTM)是一種特殊的循環神經網絡(recurrent neural networks, RNN),主要被設計用來解決長序列訓練過程中的梯度消失和梯度爆炸問題[23-24]。LSTM細胞是相互連接的,取代了普通RNN中的傳統隱藏單元,它由遺忘門、輸入門和輸出門組成。LSTM的結構示意圖如圖3所示。
遺忘門使用sigmoid函數決定細胞單元從網絡中接收多少信息,控制著從狀態Ct-1到Ct的信息保留程度,從而實現信息的遺忘功能。通過讀取輸入值xt和前一個時間步的隱藏狀態ht-1,可以計算出一個0~1之間的值,表示細胞單元獲取網絡信息的百分比,計算方法為
ft=σ(Wf[ht-1,xt]+bf)。(11)
式中:ft為遺忘門的輸出;σ為sigmoid函數;Wf為遺忘門循環權重;bf為遺忘門偏置量。
輸入門決定了在當前時刻有多少輸入信息會被保存到單元狀態中,這一過程分為決定更新哪些值和生成新候選值兩個部分,計算方法為:
it=σ(Wi[ht-1,xt]+bi);(12)
C~t=tanh(WC[ht-1,xt]+bC)。(13)
式中:it為輸入門的輸出;Wi為輸入門循環權重;bi為輸入門偏置量;C~t為新的候選細胞狀態;WC為候選細胞狀態循環權重;bC為候選細胞狀態偏置量。此時,細胞狀態會根據遺忘門和輸入門的輸出進行更新,計算方法為
Ct=ftCt-1+itC~t。(14)
式中:Ct為此時的細胞狀態;Ct-1為前一時刻的細胞狀態。
輸出門用來確定輸出的值。使用sigmoid函數得到新的細胞狀態傳遞給tanh函數,細胞狀態經過tanh函數處理,并與sigmoid函數的輸出相乘,得到輸出值:
ot=σ(Wo[ht-1,xt]+bo);(15)
ht=ottanh(Ct)。(16)
式中:ot為輸出門的輸出;Wo為輸出門循環權重;bo為輸出門偏置量。
1.9"雙向GRU
門控循環單元(gated recurrent unit, GRU)是LSTM的一種簡化結構,較LSTM網絡的結構更加簡單,又保持了LSTM的預測效果,由更新門和重置門兩個門組成[25]。
更新門決定了多少前一時刻的隱藏狀態應該保留到當前狀態:
zt=σ(Wz[ht-1,xt]+bz)。(17)
式中:zt為更新門的輸出;Wz為輸出門循環權重;bz為輸出門偏置量。
重置門決定了多少當前時刻的輸入應該影響到當前的隱藏狀態:
rt=σ(Wr[ht-1,xt]+br)。(18)
式中:rt為重置門的輸出;Wr為輸出門循環權重;br為輸出門偏置量。GRU的結構示意圖見圖4。
雙向GRU同時訓練正向和反向傳遞,然后通過線性融合算法來結合它們的結果[26]。正向網絡層的計算公式為
ht=f(W→xt+V→ht-1+b→)。(19)
式中:W→、V→為正向網絡層的權重矩陣;b→為正向網絡層的偏置量。反向網絡層的計算公式為
ht=f(W←xt+V←ht+1+b←)。(20)
式中:W←、V←為反向網絡層的權重矩陣;b←為反向網絡層的偏置量。最終輸出的計算公式為
yt=g(U[h→t;h←t]+c)。(21)
式中:U為權重矩陣;c為偏置量。雙向GRU的結構示意圖如圖5所示。
1.10"生成對抗網絡
生成對抗網絡(generative adversarial networks, GAN)是基于零和博弈的思想而提出的,由生成器和判別器兩個神經網絡組成[27-28]。生成器通過學習真實數據的分布并生成偽數據,盡可能地使生成的偽數據與真實數據相似,以欺騙判別器網絡;判別器網絡則盡可能地辨別輸入的數據是由生成器生成的偽數據還是真實數據。兩者的最終目標是達到納什均衡狀態,使生成器盡可能地學習到真實數據的分布。GAN的目標函數為
V(D,G)=
Ex~Px[logD(x)]+Ez~Pz[log(1-D(G(z)))]。(22)
式中:D為判別器;G為生成器;E為樣本期望;Px為真實數據的分布;Pz為輸入數據的分布;G(z)為生成器生成的偽造數據。生成器的目標是最大化D(G(z))的值,以欺騙判別器;而判別器的目標則是最大化D(x)的值,以正確判別真實數據,并最小化D(G(z))的值。GAN的結構示意圖如圖6所示。
2"常規測井曲線大尺度差異超分辨模型設計
2.1"總體設計
本文所進行的超分辨處理需要將常規測井曲線(如0.125 m采樣間隔)超分辨到常規高分辨曲線(如2~3 mm采樣間隔),即系統的輸入與輸出尺度差異超過50倍。面對這種大尺度差異的實際情況,傳統插值或超分辨方法很難實現,解決這個問題最關鍵的難題在于如何抓住高分辨信息,如何能夠將現有高分辨數據中隱含的儲層高分辨信息轉移到常規曲線超分辨結果中。為了解決這一難題,采用如圖7所示的兩級知識遷移的系統總體設計過程。其中,第一級知識遷移實現常規曲線高分辨參考信號的構建,第二級知識遷移實現常規曲線大尺度差異超分辨信號的估計。
2.2"深度向多尺度非線性映射集成高分辨參考數據構建
為了實現圖7總體方案中的第一級知識遷移,需要建立已有高分辨數據與目標常規低分辨數據間的精確非線性映射模型。由于高分辨數據與低分辨數據尺度差異大,而且深度向測井曲線具有一定的連續性,因此,某具體采樣點處有豐富的高分辨上下文信息用于進行到低分辨數據的非線性映射。那么,為了充分發揮豐富的高分辨上下文信息,采用多尺度非線性映射集成的方式進行高分辨數據到低分辨數據的映射,如圖8所示,模型可以表示為
Lm=∪rF(Nrm)。(23)
式中:m為深度;Lm為深度m處的低分辨數據;r為局部鄰域集的數目;Nrm為在尺度r下深度m處高分辨數據的局部鄰域點集。每個尺度下的非線性映射模型F均可采用RF回歸來實現。
利用模型井數據,在完成不同尺度下非線性映射模型的構建后,即可連續獲取高分辨數據局部多尺度鄰域進行低分辨目標曲線在高分辨深度采樣點上的取值估計。為了進一步增強第一級知識遷移的精度和可靠性,可以把多尺度估計結果看作一種編碼信息,通過對這種編碼信息的再學習或再映射實現非線性映射的精度提升。該環節可以采用RF等回歸方法實現。
2.3"序貫式多視多尺度超分辨集成測井曲線超分辨模型構建
獲得目標曲線高分辨參考數據后,即可建立高分辨參考數據與對應常規低分辨數據間的非線性映射關系。對于常規曲線1/8 m(0.125 m)的采樣率,首先對高分辨參考數據進行便于超分辨處理的重采樣,如1/512 m采樣率。那么,在下采樣后的高分辨參考數據與常規低分辨數據間就可以獲得多個尺度的參考信號,如采樣率分別為1/256 m、1/128 m、1/64 m、1/32 m、1/16 m等。這樣的話,就可以將1/8 m采樣率到1/512 m采樣率的64倍超分辨問題轉換為1/8 m到1/16 m、1/16 m到1/32 m等多個二倍超
分辨問題。這樣,通過逐級下采樣,最高采樣率下的高頻信息就可以逐級轉移到低分辨數據上,使大尺度差異超分辨成為可能。此序貫式多視多尺度超分辨集成的總體框架圖如圖9所示。
基于以上分析,所提出的序貫式多視多尺度差異超分辨的關鍵環節在于二倍尺度差異的超分辨。為了保證二倍尺度差異超分辨結果的精確性和可靠性,采用了生成對抗網絡回歸的方式,即:
LH(i)=fGAN(L(i))。 (24)
式中:LH(i)為第i個數據點二倍超分辨后的數據;fGAN為GAN模型;L(i)為第i個數據點的
低分辨數據。顯然,由于低分辨數據與高分辨數據之間的尺度差異,需要將低分辨數據先插值到一個初始二倍高分辨數據L′,這樣就可以得到一個一對一的關系。然而,這種情況下信息量還無法完成初始二倍高分辨數據到實際高分辨數據的高精度映射,為了保證映射質量,采用了多視非線性映射的方式,即
LH(i)=fGAN(∪v∪jL′(gv,j)(i))。(25)
式中,j=1, 2, 3, 4, 5,表示五個不同的視,即用不同的插值方法得到的不同二倍高分辨數據估計,分別采用了埃爾米特插值、二次樣條插值、三次樣條插值、分段線性插值、徑向基函數插值五種插值方法;gv(v=1, 2, 3, 4)表示不同非線性映射模型,分別采用了SVR、RF、LSTM、雙向GRU四個非線性映射模型。每個二倍尺度差異的超分辨框架圖如圖10所示。
2.4"評價指標
為了客觀地評價所提出的超分辨模型的性能,本文采用了常規的誤差函數和皮爾遜相關系數(Pearson correlation coefficients, PCCs)作為評價指標。其中:誤差函數包括均方誤差(mean square error, MSE)、均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)、平均絕對百分比誤差(mean absolute percentage error, MAPE)和對稱平均絕對百分比誤差(symmetric mean absolute percentage error, SMAPE),數值越小,模型的性能越好;PCCs用來衡量真實值與預測值之間的相關性,數值越大,模型的性能越好。各評價指標的計算方式如下:
MSE=1N∑Ni=1(y′i-yi)2; (26)
RMSE=1N∑Ni=1(y′i-yi)2; (27)
MAE=1N∑Ni=1y′i-yi;(28)
MAPE=100%N∑Ni=1y′i-yiyi;(29)
SMAPE=100%N∑Ni=1y′i-yi(y′i+yi)/2;(30)
PCCs=cov(y′i,yi)σyiσy′i。(31)
式中:N為樣本數目;y′i為預測值;yi為真實值; cov( )為協方差;σyi、σy′i為標準差。
3"實驗結果及分析
為了驗證所提超分辨方法的有效性,對具有高分辨電成像電阻率(LLD3)曲線(分辨率為0.002 m左右)的大慶油田某頁巖油區塊的4口井(W1—W4)進行了實驗,實驗分為2個部分:1)利用深度向多尺度非線性映射模型完成常規測井曲線(分辨率為0.125 m)高分辨參考數據的構建;2)利用序貫式多尺度超分辨模型分別完成LLD3曲線和常規測井曲線的超分辨實驗。
3.1"高分辨參考數據構建
首先對LLD3曲線進行便于超分辨處理的重采樣到1/512 m采樣率。本文選擇地層反映較好的微球電阻率(MSFL)、自然伽馬(GR)、聲波時差(AC)作為目標曲線進行實驗。采用已有的高分辨數據LLD3曲線與目標低分辨數據間建立非線性映射模型,同時選用了4、8、10和14四個不同的尺度,再將多尺度的結果進行集成。圖11展示了部分目標曲線得到高分辨參考數據的過程,可以看出,通過第一級知識遷移可以得到準確的高分辨參考數據。
3.2"超分辨實驗
為了驗證本文提出序貫式多尺度超分辨模型的有效性,先以實際的LLD3曲線進行超分辨實驗,這里以W1井為例。以W1井作為測試集,其他三口井作為訓練集,首先分別對這四口井的LLD3曲線(1/512 m采樣率)進行下采樣到1/256 m(2倍)、1/128 m(4倍)、1/64 m(8倍)、1/32 m(16倍)、1/16 m(32倍)、1/8 m(64倍)采樣率。將采樣率為1/8 m的LLD3曲線進行64倍到32倍的二倍超分辨實驗到采樣率為1/16 m,再將得到的采樣率為1/16 m的LLD3曲線進行32倍到16倍的二倍超分辨實驗到采樣率為1/32 m……以此類推,最終得到采樣率為1/512 m(1倍)的超分辨LLD3曲線。圖12給出了各個二倍尺度LLD3曲線超分辨實驗結果,為了更清晰地展示,這里選取了50 m的范圍。其部分局部放大圖如圖13所示。可以看出,隨著采樣率從1/8 m逐步提升至1/512 m,曲線的變化趨勢更加平滑且連續,原本因低采樣率而丟失的高頻信息得到了有效的恢復。在實際測試中,將低分辨測井曲線輸入模型可直接得到最終的超分辨曲線。
為了進一步體現本文提出的模型超分辨效果,將W1井的LLD3曲線最終超分辨結果與雙線性插值、隨機分形和稀疏表示直接64倍超分辨結果一起繪制,結果如圖14所示。從圖14中可以看出,本文方法得到的超分辨曲線更接近真實高分辨曲線的整體特征,且高頻細節更豐富。其定量評價結果在表1中給出。
表2—表4分別列舉了W2井—W4井LLD3曲線不同超分辨方法和本文方法的定量評價結果。
從各個評價指標結果來看,本文方法相較于對比方法得到的超分辨曲線均具有更高的相關性和更小的誤差。以W2井為例,本文方法得到的超分辨曲線與真實高分辨曲線相關系數為0.924 5,與對比方法相比提高了3.6%~16.0%,誤差分別降低了28.9%~90.8%(MSE)、15.7%~69.8%(RMSE)、24.4%~74.7%(MAE)、25.0%~74.2%(MAPE)、25.2%~77.4%(SMAPE)。
獲得各目標曲線的高分辨參考數據后,即可應用序貫式多尺度超分辨模型完成各目標曲線的超分辨實驗,步驟與LLD3曲線的超分辨實驗相似。表5—表8給出了W1井—W4井各曲線的高分辨參考數據與超分辨數據的定量評價結果。結合解釋巖性信息與電成像元素數據作為參考,圖15—圖18分別給出了W1井—W4井各曲線的部分超分辨結果。盡管部分曲線的評價指標一般,但是超分辨曲線相比原始曲線引入了足夠的高頻信息,能夠大致地捕捉到地層的變化。結果顯示,本文所提的測井曲線大尺度差異超分辨方法具有顯著的高頻信息捕獲及傳遞能力。
4"結論
1)針對頁巖油精細儲層有效識別與現有常規測井曲線分辨能力間存在巨大差異這一難題,本文提出了一種兩級知識遷移的測井曲線大尺度差異超分辨方法。第一級知識遷移實現了常規曲線高分辨參考信號的構建,解決了高分辨數據與低分辨數據存在屬性差異這一問題——跨屬直接映射效果差,需要充分利用高分辨信息降低屬性差異的影響。第二級知識遷移實現了常規曲線大尺度差異超分辨信號的估計,解決了高分辨數據與低分辨數據的尺度差異大這一問題——直接映射效果差,需要設計合理的間接映射模型。
2)本文以具有高分辨電成像電阻率數據的大慶油田某頁巖油區塊的4口井作為實驗對象進行實驗,結果表明本文方法能夠很大程度上實現現有常規測井曲線的毫米級超分辨處理,降低了頁巖油精細儲層有效識別問題的難度。
參考文獻(References):
[1] 鄒才能,楊智,張國生,等. 非常規油氣地質學理論技術及實踐[J]. 地球科學,2023,48(6):2376-2397.
Zou Caineng, Yang Zhi, Zhang Guosheng, et al.Theoretical Techniques and Practice of Unconventional Oil and Gas Geology[J]. Earth Science, 2023, 48(6): 2376-2397.
[2] 羅昌魁. 非常規油氣地質學理論技術及實踐[J]. 價值工程,2013,32(17):308-309.
Luo Changkui. Mechanism of Unconventional Oil and Gas Reservoir Formation and Key Technology of Development[J]. Value Engineering, 2013, 32(17): 308-309.
[3] 蘇艷麗. 提高測井曲線分辨率的方法研究及應用[D]. 武漢:長江大學,2012.
Su Yanli. Research and Application of Methods to Improve the Resolution of Logging Curve [D]. Wuhan: Changjiang University, 2012.
[4] 李鳳琴,劉麗瓊,杜淑艷,等. 提高測井資料分辨率處理方法在東濮凹陷的應用[J]. 內蒙古石油化工,2012,38(13):135-137.
Li Fengqin, Liu Liqiong, Du Shuyan, et al. Application of Improved Logging Data Resolution Processing Method in Dongpu Depression [J]. Inner Mongolia Petrochemical Industry, 2012, 38(13): 135-137.
[5] 侯賢沐,王付勇,宰蕓,等. 基于機器學習和測井數據的碳酸鹽巖孔隙度與滲透率預測[J]. 吉林大學學報(地球科學版),2022, 52(2): 644-653.
Hou Xianmu, Wang Fuyong, Zai Yun, et al.Prediction of Carbonate Porosity and Permeability Based on Machine Learning and Logging Data[J]. Journal of Jilin University (Earth Science Edition), 2022, 52(2): 644-653.
[6] Conaway J G. Exact Inverse Filters for the Deconvolution of Gamma-Ray Logs[J]. Geoexploration, 1980, 18(1): 1-14.
[7] Lyle W D, Williams D M. Deconvolution of Well Log Data: An Innovations Approach[J]. The Log Analyst, 1986, 28(3): 667.
[8] Mitchell W K,Nelson R J. Improved Vertical Resolution of Well Logs by Resolution Matching[J]. The Log Analyst,1991,32(4):SPWLA-1991-v32n4a1.
[9] 王祝文,李舟波,陸敬安,等. 提高碳氧比能譜測井分辨率的反褶積法[J]. 地球物理學報,1998, 41(4): 570-578.
Wang Zhuwen, Li Zhoubo, Lu Jing’an, et al. Inverse Folding Method to Improve the Resolution of Carbon and Oxygen Specific Energy Spectral Logging[J]. Chinese Journal of Geophysics, 1998, 41(4): 570-578.
[10] 馮國慶,楊琨,陳忠強,等. 提高測井曲線縱向分辨率的小波變換技術[J]. 新疆石油地質,2004, 25(5): 529-531.
Feng Guoqing, Yang Kun, Chen Zhongqiang, et al.Wavelet Transform Technique for Improving Longitudinal Resolution of Logging Curves[J]. Xinjiang Petroleum Geology, 2004, 25(5): 529-531.
[11] Myrontsov N. Method for Improving the Spatial Resolution of Resistivity Logging[J]. Геофизический журнал, 2010, 32(4): 119-121.
[12] Bagheripour P, Asoodeh M, Nazarpour A. Vertical Resolution Enhancement of Petrophysical Nuclear Magnetic Resonance (NMR) Log Using Ordinary Kriging[J]. Central European Journal of Geosciences, 2013, 5(3): 450-456.
[13] Zhang Z, Alkhalifah T. Regularized Elastic Full-Waveform Inversion Using Deep Learning[J]. Geophysics, 2019, 84(5): 741-751.
[14] Zhang Q, Peyaud J B. Development and Validation of a Novel Interpretation Algorithm for Enhanced Resolution of Well Logging Signals[J]. Journal of Sensors, 2021(1): 1-10.
[15] 方宗華,王文豐,董健華,等. 基于埃爾米特插值法的DBSCAN算法研究[J].南昌工程學院學報,2020, 39(4): 80-84.
Fang Zonghua, Wang Wenfeng, Dong Jianhua, et al. Research on DBSCAN Algorithm Based on Hermite Interpolation[J]. Journal of Nanchang Institute of Technology, 2020,39(4): 80-84.
[16] 劉為,高毅,高尚. 二次樣條插值研究[J]. 計算機與數字工程,2011, 39(3): 21-23, 64.
Liu Wei, Gao Yi, Gao Shang. Research on Quadratic Spline Interpolation[J]. Computer and Digital Engineering, 2011,39(3):21-23, 64.
[17] 邢麗. 一維插值算法在實際問題中的應用和比較[J]. 上海第二工業大學學報,2013, 30(4): 311-314.
Xing Li. Application and Comparison of One-dimensional Interpolation Algorithm in Practical Problems [J]. Journal of Shanghai Second Polytechnic University, 2013, 30(4): 311-314.
[18] 張凱選,馬傳寧. 結合三次樣條和時序模型的橋墩沉降預測[J]. 測繪科學,2016, 41(12): 229-232, 253.
Zhang Kaixuan, Ma Chuanning. Prediction of Pier Sett-lement Based on Cubic Spline and Time Series Model [J]. Science of Surveying and Mapping, 2016, 41(12): 229-232,253.
[19] 林言中,陳兵,徐旭. 徑向基函數插值方法在動網格技術中的應用[J]. 計算物理,2012, 29(2): 191-197.
Lin Yanzhong, Chen Bing, Xu Xu. Application of Rad-Ial Basis Function Interpolation Method in Dynamic Me-Shing Technique [J]. Computational Physics, 2012, 29(2): 191-197.
[20] Peng X, Xu D. Projection Support Vector Regression Algorithms for Data Regression[J]. Knowledge-Based Systems, 2016, 36(3): 369-374.
[21] 秦喜文,劉媛媛,王新民,等. 基于整體經驗模態分解和支持向量回歸的北京市PM2.5預測[J]. 吉林大學學報(地球科學版),2016, 46(2): 563-568.
Qin Xiwen, Liu Yuanyuan, Wang Xinmin, et al.PM2.5 Prediction of Bejing City Based on Ensemble Empirical Mode Decomposition and Support Vector Regression[J]. Journal of Jilin University (Earth Science Edition), 2016, 46(2): 563-568.
[22] 王明常,丁文,趙競爭,等. 基于知識圖譜與隨機森林的落葉松毛蟲害遙感識別[J]. 吉林大學學報(地球科學版),2023, 53(6): 2006-2017.
Wang Mingchang, Ding Wen, Zhao Jingzheng, et al.Remote Sensing Identification of Dendrolimus Superans Infestation Based on Knowledge Graph and Random Forest[J]. Journal of Jilin University (Earth Science Edition), 2023, 53(3): 2006-2017.
[23] Pulver A, Lyu S. LSTM with Working Memory[C]// 2017 International Joint Conference on Neural Networks. [S. l.]: IEEE, 2017: 845-851.
[24] 張東曉,陳云天,孟晉. 基于循環神經網絡的測井曲線生成方法[J]. 石油勘探與開發,2018, 45(4): 598-607.
Zhang Dongxiao, Chen Yuntian, Meng Jin. Synthetic Well Logs Generation Recurrent Neural Network[J]. Petroleum Exploration and Development, 2018, 45(4): 598-607.
[25] 滕建強,邱萌,楊明任,等. 基于門控循環單元神經網絡的測井曲線預測方法[J]. 油氣地質與采收率,2023, 30(1): 93-100.
Teng Jianqiang, Qiu Meng, Yang Mingren, et al.Logging Curve Prediction Method Based on GRU[J]. Petroleum Geology and Recovery Efficiency, 2023, 30(1): 93-100.
[26] 沈記全,魏坤. 融合殘差網絡的CR-BiGRU入侵檢測模型[J]. 吉林大學學報(理學版),2023, 61(2): 353-361.
ShenJiquan, Wei Kun. CR-BiGRU Intrusion Detection Model Based on Residual Network[J]. Journal of Jilin University (Science Edition), 2023, 61(2): 353-361.
[27] Ghanem R, Loey M. Face Completion Using Generative Adversarial Network with Pretrained Face Landmark Generator [J]. International Journal of Intelligent Engineering and Systems, 2021, 14(2): 295-305.
[28] 王良基. 基于生成對抗網絡(GAN)的地質統計學反演方法研究[D]. 成都:電子科技大學,2021.
Wang Liangji. Geostatistical Inversion Using Generative Adversarial Network (GAN)[D]. Chengdu: University of Electronic Science and Technology of China, 2021.