吳非 王衛 王佳琦
關鍵詞:測井數據;曲線分層;交會圖;BP神經網絡;支持向量機;巖性識別
1緒論
地層巖性識別在水平井與地層關系解釋、及隨鉆導向評價等方面具有的重要的研究意義。目前,可以通過巖屑錄井、取芯和測井資料的處理解釋等方式來獲取地下三維空間的巖性信息。在巖性識別過程中,主要以sP、GR、AC、RT、DEN和CN等曲線作為巖性響應特征數據,實現對測井曲線分層、巖性識別和預測進行分析。而測井曲線分層、不同巖性識別方法對識別結果影響很大。
測井曲線分層一直是關注的熱點。目前,測井曲線分層主流的方法有人工智能、數理統計和非數理統計等方法。雍世和認為測井曲線的數值變化不大的可以歸為同一層,不同的層其差別比較大,就是所謂的層內差異法,基于統計學方法的測井曲線分層有李廣場的有序聚類分析和Danilo R.Velis的變點分析法。閻輝等提出了小波變換方法的非數理統計方法。近年來人工智能的興起,相關的算法也在測井曲線分層中有較多方法的應用,如劉春桃等提出了基于神經網絡的測井曲線分層方法,梁亞納等提出了基于支持向量機測井曲線分層方法等。上述方法各有優劣,數理統計方法計算量大,但數學理論嚴密;非數理統計方法一般只考慮局部或整體,不適合于多因素綜合;人工智能方法受樣本數據影響較大,如果樣本訓練準確率較高,則識別的效果相對較好。
巖性識別方法更是受專家和學者探討和研究的熱點之一。國內外關于這兩方面的研究比較成熟,交會圖技術法是利用測井資料進行巖性識別的常用方法,隨著IT技術的發展和多學科的交叉融合應用,模式識別領域的人工智能方法也被引入到巖性識別中來,比如:聚類分析法、BP神經網絡等方法。
總之,現有研究主要單一的考慮測井曲線分層方法或者巖性識別方法,并沒有很好地結合二者對分層的數據采取不同的識別方法或者測井資料進行巖性識別,同時對各種識別方法缺少對比分析。本文先采用移動平均方法,主要利用自然伽馬(GR)曲線進行分層,然后根據不同的分層結果使用相對應的測井資料和交會圖、BP神經網絡和支持向量機等方法方法進行識別,識別結果與井壁取芯樣本以及MATLAB識別結果基本一致。
2數據處理與曲線分層
2.1數據處理
目前,國內主要的測井數據處理解釋軟件支持的主流數據格式主要有LAS和WIS等,LAS和WIS有相似的數據存放結構,其數據的組成包括標題塊和數據塊兩部分。標題塊主要包含井名,采樣的起始值、終止值及測井曲線名等,如下圖1所示,x1井數據格式。其中存在無效值,因此需要對其進行數據處理。
2.2基于測井曲線自動分層
在隨鉆導向井與地層關系的解釋過程中,首要的任務就是要基于測井數據進行地質分層。測井曲線分層的目的是為了提高巖性識別的準確率,特別是對于復雜儲層,分層處理顯得更為重要,對不同的儲層可以選取不同的樣本數據和不同研究方法,以提高巖性識別的穩定性和正確性。本文提出了一種移動平均算法,該算法的詳細步驟描述如下:
步驟1:首先設定移動平均法的步長n,一般可以n取8個數據,對i到i+2n,i+n到i+3n,i+2n到i+4n,…進行移動平均求解,因此每相鄰的n個測井曲線的移動平均值為:
式中:為測井曲線數據,代表in節點處的平均值。同時記錄當前索引點:
步驟2:設定曲線變化率的閾值P,P值初始可以定為30至60左右,發現不合適時可以交互修改直至結果滿意為止。如果兩相鄰的節點A和A差值小于閾值P,則對其進行合并,求A與A和的平均值作為新的均值,刪除集合I中kn值。
步驟3:求索引點集合I的移動均值,并將求得移動均值記為V。
步驟4:設定巖性變化幅度閾值Y,Y值一般需要考慮目標井所在的儲層情況來取值,對集合V進行判斷,如果V.大于給定的閾值Y,則該層對應的巖性歸為第一大類;否則,該層對應的巖性歸為第二大類。
3巖性識別方法及應用
3.1交會圖法
測井曲線交會圖版方法是一種測井資料的解釋技術,它是基于測井曲線數據標給出可識別的圖像的圖版。它需要在平面上把兩種不同的測井曲線進行交會,并根據兩曲線的交點,標定出未知變量的值和范圍的方法。巖石的主要礦物成分與一些微量元素具有很強的相關性。因此根據不同的測井資料,應選取與其合適的微量元素(Mg、A1、si等)作交會圖來識別巖性。然而在測井中自然伽馬、中子、密度、光電吸收界面指數等對不同巖性的反應比較靈敏,因此選擇自然伽馬、中子、密度、光電吸收界面指數比較合適,該方法在巖性識別中應用廣泛,但在復雜巖性識別中,如果不作特殊處理,其直接識別巖性的準確率較低。
3.2 BP神經網絡
該網絡由Rumethart等人于1985年提出,是一種前饋網絡,又稱為誤差反向傳播網絡。BP神經網絡是一種由輸入層、隱含層和輸出層3層組成的網絡結構,其網絡拓撲結構如圖2所示。該方法主要是采用AC曲線、GR曲線、RT曲線和sP曲線等來預測地層的巖性,該方法也是目前巖性識別的主流方法之一,識別巖性的準確率高,應用廣泛。
3.3支持向量機
支持向量機(sVM)是屬于模式識別中的一種新的方法,它的明顯優勢主要在于對小樣本數據和非線性關系等方面的識別問題,其顯著特點在于數學形式簡單、人機交互設置參數少,并且能尋找到極值解,該方法也是目前主流的巖性識別方法之一,識別巖性的準確率相對較高,應用廣泛。
3.4應用
本文以A油田x1井數據為例,采用傳統方式對整口井不分層段直接用巖性響應特征曲線數據進行全井段識別,交會圖、神經網絡以及支持向量的識別率只有60%至80%識別準確率,有的井識別率甚至低于50%。本文先根據明碼格式的測井曲線結構,將數據劃分為標題塊+數據塊,對其中存在的無效值進行處理,再利用移動平均的方法對測井曲線進行分層,在分層過程中,主要采用GR曲線作為特征曲線進行分層,分層結果如下圖3所示。
為了提高巖性識別正確率,在自動分層的基礎上,將巖性響應特征數據按變質巖、巖漿巖和沉積巖等巖性分大類分別處理,針對不同的巖性大類生成不同的交會圖版和學習樣本,并對目標井各選取上述提到的三方法進行巖性識別,并與商業軟件MATLAB提供的支持向量機算法識別結果進行對比,取3580~3610米左右的井段識別的結果如圖4所示。
通過識別結果的對比分析,得出以下幾點認識:(1)在分層處理基礎上,按大類分別設置不同參數和方法進行巖性識別,其識別結果更加準確,如圖中所展示的三種巖性識別結果都和實際相符;(2)井壁取芯處三種方法的巖性識別都相同,其他地方存在細微的差別;(3)通過圖4對比分析,可以發現BP神經網絡和支持向量的識別相似度較高,且識別正確率達到90%以上。(4)與商業軟件MATLAB進行識別結果對比,結果基本一致,說明按分層處理后的識別方法達到了商業軟件識別效果,本方法具有很好的推廣價值。
4結語
本文提出了一種基于移動平均對GR等測井曲線進行自動分層方法,能快速標定出不同的層對應的大類巖性,并對不同的大類巖性指定合適的巖性響應測井數據,作為交會圖圖版和樣本學習的原始數據,然后分別采用支持向量機、交會圖和BP神經網絡等方法進行巖性識別以進行對比。通過自動分層的各種識別方法能夠有效地提高巖性識別率,為測井資料處理、解釋等工作提供了很好的指引。通過對比這三種方法與井壁取芯樣本點巖性以及MATLAB識別結果,說明基于自動分層巖性識別方法的有較高的準確率,其推廣價值較高。