謝會文,許永忠,鄭多明,高宏亮,李國會,葉茂林,王雙雙
(1.中國石油天然氣股份有限公司塔里木油田分公司勘探開發研究院,新疆 庫爾勒 841000;2.中國礦業大學資源與地球科學學院,江蘇 徐州 221116;3.中國科學院地質與地球物理研究所油氣資源研究重點實驗室,北京 100029)
基于交叉驗證的地震多屬性概率神經網絡(PNN)反演在識別熱瓦普地區火成巖中的應用
謝會文1,許永忠2,3,鄭多明1,高宏亮1,李國會1,葉茂林1,王雙雙2
(1.中國石油天然氣股份有限公司塔里木油田分公司勘探開發研究院,新疆 庫爾勒 841000;2.中國礦業大學資源與地球科學學院,江蘇 徐州 221116;3.中國科學院地質與地球物理研究所油氣資源研究重點實驗室,北京 100029)
新疆塔北地區發育巨厚二疊系火成巖,速度差異較大,而且火山噴發模式難確定,給其下伏低幅度碎屑巖圈閉和巖性圈閉落實帶來困難。本文對二疊系火成巖利用概率神經網絡反演等方法進行精細的速度場研究。概率神經網絡反演是一種典型的非線性反演方法,相比于稀疏脈沖反演,在地震反演過程的非線性問題,具有更好的分辨率。通過逐步回歸和交叉驗證優選使驗證誤差最小的屬性組合,使反演結果與測井屬性有更好的相關性。建立的速度場經驗證,更符合火成巖分布與速度變化規律。
PNN神經網絡反演;交叉驗證;巖性識別;火成巖
地震反演技術是巖性地震勘探中十分重要的手段之一,它在油氣地震勘探中已經作為一種成熟的技術被廣泛應用,非線性反演作為研究熱門也越來越被更多的實際生產中[1-4]。夏步余等應用層位標定、地震屬性描述及測井約束反演等地震技術,對火成巖分布規律進行了深入研究[5]。張傳林應用波阻抗反演技術來預測火成巖的厚度[6]。石勝群等應用測井約束反演方法對火成巖進行識別,預測火成巖的厚度與孔隙度[7]。楊曉蘭等采用曲線重構反演預測了蘇北盆地海安凹陷四灶地區阜寧組火成巖儲層[8]。范洪軍等應用波阻抗反演及地震屬性聚類分析方法,預測了火成巖的噴發期次和平面分布形態[9]。
PNN神經網絡反演方法突破了常規地震反演方法的限制,主要表現在以下幾個方面:①直接得到測井屬性而不是波阻抗,和從反演的波阻抗信息中得到的屬性是有區別的;②參與預測的是從地震數據中得到的屬性信息而不是常規的疊后地震數據,且地震屬性包括疊前數據或者疊后數據的非線性轉換,從而提高了預測能力;③通過對井位處的數據進行訓練,尋找測井數據和地震數據之間的統計學關系,而不是假設某一特定的地質模型,且這種關系可以是線性的或者非線性的;④應用交叉驗證的思想來檢驗二者關系的可靠性[10]。
基于交叉驗證的PNN神經網絡反演是用地震數據體中的屬性信息直接預測井數據的一種方法。在數據分析之前,可對測井數據進行帶通濾波,以提高測井數據與地震數據的匹配程度。采用逐步回歸法將屬性的預測效果排序,借助交叉驗證的思想確定褶積因子,參與運算的地震屬性的類型和個數,并通過概率神經網絡方法,建立多種地震屬性與測井值之間的關系。將預測結果用于全區可得到火成巖速度體[11-13]。
1.1 概率神經網絡
概率神經網絡(Probabilistic Neural Network,簡稱PNN)是一種利用神經網絡結構來完成數學上擬合的方法。其所使用的訓練數據包括一系列不同類型的屬性值(訓練樣本),訓練樣本的表示方法如式(1)所示。
(1)
式中,A為屬性,每種屬性有 個采樣點,即 個樣本值, 是每個采樣點的實際測井值。
概率神經網絡方法假設每一個輸出的新的測井值都可以看成訓練樣本中測井值的線性組合。數據樣本的屬性值可以寫成式(2)。
(2)
新的測井值可通過式(3)、式(4)來估算。
(3)
(4)
1.2 逐步回歸法確定屬性類型
用于預測的屬性類型是反演過程中相當重要的環節,采用逐步回歸法確定類型。假設最優的種屬性的組合已知,那么種屬性的組合就是在這種屬性的基礎上再尋找一種屬性,并重新計算權重。首先用窮舉法找出最優的某一種屬性:對每一種屬性(比如振幅加權相位、平均頻率、視極性等),解出最優系數并計算預測誤差,選擇誤差最小的屬性作為第一種屬性,從剩余屬性中尋找第二種屬性,使二者組合對的預測誤差最小,并以此類推。但逐步回歸法不能確保最終獲得的解是最優的,每加入的屬性,預測誤差小于或等于之前的預測誤差,一般的多屬性轉換可定義為一組不同類型的屬性組合,按一定的規則,轉化為期望的測井值。
1.3 交叉驗證
每一種屬性都對應一個權重,由于測井數據的采樣間隔要遠遠小于地震數據的采樣間隔,而地震屬性的采樣間隔和地震數據的采樣間隔一致,所以實際測井數據的頻率要比地震屬性的頻率高得多,因此單純地將實際測井值和屬性值點對點地關聯起來是不恰當的,忽略了測井數據很多的變化細節??杉僭O目標測井值的每一個采樣點與地震屬性一組相鄰的采樣點是有一定關系的。
以三種屬性為例,對每一個采樣點,目標測井值通過下面的式子計算得出L(t)為預測的采樣點處的測井值,w為各井的權重值,A(t)為采樣點處的屬性值,計算過程見式(5)。
(5)
利用逐步回歸確定屬性個數時,參與運算的屬性越多,則預測誤差越小。當使用較多的屬性時,預測數據與訓練數據之間的吻合程度在不斷地增加,但是對于不包括在訓練樣本內的數據可能使效果變得差,導致過度訓練[2]。
交叉驗證用于預測的屬性個數。其原理是把整個訓練數據分成兩部分,一部分是訓練數據組,另一部分是驗證數據組。選擇訓練數據組來參與概率神經網絡的運算,得到擬合結果,而驗證數據組代入擬合關系,計算最終的預測誤差。
2.1 工區概況
哈拉哈塘地區位于塔北隆起,東面是輪南低凸起,西面是英買力低凸起,南接滿加爾凹陷,北接輪臺低凸起。研究區奧陶系、石炭系砂礫巖油藏均有突破性發現,且多為低幅構造,均有良好的油氣勘探前景。
工區二疊系火山熔巖主要為基性噴出的玄武巖和介于中性和酸性之間噴出的英安巖,以及過渡類型的凝灰質英安巖,安山質英安巖,局部出現少量的安山巖和流紋巖?;鹕交顒哟笾路譃槿齻€期次,第一期次巖性主要為凝灰巖和碎屑巖,第二期次以玄武巖為主,第三期次以英安巖和英安質凝灰巖為主[3]。
2.2 反演屬性優選
進行地震反演前,進行多屬性分析,要建立多種地震屬性與P波速度之間的關系。在這個過程中需要解決兩個問題:①敏感屬性組合和褶積因子的選取,選取的每一種敏感屬性都應該對應一個權重,并且保證這些屬性組合起來的預測誤差最?。虎诖_定參與運算的屬性個數。
采用逐步回歸法選取屬性,在確定褶積因子和屬性個數后,將利用交叉驗證的思想確定褶積長度。先假定每個采樣點的數值由附近相鄰的10個采樣點來確定,總共參與運算的屬性個數為8個。褶積因子的驗證誤差如圖1所示,當褶積長度不超過9點時,隨著點數的增加,驗證誤差逐漸降低,當點數超過9個時,驗證誤差不但沒有降低,反而誤差變差。選擇褶積長度為9點。
圖2表示褶積長度為9點,屬性個數為8時的預測誤差和驗證誤差。從圖中可以看出,參與預測的屬性個數越多,預測誤差越小,但是驗證誤差卻和
預測誤差的變化趨勢不同。當屬性個數不超過5時,驗證誤差隨著屬性個數的增加而降低,當屬性個數為5時,驗證誤差取最小值,當屬性個數大于5時,驗證誤差反而隨著屬性個數的增加而上升。即當屬性個數大于5時,出現了過度訓練,即訓練的樣本增加,訓練效果反而有所下降。因此,選擇前5種屬性用于預測。8種屬性及不同的屬性個數對應的訓練誤差和驗證誤差見表1。

圖1 褶積因子的驗證誤差

圖2 褶積因子為9時的預測誤差與驗證誤差
表1 多屬性預測結果

屬性個數目標最終屬性訓練誤差預測誤差1P-wave(inversionimpedance)**2223.109442228.7252772P-waveCosineInstantaneousPhase212.251285218.4145923P-waveFilter45/50-55/60210.029851217.4380654P-waveFilter5/10-15/20208.090230217.4970735P-waveFilter25/30-35/40206.879246217.3671736P-waveApparentPolarity205.738557217.9803397P-waveFilter35/40-45/50205.203506219.0837428P-waveIntegratedAbsoluteAmplitude204.631039220.266730
建立多種屬性與測井信息之間的關系可通過概率神經網絡分析。概率神經網絡是一種非線性方法,它的預測精度要比線性回歸的預測精確度高,但是計算量比線性回歸大。圖3、圖4分別為多元線性回歸的預測結果和概率神經網絡的預測結果。圖5為將速度誤差大于400m/s的RP1和RP12井剔除后,概率神經網絡重新預測的結果,其中橫坐標為實測的P波速度,縱坐標為三種情況預測的P波速度。圖5中,線性關系較差的點表示將被刪除,即在

圖3 線性回歸預測結果與實測結果交會圖

圖4 概率神經網絡預測結果與實測結果交會圖

圖5 修改后概率神經網絡預測結果與實測結果交會圖
訓練時不作為樣本數據,這些點的波阻抗值偏低,與其它點之間異常明顯。擬合斜線為預測結果與實測結果的之間的最佳擬合。
從表2中可以看出,相同的訓練樣本數據,概率神經網絡的預測誤差要比多元線性回歸的預測誤差小,相關度達到0.911,相應的速度誤差也小。但是神經網絡的交叉驗證誤差比線性回歸的大。當剔除誤差較大的井后,概率神經網絡的預測精度進一步提高,預測結果的相關度達到0.921,速度誤差反而降至147.047m/s。驗證誤差也隨著減小。因此,將第三種情況得出的預測數據與實測數據的關系應用于全區,通過神經網絡反演得到的速度體。圖6、圖7分別為道號1659的神經網絡反演速度剖面和約束稀疏脈沖反演速度剖面。從圖中明顯看出,神經網絡反演得到的數據體的分辨率明顯高于稀疏脈沖反演,反演剖面中藍色的區域為高速區,稀疏脈沖反演的高速區內部無明顯的細分,分辨率較差,其反演本質仍為基于褶積模型的反演,受制于地震記錄頻帶以及子波等因素的影響。前者作為一種典型的非線性反演方法,在縱向分辨上,對于高速火成巖的刻畫較為細致,也更符合真實的地質情況。
概率神經網絡及地震屬性反演方法是一種典型的非線性算法,采用逐步回歸法將屬性的預測效果排序,借助交叉驗證的思想確定褶積因子、參與運算的地震屬性的類型和個數,通過線性回歸分析和概率神經網絡方法,建立多種地震屬性與測井值之間的關系,使概率神經網絡的預測結果達到最優。

表2 三種情況下的預測結果

圖6 1659道概率神經網絡速度反演剖面

圖7 1659道約束稀疏脈沖速度反演剖面
相對于約束稀疏脈沖反演等傳統反演方法,概率神經網絡反演具有更好的分辨率,能夠較好的逼近真實值,對工區內的火成巖進行有效的識別。將預測結果用于全區并得到火成巖速度體。該方法在該工區內切實可行,有效的提高了火成巖的識別精度。
概率神經網絡在井的數量上有一定的要求,而且屬性種類與個數的選擇與波阻抗值應該具有較好的相關性,這是反演過程中需要充分考慮的,需要進一步的深入研究。
[1] 曾富英,羅霞,肖紅平,等.松遼盆地深層火山巖體的地震綜合識別及預測[J].勘探地球物理進展,2009,32(4):270-274.
[2] 冉啟全,周雪峰,胡永樂.基于神經網絡的多屬性火成巖巖性反演技術[J].西南石油學院學報,2006,28(1):5-8.
[3] 張昆,劉永福,許永忠,等.基于D-S證據理論的多參數反演的火成巖識別-以塔里木哈拉哈塘地區為例[J].東北石油大學學報,2013,37(1):51-57.
[4] 湯浩哲,許永忠,劉永福,等.多屬性分析在哈拉哈塘斷裂及裂縫中的應用[J].中國礦業,2013,22(4):51-54.
[5] 夏步余,諶廷姍.地震技術在火成巖發育區開發中的應用[J].石油物探,2002,41(4):461-465.
[6] 張傳林.塔里木盆地塔中地區火成巖體識別與預測技術[J].石油實驗地質,2003,25(5):513-516.
[7] 石勝群,楊德洲,張秀萍,等.蘇北海中地區火成巖儲層預測及其應用[J].沉積與特提斯地質,2004,24(3):108-112.
[8] 楊曉蘭,劉小平,趙錫橋.曲線重構反演在火成巖儲層預測中的應用[J].西安石油大學學報:自然科學版,2007,22(6):32-35.[9] 范洪軍,徐春雨,王云雷.歧口凹陷北部火成巖地震預測方法研究[J].內蒙古石油化工,2008(5):124-126.
[10] YANG Haijun,LIU Yongfu,XIE Huiwen,et al.Integrative method in lithofacies characteristics and 3D velocity volume of the Permian igneous rocks in H area,Tarim Basin[J].International Journal of Mining Science and Technology,2013,23(2):167-172.
[11] Xu Yongzhong,Yang Haijun,Liu Yongfu,et al.Application of seismic facies and attributes analysis on the identification of Permian igneous rock[J].International Journal of Mining Science and Technology,2012,22(4):471-475.
[12] XU Yongzhong,CHEN Tongjun,CHEN Shizhong,et al.Comparison between several seismic inversion methods and their application in mountainous coal fields of western China[J].International Journal of Mining Science and Technology,2010,20(4):585-591.
[13] XU Yong-zhong,CUI Ruo-fei,HUANG Wei-chuan,et al.Reflectivity forward modeling and a CSSI method seismic inversion study of igneous intrusive area,coked area,and gas-enriched area located within a coal seam[J].Mining Science and Technology,2009,19(4):57-462.
Multi-attribute probabilistic neural network inversion applicated in identifying igneous in RWP area based on cross-validation
XIE Hui-wen1,XU Yong-zhong2,3,ZHENG Duo-ming1,GAO Hong-liang1,LI Guo-hui1,YE Mao-lin1,WANG Shuang-shuang2
(1.Research Institute of Petroleum Exploration and Development,Tarim Oilfield Branch Company,China National Petroleum Corp,Korla 841000,China; 2.School of Resource and Earth Science,China University of Mining and Technology,Xuzhou 221116,China; 3.Key Laboratory of Petroleum Resource Research,Institute of Geology and Geophysics,Chinese Academy of Sciences,Beijing 100029,China)
There developed huge thick Permian Igneous in Tabei area of Xinjiang.The Permian igneous rocks with sharp variation of velocity,affects the process of oil and gas exploration seriously,and makes trap-confirming more difficult.For solving this problem,this paper use Probabilistic Neural Network inversion method to establish igneous velocity field.Compared with CSSI,PNN inversion is a typical nonlinear inversion with its high resolution.At first,a group of attributes was selected by using Stepwise regression and cross-validation for analyzing and error minimum,to make inversion results have better correlation with log properties.The inversion velocity field was testified to conform the distribution of igneous and velocity changes.
probabilistic neural network inversion;cross-validation;identifying-lithology;igneous rocks
2014-03-07
謝會文(1967-),男,重慶萬州人,高級工程師,礦產普查與勘探專業,現從事油氣勘探方面的研究工作。E-mail:xiehw-tlm@petrochina.com.cn。
許永忠(1969-),男,福建莆田人,博士,副教授,從事地球物理勘探與反演方面的研究工作。E-mail:xuyongzhong2004@126.com
P361.4
A
1004-4051(2015)02-0154-05