李艷芳,王 成
(中煤科工集團 西安研究院,陜西 西安 710077)
為了減少地震屬性解釋的多解性,提高構造解釋和巖性預測精度,常用多種優化屬性聯合分析,用以提高預測精度、降低勘探開發風險。隨著地震屬性技術的發展,地震屬性的種類數量增多,因此必須優選地震屬性。地震屬性優化就是優選出對求解問題最敏感、最有效、最有代表性的屬性[1],選出適于工區情況的最佳屬性組合。屬性優化的方法可分三類:基于模型正演的屬性優選、基于數理統計的屬性優選、基于人工智能的屬性優選。
地震模型正演是在假定已知地下介質的結構模型和相應物理參數的情況下,模擬地震波在地下各介質中的傳播規律,并計算在地面或地下各觀測點所觀測到的數值地震記錄的一種地震模擬方法,分為物理模擬和數值模擬。地震模型正演技術在地震數據采集、處理、解釋領域有著廣泛應用。在地震數據采集方面,模型正演有助于合理選擇地震采集參數和優化觀測系統設計,從而獲得高質量的采集資料。在地震數據處理方面,模型正演可幫助選擇處理參數,改善處理質量。在地震資料解釋方面,模型正演能驗證解釋結果,提高解釋成果精度。在地震屬性分析中,除了根據以往經驗可做出定性的判斷外,可在很大程度上依靠地震模型正演的測試結果。因已知的地質資料畢竟有限,地震模型可視為能替代鉆孔的已知資料,地震數學模型正演模擬對屬性參數的優選、組合、以及后續的屬性靈敏度分析等,都很重要[2]。
數理統計法是利用數學方法優選一些屬性進行儲層預測,例如相關法、粗集、依據井旁地震屬性值與測井特征值計算地震屬性的有效性等,它是直接利用數學方法選出一些理想的屬性、然后分析,刪除一些認為不合理的屬性,最后利用剩下的一些屬性進行預測。其優點是:減少了解釋人員的工作量,不要求對工區和地震屬性含義進行深入理解,比較客觀;缺點是可信度不高,優選的地震屬性有時沒有明確地質意義。
1)直方圖分析。屬性提取后,不能盲目分析屬性數據,需對各個屬性統計分析,以便了解各屬性數據的大致情況(包括:直方圖分布、相關統計信息、采樣點個數、最大值、最小值、均值、協方差等)。圖1為某工區異常值刪除前后的屬性直方圖,對其明顯的尖峰,通過研究發現:該工區為不規則形狀;并在屬性提取時,對Inline和Crosslink插值后,范圍為矩形;圖中的尖峰為0值的樣點數,代表了矩形范圍外的0值,可認為是區域背景;如果不對此加以處理,將使工區內的局部異常淹沒在區域背景中。
2)相關分析。它是描述兩個或兩個以上變量間關系密切程度的統計方法,變量間關系的密切程度常以一個數量性指標相關系數描述,它是社會學中常用的分析方法。相關分析可分類為:直線相關、非直線相關。并可進一步根據變量層次和數目分類。相關分析可直觀地排除接近正相關或負相關的屬性。

圖1 異常值刪除前后的屬性直方圖
3)聚類分析(Cluster Analysis)又稱群分析:它是對樣品或指標分類的一種多元統計分析方法,它的對象是大量樣品,要求合理地按各自的特性進行分類,即在沒有先驗知識的情況下進行分類。聚類是將數據分類到不同的類或簇的過程,同一簇的對象有很大相似性,不同簇間的對象有很大相異性。聚類分析的目標是在相似的基礎上收集數據分類。若將聚類分析和其它方法(例如判別分析、主成分分析、回歸分析等)聯合起來使用效果更好。
4)主成分分析(Principal Component Analysis ,PCA)也稱主分量分析:旨在利用降維思想,在損失很少信息的前提下,把多指標轉化為少數綜合指標,即主成分;這些主成分要能反映原始變量的絕大部分信息,通常為原始變量的線性組合;各主成分之間互不相關、且按照方差依次遞減的順序排列。主成分分析的計算過程依次為:計算相關系數矩陣、計算特征值與特征向量、計算主成分貢獻率及累計貢獻率、計算主成分載荷[3]。
傳統的地震屬性優選方法是在某種單一屬性與儲層參數之間建立關系,例如圖2是儲層孔隙度參數(porosity)與某種地震屬性的交會圖,采用線性關系優選屬性的方法簡單,但預測精度低,圖中的擬合精度只有29.8%;此考慮非線性優選。Schultz、Ronen、Hattori、Corbett、謝雄舉等提出了地震多屬性非線性優選的思路方法[4]。運用人工智能進行屬性優選的關鍵問題是:如何從n種屬性中選出m種最優屬性,常用的方法有[4]:①窮盡搜索。希望從n種屬性中選出m種屬性,測試所有m種屬性的組合,在所有組合中預測誤差最低的就是所求解;若從25種屬性中選出5種最好組合,將會有53130種組合,運算量大,耗時長。②單步尋優算法。雖不是最優化,但運算速度快;其理論假設是:已知最好的m種屬性組合,那么最好的m+1種屬性組合一定包含這m種屬性的最優組合,當然以前計算的系數必須被重新計算。具體的實現步驟為:設有多種屬性,第一步通過窮盡搜索找出最好的一種屬性,稱為屬性1;第二步在所有與屬性1組合的屬性中通過求取最小預測誤差找出最好的一對屬性,稱為屬性2;然后依次類推。利用這種方法運行時間大大短于窮盡搜索。

圖2 屬性交會圖
人工神經網絡 (Artificial Neural Network,ANN)是模擬生物神經網絡的結構和功能的人工系統。人工神經網絡算法在確定兩個測量變量之間的非線性函數關系,特別是未知非線性函數關系方面,具有速度快、誤差小的優點;作為多學科的交叉科學,神經網絡的并行處理能力、自組織自學習能力、高度的計算能力,引起人們的普遍興趣[4]。目前,在地震、重力、電磁法、磁法等方面都進行了應用探索。1986年Rumelhart提出了反向傳播(Back Propagation)學習算法(BP算法),目前應用最廣模型之一。BP網絡能學習和存貯大量的輸入-輸出模式映射關系,它的學習規則是用最速下降法,通過反向傳播調整網絡的權值和閾值,使網絡的誤差平方和最小。運用神經網絡進行多屬性優選,以較大的訓練樣本量為基礎,但隨著樣本數量的增加,有可能相關性反而降低,出現“過擬合”現象(見圖3)。

圖3 訓練數據過擬合圖
支持向量機 (Support Vector Machines,SVM)是Corinna Cortes和Vapnik等于1995年提出,以最小化錯誤率的理論界限為思想,以統計學習理論(Statistical Learning Theory,SLT)為基礎,服務于小樣本統計估計和預測學習的一種新的機器學習方法。它能根據有限樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,提高模型的泛化能力,得到全局最優解,又不存在“過擬合”問題,較好地解決了小樣本的學習問題。支持向量回歸是用一個非線性映射將訓練數據集非線性映射到一個高維特征空(Hilbert空間),并在此空間中構造最優分類超平面,以求最優解的實現過程[5]。針對地震勘探中已知樣本數目偏少的實際情況,可用基于SVM方法進行多屬性的非線性優選。圖4為某工區運用已知孔插值形成的預測圖,圖5為運用基于SVM的屬性優選后的預測圖。

圖4 已知孔插值形成的預測圖

圖5 SVM預測圖
本文從模型正演、數理統計、人工智能方面討論了地震多屬性的優選技術;闡述了運用相關分析、聚類分析、主成分分析、神經網絡進行地震屬性的優選方法;重點闡述了基于小樣本的支持向量機優選屬性方法,并將SVM方法和多屬性優選方法應用于煤層氣預測中。實際資料應用結果表明,針對地震勘探中已知鉆孔較少的情況,基于SVM的屬性優選方法是一種較為有效的方法。
[1]印興耀,周靜毅.地震屬性優化方法綜述[J].石油地球物理勘探,2005,40(4):284-289.
[2]蔣先藝,劉賢功,宋葵.復雜構造模型正演模擬[M].北京:石油工業出版社,2004.
[3]印興耀,孔國英,張廣智.基于核主成分分析的地震屬性優化方法及應用[J].石油地球物理勘探,2008,43(2):179-183.
[4]謝雄舉,季玉新.優選地震屬性預測儲層參數的方法及其應用[J].石油物探,2004,43(S):127-131.
[5]遵德.儲層地震屬性優化方法[M].北京:石油工業出版社,1998.