楊玲
摘 要: 地層劃分是一個復雜的非線性系統,根據地層結構,本文提出了一種基于SVM(支持向量機)的劃分方法。該方法利用同一區域地質結構相似、地質結構有序連續的特征,使用有序學習多分類模型,以高斯核函數為核函數,建立了地層自動分層模型,最終得到樣本空間的分類結果。實驗結果表明,按照所提方法訓練出的SVM可以很好地劃分同一區域內其他井的地層,有效地提高地層劃分的效率。
關鍵詞: 地層劃分;SVM;高斯核函數
0 引言
地層劃分的目的是把地層由上至下切割成不同的片段,劃分出不同等級的地層單位,即把一個地區的地層進行縱向劃分,以便與地質單層相對應。目前采用的方法主要有人工解釋方法,數理統計方法和人工智能方法。
人工解釋的方法對測井曲線進行分層,該方法不僅費時費力,而且分層取值過程中受測井分析人員的經驗知識和熟練程度影響較大,主觀性較強;數理統計方法能夠保持巖層內部的均一性,但計算量比較大,同時對測井信息和地質信息的一一對應有很高的要求,如果達不到(事實上也無法完全做到一一對應),則分層結果不易達到地質應用的要求。人工智能是一種現代化方法,主要有神經網絡和機器學習等,其具有較好地學習和自適應能力,但在地質分層應用中目前仍處于探索階段。
本文采用SVM機器學習方法對測井曲線進行地層劃分,以同一區域已有的分層井數據變化特點為切入點,結合每口井測井曲線數據以及代表地層特性測井曲線數據的變化特點,建立合理的數學模型,實現自動分層。實踐證明,根據實際問題合理選擇二類分類模型和核函數,SVM方法對于測井曲線劃分是行之有效的。
1 SVM簡介
SVM方法是建立在統計學習理論基礎上的機器學習方法,其目的在于尋找一個超平面H(d),該超平面可以將訓練集中的數據分開,且與類域邊界的沿垂直于該超平面方向的距離最大,故SVM法亦被稱為最大邊緣(Maximum Margin)算法。通過學習算法,SVM可以自動尋找出那些對分類有較好區分能力的支持向量,構造出的分類器可以最大化識別類與類的間隔,因而有較好的適應能力和較高的分準率。目前,構造SVM多類分類器的方法主要有兩類:一類是直接法,直接在目標函數上進行修改,將多個分類面的參數求解合并到一個最優化問題中,通過求解該最優化問題“一次性”實現多類分類。這種方法看似簡單,但其計算復雜度比較高,實現起來比較困難,只適合用于小型問題;另一類是間接法,主要是通過組合多個二分類器來實現多分類器的構造,常見的方法有一對多法和一對一法兩種。不同的構造方法訓練時需要的分類器個數不同,實際應用時,可根據問題背景選擇合適的分類方法。
2 SVM測井曲線分層
測井曲線分層是通過多條測井曲線數據對地層進行劃分的過程,由于地層具有連續性且在同一區域內地質特征相似,而對某采樣點進行分類時,其只可能屬于兩個連續地層中的某一層,因此測井曲線分層可以歸為有序多分類問題。
2.1 設計多類分類模型
對測井曲線分層,采用優化的一對一的方法,將多類問題轉化為二類問題。按照地層順序,建立N-1個相鄰地層的二類模型。
已知測井曲線數據X={Xij}r×s,r為樣本個數;地層分類L={li}n×1,N為地層個數。將X按照已知的分層結果分為N個子集:Xl,l=1,2,...,N,按照順序依次建立Xl和Xl+1的二類模型。
2.2 分層模型
對測井曲線分層,重點是尋找地層分層界面。但是由于地質的隨機性、復雜性和不可預見性,單獨一個或幾個采樣點并不能代表某一連續區域的地質特征。因此,需在一定區域內多達幾十個、甚至幾百個的連續采樣點的二分類基礎上做進一步分析。尋找出分類結果的分類面從而確定出地層的分界面。
假設已知連續樣本集X={xij}m*s,為l和l+1層的樣本點,其中m為樣本個數;l和l+1的分界樣本點為Xt,t∈{1,2,...,m}。
由二類模型的決策函數f(X)=sgn(g(X)),可以計算得到Y={yi}m*1,其中Yi∈{+1,-1}。假設Xt為兩類分類面,由于二類分類問題存在錯判的情況,只能保證Y={yi},y=1,2,...,t中大部分應該為+1,而Yl+1={yi},i=t,t+i,...,m中大部分應該為-1。此時,為了得到分界點Xt,需要求解如下模型:
但是根據上述假設,需要確定樣本集X可以被分為兩類,因此可以增加約束條件:
其中C∈{0,1,...m/4}為兩類樣本個數的差值的閥值,根據樣本個數可以適當選擇數值。
2.3 曲線分層
由于每次只能對連續兩層的樣本數據進行分類,因此采用循環步進的方式實現分層,流程如圖1所示。
每次從樣本集中選擇連續的t個樣本點,根據 l 和 l+1 層的學習結果進行分類,則可能有三種結果:第一種大部分為 l 層,則向前步進選取新的 t 個樣本點;第二種大部分為 l+1 層,則退回上層分層線重新選取新的 t 個樣本點,并更新l=l+1;第三種兩層點比較均衡,此時通過分層模型確定分層界面。循環上述步驟,直到分層結束。
3. 結果比較與分析
首先對樣本井進行學習并對其進行自動分層,然后根據樣本井的學習結果對 B-D 號井進行自動分層,人工與自動分層結果比較如表4-1.
表 4-1 B-D 號井分層結果比較
由實驗結果可知,與人工解釋方法相比,SVM應用于測井曲線自動分層效果良好,在測井數據較少的情況下也可以很好的實現分層,大大提高了工作效率,并減少了人為主觀性及經驗性對分層結果的影響。
參考文獻
[1] Hsu C W, Lin C J. A comparison of methods for multi-class support vector machines. IEEE Transactions on Neural Networks. 2002.