曹志民 吳 云 韓 建 呂秀麗 宋鴻梅 趙麗華
(1.東北石油大學電子科學學院;2.大慶油田博士后科研工作站)
測井數據巖相分類的機器學習方法和大數據巖相分類探討①
曹志民1,2吳 云1韓 建1呂秀麗1宋鴻梅1趙麗華1
(1.東北石油大學電子科學學院;2.大慶油田博士后科研工作站)
對現有測井數據巖相分類的機器學習方法進行歸納總結,并針對大數據巖相分類的相關問題進行探討。
機器學習 巖相分類 儲層預測 測井數據 大數據
巖相是指一定沉積環境下形成的一系列具有特殊巖性(如礦物組成、沉積結構及幾何結構等)的巖石或巖石組。準確可靠的巖相分析對于地層特性分析、地層學小層對比及儲層預測等油氣田勘探開發應用來說至關重要[1~4]。巖相分類是油氣田開發中地層特性分析、小層對比及儲層預測等應用的關鍵環節。顯然,通過取心井提取巖心進行巖相分析的精確度和可靠性是最高的,但是這種方法不但費時,而且成本非常高;特別的,對于密井網獲取的大量數據來說,這種方法根本就行不通。測井技術通過利用不同物理屬性(如自然伽馬、電阻率、自然電位、聲波速度、巖石體積密度、巖石中子減速及俘獲信息等)的測井手段可以獲取能夠直接反映地下連續巖相地質信息的測井響應數據(信息)。可見,測井數據(信息)能夠直接用于巖相分析。然而,實際獲取的測井數據不可避免的會受到采集、記錄及地層環境等多種內在或外在因素造成的噪聲和失真的干擾,從而導致測井信號降質,而且不同巖相的測井響應往往具有一定的重疊特性,這就造成了利用測井曲線進行巖相分類解譯往往依賴于解譯人員的經驗,且解譯成果具有一定的多解性,而且人工測井數據巖相分類的效率還是太低。為此,在過去的20年里,樸素貝葉斯(Na?ve Bayes,NB)分類器[5]、人工神經網絡(Artificial Neural Networks,ANNs)[6~11]、決策樹(Decision Tree,DT)[12]、支持向量機(Support Vector Machine,SVM)[13~15]、聯合/集成分類器(Combined Classifier,CC)[16,17]等(有監督)機器學習方法不斷被成功應用于各種不同地質環境的巖相分類和識別應用中。
隨著我國大部分油氣田已經進入開發后期,地層結構越來越復雜,油氣開發成本越來越高,各種應用都對巖相分類的精度和可靠性提出了越來越高的要求。為此,越來越多的機器學習方法被應用到測井數據巖相分類的研究中。筆者對現有的主要巖相分類機器學習方法進行歸納總結,并針對大數據巖相分類的機器學習方法存在的問題進行了較為詳細的分析。
一般的,機器學習方法的基本流程如圖1所示。

圖1 機器學習方法基本流程
由圖1可知,在選定分類器的情況下,分類器分類性能直接取決于訓練數據的構建和特征提取/選擇。現對基于ANNs分類器、基于SVM分類器和基于聯合/集成分類器3種典型的巖相分類機器學習方法,分別從分類器基本原理和典型應用的訓練數據構建及特征提取/選擇等方面進行介紹。
1.1 ANNs法
ANNs方法采用的是一種并行的分布式處理網絡結構,通過多層神經元結構的加權組合構成的前饋神經網絡或誤差反向傳播神經網絡(BP神經網絡)在巖相分類等地質和地球物理勘探中都得到了較好的應用。顯然,神經網絡的基本元素是神經元,圖2a給出了神經元的基本結構,以此為基礎,可以構造如圖2b所示的多層神經網絡,圖2b中的每個圓形結構代表一個圖2a給出的神經元結構。

圖2 神經網絡基本結構示意圖
由圖2可知,ANNs網絡的成功應用需要對網絡中的參數組{Wi,Bi}進行精確學習,而這些參數精確學習的基礎是質量良好的訓練樣本。
文獻[9]在對法國拉希奧塔附近的南省盆地La Ciotat-1號井進行巖相分析時采用孔隙度、密度、P波速度、S1波速度、S2波速度、礦化基質體積模量、礦化基質剪切模量及各種礦物含量等19種特征,對石灰巖、石英、純凈砂巖及碳酸鹽砂巖等巖相進行分類。所采用的ANNs網絡為一個三層BP ANNs:一個輸入層,一個隱層和一個輸出層。實驗結果表明該井的ANNs巖相預測精度達到了85.62%。
盡管ANNs法可以通過學習實現較高的分類精度,但仍然具有對不同數據集的泛化能力很弱、參數過多,以及學習時間長甚至達不到學習效果等缺陷。
1.2 SVM法
SVM法是一種基于經驗風險最小化等嚴格理論基礎的間隔最大準則下的分類方法,如圖3所示。
SVM法的判別函數f(x)=ωTx+b,在間隔最大準則下通過引入支持向量的概念,最優判別參數求解的優化問題通過對偶轉化為易于求解的如下二次規劃問題:

圖3 SVM法分類劃分示意圖

s.t.yi(ωTxi+b)≥1,i=1,…,N
(1)
構造拉格朗日函數:

(2)
s.t. αi≥0,i=1,…,N
(3)
最終,可以根據下式給出最優SVM參數:
(4)
上述SVM分類原理是針對線性SVM分類器而言的,對于非線性分類問題,僅需引入核函數,通過對上述優化問題進行核擴展即可。顯然,SVM方法與ANNs方法相比,學習參數要少很多,并且具有更好的泛化性能。
文獻[13]在對中東某砂巖儲層開展的關于測井曲線巖相分類研究中,以井徑CAL、自然伽馬GA、光電PEF、中子孔隙度NPHI、聲吶孔隙度DT、體積密度RHOB、深側向電阻率LLD、淺側向電阻率LLS和微球聚焦電阻率MSFL共9種測井曲線為輸入特征,對純凈砂巖、砂礫巖和砂頁巖3種巖相進行分類。結果表明,與ANNs法相比,SVM法具有更好的分類性能。
SVM法雖然已經較為成功地應用于巖相分類等應用中,但是面對復雜數據集,核函數的選擇等問題制約了該方法的泛化能力。
1.3 聯合/集成學習法
雖然各種專家系統和單分類器機器學習系統在測井曲線巖相識別、分類等研究中已經取得了較多的成功經驗,然而,隨著大多數油氣田開發已經進入中晚期,地層地質環境越來越復雜,儲層預測難度和開采成本不斷增加,為了更好地實現對復雜環境下專家知識和實際測試數據的有效集成,有必要開展更復雜的機器學習方法來提高系統預測和分析的準確度和可靠性。
聯合/集成機器學習法是通過多個同類或異類學習機器構成一個學習網絡,進而,通過綜合各個學習機器的判決結果實現最終判決,圖4給出了該類方法的基本框圖。

圖4 聯合/集成機器學習方法基本框圖
可見,該類方法主要由兩部分組成,即學習機器的選擇和決策規則的制定。根據學習機器的構成情況,可以有神經網絡委員會法、集成學習法及異構機器聯合學習法等。
文獻[17]對巴西亞馬遜油田相關儲層進行的巖相識別研究中,利用自然伽馬GR、感應測井ILD、聲吶DT和密度RHOB共4種測井曲線進行砂屑灰巖、無水石膏、頁巖和巖鹽4種巖相,分別采用多層感知器、SVM、kNN、決策樹J48及邏輯回歸等單個分類法以及所有這些方法集成的集成分類法進行巖相分類研究。實驗結果表明,集成分類法在6組測試中的4組分類精度最高,而且相關統計結果表明,在改變訓練數據的情況下,集成分類法的性能最穩定。
隨著勘探開發進程的推進,國內外油氣田勘探開發均已進入大數據時代[18~20]。所謂大數據就是指數據量和數據屬性變化已經超出現有數據庫與相關軟件工具的采集、存儲、管理和分析能力的數據集。具體的,大數據主要體現為數據量大、數據質量不統一及數據結構多樣化等多源、異構且多時相特點。顯然,油氣田勘探開發過程中測井數據本身就是一種大數據,利用測井數據可以進行巖相分類、巖相相關的沉積微相分類、小層對比等多種任務,且不同開發區塊,不同沉積相下的巖相種類變化多樣等問題,都為機器學習方法在測井數據巖相分類等應用中的大數據分析提出了很多亟待解決的難題。
綜合考慮,面對大數據的應用需求,傳統機器學習方法主要存在如下問題:
a. 機器學習分類方法的魯棒性問題。利用某個數據庫或數據域的樣本訓練得到的學習機器很難適用于其他數據庫或數據域中的數據。
b. 類別確定性問題。傳統機器學習方法的訓練數據往往是針對有限已知類別進行的,而隨著數據的快速變化,類別多變性問題很難得到解決。
c. 傳統機器學習方法一般是針對單任務學習,不適合大數據環境下的多任務學習和知識遷移的需求。
顯然,大數據分類技術需要重點著眼于多領域表示學習技術,在數據聯合表示、聯合特征提取與選擇、跨領域知識遷移等方面進行深入研究。
面對日益復雜的地質地理條件,測井數據在巖相分類相關應用的研究中越來越迫切的需要人工智能與機器學習方法的參與。針對測井數據巖相分類問題,對現有機器學習方法進行了歸納,重點對ANNs、SVM和聯合/集成分類法進行了介紹,并對測井數據巖相分類大數據分析的機器學習方法存在的問題進行了探討。顯然,聯合/集成學習方法是今后勘探開發大數據分析的一個主流發展方向,在特征選擇、分類器選擇及分類決策等多方面還存在較多問題需要解決。而對于測井大數據來說,重點在于多任務聯合特征和知識的應用潛能挖掘。
[1] Rogers S J,Fang J H,Karr C L,et al.Determination of Lithology from Well Logs Using a Neural Network[J].AAPG Bulletin,1992,5(5):731~739.
[2] A Kadkhodaie Ilkhchi,Rezaee M,Moallemi S A.A Fuzzy Logic Approach for Estimation of Permeability and Rock Type from Conventional Well Log Data:An Example from the Kangan Reservoir in the Iran Offshore Gas Field[J]. Journal of Geophysics & Engineering,2006,3(4):356~369.
[3] Dong S Q,Wang Z Z,Zeng L B.Lithology Identification Using Kernel Fisher Discriminant Analysis with Well Logs[J].Journal of Petroleum Science and Engineering,2016,143:95~102.
[4] 趙顯令,王貴文,周正龍,等.地球物理測井巖性解釋方法綜述[J].地球物理學進展,2015,30(3):1278~1287.
[5] Li Y M,Richard A S.Facies Identification from Well Logs:A Comparison of Discriminant Analysis and Na?ve Bayes Classifier[J].Journal of Petroleum Science and Engineering,2006,53(3-4):149~157.
[6] Derek H,Johns R,Pasternack E.Comparative Study of a Backpropagation Neural Network and Statistical Pattern Recognition Techniques in Identifying Sandstone Lithofacies[C].Processdings 1990 Conference on Artificial Intelligence in Petroleum Exploration and Production.Houston,TX(United States):Knowledge Systems, Inc,1990:41~49.
[7] Bhatt A,Helle H.Determination of Facies from Well Logs Using Modular Neural Networks[J].Pet Geosci,2002,8(3):217~228.
[8] Dubois M K,Bohling G C,Chakrabarti S.Comparison of Four Approaches to a Rock Facies Classification Problem[J].Computers & Geosciences,2007,33(5):599~617.
[9] Adrielle A S,Irineu A L.Artificial Neural Networks to Support Petrographic Classification of Carbonate-Siliciclastic Rocks Using Well Logs and Textural Information[J].Journal of Applied Geophysics,2015,117:118~125.
[10] 張強,許少華,富宇.基于過程神經網絡的儲層微觀孔隙結構類型預測[J].化工自動化及儀表,2015,42(8):893~897.
[11] Sasmita S,Madan K J.Pattern Recognition in Lithology Classification:Modeling Using Neural Networks,Self-Organizing Maps and Genetic Algorithms[J].Hydrogeol J(Springer Online),2016,(1):20.
[12] 石寧,李洪奇,羅偉平.數據挖掘與測井解釋:應用于礫巖儲層[J].應用地球物理(英文版),2015,12(2):263~272.
[13] Anazi A A,Gates I D.On the Capability of Support Vector Machines to Classify Lithology from Well Logs[J].Natural Resources Research,2010,19(2):125~139.
[14] Sebtosheikh M A,Motafakkerfard R.Support Vector Machine Method,A New Technique for Lithology Prediction in an Iranian Heterogeneous Carbonate Reservoir Using Petrophysical Well Logs[J].Carbonates Evaporites,2015,30:59~68.
[15] Fatai A,Suli A.Integrating Seismic and Log Data for Improved Petroleum Reservoir Properties Estimation Using Non-linear Feature-selection Based Hybrid Computational Intelligence Models[J].Journal of Petroleum Science and Engineering,2016,145:230~237.
[16] Christopher M G,Arvin A.Collaborative Multi-agent Rock Facies Classification from Wireline Well Log Data[J].Engineering Applications of Artificial Intelligence,2010,23:1158~1172.
[17] Joacir Marques de Oliveira Jnior,Eulanda Miranda dos Santos.Ensemble of Heterogeneous Classifiers Applied to Lithogacies Classification Using Logs from Different Wells[C].Neural Networks (IJCNN),The 2013 International Joint Conference on.Piscataway,NJ:IEEE,2013:1~6.
[18] 崔海福,何貞銘,王寧.大數據在石油行業中的應用[J].石油化工自動化,2016,52(2):43~45.
[19] 李洪奇,郭海峰,郭海敏,等.復雜儲層測井評價數據挖掘方法研究[J].石油學報,2009,30(4):542~548.
[20] Johnston J,Guichard A.New Findings in Drilling and Wells Using Big Data Analytics[C].Offshore Technology Conference.Calgary,Canada:Society of Petroleumn Engineers(SPE),2015:OTC-26021-MS 1~8.
MachineLearningMethodsforLogDataLithofaciesClassificationandBigDataLithologyClassificationDiscussion
CAO Zhi-min1,2, WU Yun1, HAN Jian1, LV Xiu-li1, SONG Hong-mei1, ZHAO Li-hua1
(1.SchoolofElectronicScience;NortheastPetroleumUniversity;2.PostdoctoralResearchStation,DaqingOilfield)
The existing machine learning methods for lithofacies classification of the log data were summarized and issues relating to big data lithofacies classification were discussed.
machine learning, lithofacies classification, reservoir prediction, log data, big data
TH865
A
1000-3932(2017)08-0717-05
2016-12-28,
2017-04-20)
曹志民(1980-),講師,博士后,從事多源信號融合及模式識別、大數據儲層預測及油藏描述的研究,dahai0464@sina.com。