羅海峰 王濤



摘要:隨著國家對互聯網、人工智能、機器學習等前沿計算機技術的推廣,以及計算機技術所帶來的高效能力,提供的先進決策方法,為智能鉆井提供了新的解決方案。相較傳統的離線學習的方法,在線機器學習在分析鉆井過程中具有更強的適應性、更好的解析能力和糾錯能力。本文簡述了在線學習在鉆井工程的應用。
關鍵詞:機器學習;離線學習;在線學習;智能鉆井
中圖分類號:TP311文獻標識碼:A
文章編號:1009-3044(2021)16-0188-02
開放科學(資源服務)標識碼(OSID)
Application of Online Machine Learning in Intelligent Drilling
LUO Hai-feng, WANG Tao
(School of Computer Science, Southwest Petroleum University, Chengdu 610500,China)
Abstract: With the country's promotion of cutting-edge computer technologies such as the Internet, artificial intelligence, and machine learning, as well as the efficient capabilities and advanced decision-making methods brought by computer technology, new solutions are provided for intelligent drilling. Compared with the traditional offline learning method, online machine learning has stronger adaptability, better analytical ability and error correction ability in the analysis and drilling process. This article briefly describes the application of online learning in drilling engineering.
Key words: Machine learning; Offline learning; Online learning; Intelligent drilling
1概述
隨著對油氣資源需求的增長,石油勘探開發的速度不斷提高,鉆井新技術迅速推廣,對智能化鉆井的需求不斷增加[1]。智能鉆井從空間環境來看主要分為井下工具的智能化、井上智能鉆井系統和高效的信息傳輸通道,當前鉆井過程中將井下信息傳遞到地面已經具備完善的鉆井裝備和解決方案,但是如何有效利用獲取的鉆井信息,是智能鉆井當前需要解決的關鍵問題之一。機器學習的強大的高維非線性映射能力和大數據處理能力為鉆井數據分析利用提供了有效的解決途徑,減少現場作業人員,提供一定的決策支持能力,大幅提高作業效率和安全性。
傳統作業方法中,通過建立數理方程對鉆井參數分析,實現井眼監測、卡鉆監測、井涌預測和機械鉆速預測等。相比傳統方法,基于機器學習的鉆井參數分析具有更可靠的分析精度,并且可以更全面的考慮多種特征因素對分析結果的影響。但是,由于新開鉆井地質和工程條件的差異,以及現場工況的復雜性導致離線模型的適用性會隨實際開采情況變化,不再具有穩定的分析預測效率。在線模型具有的實時校正和在線更新的能力,因此,在某些工況下是更符合智能鉆井的需求。
2基于離線學習的智能鉆井
2.1 離線模型建立流程
基于離線模型的智能鉆井參數分析中,主要過程如圖1所示,獲取的鉆測井數據包括深度、鉆壓、轉速、鉤載、排量、鉆井液密度、轉盤扭矩、轉盤扭矩變異系數、鉆頭尺寸、鉆頭型號和地層等相關信息,經過數據預處理剔除無效數據,提取有效特征因素,構建離線機器學習模型,將離線模型用于新井工況檢預測。
2.2 離線隨機森林
隨機森林可以理解為基于自助采樣法和決策樹的一種提升方法,如圖2所示,通過自助采樣法有放回隨機選取m個子樣本使用決策樹訓練基礎模型,在訓練決策樹時選擇k個屬性建立基模型,一般情況下k=log2d(d表示樣本中的屬性個數),這樣做的目的是提供一定的樣本擾動性和屬性擾動性,使得基礎模型盡可能有較大差異,具有多樣性的同時個體模型不會太差,最終的集成樹效果有提升。
機器學習在智能鉆機中典型應用之一是巖性識別。文獻[5]集中探討了不同機器學習方法在巖性預測上的性能表現。
基于離線方法建立模型的方式中,一個重要假設是我們已經獲取了全部可能的樣本。在利用堪薩斯大學[2]提供的鉆井數據集中,使用傳統離線方式建立預測模型,將數據集隨機打亂并按照1:4的比例劃分為訓練集和測試集,采用隨機森林算法實現巖性分類,模型的效果能夠達到85%。但是當我們模擬現場鉆井過程,數據是按照順序流的方式到來,由于未學習過的樣本模型是不能識別的,只能對學習過的樣本識別,模型準確率僅有47.65%,所以此時訓練出的模型是不適用此類工況環境的。
3基于在線學習的智能鉆井
3.1在線模型建立流程
同離線模型相比在線模型的建立過程中主要的不同點在于模型的更新過程,通過有效的更新模型使得模型更加適用于這類隨時間變化隨工況變化的存在概念漂移的數據。如圖3所示,為了使模型能夠適用概念漂移在新樣本到達時,首先基于上一輪的模型對新樣本進行預測分析,再基于新樣本對模型更新,學習新樣本的數據特征。
3.2在線隨機森林
在線隨機森林[3]中一種有效的模型更新方法是每個決策樹模型可以在線分裂,分裂的條件是預測的數量和葉子節點的Gini指數達到設定的閾值。這種方法不會改變整個森林的結構。如圖4所示,基于決策樹更新的方式流程圖。
在線機器學習在Shai[4]等人首次設計出一種高效的在線SVM求解算法后由此掀起了在線學習在機器學習領域的研究和應用高潮,并在近年持續成為熱點研究問題。鉆井工程中在線學習還未得到相關的研究。
基于在線方法建立模型的方式中,我們同樣將測井數據集[2]模擬實際開采過程數據流的到達方式,在線隨機森林相比離線隨機森林能夠有效地提高模型對未知新樣本的識別能力,模型分類效果達到62%。
4結束語
在線學習算法相對離線機器學習對新樣本的處理能力有效提高,但是在我們的應用中,模型效果還不足以用于實際開采工作中給出具有指導性決策支持,下一步可行的方案是在獲取大量可靠數據后首先建立傳統的離線模型,將離線模型融合到在線模型中,提高在線模型效率。
參考文獻:
[1] 王茜,張菲菲,李紫璇,等.基于鉆井模型與人工智能相耦合的實時智能鉆井監測技術[J].石油鉆采工藝,2020,42(1):6-15.
[2] Xie Y X,ZhuCY,ZhouW,etal.Evaluation of machine learning methods for formation lithology identification:a comparison of tuning processes and model performances[J].Journal of Petroleum Science and Engineering,2018,160:182-193.
[3] http://www.kgs.ku.edu/PRS/petroDB.html
[4] SaffariA,LeistnerC,SantnerJ,etal.On-line random forests[C]//2009 IEEE 12th International Conference on Computer VisionWorkshops,ICCVWorkshops.September27 - October4,2009,Kyoto,Japan.IEEE,2009:1393-1400.
[5] Shalev-ShwartzS,SingerY,SrebroN.Pegasos:primal estimated sub-GrAdientSOlver for SVM[C]//Proceedings of the 24thinternational conference on Machine learning - ICML '07.June20-24,2007.Corvalis,Oregon.NewYork:ACM Press,2007:807-814.
【通聯編輯:梁書】