999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機(jī)森林的溢漏實(shí)時(shí)判斷方法研究

2020-07-21 01:56:50史肖燕周英操趙莉萍蔣宏偉
鉆采工藝 2020年1期
關(guān)鍵詞:特征

史肖燕, 周英操, 趙莉萍, 蔣宏偉

(中國(guó)石油集團(tuán)工程技術(shù)研究院有限公司)

井漏和溢流是影響鉆井施工安全最為常見的兩種井下復(fù)雜事故。井漏和溢流不僅會(huì)帶來(lái)嚴(yán)重的儲(chǔ)層損害,增加勘探開發(fā)投入成本,造成油氣開發(fā)效率低下,一旦控制不力,還會(huì)誘發(fā)卡鉆、井塌、井噴等重大惡性事故,造成損失及負(fù)面社會(huì)影響。因此,鉆井過程中溢流、漏失的實(shí)時(shí)識(shí)別判斷具有重要意義。

目前,國(guó)內(nèi)外在溢流、漏失監(jiān)測(cè)方面展開了較多研究,形成的技術(shù)主要有:井口監(jiān)測(cè)技術(shù)、井下隨鉆監(jiān)測(cè)技術(shù)和人工智能監(jiān)測(cè)技術(shù)。井口監(jiān)測(cè)技術(shù)成熟,能比較準(zhǔn)確地監(jiān)測(cè)出溢流和漏失,但這種方法的監(jiān)測(cè)結(jié)果存在滯后性,不能很好地解決高壓氣井、深水鉆井等特殊環(huán)境下的井下溢流、漏失監(jiān)測(cè)問題。井下隨鉆監(jiān)測(cè)方法能夠快速、早期監(jiān)測(cè)到溢流和漏失,但成本較高,并且隨鉆測(cè)量?jī)x器存在失效的風(fēng)險(xiǎn)。隨著信息技術(shù)和人工智能技術(shù)快速發(fā)展,國(guó)內(nèi)外研究人員把人工智能技術(shù)應(yīng)用到溢流、漏失的監(jiān)測(cè)中,監(jiān)測(cè)結(jié)果更為準(zhǔn)確,但這些人工智能的方法普遍存在著建模較為復(fù)雜,推廣較難的問題。

近年來(lái),以數(shù)據(jù)為驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法在社會(huì)各領(lǐng)域得到了廣泛的應(yīng)用,其中最重要的算法之一隨機(jī)森林具有建模較為簡(jiǎn)單、調(diào)節(jié)參數(shù)少、預(yù)測(cè)準(zhǔn)確率高和強(qiáng)魯棒性的特點(diǎn)。本文采用隨機(jī)森林的方法對(duì)鉆井實(shí)時(shí)測(cè)量數(shù)據(jù)進(jìn)行建模,來(lái)對(duì)溢流、漏失進(jìn)行實(shí)時(shí)識(shí)別判斷。

一、隨機(jī)森林方法

隨機(jī)森林由Breiman L在2001年提出,是一個(gè)可處理高維度與非線性樣本的分類器組合模型。大量的理論和實(shí)證研究都證明了隨機(jī)森林具有很高的預(yù)測(cè)準(zhǔn)確率,對(duì)異常值和噪聲具有很好的容忍度,并且不容易出現(xiàn)過擬合。因此,自其被提出以來(lái),在醫(yī)學(xué)、生物信息、管理學(xué)等領(lǐng)域得到了廣泛應(yīng)用。隨機(jī)森林分類的基本思想[1-2]:首先,利用自助法(Bootstrap)抽樣技術(shù)從原始訓(xùn)練集抽取k個(gè)樣本集;然后,對(duì)k個(gè)樣本集分別建立k個(gè)決策樹模型,得到k種分類結(jié)果;最后,對(duì)每個(gè)新記錄根據(jù)k種分類結(jié)果進(jìn)行投票表決決定其最終分類。

二、基于隨機(jī)森林的溢漏實(shí)時(shí)判斷方法

在鉆井過程中,當(dāng)有溢流、漏失發(fā)生時(shí),在鉆井測(cè)量參數(shù)上會(huì)有所體現(xiàn);例如溢流發(fā)生時(shí),進(jìn)出口流量之差會(huì)增加,立壓降低,大鉤負(fù)載緩增;漏失發(fā)生時(shí),進(jìn)出口流量之差減少,立管壓力降低,井底環(huán)壓降低;由此可見,鉆井測(cè)量參數(shù)與溢流、漏失存在著相關(guān)關(guān)系。可把溢流、漏失的識(shí)別問題建模成以鉆井測(cè)量參數(shù)為自變量,是否發(fā)生溢流、漏失為結(jié)果變量的分類模型。本文選用隨機(jī)森林方法對(duì)溢流、漏失的實(shí)時(shí)識(shí)別進(jìn)行分類建模,通過大量歷史數(shù)據(jù)對(duì)隨機(jī)森林進(jìn)行訓(xùn)練,并對(duì)新的實(shí)時(shí)輸入數(shù)據(jù)作出是否發(fā)生溢流、漏失的分類。

基于隨機(jī)森林的溢流、漏失實(shí)時(shí)判斷方法的流程如圖1所示。

圖1 基于隨機(jī)森林的溢流、漏失實(shí)時(shí)判斷方法的流程圖

1. 生成原始數(shù)據(jù)集

隨機(jī)森林是有監(jiān)督的機(jī)器學(xué)習(xí)算法,用于訓(xùn)練算法的樣本數(shù)據(jù)需要有輸入變量和結(jié)果變量。在本文的模型中,輸入變量即以時(shí)間為索引的鉆井測(cè)量參數(shù),結(jié)果變量為是否發(fā)生溢流或漏失。因?yàn)橐缌鳌⒙┦У男畔⒁话阋晕谋镜姆绞接涗浽诰窋?shù)據(jù)中,因此需要對(duì)文本數(shù)據(jù)進(jìn)行自動(dòng)識(shí)別,并根據(jù)文本中溢流、漏失事故的發(fā)生和持續(xù)時(shí)間,生成以時(shí)間為索引的溢流、漏失數(shù)據(jù);合并以時(shí)間為索引的鉆井測(cè)量參數(shù)和溢流、漏失數(shù)據(jù),即可生成用于隨機(jī)森林算法的原始數(shù)據(jù)集。生成的原始數(shù)據(jù)集是以時(shí)間為索引的多維特征數(shù)據(jù)和分類結(jié)果,特征包括:入口流量、出口流量、PWD環(huán)空壓力、PWD環(huán)空溫度、大鉤載荷、井深、鉆頭深度、總池體積、立管壓力、轉(zhuǎn)速、鉆壓、鉆井液出口密度和鉆井液出口溫度;數(shù)據(jù)的分類結(jié)果為離散值:0代表無(wú)事故發(fā)生,1代表有溢流發(fā)生,2代表有漏失發(fā)生。

2. 數(shù)據(jù)預(yù)處理

本文的原始數(shù)據(jù)集是以時(shí)間先后為順序排列的數(shù)據(jù)集,很難直接用于溢流、漏失實(shí)時(shí)識(shí)別的建模,為了讓數(shù)據(jù)適合于隨機(jī)森林的建模,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。

首先,溢流、漏失的發(fā)生導(dǎo)致原始數(shù)據(jù)集中各特征數(shù)據(jù)發(fā)生變化,因此各特征數(shù)據(jù)的相對(duì)變化量能更好的應(yīng)用于隨機(jī)森林中決策樹的創(chuàng)建,而且使用特征數(shù)據(jù)的相對(duì)變化量,可綜合多口井的數(shù)據(jù),形成更大數(shù)據(jù)量的歷史數(shù)據(jù)集。對(duì)于某一特征數(shù)據(jù),相對(duì)變化量的計(jì)算公式為:

(1)

式中:A(Ti)—特征數(shù)據(jù)列A在Ti時(shí)間點(diǎn)的值;A(Ti-1)—特征數(shù)據(jù)列A在Ti-1時(shí)間點(diǎn)的值。

其次,在不同的工況下,當(dāng)溢流和漏失發(fā)生時(shí),各特征數(shù)據(jù)的變化情況不同,因此根據(jù)原始數(shù)據(jù)集中的數(shù)據(jù),對(duì)工況進(jìn)行自動(dòng)識(shí)別,有助于下一步?jīng)Q策樹的生成。本文自動(dòng)識(shí)別的工況包括:鉆進(jìn)、起鉆、下鉆和其它(包括接單跟,卸單根和鉆井液循環(huán)等)。鉆井工況計(jì)算方法為:

在時(shí)間Ti,若HDEP(Ti)=BDEP(Ti),HDEP(Ti)> HDEP(Ti-1),則鉆井狀態(tài)DS(Ti)為鉆進(jìn)。

在時(shí)間Ti,若HDEP(Ti)>BDEP(Ti),BDEP(Ti)>BDEP(Ti-1),則鉆井狀態(tài)DS(Ti)為下鉆。

在時(shí)間Ti,若HDEP(Ti)>BDEP(Ti),BDEP(Ti)

否則, 鉆井狀態(tài)為其它。

其中,HDEP(Ti)為Ti時(shí)刻的井深,HDEP(Ti-1)為Ti-1時(shí)刻的井深,BDEP(Ti)為Ti時(shí)刻的鉆頭深度,BDEP(Ti-1)為Ti-1時(shí)刻的鉆頭深度。

再次,把相關(guān)特征數(shù)據(jù)進(jìn)行簡(jiǎn)單的計(jì)算,能與溢流、漏失的發(fā)生建立更直接的關(guān)系,例如出口流量和入口流量之差,可更直接反應(yīng)是否有溢流、漏失發(fā)生。因此把出入口流量差加入到輸入特征集中。

3. 生成子數(shù)據(jù)集

對(duì)于預(yù)處理之后的溢流、漏失數(shù)據(jù)集,隨機(jī)森林采用Bootstrap重采樣方法,生成k個(gè)用于決策樹生成的樣本集,k由所需建立的決策樹的數(shù)量確定。隨機(jī)森林中決策樹的數(shù)量對(duì)預(yù)測(cè)結(jié)果有重要影響,本文將在現(xiàn)場(chǎng)實(shí)例中進(jìn)行討論。Bootstrap方法的基本思想為[3]:從容量為N的原始樣本集中進(jìn)行有放回的重復(fù)采樣,采樣樣本的容量也為N,每個(gè)觀測(cè)對(duì)象被抽到的概率為1/N,每次采樣構(gòu)成的子樣本集稱為Bootstrap樣本集。

4. 用CART樹進(jìn)行分類

對(duì)于上述步驟生成的每一個(gè)樣本集,隨機(jī)森林采用CART決策樹來(lái)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行分類。CART算法采用一種二分遞歸分割的技術(shù),總是將當(dāng)前樣本集分割為兩個(gè)子樣本集,使得生成的決策樹的每個(gè)非葉節(jié)點(diǎn)都只有兩個(gè)分支,因此CART算法生成的決策樹是結(jié)構(gòu)簡(jiǎn)潔的二叉樹,可用于分類和回歸任務(wù)。在創(chuàng)建分類樹遞歸過程中,CART每次都選擇當(dāng)前數(shù)據(jù)集中具有最小gini信息增益的特征作為節(jié)點(diǎn)劃分決策樹。gini指數(shù)是一種不等性度量,可用來(lái)度量任何不均勻分布,是介于0~1之間的數(shù),0代表完全相等,1代表完全不想等。分類度量時(shí),總體內(nèi)包含的類別越雜亂,gini指數(shù)就越大。gini指數(shù)的計(jì)算公式為:

(2)

式中:pj—類別j在樣本T中出現(xiàn)的頻率;

nj—樣本T中類別j的個(gè)數(shù)。

在每個(gè)節(jié)點(diǎn)分裂時(shí),計(jì)算不同特征和不同閾值相對(duì)應(yīng)的gini信息增益,選擇最小的gini指數(shù)對(duì)應(yīng)的特征和閾值,對(duì)特征空間進(jìn)行二元分裂。對(duì)節(jié)點(diǎn)進(jìn)行二元分裂時(shí),gini信息增益的計(jì)算公式為:

(3)

式中:s1—T1中樣本的個(gè)數(shù);s2—T2中樣本的個(gè)數(shù)。

不同于傳統(tǒng)的CART樹,隨機(jī)森林在CART樹的創(chuàng)建過程中,采用了隨機(jī)特征的選擇,即在每一個(gè)結(jié)點(diǎn)隨機(jī)選擇一小組輸入變量(m個(gè)特征,m<總待選特征個(gè)數(shù))進(jìn)行分割,如圖2所示。

圖2 決策樹創(chuàng)建過程中的特征選擇

5. 溢流、漏失識(shí)別

對(duì)于新的輸入樣本,隨機(jī)森林根據(jù)CART算法所生成的k棵決策樹的投票結(jié)果,判斷是否有溢流、漏失發(fā)生。

三、現(xiàn)場(chǎng)實(shí)例

1. 實(shí)驗(yàn)數(shù)據(jù)

本文以塔里木油田的某復(fù)雜井為例,用基于隨機(jī)森林的智能方法對(duì)溢流、漏失進(jìn)行實(shí)時(shí)識(shí)別。用于隨機(jī)森林算法訓(xùn)練的歷史數(shù)據(jù)從該井的鄰井?dāng)?shù)據(jù)中獲取,訓(xùn)練數(shù)據(jù)集包括正常鉆井樣本,溢流樣本和漏失樣本。

2. 溢流識(shí)別

對(duì)該井的鉆井測(cè)量參數(shù)進(jìn)行實(shí)時(shí)監(jiān)測(cè)的開始時(shí)間為2018年2月11日21∶08,如圖3所示。從21∶09開始,該井停止鉆進(jìn),并打開泵進(jìn)行循環(huán)。由圖3可見從21∶09開始,出口流量大于入口流量;總池體積從21∶19分開始明顯增加,到21∶25達(dá)到峰值,為147.9 m3,增量為0.9 m3,可判斷有溢流發(fā)生。

圖3 鉆井實(shí)時(shí)測(cè)量參數(shù)

圖4為用隨機(jī)森林的方法對(duì)溢流進(jìn)行實(shí)時(shí)識(shí)別的結(jié)果,0代表正常工況,1代表溢流工況,2代表漏失工況。由圖4可見,系統(tǒng)自動(dòng)在溢流發(fā)生初期(21∶09)即對(duì)溢流進(jìn)行了自動(dòng)識(shí)別,這比用傳統(tǒng)的總池體積增加法來(lái)判斷溢流提早了16 min,實(shí)現(xiàn)了溢流監(jiān)測(cè)的及時(shí)性;在21∶24,出口流量等于入口流量,溢流結(jié)束,系統(tǒng)亦進(jìn)行了自動(dòng)識(shí)別,識(shí)別的結(jié)果為正常工況。

圖4 基于隨機(jī)森林的溢流實(shí)時(shí)識(shí)別

3. 漏失識(shí)別

從2018年2月16日00∶16開始,對(duì)該井的鉆井測(cè)量參數(shù)進(jìn)行實(shí)時(shí)監(jiān)測(cè),如圖5所示。從00∶16開始,該井邊鉆邊漏,出口流量小于入口流量。從00∶35開始,總池體積明顯減少,到00∶39,總池體積從原來(lái)的129.3 m3降低到128.1 m3,減少了1.2 m3,可判斷漏失發(fā)生。

圖6為用隨機(jī)森林的方法對(duì)漏失進(jìn)行實(shí)時(shí)識(shí)別的結(jié)果。由圖6可見,系統(tǒng)自動(dòng)在溢流發(fā)生初期(00∶16)即對(duì)漏失進(jìn)行了自動(dòng)識(shí)別,這比用傳統(tǒng)的總池體積減少法來(lái)判斷漏失提早了23 min,實(shí)現(xiàn)了漏失監(jiān)測(cè)的及時(shí)性。

圖5 鉆井實(shí)時(shí)測(cè)量參數(shù)

圖6 基于隨機(jī)森林的漏失實(shí)時(shí)識(shí)別

4. 建模參數(shù)的選擇

用隨機(jī)森林的方法建模時(shí),一個(gè)重要參數(shù)為決策樹的數(shù)量,此參數(shù)的選擇對(duì)于隨機(jī)森林的預(yù)測(cè)準(zhǔn)確性有重要影響。因此本文對(duì)此參數(shù)的選擇進(jìn)行討論。

圖7~圖10展示了用不同的決策樹數(shù)量,對(duì)發(fā)生在2月11日20∶17開始的溢流進(jìn)行識(shí)別的結(jié)果。由圖7可見,當(dāng)決策樹數(shù)量為10時(shí),溢流的識(shí)別結(jié)果里有較多的錯(cuò)誤,隨著決策樹數(shù)量的增加,溢流識(shí)別結(jié)果越來(lái)越準(zhǔn)確,到?jīng)Q策樹數(shù)量為100時(shí),識(shí)別結(jié)果趨于穩(wěn)定。因此選用100為決策樹數(shù)量可得到較為準(zhǔn)確的預(yù)測(cè)結(jié)果。

圖7 決策樹數(shù)量為10時(shí)的溢流識(shí)別圖

圖8 決策樹數(shù)量為20時(shí)的溢流識(shí)別圖

5. 變量的重要性分析

本文還用隨機(jī)森林的方法對(duì)用于溢流漏失識(shí)別的14個(gè)輸入特征的重要性進(jìn)行分析,其中,流入流出差對(duì)于溢流漏失識(shí)別的重要性最高,這符合當(dāng)前主要的溢流、漏失識(shí)別的判斷依據(jù);重要程度接近于0的鉆壓變化量、轉(zhuǎn)速變化量、泵沖變化量和出口溫度變化量可從用于隨機(jī)森林建模的輸入特征中剔除,以提高計(jì)算速度。

圖9 決策樹數(shù)量為50時(shí)的溢流識(shí)別圖

圖10 決策樹數(shù)量為100時(shí)的溢流識(shí)別圖

四、結(jié)論

(1)隨機(jī)森林作為新興起的集成學(xué)習(xí)算法,具有預(yù)測(cè)準(zhǔn)確度高、對(duì)噪聲的容忍度大,計(jì)算速度快等優(yōu)點(diǎn),這些優(yōu)點(diǎn)使其適用于溢流、漏失的實(shí)時(shí)識(shí)別判斷。

(2)現(xiàn)場(chǎng)實(shí)例顯示,通過對(duì)鉆井實(shí)時(shí)測(cè)量數(shù)據(jù)的合理預(yù)處理,結(jié)合隨機(jī)森林的方法,溢流、漏失可在早期被準(zhǔn)確識(shí)別。

(3)由于隨機(jī)森林可以處理大量的特征數(shù)據(jù)(輸入數(shù)據(jù)),并可在決定類別時(shí),評(píng)估特征的重要性;本文利用隨機(jī)森林對(duì)初選的特征進(jìn)行重要性分析,結(jié)果表明鉆井液流入流出差對(duì)于溢流、漏失的判斷具有重要影響。

猜你喜歡
特征
抓住特征巧觀察
離散型隨機(jī)變量的分布列與數(shù)字特征
具有兩個(gè)P’維非線性不可約特征標(biāo)的非可解群
月震特征及與地震的對(duì)比
如何表達(dá)“特征”
被k(2≤k≤16)整除的正整數(shù)的特征
不忠誠(chéng)的四個(gè)特征
詈語(yǔ)的文化蘊(yùn)含與現(xiàn)代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 91免费国产高清观看| 一本大道香蕉久中文在线播放| 国产精品开放后亚洲| 成人福利一区二区视频在线| 制服无码网站| 亚洲无码免费黄色网址| 国产va欧美va在线观看| 国产午夜精品一区二区三区软件| av在线人妻熟妇| 中文字幕有乳无码| 国产麻豆aⅴ精品无码| 伊人国产无码高清视频| 在线观看国产精品第一区免费 | 亚洲精品中文字幕午夜| 免费一级毛片在线观看| AV老司机AV天堂| 无码网站免费观看| A级毛片无码久久精品免费| 国产福利小视频高清在线观看| 538国产视频| 国产在线视频自拍| 一本色道久久88综合日韩精品| 欧美一区二区三区欧美日韩亚洲 | 日韩精品专区免费无码aⅴ| 国产精品成人观看视频国产 | 天天综合亚洲| 国产精品三级专区| 97青青青国产在线播放| 国产午夜精品一区二区三| 亚洲资源站av无码网址| 国产午夜精品一区二区三| 91www在线观看| 亚洲乱码精品久久久久..| 久久频这里精品99香蕉久网址| 美女无遮挡免费网站| 天天躁夜夜躁狠狠躁躁88| 少妇极品熟妇人妻专区视频| 国产精鲁鲁网在线视频| 一级爱做片免费观看久久| 亚洲欧洲美色一区二区三区| 无码中文字幕精品推荐| 99999久久久久久亚洲| 国产综合色在线视频播放线视| 国内精品久久人妻无码大片高| 特级毛片8级毛片免费观看| 午夜福利免费视频| 成人免费黄色小视频| www亚洲天堂| 91久久夜色精品国产网站| 热re99久久精品国99热| 国产精品视频观看裸模| 亚洲欧美国产视频| 亚洲美女一区二区三区| 午夜无码一区二区三区| 国产亚洲高清视频| 亚洲综合中文字幕国产精品欧美| 国产幂在线无码精品| 99re在线视频观看| 国产精品久久久久鬼色| 亚洲制服丝袜第一页| 91小视频在线观看免费版高清| 国产91小视频在线观看| 狠狠综合久久久久综| 99在线视频免费观看| 成人亚洲国产| 亚卅精品无码久久毛片乌克兰| 91成人在线观看| 欧美色99| 五月天丁香婷婷综合久久| 国产高清又黄又嫩的免费视频网站| 亚洲毛片一级带毛片基地| 国产97色在线| 操操操综合网| 国产免费人成视频网| 欧美日韩国产一级| 久久久亚洲色| 亚洲精品动漫| 伊人色综合久久天天| 国产Av无码精品色午夜| 日韩一二三区视频精品| 国产成人成人一区二区| 五月天香蕉视频国产亚|