999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘技術應用下基于決策樹模型的油水井生產(chǎn)異常狀況管理

2022-09-23 09:25:46李婧璇
中國管理信息化 2022年14期
關鍵詞:分類生產(chǎn)模型

李婧璇

(中國石油大港油田信息中心,天津 300280)

0 引言

隨著信息化的發(fā)展,石油勘探開發(fā)中逐漸大規(guī)模應用計算機網(wǎng)絡、智能控制和數(shù)據(jù)挖掘等新興技術來實現(xiàn)高效管理。然而,當前數(shù)字化系統(tǒng)存在信息共享性差、數(shù)據(jù)綜合應用率低、報警準確率低等問題。對此,不少石油企業(yè)以數(shù)字油田為基礎逐漸向智能油田建設方向發(fā)展。其智能決策控制中心通過分析大數(shù)據(jù),實時進行資源合理調配、異常狀況判斷和生產(chǎn)風險預警,從而實現(xiàn)油田資產(chǎn)的智能化開發(fā)和管理。油水井生產(chǎn)異常狀況診斷和管理系統(tǒng)是智能油田建設的一項具體應用,主要針對注采井組進行動態(tài)分析。注采井組是以注水井為中心,聯(lián)系周圍的油井和水井共同構成的油田開發(fā)基本單元。該系統(tǒng)可以實現(xiàn)井組實時診斷檢測、提出相應管理措施、跟蹤進度等功能。

數(shù)據(jù)挖掘指的是從已有數(shù)據(jù)庫大體量、有損壞且具體含義模糊的實際數(shù)據(jù)中進行抽取、轉換、分析以及模塊化處理,發(fā)現(xiàn)其中具有潛在價值的可歸納信息的過程。數(shù)據(jù)挖掘過程中需要保證數(shù)據(jù)統(tǒng)計的有效性及準確性。決策樹作為一種預測模型,代表的是對象屬性與對象值之間的映射關系。決策樹模型算法簡單,仿真結果準確率高,易于理解和使用,常用于生產(chǎn)故障預測和目標追蹤檢測等。本研究以數(shù)據(jù)挖掘技術中的決策樹模型來構建系統(tǒng)的核心診斷算法。基于井組生產(chǎn)中的實時數(shù)據(jù),工作人員可以通過決策樹模型對生產(chǎn)異常狀況作出判斷和管理,還可以對歷史數(shù)據(jù)進行分析,設置保護設定值,對各類生產(chǎn)異常相關的指標進行預警監(jiān)測。模型性能優(yōu)異,分類精確度高,能夠保障生產(chǎn)穩(wěn)定安全,為油水井生產(chǎn)異常狀況管理提供參考。

1 油水井生產(chǎn)異常狀況診斷模型的構建

1.1 CART 決策樹

油水井生產(chǎn)異常狀況診斷模型屬于分類模型,決策樹算法挖掘出的分類規(guī)則準確性高且易于理解,算法運算速度快。因此,本文選擇使用分類回歸樹(Classification and Regression Tree,CART)決策樹對油水井生產(chǎn)數(shù)據(jù)進行分析,初步建立生產(chǎn)異常狀況診斷模型。CART 決策樹由根節(jié)點、中間節(jié)點和葉節(jié)點構成,通過計算基尼系數(shù)增益來確定分割點,采用二元分割法對數(shù)據(jù)進行分類,最終形成分類二叉樹。相較于其他決策樹,CART 決策樹在分析大規(guī)模樣本時不用進行大量的排序運算和對數(shù)運算,運算效率更高。

隨機變量x 對應i 種狀態(tài)下的概率為p,p,…,p,使用基尼指數(shù)(Gini index)來選擇最佳的節(jié)點劃分特征。基尼指數(shù)代表屬性分類的不確定性,值越小,代表不確定性越低。兩點分布的隨機變量x 的基尼指數(shù)為:

式(1)中,Gini 代表基尼指數(shù),p代表樣本屬于i 類別的概率,1-p代表樣本錯誤分類的概率。

對于訓練數(shù)據(jù)集A,假設有j 個類別,而C代表第j 類樣本的子集,|A|為A 的大小,|C|為C的大小,則集合A 的基尼指數(shù)為:

假設數(shù)據(jù)集A 被特征L 劃分,若L 是離散型,則由L 的某個可能值l 將A 劃分為A、A:

若L 為連續(xù)型,則可以得到Gini(A,L):

A、A表示數(shù)據(jù)集A 被特征屬性L 的最佳分割點分割后的兩部分,|A|、|A|分別表示A、A中樣本的個數(shù)。Gini(A,L)取值越大,樣本數(shù)據(jù)集被標簽劃分的不確定性就越高,因此,對于CART 決策樹,可以選擇Gini(A,L)的最小值作為最佳分割點。

1.2 基于提升方法優(yōu)化的CART 決策樹

本文引入提升算法提升決策樹分類精度,在初步構建完成CART 決策樹后改變樣本權重,構建新的訓練集得到一系列弱分類二叉樹{T,T,T,…,T},將其進行加性組合,最終得到一個更加穩(wěn)定高效的強分類二叉樹F。

第n 個弱分類器的誤差率E為:

式(5)中,W表示第n 個弱分類器、第m 個樣本的權重;T(m)表示數(shù)據(jù)集A 的第m 個樣本經(jīng)弱分類器T分類后得到的值;y表示樣本真實值;I 為指示函數(shù),取值為0 或1;N 為樣本集A 的樣本個數(shù)。當預測值T(m)=真實值y時為0,當預測值T(m)≠真實值y時為1。

分類器加性組合系數(shù)α為:

權重W為:

規(guī)范因子Z為:

最終的強分類器函數(shù)表達式為:

F對數(shù)據(jù)集的誤分類次數(shù)達到最低值時,新的弱分類器即停止構建。

1.3 原始數(shù)據(jù)來源及預處理

本文所使用的原始數(shù)據(jù)來源于某油田注采井組施工現(xiàn)場各底層傳感器采集的生產(chǎn)動態(tài)資料,具體包括產(chǎn)能資料、壓力資料、水淹狀況資料、原油和水的物性資料以及井下作業(yè)資料等。

將原始數(shù)據(jù)按照生產(chǎn)時間保存日志文件,通過編程進行解析。對解析后得到的數(shù)據(jù)中重復、缺失和有明顯錯誤的數(shù)據(jù)分別采取合并、臨近數(shù)值補全和直接舍棄的措施進行初步處理。從不同時間段隨機抽取2020—2021 年生產(chǎn)正常時的數(shù)據(jù)4 500 組,等概率抽取2020—2021 年生產(chǎn)異常時的數(shù)據(jù)3 500 組共同組成數(shù)據(jù)集A。將數(shù)據(jù)集中的正常數(shù)據(jù)和異常數(shù)據(jù)進行隨機混合,將其中的5 000 組數(shù)據(jù)作為訓練集,剩下的3 000 組數(shù)據(jù)作為測試集。利用CART 決策樹模型對訓練集進行訓練。

2 模型實驗結果

油水井生產(chǎn)異常狀況可以細化為決策樹深度為9的二叉樹,且在輸入因素中,電網(wǎng)波動、電潛泵控制柜故障、地層壓力、含水變化、原油相對密度黏度和施工單位規(guī)模這6 個因素集中在決策樹中的前3 層,表明這些因素對油水井生產(chǎn)影響較大。為了進一步清晰地展示油水井生產(chǎn)異常狀況的具體分類預測情況,本文根據(jù)決策樹細化了生產(chǎn)異常因素分類規(guī)則及其樣本分布,部分樣本數(shù)量較多的分類情況如表1 所示。

表1 部分油水井生產(chǎn)異常狀況的分類規(guī)則及樣本分布情況

學習率是機器學習中重要的超參數(shù),合適的學習率能夠使模型在一定時間內(nèi)收斂到局部最小值,達到最優(yōu)性能。根據(jù)實驗結果,本文繪制了強分類器分類精確度與學習率關系曲線以及受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC 曲線),具體如圖1 所示。

圖1 強分類器ROC 曲線及精確度與學習率關系曲線

理論上,學習率的取值也會影響強分類器分類精度,但在實際測試中,學習率變化對分類精度的影響較小。圖1 中可以看出在學習率為[0,0.1]時,分類器處于欠擬合狀態(tài);學習率大于0.1 后,分類精度逐漸增高后降低;當學習率取0.8 時精度最大,為87%,此時ROC 曲線如圖1 所示。ROC 曲線中越靠近圖1 左上角,模型預測結果越準確,曲線下面積(Area Under Curve,AUC)約為0.90,表明該模型性能優(yōu)異。

3 結語

對油水井生產(chǎn)異常狀況進行診斷和管理能夠有效穩(wěn)定原油產(chǎn)量,保障生產(chǎn)工人的生命財產(chǎn)安全。模型仿真形成的決策樹可以對生產(chǎn)異常狀況輸入因素進行分類,直觀顯示出影響油水井生產(chǎn)的不同因素及其比重。模型學習率變化對分類精度的影響較小,ROC 曲線下面積基本大于0.90,表明模型性能優(yōu)異,可為油水井生產(chǎn)異常狀況管理提供參考。但是,模型僅對生產(chǎn)異常狀況進行了初步分類,對于油水井生產(chǎn)異常情況的管理依然需要人工操作,還需針對異常管理進行智能化改進。

猜你喜歡
分類生產(chǎn)模型
一半模型
分類算一算
重要模型『一線三等角』
用舊的生產(chǎn)新的!
重尾非線性自回歸模型自加權M-估計的漸近分布
“三夏”生產(chǎn) 如火如荼
分類討論求坐標
數(shù)據(jù)分析中的分類討論
S-76D在華首架機實現(xiàn)生產(chǎn)交付
中國軍轉民(2017年6期)2018-01-31 02:22:28
教你一招:數(shù)的分類
主站蜘蛛池模板: 欧美国产精品不卡在线观看| 亚洲乱亚洲乱妇24p| 日韩a在线观看免费观看| 久久精品无码中文字幕| 国产白浆在线观看| 国产毛片基地| 好久久免费视频高清| 亚洲国产日韩在线观看| 一级不卡毛片| 国产欧美日韩va另类在线播放| 一本大道无码日韩精品影视| 狠狠做深爱婷婷综合一区| 欧美性色综合网| 日韩美一区二区| 国产特级毛片aaaaaa| 亚洲精选无码久久久| 亚洲色偷偷偷鲁综合| 亚洲欧美日韩成人在线| 蜜桃视频一区二区三区| 永久在线播放| 四虎AV麻豆| 亚洲精品无码专区在线观看| 免费久久一级欧美特大黄| 国产乱子伦视频在线播放| 欧美激情视频一区| 国产成人啪视频一区二区三区| 国产极品美女在线观看| 天天综合网色| 欧美久久网| 人妻丰满熟妇啪啪| 超碰免费91| 在线观看国产精品日本不卡网| 福利国产微拍广场一区视频在线| 国产丝袜丝视频在线观看| 亚洲欧美h| 国产精品对白刺激| 啊嗯不日本网站| 国产99视频精品免费观看9e| 午夜激情婷婷| 午夜电影在线观看国产1区| 毛片网站免费在线观看| 嫩草国产在线| 内射人妻无码色AV天堂| 国产Av无码精品色午夜| 国产欧美日韩另类精彩视频| 亚洲另类国产欧美一区二区| 中文毛片无遮挡播放免费| 71pao成人国产永久免费视频| 免费国产高清视频| 日韩成人免费网站| 国产av一码二码三码无码 | 国产美女自慰在线观看| 国产精品香蕉在线| 亚洲人成影院在线观看| 日韩国产高清无码| 日韩人妻少妇一区二区| 国产男女XX00免费观看| 久久综合色88| 亚洲精品男人天堂| 熟女成人国产精品视频| 97国产在线观看| 欧美午夜视频| 久久精品国产国语对白| 性激烈欧美三级在线播放| 夜色爽爽影院18禁妓女影院| 青青青草国产| 久久99精品久久久久久不卡| 国产日本一线在线观看免费| 国产一区二区在线视频观看| 国产在线视频欧美亚综合| 欧美a在线| 午夜不卡视频| 无码高潮喷水专区久久| 国产精品嫩草影院视频| 国产精品女在线观看| 91视频国产高清| 无码丝袜人妻| 亚洲二三区| 真实国产乱子伦视频| 凹凸精品免费精品视频| 97国产在线视频| 日韩欧美国产精品|