999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

斜井有桿泵數據挖掘系統中的預處理設計

2012-08-14 02:42:34高書香
承德石油高等專科學校學報 2012年4期
關鍵詞:數據挖掘數據庫生產

高書香

(承德石油高等專科學校 石油工程系,河北 承德 067000)

隨著油氣田工程中斜井數量的增加,將產生超大量油井方面的工程數據,對這些數據的研究和處理,將影響工程決策和實施過程[1]。而處理這些數據時行之有效的方法就是進行數據挖掘;它能夠從超大量、有噪聲、模糊的、隨機的、不完整的實際生產數據中發現隱含的、事先未知的、卻是潛在有用的知識和信息。數據挖掘是數據庫中知識發現的一個主要步驟;知識發現可以分為5部分,即數據選擇、數據預處理、數據轉換、數據挖掘、結論及驗證[2]。

1 數據挖掘目標值的確定

油田的生產運營應該是以最大經濟效益為目標,而不是以油井的系統效率、采油量、作業費用等指標的最大值為目標。在有桿泵系統的生產管理中,確定各種管理措施的優選方法也應該以經濟效益為指標。因此通過數據挖掘來回答諸如“哪個管理方案是最優的”等類似問題,這是傳統評價方法無法具備的。在數據挖掘設計中,建議選擇單井生產成本作為目標值或是響應值。

影響單井生產成本的因素很多,在工藝分析的基礎上認為,作業費用、設備費用、單井油氣產量等是主要影響因素。但是,作為一個生產系統,油井的上述3 個主要因素分別受到地層參數、設備參數、流體參數、生產參數等眾多因素的影響。為了能充分進行數據挖掘,必須首先保證數據的全面性。針對生產過程的每個環節,設計各數據庫的字段時,應該保證數據之間的完整性,不能因為影響因子小,而將該數據丟棄[3]。

2 有桿泵系統數據分類

簡單說,有桿泵生產系統中的所有數據都可能會影響其生產成本。例如,導致桿管偏磨的因素很多[4],那么因桿管偏磨導致單井生產成本增加的因素就有很多。為了便于對超大量的數據進行采集與歸類,借鑒文獻[4]的分類方法,將主要數據分成油層基礎數據、井眼軌跡數據、井下流體數據、井下工具數據、井下作業數據、地面設備數據、日常生產數據等7 大類數據;每一大類數據又可以細分成多種數據;具體分類見表1。

表1 有桿泵系統數據分類表

對固定的油井而言,油層基礎數據是定值,不必采集。但對數據挖掘技術而言,數據信息量越大,則其獲取知識的準確度越高。另外,將油層基礎數據納入到超大量的數據信息中,既可以實現同一油藏的不同油井數據的共用,還可實現不同油田之間的油井數據共用。因此,有必要將油層基礎數據納入到數據庫系統中。

3 數據的預處理設計

在數據庫設計中易出現空白數據、錯誤數據、重復數據等不規范現象和問題,需要經過統一的過濾和修正。因此數據預處理的主要目的是清洗錯誤的、有沖突的、重復的數據,避免數據的冗余或不統一,以利于數據搜索。

3.1 數據的標準化處理

數據選擇是為了目標而搜索和選擇相關數據,其目的是辨別出待分析數據的集合,縮小處理范圍,提高數據挖掘質量。例如,生產層巖性的數據值可按巖石深度分別賦予不同深度上的對應值;桿柱材質的數據值可按材質類型分別賦予不同的數值;等等。

3.2 過濾噪聲數據

為了確保數據挖掘系統在信息和文字識別中能夠正確地分析和錄入數據,應必須找出數據庫中的空白數據、錯誤數據、重復數據等以便修改和完善。另外還要找出所有不完整的數據,例如高含蠟量的油井數據中有清防蠟時間,但卻沒有加藥量和藥劑類型;措施后的油井數據中有措施名稱和新換管柱數據,但卻沒有措施后地面設備數據。上述情況下都會導致系統信息的不確定性,降低數據挖掘結果的可靠性。因此必須加以過濾或修改。

3.3 數據單位的規范化

不同油田、不同油井、不同時間內記錄的數據很可能存在單位上的不同;即使使用的是同一單位,其計量標準可能也會不同。例如,油井的油套壓數據在記錄時,有的是用MPa 作單位,有的卻是用atm 作單位;油井的動液面數據有的是以方補心為標準計量,有的數據卻是以井口位置為標準計量;等等。為使數據能夠進行縱向、橫向的比較,需要把計量標準、數據單位等進行全面統一。將統一后的結果進行整理,以便查閱和使用。

3.4 表達術語統一化

石油生產中有很多一事多名的現象。例如,油層套管和生產套管在很多情況下混用;油層壓力、地層壓力、油藏壓力在很多表述中是同一個壓力;流壓、井底流動壓力、流動壓力在很多情況下是同一處的壓力,有時卻是折算出的不同點的壓力;等等。在數據庫的建立過程中,會出現大量的類似數據,需要設定統一的使用規范和名稱,以保證數據的完整有效。需要將統一后的結果進行整理和文檔化,以便查閱和使用。

3.5 成本量化處理

在石油生產中,即便是同一家廠商的產品,在不同時間、不同生產單位的支出也是不同的。為了獲得較為客觀的數據挖掘結果,對所有產品、設備及作業費用等設定一個具體數據;而這些數據也是數據庫中的一部分。這樣既避免了因設備費用差別而引起的方案優選問題,還可以利用數據挖掘獲得企業在不同設備上的支出費用分析。

4 結語

通過數據的預處理過程,數據庫中的數據成為統一標準的、無噪聲的數據。此后即可采用數據挖掘系統中的挖掘算法對相關問題進行知識和信息發掘。

[1]王學軍,田乃林,高書香.斜井抽油相關數據的處理方法[J].油氣田地面工程,2011(6):3 -4.

[2]唐笑林.數據挖掘技術的研究與應用[J].華東理工大學學報(自然科學版),2008(4):290 -295.

[3]王學軍,田乃林.斜井有桿泵抽油參數系統中的數據庫設計[J].油氣田地面工程,2011(3):81 -82.

[4]高書香,王學軍.抽油機井桿管偏磨因素分析[J].油氣田地面工程,2010(10):52 -53.

猜你喜歡
數據挖掘數據庫生產
探討人工智能與數據挖掘發展趨勢
用舊的生產新的!
“三夏”生產 如火如荼
S-76D在華首架機實現生產交付
中國軍轉民(2017年6期)2018-01-31 02:22:28
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 毛片网站在线播放| 亚洲大尺码专区影院| AV不卡国产在线观看| 国产精品亚洲专区一区| 欧美a级在线| 国产精品一区在线观看你懂的| 国产成本人片免费a∨短片| 午夜精品影院| 久久久久无码精品| 免费观看亚洲人成网站| 国产美女无遮挡免费视频| 亚洲中字无码AV电影在线观看| 国产视频自拍一区| 成人免费午间影院在线观看| 伊人久久婷婷五月综合97色| 谁有在线观看日韩亚洲最新视频 | 青草视频免费在线观看| 亚洲高清中文字幕在线看不卡| 欧美亚洲综合免费精品高清在线观看| 中文字幕伦视频| 精品国产香蕉在线播出| 日韩欧美国产成人| a级毛片在线免费观看| 亚洲AⅤ永久无码精品毛片| 中文字幕1区2区| 视频一区视频二区日韩专区| 538精品在线观看| 亚亚洲乱码一二三四区| 亚洲开心婷婷中文字幕| 丰满人妻中出白浆| 亚洲日本一本dvd高清| 国产一区二区三区夜色| 亚洲欧美成人网| 日韩在线观看网站| 尤物特级无码毛片免费| 色AV色 综合网站| 国产成人亚洲欧美激情| 日韩欧美国产三级| 亚洲欧美色中文字幕| 国产精品观看视频免费完整版| 91小视频在线观看免费版高清| 毛片在线播放a| 一区二区影院| 欧美日韩成人| 久久女人网| 国产不卡在线看| 久久精品人妻中文系列| 97超爽成人免费视频在线播放| 麻豆AV网站免费进入| 2020国产在线视精品在| 麻豆精品国产自产在线| 日韩大片免费观看视频播放| 国产成人综合欧美精品久久| 制服丝袜国产精品| 中文字幕 91| 蝴蝶伊人久久中文娱乐网| 免费无码又爽又黄又刺激网站| 人妻中文字幕无码久久一区| 免费人成黄页在线观看国产| 狠狠亚洲五月天| 成人免费视频一区| 亚洲免费人成影院| 毛片免费网址| 欧美成人精品在线| 欧美国产日产一区二区| 久久综合久久鬼| 亚洲 欧美 日韩综合一区| 亚洲大尺度在线| 亚洲人人视频| 天堂岛国av无码免费无禁网站 | 91福利国产成人精品导航| 99视频免费观看| 国产高清在线观看| 全午夜免费一级毛片| 欧美成人午夜视频| 不卡午夜视频| 亚洲性日韩精品一区二区| 久久亚洲国产最新网站| 国产日韩欧美视频| 国产人成在线观看| 亚洲国产精品日韩专区AV| 日韩在线成年视频人网站观看|