呂春怡
【摘要】在油田工作中,經常要對大量的數據進行處理。而傳統的信息處理方式中常見的問題有信息加工手段差、信息共享程度低、用戶分撒、復雜的人工操作等,導致信息的處理不及時,決策部門無法有效的應用這些數據。在油田數據信息處理中引進數據挖掘技術,對數據進行在線分析處理并且提供決策支持系統。
【關鍵詞】油田數據 信息 數據挖掘技術
【中圖分類號】TP391 【文獻標識碼】A 【文章編號】1672-5158(2013)04-0217-01
一、引言
目前決策科學化、管理扁平化、業務綜合化、數據集中化是信息化建設的發展趨勢,通過建立數據挖掘系統來處理紛繁復雜、規模龐大的信息數據并且挖掘出隱藏在這些數據背后有價值、有決策意義的信息。
數據挖掘技術概述:
數據挖掘就是從大量不完全的而且模糊的、有噪聲的、隨機的數據中獲取隱含在其中的潛在有用的信息和知識的過程。計算機取證數據挖掘技術可以發現、分析并出示計算機犯罪的未知信息。通過對犯罪屬性分類、模式的發現、規則的提取實現計算機犯罪證據的數據挖掘。而廣義數據挖掘是把統計數據建立在經驗和直覺之上的組合數據挖掘方法,不是僅依靠不完全的數據分析。這樣,就避免了大量的、不完全的、有噪聲的、模糊的和隨機的數據在大多情形下并不具有數據分析情況的出現。廣義數據挖掘基本結構如圖如下:
二、建立數據應用平臺
(1)采用數據挖掘與在線分析技術、數據倉庫相結合能夠實現不同系統的共享和互聯,用戶訪問信息變得很方便,一段時間的歷史數據能夠被決策人員用來分析,從而對事物發展的趨勢進行研究。通過分析油田數據,建立適合于油田數據信息的數據挖掘應用平臺,如下圖:
(2)建立油田生產數據倉庫
系統主領域的確定、數據建模是構建數據倉庫的首要步驟,如在在井組生產中系統主題的確定是:油井生產受注水量的不同和層位不同的注采工藝的影響。其中注水井生產數據、油井生產數據、油井屬性數據、生產時間等是分析中要應用到的數據,從而對每個主題的維度和事實進行確定,并且數據倉庫的建立使用多維數據模型。在井組生產中,氣油比、日產氣量、日產液量等事實數據是決策者所關心的。數據的含義是多維數據模型所關心的,并且對分析領域的數據模型能夠清晰的表達出來。所以應用多維數據模型來建立數據倉庫的概念模型。在建立中首先建立的不是物理模型而是邏輯模型,物理實施在邏輯模型的指導來實現。確定數據源、定義關系模式、劃分粒度層次等是設計邏輯模型的主要內容,其中粒度的大小需要兼顧查詢分析效率和數據量的大小,并且對數據倉庫的分析能力也要進行考慮。如下圖是井組生產的多維數據模型:
三、在處理油田信息中數據挖掘的過程
(1)在油田信息中應用數據挖掘技術的時候,必須明確所要達到的目標和要解決的問題。針對數據挖掘的目標進行如下定義:對油田生產中的異常現象應用聚類分析法或分類分析法進行分析、如超注欠注、單量異常變化等。而且對泄露、異常井號及時發現,使生產出運行參數得到優化,確保油田經濟、安全、正常運行;對數據之間的聯系等利用時間序列分析、回歸分析、相關分析等方法進行挖掘,能夠檢測出油田生產受到各變量的影響程度,便于融合油田分散的數據,對生產的指導也有很大的幫助;在油田生產經營中進行了信息化建設,生產經營的大量成果數據和歷史數據得到了很好的積累,進行這些數據背后的知識的挖掘和提取可以采用興趣模型來實現,對油田生產中的規律進行探索,對未來的生產情況、油藏開發指標等能夠進行預測,從而在優化和調整生產方面起到更好的作用。
(2)數據準備階段在數據倉庫中完成之后,接下來需要進行模型應用、建立模型、數據探索等工作。在數據挖掘工作中建立數學模型是核心環節,各種數據挖掘算法在這一模型中有效的集成,如貝葉斯預測、模糊聚類、神經網絡、統計分析、決策樹、關聯規則等嗎,通綜合和比較多種建模方法來實現數學模型的建立,并且數據被分層為校驗數據和訓練數據,在模型檢驗主要使用校驗數據,在求解模型參數中主要使用訓練數據。在已經建立的模型中代入檢驗數據是模型檢驗階段的主要任務,并且要對模型的響應進行觀察,模型準確程度的評估是通過真實數據和模型相應的比較來實現的。倘若是比較差的模型準確性,那么就要建立新的模型、重新進行數據探索,指導新模型檢驗。所以,模型檢驗、建立模型、數據探索在實際應用中是反復迭代的過程。
(3)在大量數據采集中選擇訓練樣本,很可能出現數據誤差,網絡訓練的準確性會受到一些明顯矛盾的影響,網絡識別的能力降低,所以必須有效的篩選訓練樣本,經過專家經驗和用戶對數據挖掘階段發現模式的評價,剔除無關和冗余的模式,當用戶的要求模式不能滿足的時候,整個發現過程需要對數據進行重新選取,換一種算法進行再次挖掘,或對數據挖掘參數值進行重新設定、應用新的數據變化方法。通過圖形化的方式把一些正確并有趣的模式呈現給用戶。
四、結束語
在處理油田數據信息時,采用數據挖掘技術建立數據應用平臺,對超大規模的數據進行集中挖掘,對油田的生產規律進行探索,提取對企業戰略發展和業務決策有用的信息。油田數據信息處理中數據挖掘技術將有廣闊的發展前景。