張 敏
(天津市大港油田信息中心大數據技術部,天津 300280)
隨著互聯網(或者物聯網)、云計算、大數據和人工智能等新技術的興起與應用,人們的工作和生活都在發生改變。大數據技術以其高效的信息處理能力、技術分析能力、多樣的模型算法等,在石油行業勘探開發生產中輔助相關人員開展工作。近幾年,隨著大港油田大數據技術應用的不斷深化,大數據技術已經在協同研究環境、數字井筒應用和數據治理以及數字油藏技術研究等方面取得了一系列成績。目前,針對智慧油田建設,大港油田制定了頂層設計方案,明確了大數據建設的目標、框架、內容、實施方案和制度機制5 部分內容。在頂層設計方案推動中,為保證大數據工作有效落地,大港油田采取了多部門聯合推動、多業務協調開展、多節點全面實踐等措施,使得大數據技術在儲層預測、油氣層識別、地震數據管理等方面發揮了重要作用。大數據處理過程主要包括數據采集、提取、清洗,在數據分析中發現規律、建立分析模型、展示結果并表達、驗證結果、優化模型等步驟。大港油田基于私有云環境,通過分別搭建Hadoop 平臺和大數據同步數字體系(Synchronous Digital Hierarchy,SDH),為石油勘探開發應用搭建了基礎的應用研究環境,并在此基礎上進行了中心數據庫大數據環境實驗,開展了與勘探開發相關的幾十種算法適應性研究。下面將在儲層預測、油氣層識別以及地震數據管理和智能油藏建設幾個方面闡述大數據技術的具體應用。
在油氣田勘探開發領域中,構造認識、儲層識別是核心內容,儲層預測是油氣勘探開發的難點。在實際應用中,如果因地質意義模糊、地震屬性混亂,造成無法對數據進行分析利用的問題,就需要地質和地球物理研究人員通過分析現有的大量數據,結合大數據分析技術和模型,進行儲層的定性、定量和預測工作。目前,應用于大數據分析處理主要有兩類技術:一類是大數據抽取及預處理,另一類是大數據分析。
數據抽取及預處理主要是把多種結構和類型的數據抽取轉化成單一的或便于處理的結構類型。其要求不同時間、不同地點、不同名稱的相同數據的內涵和算法一致,以方便計算機處理,因此是數據提取的關鍵。對于數據抽取的標準化、規范化的檢查,則需要利用數據清洗技術進行處理。數據清洗的主要目的是確定有用記錄和字段,檢查數據是否存在缺失和異常等情況。在使用數據清洗技術時,主要采用剔除法或使用估計值、平均值填補錯誤數據等方法,有時也可利用邏輯關系進行手動替換。除此之外,還需要通過數據構建技術來輔助大數據建模需求而創建新字段,以及通過數據轉換技術將原始數據轉換為下一步處理應用所需要的數據格式。
大數據分析技術常用的方法主要有回歸分析、聚類分析、因子分析、相關分析以及數據挖掘等方法。這些方法在油田中都較為常用。其中最為關鍵的技術是數據挖掘技術,它是大數據時代的核心處理技術。數據挖掘技術可以將海量非完整的、有噪音的、模糊且隨機的數據通過模型和算法分析,挖掘出有用的數據信息進行處理應用。數據挖掘主要有兩類功能,一種稱為描述性挖掘,主要用于分析數據的普通特性,展現集體數據的一般特性;另一種是預測性挖掘,主要應用于預測性研究,通過推算處理數據,完成預測等任務。
大數據技術在油田勘探開發中的應用可以通過處理和抽取技術,對現有數據進行對比篩查及轉換,通過分析和計算研究,從中找出有價值的數據進行預測和描述,并分析得出結果。目前,大港油田在儲層預測中主要應用的就是數據挖掘思路,通過進行數據可視化全流程實踐,為石油勘探開發和生產提供依據。
目前,大港油田各個區域都存在石油儲量、開發產能、生產成本等多方面壓力。利用大數據技術可以輔助決策者和技術人員進行分析和處理,從儲集層快速找到具有二次開發價值的油氣層,并采取補孔及壓裂等手段,增加油井產量。利用大數據技術的數據挖掘方法,可以幫助科研人員基于數據建立模型,由專家對模型進行分析,解析出實際所需的數據,最終幫助高層決策者做出準確的勘探開發決策,取得滿意的效果。
在具體應用中,針對數據量過多無法識別有效信息、數據量過少無法根據模型得到有效結果的情況,需要科學識別有效數據。當前,油氣層的識別和預測利用鉆井、錄井、測井、生產、試油和分析化驗等多類型的數據,并根據需要對所需數據進行歸一化、標準化處理。近幾年,基于對大數據技術的成熟應用,大港油田已開始建立油藏數據成果圖庫和精細油藏描述成果庫,通過對地震解釋、測井解釋、地質建模、數值模擬等油描成果的深入研究,實現成果數據的邏輯校驗,數據完整性、一致性的自動檢查,自動生成質量報告,為科研及工程人員利用數據成果進一步分析和研究奠定良好的數據基礎。
伴隨大港油田智慧井場的建設,對于多維地震采集技術的應用不斷深化,地震勘探所產生的數據量也呈幾何級增長。為滿足地震數據管理的需要,大港油田開發了地震采集處理工區信息管理與發布系統,并通過協同研究環境及專業數據庫進行大數據存儲和處理。利用大數據技術的數據挖掘和處理,可以高效實現地震數據的處理解釋,同時對成果數據的分析、解釋及轉化都有了更深入的應用。
綜合利用地震大數據技術,建立地震大數據信息系統,同時利用分布式架構的方式,采用分布式讀取和存儲數據,可以高效快捷地對數據進行管理。大港油田開展的大數據實驗表明,采樣點地震數據在多節點Linux 的大數據環境中較單節點Windows 環境的處理速度有數量級的提升。在數據挖掘方面,地震數據由于其分辨率較小,利用大數據技術能建立井與井之間的聯系,能夠從平面和三維空間較好地描述整個區塊的含油氣性質。在利用不同數據類型進行建模時,結合時間屬性及空間屬性技術,通過數據挖掘模型,可以更深入地獲取地震數據處理和解釋潛在數據信息。
隨著物聯網系統在大港油田油井開發生產的使用,每天都會有海量的數據需要存儲和分析。如何利用大數據技術對海量數據進行分析處理,幫助專業技術人員更為直觀地獲取信息,使勘探開發領域的各類數據可以直接指導實際的油氣勘探,即數據勘探,對下一步智能油田建設發展有著重要意義。在這個多學科交叉、多背景綜合的領域區間,大數據技術不僅需要各種數據存儲的采集方案,更需要多種數據挖掘方法和數學模型,還要有專業技術人員的地球物理和地質專業知識作支撐。只有滿足了這些需求,才能更好地保證大數據技術的正確使用,才能得到有效的大數據分析結果。這一結果可以用來指導二次、多次開發和精細解釋,在勘探開發生產領域所產生的深層作用,具有很重要的現實意義。當前,國內很多油田都在嘗試和探索將人工智能技術和大數據技術相結合來組建智慧油田系統。大港油田通過采油廠的試點應用,已逐步建立了全天候的監測控制、無人值守操控、重點部位無人機巡視、組織運維、層級簡化的新型站庫。利用物聯網技術遠程采集信息,利用大數據技術分析挖掘信息,利用云數據計算處理中心存儲分析信息,加上移動數據的處理應用、油田生產經營管理平臺建設,都為保證油田實現穩產高產奠定了良好的信息化數據基礎。
大數據技術應用作為油田企業的一次創新,強有力地推動了企業發展,數據逐漸成為企業的戰略性核心資源。智能油田業務是基于數據驅動的,為發揮數據資源優勢,數據應用成為智能油田建設的關鍵環節。
油田企業的環境和地質工程一體化建設、數據信息采集,對企業信息技術和智能化發展提出了更高的要求。如何高效處理油田各采油廠在生產運行中所形成的大數據信息,實現對大數據的安全利用,為高層決策者提供決策依據,是當前急需解決的問題。日益突出的油氣供需問題以及存儲的大量油氣開發數據,要求科研技術人員能夠通過大數據技術高效應用剩余油氣分布規律及油氣數據之間的內在、有跡可循的聯系,從而推動油氣勘探大數據技術的廣泛應用,以滿足企業生產經營的實際需求。大數據技術的應用可有效促進油田智能化發展和建設,從而實現互聯網技術與油田業務的深度融合,為油氣勘探開發提供更好的思路和方法。