蔣天皓,陳波,史旻,和鵬飛,宋峙潮
1.中國海洋石油有限公司(北京 100010)
2.中海油能源發(fā)展股份有限公司 工程技術分公司(天津 300452)
隨著大數據的增長和信息化技術的創(chuàng)新,社會各傳統(tǒng)行業(yè)都進入了數字化轉型階段,如何提高數據質量是轉型中面臨的巨大挑戰(zhàn)[1-3],為降低無效數據體量,許多企業(yè)都投入了大量成本開展數據治理工作[4-5]。
中海油鉆完井數據庫涵蓋海洋石油鉆完井作業(yè)全周期的靜態(tài)數據信息,為管理者決策部署、作業(yè)人員回顧作業(yè)信息、降本增效提供扎實全面的數據支持。為確保數據的完整性、準確性、一致性和有效性,梳理分析了近年來鉆完井靜態(tài)數據質量存在的主要問題,提出通過完善制度管理體系、健全源頭管控標準、把控末端數據質量等手段,從管理和技術層面提高數據質量,促進數據對鉆完井作業(yè)生產提供更優(yōu)質的支持。
中海油鉆完井靜態(tài)數據主要由鉆完井現場作業(yè)監(jiān)督根據當日作業(yè)情況進行相關數據的收集提煉,通過靜態(tài)數據源頭采集工具對每日鉆完井作業(yè)數據進行上報,同時傳輸至數據庫。靜態(tài)數據主要包括鉆井平臺信息、人員信息、天氣信息、支持船信息、鉆頭、鉆具組合、鉆井液性能、作業(yè)日志等。鉆完井工程作業(yè)數據具有體量大、種類多、關聯(lián)性強等特點,管理者需要通過數據預處理才能充分了解工程現狀、做出決策[6],這對數據的及時性、準確性提出了更高的要求。通過梳理分析,目前數據質量存在的問題主要表現在以下3個方面:
1)數據管理制度不健全,數據完整性和一致性差。《中海油鉆完井數據庫管理辦法》僅針對數據庫的維護、使用和數據安全管理等做了相應的規(guī)定,在實際執(zhí)行中仍有諸多方面無法被該辦法涵蓋。所有靜態(tài)數據均由采集者直接錄入至數據庫,沒有任何分級審核和監(jiān)管機制。
2)源頭數據采集標準不統(tǒng)一,數據質量亟需提升。中海油鉆完井監(jiān)督人員已超200 人,人員素質不一。現場作業(yè)監(jiān)督作為源頭數據的采集者,因認知不同,在數據采集的時效性、完整度、規(guī)范性等方面均存在較大差異,無法進行統(tǒng)計計算處理。以“渤海五號”為例,錄有“渤海5 號”“渤五”“BH5”“B5”等多種名稱。
3)入庫數據缺乏質量管控機制,未充分釋放數據應用價值。對歷史數據質量檢查、新增數據質量校驗沒有明確和有效的控制措施,出現數據質量問題無法考核。目前組建鉆完井數據管理團隊進行庫內數據檢查,但由于數據體量巨大,檢查復核任務艱巨,難以高效開展工作。
鉆完井作業(yè)中產生的原始數據,以行業(yè)標準規(guī)范的報表格式進行采集、存儲、分析和展示,才能最大程度釋放數據價值。在開展數據質量管控時,要注重管理和技術兩個方面的功能措施:在管理方面,制定數據管理、治理的相關制度和流程,并在公司內部進行推廣;在技術方面,應用人工智能算法及大數據分析促進數據質量管理與服務的進步和發(fā)展,為各項業(yè)務需求應用和決策提供高質量的數據。
鉆完井數據管理團隊通過梳理近年來各環(huán)節(jié)數據采集、質量控制存在的問題,進一步優(yōu)化數據質量管理流程,完善鉆完井數據管理制度體系,保證鉆完井數據的整體質量。
1)從集團公司層面緊抓數據質量管理,修訂《中海油鉆完井數據管理辦法》,落實集團公司、分公司數據管理的職責,增加分公司、集團公司兩級審核制度,明確鉆完井數據質量管理流程(圖1)。

圖1 鉆完井數據質量管理流程
2)嚴格執(zhí)行數據源頭及分公司級審核制度,制定分公司級別的《鉆完井數據采集管理制度》辦法,以制度形式明確數據采集管理崗位職責、數據采集內容、具體數據采集上報時間和采集管理方式。
3)優(yōu)化鉆完井數據質量考核內容,建立數據質量直接與績效考核掛鉤,壓實責任,推動數據質量考核成績在鉆完井監(jiān)督年度績效考核中占比從0提升至5%。
源頭采集主要涉及到靜態(tài)數據源頭采集工具和鉆完井現場作業(yè)監(jiān)督培訓兩個方面[7-8]。
1)靜態(tài)數據源頭采集工具結合靜態(tài)數據和實時數據的特點,規(guī)范了數據管理和數據服務職能,梳理出鉆完井專業(yè)所涉及的一級業(yè)務、二級業(yè)務、三級業(yè)務和其他業(yè)務活動。根據業(yè)務活動劃分出244 個數據集,并細分當前鉆完井專業(yè)所涵蓋的3 399 個數據項。明確每個數據項的來源、名稱、代碼、描述、數據類型、量綱、字符長度和值域等,最終形成《鉆完井業(yè)務數據規(guī)范》和《鉆完井業(yè)務數據質量規(guī)則模板》(圖2),以此為基準統(tǒng)一采集工具的數據標準。

圖2 數據質量規(guī)則模板
2)針對靜態(tài)數據源頭采集工具使用過程中出現的問題,編制鉆完井時效劃分管理、數據質量提升培訓課程和《鉆完井靜態(tài)數據采集操作手冊》。定期為現場監(jiān)督組織開展數據標準規(guī)范、源頭數據采集培訓答疑,提高現場監(jiān)督數據錄入的技能,保證鉆完井靜態(tài)數據的準確、完整和實用。
為提高數據質量,保證其有效性,靜態(tài)數據存儲到數據庫后,鉆完井數據管理團隊采用人工復核和智能檢測兩種方式進行數據質量的末端把控,向各生產、研究單位提供高質量的數據。
1)人工復核。鉆完井專業(yè)各項業(yè)務指標均由數據庫內不同數據項計算得出,為降低數據管理難度,提高數據質量,根據中海油鉆完井作業(yè)不同數據項的使用頻次和對核心業(yè)務指標影響程度的高低,將鉆完井數據劃分為“核心數據項”和“非核心數據項”。以月為周期開展上月完成井的入庫數據復查(圖3),以完整性、準確性、一致性和有效性4個維度進行人工復核。同時,將復查結果反饋給鉆完井業(yè)務管理部門和問題井的現場監(jiān)督,并要求現場監(jiān)督進行完善整改,整改后由鉆完井數據管理團隊再次進行復查。

圖3 人工復查數據質量
2)智能檢測。依據《鉆完井業(yè)務數據規(guī)范》標準和《鉆完井業(yè)務數據質量規(guī)則模板》,開發(fā)了鉆完井靜態(tài)數據質量智能檢查系統(tǒng)(圖4),每日實時進行作業(yè)井的完整性檢查、一致性檢查、記錄條數檢查和特殊樣本數據的檢查,并根據檢查結果,自動導出常規(guī)異常數據質量問題,及時報告作業(yè)井現場監(jiān)督進行完善修改[9-10]。

圖4 鉆完井靜態(tài)數據質量智能檢查系統(tǒng)
研發(fā)智能檢測系統(tǒng)能夠有效降低人工復核的工作量,輔助提高數據復核準確率。該系統(tǒng)能精準分析海況、管柱組合、防噴器部件等信息的完整性,向管理人員直觀呈現數據缺失項,減少了數據復查時間;實時檢查作業(yè)日志、鉆井時效等結構化數據的準確性,發(fā)現問題后及時提示前端數據錄入人員和后端數據復核人員,強化鉆完井數據前后端的溝通,提升了數據復核工作整體效率。
鉆完井數據質量管理方法于2020年實施,對鉆完井靜態(tài)數據進行管控,結合源頭控制、人工復核、智能檢測和制度保障等手段有效提升了鉆完井靜態(tài)數據質量,“核心數據”與“非核心數據”問題數量逐步減少。以天津分公司鉆完井數據為例,“核心數據”平均單井問題數從高點4.97%降至目前“核心數據”無新增問題數據,“非核心數據”平均單井問題數從2020 年1 月至2021 年6 月平均下降了77.68%(圖5)。

圖5 平均單井核心數據及非核心數據問題數
井壁穩(wěn)定分析對鉆完井作業(yè)安全具有極其重要的意義,渤海C油田東營組泥巖掉塊、垮塌問題突出,以一口調整井C3 井為例,該井設計井深5 000 m,215.9 mm(8?2")水平段穿過東二下段地層,井壁失穩(wěn)風險較高,需要在鉆井液設計、井深結構設計及地質風險分析等環(huán)節(jié)廣泛參考鄰井資料。根據同區(qū)塊已鉆歷史井與待鉆C3 井之間的靶點距離位置關系,優(yōu)選了1 井、2 井、A1 井及A5 井為參考鄰井。通過審核上述4 口已鉆歷史井測井、鉆井等數據資料的適用性及完整性,分析現有數據是否滿足巖石力學及井壁穩(wěn)定分析的需要。已鉆歷史井資料見表1。

表1 歷史井資料審核情況
治理后的數據具有較強的參考應用價值,通過鉆井日志資料統(tǒng)計卡鉆、漏失等復雜情況,通過測井資料計算巖石力學參數,綜合地質錄井圖資料,形成了基于有限量歷史數據資源的井壁穩(wěn)定分析方法,對減少C3井鉆井復雜情況及事故的發(fā)生具有重要意義。
1)中海油鉆完井數據庫涵蓋鉆完井作業(yè)全周期的靜態(tài)數據信息,具有體量大、種類多、關聯(lián)性強等特點,目前數據治理過程中存在制度管理體系不完善、源頭采集標準不統(tǒng)一、入庫質量把關不嚴格等問題。
2)針對數據質量問題,從管理層面提出制定數據治理相關制度、標準、流程,并廣泛推廣;從技術層面提出人工復核+智能化軟件輔助監(jiān)控,降低“非核心數據”入庫前的錯誤率,杜絕“核心數據”質量問題。
3)通過統(tǒng)計庫內問題數據數量發(fā)現,鉆完井數據質量管理體系運行以來,平均單井核心數據問題數降低了100%,非核心數據問題數降低了77.68%。基于治理后的鄰井歷史數據,形成了一套適用于渤海C 油田泥頁巖井壁穩(wěn)定分析模型,對減少該油田鉆井復雜情況及事故的發(fā)生具有重要意義。
數據質量是數字化轉型的基礎,通過應用鉆完井靜態(tài)數據質量管理方法,有效降低了無效數據體量。但隨著鉆完井數據的不斷增加,還需探索出更加切實有效的數據質量提升方法,建立健全數據質量評價體系。