楊夢露
(中法渤海地質服務有限公司,北京 100010)
近年來,黨和國家對數據發展高度重視,中央全面深化改革委員會第二十六次會議指出,加快構建以數據為關鍵要素的數字經濟。2023 年3 月,國家能源局發布《關于加快推進能源數字化智能化發展的若干意見》,強調釋放能源數據要素價值潛力,推動能源數據分類分級管理與共享應用。數據作為新型生產要素,被稱為數字經濟時代的“石油”,已成為一個國家重要的基礎性、戰略性資源。當前,各大油氣企業正在加快推進數字化轉型智能化發展,數字化轉型的核心是利用新興數字技術改造業務流程和管理模式[1],其關鍵能力在于數據采集和數據分析,因此數據治理是企業實現數字化轉型的關鍵基礎和重大挑戰。
近年來,國際大型油氣公司相繼推出勘探開發一體化智能化協同平臺,推動地質、物探、測井、鉆井、修井、儲運等各業務領域的數據信息共享。斯倫貝謝公司于2017 年推出公司內部統一的數據平臺DELFI 勘探開發認知環境平臺,整合并支持各類軟件應用程序,存儲全部歷史數據資料,實現全部業務的數字化轉換[2]。哈里伯頓公司在云平臺上部署了DecisionSpace 365 勘探開發云平臺,通過集成物聯網、云計算和大數據技術,實現油田現場各種數據流的實時捕捉、處理和傳輸的無縫對接[3]。此外,2019 年起斯倫貝謝、殼牌、埃克森美孚等國際油氣公司還積極加入“開放地下數據空間”,將數據與應用程序分離,借助微軟、IBM 等數字化技術公司的力量,打造一個油氣行業開放、基于標準的數據平臺[4]。中國石油于2018 年發布了中國石油勘探開發夢想云平臺并不斷升級,已發展成為全球油氣行業規模最大、業務覆蓋最全的工業互聯網平臺[5]。該平臺以“兩統一、一通用”(統一數據湖、統一技術平臺、通用應用和標準規范體系)為核心,構建了“一湖、一云、一平臺、一門戶”,創新研發由主湖和區域湖構成的連環數據湖架構,實現分布式存儲、分層次治理、海量數據高效訪問[6],建成上游集成統一的數據湖,形成了強大的數據中臺能力[7],完成60 余年勘探開發數據全面入湖,數據總量達10 PB,有效消除數據和信息孤島,推動上游業務數據資源向數據資產轉變[5]。
國內油氣企業的信息化建設起步于20 世紀90 年代初期,從最初各類勘探開發業務紙質資料的電子化錄入,經歷單機應用、分散數據庫建設、統一數據庫建設和集成應用4 個階段,已經基本跨過數字油田初級階段,正在向數字化智能化階段邁進[2]。經過長期信息化建設,各油氣企業都沉淀了PB 級的數據資源,且數據增量相當可觀。與此同時,數據資源分散和共享困難等問題也給油氣企業數字化轉型帶來不小的挑戰,各油氣企業迫切需要開展集團級的數據治理工作,推動海量的數據資產真正釋放價值。
當前,國內油氣企業已紛紛自上而下啟動了集團級的數據治理。中國石油、中國石化和中國海油數據治理工作均對數據管理組織體系進行了完善,明確了歸口管理和實施部門,中國石化和中國海油均成立了數據治理委員會,中國石油和中國海油分別成立了數據管理中心、勘探開發數據資源中心;3 家單位均對數據資產開展了全面梳理,編制或發布了數據治理頂層設計、數據管理技術規范、數據標準,并明確了相關制度流程;3 家單位均以統一的技術平臺作為數據治理的平臺支撐,中國石油構建了包含總部數據庫、各專業領域數據庫的統一數據湖體系,中國石化構建了集團級、板塊級、企業級數據資源中心和統一數據中臺,中國海油已建立包含數據治理工具、數據湖和數據中臺的基礎數據平臺;3 家單位已經不同程度地開展了勘探開發、經營管理等領域數據治理的實踐,取得了階段性成果。
目前,國內一些油氣企業數據治理工作普遍面臨業務鏈長、業務活動復雜,信息系統數量龐大,數據量多、分散且標準不統一,數據共享不充分等痛難點問題。
以中國海油為例,在上游業務層面,海洋油氣勘探開發業務鏈長,包含從勘探發現到油田廢棄的全生命周期,涉及勘探、開發、鉆完井、工程、生產5 大專業的千余項業務活動,以及10 多個業務部門和二級單位,地下、井筒、地面等設備設施關系復雜;各專業歷史數據存量巨大且類型繁多,包含各類圖表、報告和模型等,在傳統的組織運營模式下,各業務板塊間的融合協同難度較大。
在生產信息化層面,中國海油在勘探開發領域擁有80 余個數據庫,各數據庫間數據標準不統一,業務含義不一致,且在數據治理方面沒有成熟的模型、標準及經驗。擁有200 余個勘探開發應用系統,部分應用功能重復,系統間未實現互通,上游領域的數據孤島和系統煙囪現象較為明顯,進一步導致各業務板塊的專業數據、管理流程和組織系統無法暢通流轉。
在經營管理層面,中國海油主要靠手工填報管理數據,所建設的各層級管理系統數量眾多且較為分散,各管理系統的數據口徑不一致、質量難以保障、共享難度大,數據橫向未集成、縱向難穿透,導致各類經營管理數據的價值難以發揮。
中國石油數據按業務領域分為經營管理、勘探生產、煉油化工、成品油銷售、天然氣銷售等12 類,累計管理各類數據量達到27 PB。中國石油以數據資源目錄梳理作為數據治理主要抓手,驅動數據標準、主數據、數據架構、數據質量等持續完善提升,依托制度保障、標準規范、組織保障的“三個保障”,以數據治理平臺和公共數據編碼平臺共同構成的技術平臺為支撐,建立數據治理體系架構,開展數據架構、數據共享、數據質量、數據安全、主數據和維度數據等六項核心活動。
中國石油采取“統籌推動、分步實施、以點帶面、多維支撐”策略,分為夯實基礎、全面深化、持續運營三個階段推動數據治理,目前處于全面深化階段。持續完善數據管理組織體系,明確由集團數字和信息化部作為數據歸口管理部門,成立數據管理中心負責數據管理的實施工作;發布數據管理與技術規范,以及公共數據的編碼、生產運行數據和經營管理數據標準三大類數據標準;加快構建包括制度流程、組織保障、數據全生命周期安全等在內的數據安全體系;建設數據治理平臺,統一管理數據架構、數據地圖和數據開發,推動形成數據生產者、使用者、管理者多主體協同數據治理機制;建設包含總部數據庫,以及油氣和新能源、煉化和新材料、支持和服務、資本和金融等各專業領域數據庫的統一數據湖體系;積極推動經營分析、供應鏈優化、財會監督等領域的大數據平臺示范應用,持續提升多源數據匯聚能力、海量數據存儲能力、高性能計算能力、多維智能分析能力;推動建立經營管理、生產管理、公共數據三個主題域的全局數據資源目錄;總結經驗逐步形成數據治理方法論,制定數據治理實施指導手冊,明確數據架構、質量、共享和安全等方面的流程規范,進一步強化數據治理的標準化、專業化和體系化水平[8]。
中國石化于2021 年確立了信息化發展“數據+平臺+應用”新模式,成立中國石化數據治理委員會,建立了業務域“域長”負責制新機制[9]。近年來,大力推進全集團數據治理工作,全面梳理數據資產,完成數據治理體系設計并規范數據應用流程,制定了“數據資源目錄+數據標準+數據質量”三大具體工作部署,初步建立數據服務運行體系,構建“統一標準、統一流程、統一授權”的集團級、板塊級、企業級數據資源中心和統一數據中臺[10]。
在生產領域,以中原油田普光分公司、西北油田采油三廠為試點,取得了“一湖、一平臺、一應用集群”的建設成果,開發數據處理、加載、傳輸配套功能,推動數據全量、完整、規范入湖,實現了數據資產統一管控和融合利用[11]。
在經營管理領域,于2020 年上線統一的經營管理大數據服務平臺,并持續推廣應用,接入430 多個源系統,形成數據模型6.7 萬個,發布數據資產3.5 萬個[10],形成了煉化業財融合、財務價格分析、客戶服務分析、集團生產運營等一批典型數據應用[12],加快推動海量數據轉化為新生產力。
作為中國最大的海上油氣生產運營商,中國海油加快推進數字化轉型和智能化發展,“十三五”時期,就全面推廣實施了勘探開發一體化數據中心,著力推進數據湖平臺和實時數據庫建設,為“智能油田”建設奠定了數據基礎。近年來,中國海油積極應對數據采集、存儲、管理和應用難題,探索開展勘探開發和經營管理數據治理,取得了明顯成效,有力提高數據質量,促進數據共享和價值發揮。
2020 年,中國海油發布《智能油田頂層設計綱要》,提出了智能油田的數據架構,要求以數據資產化管理為目標,建立數據管理的組織機構,制定制度和流程,明確相關方的職責,制定覆蓋數據采集、存儲、使用全過程的統一標準,建立公司統一數據平臺,對勘探開發數據進行全方位、全過程的規范化管理,建成智能油田數據湖,支撐數據價值的實現。2022 年,發布《數字化轉型行動計劃實施方案》,部署強化數據治理、推進數據共享、釋放數據價值三項重點任務,加快激活數據要素潛能;編制《數據治理頂層設計方案》,形成“一個愿景、四項目標、四項能力、六項保障、一個平臺”數據治理體系框架。
中國海油數據治理工作以集團基礎數據平臺為支撐,立足“采、存、管、用”數據生命周期,針對集團油氣勘探開發、專業技術服務、天然氣及發電、煉化及銷售、金融服務五大主要業務板塊的數據,通過數據治理實現業務標準化,形成高質量、安全有序、高效共享的數據資產,并通過持續的數據運營,更好地賦能業務。
2022 年11 月,成立由集團董事長任主任的中國海油數據治理委員會,統籌推動生產和經營管理專項數據治理工作,在各分公司成立數字化室。根據集團業務和管理現狀,將數據治理工作劃分為生產、經營管理兩類15 個業務域,如圖1 所示,其中生產類包括勘探開發、新能源、油田服務、海洋工程建設、能源技術服務、天然氣與發電、煉油化工、化學、銷售貿易9 個業務域,經營管理類包括人力資源、財務資金、物資供應鏈、規劃計劃、法務、審計6 個業務域;建立數據治理責任人制度,總部各相關部門、各相關單位主要負責人為本業務域數據治理責任人。

圖1 中國海油數據治理工作業務域劃分
3.2.1 中國海油勘探開發數據治理組織機構
2021 年7 月,中國海油依托研究總院成立首家公司級專業數據資源管理單位—中海油勘探開發數據資源中心,統一管理上游勘探開發業務數據;2022 年5 月,成立上游生產領域數據治理工作協調領導小組,統籌推進勘探開發數據治理工作。積極構建總部部門深度主導、研究總院總體支撐、分公司全面落實、專業公司服務保障的自上而下全員參與的勘探開發數據治理組織體系;成立數據治理標準技術委員會,強化總體技術把控;成立數據治理源頭采集暨示范督導組,自下而上開展源頭監督。
3.2.2 中國海油經營管理數據治理組織機構
2023 年1 月,在中國海油數據治理委員會下成立中國海油經營管理數據治理專項工作組織,統籌推進6 個業務域的經營管理數據治理工作;設有專項工作領導小組和管理組,以及1 個技術支持組和6 個業務組,由中國海油財務共享服務中心和信息技術中心承擔技術支持組職責,響應各業務組需求并提供技術支持,由各業務組負責搭建本業務域數據治理組織,開展本業務域數據治理工作;明確數據治理職責劃分,強調總部各相關部門是落實集團經營管理數據治理工作的責任主體,各所屬單位是本單位經營管理數據治理的責任主體。
中國海油于2020 年啟動勘探開發數據治理,按照“價值導向、以用促治,業務驅動、統一管控,源頭治理、采用分離”的治理思路,扎實推進數據整合和應用整合兩項核心任務,經過3 年多的治理工作,在前期已完成數據標準規范建設、主數據治理、試點應用整合與存量數據入湖的基礎上,總體已進入深化階段。建立完整的勘探開發數據標準體系,勘探開發專業已完成階段性存量數據清洗入湖工作,建立勘探開發源頭采集系統和工具,真正做到數據采集源頭唯一、數據標準統一、數據質量可信、數據應用共享;建立兩套勘探開發業務集成應用系統,并結合統一專業應用系統的建設,初步實現業務管理一體化;為智能油田建設提供統一的勘探開發數據標準及一體化服務,全面支撐了秦皇島32-6 智能油田等3 個智能油田試點項目對數據的需求,已實現階段性建設目標。
3.3.1 中國海油勘探開發數據治理工作原則
(1)價值導向、以用促治
面向公司增儲上產、降本增效和管理提升等需求,以數據治理為基礎,構建協同研究平臺、智能油田和業財一體化等研究、生產和管理三類數字化轉型示范場景;以價值驅動,明確源頭數據采集、歷史數據遷移,以及勘探、開發、鉆采、工程專業應用整合等治理任務,系統提升治理能力,實現以用促治、以湖養用。
(2)業務驅動、統一管控
按照誰牽頭業務誰主導、誰產生數據誰負責的原則,明確各專業和各組織的數據治理責任,構建業務驅動、IT 統籌的治理組織;明確統一規劃、統一設計、統一建設、統一標準、統一管理的“五個統一”原則,保障全集團的信息化戰略與規劃整體統一并推動落地,加強集團統一管控。
(3)采用分離、源頭治理
將數據與應用分離,應用系統數據由數據湖統一管理,將采集與應用分離,避免數據僅在專業內循環;按照統一的標準產生數據,并強化數據質量控制,確保數據源頭唯一、標準統一、口徑統一,提高入湖數據質量。
3.3.2 中國海油勘探開發數據治理工作成效
(1)建立數據標準和管理制度,夯實數據全面治理基礎
中國海油于2020 年初步完成物化探、井筒工程、綜合研究、油氣田生產、分析化驗、海洋與地面工程6 大業務域數據標準制定。2021 年進一步健全數據標準規范,發布勘探開發業務數據標準和數據管理制度,為后續全面治理奠定堅實的基礎。2023 年持續健全完善數據管理制度體系,建立完整的勘探開發數據標準體系,形成物化探、測錄試等16 冊勘探開發業務數據標準,覆蓋勘探開發全周期主要業務;發布勘探開發數據源頭采集審查、數據治理考核等相關的制度體系文件,并進一步落實業務和數據管理“一崗雙責”,切實推動業務與數據深度融合。
(2)搭建企業級勘探開發數據湖平臺,組建勘探開發數據資源中心
中國海油于2020 年啟動勘探開發數據湖平臺建設,平臺為秦皇島32-6 智能油田,通過數據湖平臺為秦皇島32-6 智能油田,以及東方、白云和中聯生產操控中心等項目提供統一數據服務,已完成數據湖一期建設,正式啟動數據湖二期建設,初步建立數據湖平臺運營運維體系。2021 年依托研究總院成立了中海油勘探開發數據資源中心,作為數據治理的技術支持和技術管理單位,推動實現數據標準統一、歷史主數據入湖和源頭采集,通過數據湖整合數千口井所采集的各專業累計60 余萬億字節數據資源,實現源頭化、資產化、一體化、統一化、平臺化管理,并具備云化數據服務、中心化數據分析等能力,為智能油田建設提供統一數據支持。
(3)強化數據源頭采集,著力清洗數據入湖
中國海油明確業務數據源頭,推動業務數據源頭采集常態化,已基本完成勘探、開發等5 個專業歷史數據遷移和源頭采集,進一步清洗數據,實現上億條數據入湖,通過以用促建、建用結合的方式有力保障數據的高可用性。
(4)推動應用系統整合,打造數據治理示范油田
中國海油于2022 年起采用試點先行方式創新開展勘探開發應用整合,確保整合改造的技術路線可靠。2023 年正式將應用整合作為勘探開發數據治理主要任務之一,加快整合各專業現有系統,每個專業僅保留1~2 個系統;加快建設“深海一號”等數據治理示范油氣田,將數據湖作為示范油氣田數據源,業務應用產生的成果數據也及時回存到數據湖,促進湖內數據在核心業務中的流轉和應用,助力數據湖價值充分發揮。
中國海油圍繞“提質增效、決策支持、風險防控、模式轉型”的經營管理數據治理目標,堅持“標準引領、業務驅動、速贏試點、以用促治、邊推邊用”的原則,以集團基礎數據平臺為支撐,采用“系統思維、問題導向,供給側驅動、需求側牽引”的工作方法,努力實現數據可知、可視、可控、可預測,助力中國海油管理變革和業務創新。
3.4.1 強化供給側驅動和需求側牽引
在供給側以數據資產目錄為抓手,基礎數據平臺為支撐,ERP 系統各域數據為核心,數據確權確責為牽引,數據治理考核為契機,驅動數據管理和數據運營兩類核心任務,沿著“采、存、管、用”的數據生命周期進行落地。在需求側選取即時可見的先導項目,以需求為牽引,通過以“用”促治,努力穿透誰負責、怎么管、存在哪、從哪采4 大問題,針對未穿透的問題,及時分析原因,明確責任主體并制定改進方案,通過改進方案的實施牽引經營管理數據治理目標實現。
3.4.2 建設集團統一的基礎數據平臺
加快構建集團統一的數據治理、數據分析、數據共享及主數據管理平臺,通過數據治理工具對數據資產目錄、架構、標準、質量、元數據、主數據等進行集中管理,由數據湖匯聚內外部儲存的數據,利用數據中臺整合處理儲存數據并支持數據計算加工,最終實現對集團數據資產的統一管理,構建集團數據資產全局視圖,支撐集團經營管理類數據管理和數據運營落地。
3.4.3 中國海油經營管理數據治理進展情況
中國海油于2022 年啟動勘探開發數據治理,相關工作目前仍處于初級階段,選定了集團兩家內部單位作為試點,推動打通“人、財、物”問題,已完成經營管理各業務域數據資產盤點,形成數據資產目錄,厘清ERP 系統數據家底,建立數據標準,統一主數據編碼,編制數據確權確責管理辦法,為后續治理工作打下堅實基礎。
數據治理沒有捷徑,尤需久久為功。中國海油將進一步強化數據治理頂層設計,持續深化勘探開發數據治理,高效推進經營管理數據治理,加快建立數據資產運營體制機制,做好跨專業、跨單位、跨系統的協同治理,構建數據有序流通和安全共享共用的機制,不斷提升數據湖的總體支持能力,努力實現業務數據化、數據資產化、資產價值化,使數據真正賦能公司生產經營管理業務。