陳嚴飛
(中國石油大港油田公司信息中心,天津 300280)
當前,在數字化油氣領域,很多軟件工具都已經被廣泛使用,在國際上已經形成完善的數字化油田方案體系,數字化油田的產品也有了大規模的發展,數據分析軟件、知識學習軟件等系統已經成為油田領域的重要輔助工具。數字化油田使油田勘察中有關地震檢測、地質勘測、油藏研究、工程建設、油田管理等一體化內容都能夠形成一個統一的整體。具有代表性的數字化軟件如斯倫貝謝、哈里伯頓、貝克休斯等,這些專業的油田行業數字化解決方案供應商已經將油田產業全產業鏈進行了數字化覆蓋,從數據模型、應用軟件、管理軟件,再到油田開發、監測軟件、營銷軟件等,實現了油田行業數據模型、產品模型統一的行業數字化應用模式,通過軟件的集成將油田的發展統一到互聯網思維下,覆蓋了全油田行業的數字化模式,也使得油田行業的信息安全面臨著一定的挑戰。
當前,我國油田在數字化方面的建設存在嚴重依賴技術進口的局面,以油田數字化中廣泛應用的商業軟件為例,我國油田行業在數字化商用軟件上幾乎沒有可競爭的產品。行業應用軟件缺乏是油田數字化的主要現狀,而在大數據應用方面,我國油田行業也面臨著相同的問題。從全球油田行業來看,油田數字化、信息化建設歷史與計算機的發展歷史趨于同步,也就是在計算機誕生、發展及成熟的各個階段,油田行業都在利用新技術來提升自身的產能效率和產品的競爭力。當前,油田數字化逐漸從地質模型、產品模型升級為大數據模型、人工智能模型,油田的數字化管理向著云端管理的方向發展,新技術應用已經成為數字化油田發展的主要特征。而我國油田行業由于缺乏自主技術,在行業生態內依舊扮演著應用者、追隨者的角色,而非開發者、引領者的角色。
當前,我國油田行業在大數據應用方面存在體系不完善的問題。油田行業在國際范圍內有著屬于其行業規范的大數據標準應用體系,如數據模型中的RPDS、PPDM、POSC 等,針對油田全過程的大數據應用給出了完善的建設體系。但在我國油田行業中,大數據應用體系還處于落后的狀態,尤其是在地質模型、產品模型方面還缺乏自主產品,大數據的應用標準仍依照發達國家的標準,更難以提高對未來油田數字化核心內容的認識水平。這種現象造成了我國油田行業利用大數據進行數字化油田建設時的不足。雖然我國在大數據、人工智能方面的應用有了顯著的進步和發展,但在油田領域的研究與應用還未形成實際效應,其建設成果一直無法達到預期目標。出現這種現象的最大原因便是我國油田領域還未形成大數據應用體系,尤其是數據安全管理的建設非常落后,從而造成其在數據分析、應用開發、架構設計、業務管理方面的研發體系落后,最終也導致國內油田領域的大數據應用落后于其他國家。事實上,大數據應用技術的普及能夠帶動油田行業的發展改革,但我國油田數字化核心技術上的發展滯后問題導致油田產業與大數據的融合缺乏基礎。這些都較為嚴重地限制了我國數字化油田的轉型發展。因此,油田行業的從業者,尤其是技術研發人員,需要加大創新力度,快速完善我國油田數字化的發展體系,為打造油田數字化領域的核心技術和產品提供助力。
油田數字化是大數據應用的重要方法,這種方法是基于油田產業結構特點來設計和實施的。數字化應用場景的打造需要實現兩個部分的內容,一是智能化,二是自動化。例如,數字化的鉆井場景建設,首先要解決的是智能化問題,智能化的鉆井場景建設的直接目標是降低成本、提高效率,而其中核心的技術是鉆速的智能化。通常鉆速會受到地質巖性、鉆頭材質、井筒管具、動力裝置、鉆井液、施工參數等因素的影響,因此在解決這個問題的過程中,技術人員需要從地質、鉆頭、管具、鉆井液、動力、施工等方面進行分析,首先要找出鉆速與這些影響因素之間的關系。在未應用大數據以前,行業內的技術人員會調取井口采集到的數據來分析這些因素與鉆速之間的關系,如泵壓、泵沖、扭矩等參數,然后根據經驗來提升鉆速,但這種以經驗來解決問題的傳統方法顯然不具備大規模推廣的可能。在經驗法的應用中,技術人員要不斷地調整參數,然后對模型進行適配,但很多時候,雖然技術人員消耗了大量的時間去調整參數,但是環境的變化往往會影響模型的公式,這對于提升油田的生產效率非常不利。而在大數據應用后,通過搭建數字化模型就能夠有效解決這樣的問題。通常鉆井過程中會產生大量的數據,通過收集這些數據,就可以建立起完善的數字化應用場景模型。這個過程中,數字化模型的建立需要基于鉆井業務的全過程,其中包含了井口實時采集數據,要精確到秒數據,還有鉆頭鉆具的數據、鉆井液數據、地層數據、動力系統數據、施工參數等綜合體數據模型。之后通過改進算法,實現對數據模型的分析,計算機會對這些數據與鉆速的關系進行全面的分析,最終獲得鉆速最高的模型。油田鉆井可以根據這些鉆速模型進行自動化系統的研發,這也就在數字化的應用場景中實現了鉆井成本的下降和鉆井效率的提高。
在數字化油田大數據應用中,技術人員需要對數據安全進行升級,這些數據的安全包含了設計數據的安全、鉆井數據的安全、測錄數據的安全等內容。通常情況下,從采集到運用,技術人員都需要對數據進行存檔,在存檔的過程中要對數據的安全進行保護,尤其是在搭建模型時如果頻度數據出錯,對秒數據、米數據進行數據分析時也很容易造成差異,最終導致數字模型搭建失敗。因此,這個過程需要針對數據進行多重備份,在搭建數據模型時要保證有一用一備的數據,同時要對采集到的不同數據進行分別測試,這樣才能找出最合理的模型。
鉆井井場的實時數據通常是以秒為單位的,在實時處理數據時要保證間隔3~5 秒進行一次數據的采集和傳輸,這是實時處理安全的核心。在實際操作中,采集數據的設備、傳輸數據的設備的參數不同,自然會造成采集的數據不同,很多時候數據都處于混亂的狀態。在這種情況下,針對數據的處理工作是需要保證其安全的,這里所說的安全并非物理上的安全,而是指保證數據處理過程中不出現數據錯誤,如數據的字段、異常值、平均值等出錯,這些數據一直是模型設計的前提。
在應用大數據時,技術人員需要根據不同數據源的不同數據按照邏輯規則進行相應的整合,從而實現邏輯命題的數字化,將模型實際構成一個可用的產品。這種樣本集合的安全性通常也被稱為數據的整合安全。以鉆井數據的整合為例,鉆井的實時數據與鉆井液數據的整合是一個小型樣本的集數,如果加入管具數據、鉆頭數據、地層數據、動力數據等數據,就會形成一個大的數據樣本。這個數據樣本的整合同樣是需要安全系數的,尤其是樣本的集合并非簡單地將所有數據糅合到一起,而是以安全的邏輯結構對數據進行篩選,從而實現目標數據的有效整合。
智能化的產品模式需要以人工智能技術為引導,這個過程就會涉及邏輯關聯的問題。邏輯關聯是將整個油田業務中的流程節點進行邏輯的關聯,通過設計流程階段的特征來實現智能模型的建立,因此邏輯關聯的安全工作非常重要。當前,由于油田業務復雜的邏輯結構,技術人員很難使用模塊化的工具來安全地完成邏輯的關聯。這種情況需要應用到相關的代碼工具來實現邏輯關聯的安全,如可以使用TempoAI的代碼嵌入功能,然后使用Python 或R 語言來對算法進行拓展。
在數字化油田大數據應用中,建模是最為關鍵的一個步驟。在分析完樣本數據后,模型的框架才算基本形成,這個模型本質上便是大數據應用的結果,這個已經建好的模型需要進行安全的存儲后才能保證數據預測和分析的準確性。例如,決策樹模型在建模完成后形成參數的樹模型,這個樹模型可以針對新產生的數據進行分析。技術人員可以在這個模型中進行各類數據的分析,但前提是保證這個模型在建模的過程中具有高度安全性。只有在模型完成安全性的測試后,才能針對模型進行使用,而保證建模安全的前提是數據必須真實、有效。
大數據不是一門可以獨立應用的技術,而是與油田行業的結構邏輯緊密相關的,只有保證油田行業結構的邏輯安全,才能有效地分析數據和建立模型。這也給了數字化油田在應用大數據的過程中需要緊密聯系“應用安全”這個概念,從安全性方面來保證數字化油田轉型成功。