王繼鵬
(中海油能源發展工程技術物探技術研究所,廣東湛江 524057)
石油企業數據中心建設及數據服務
王繼鵬
(中海油能源發展工程技術物探技術研究所,廣東湛江 524057)
在這個數據爆炸的時代,數據服務的質量直觀的影響到企業的快速發展。若能實時準確的為業務人員提供數據服務,縮短業務人員收集數據和整理數據的時間,將使業務人員能有更多的精力投入到科研和生產中,直接為企業創造價值。基于此,本文對石油企業數據中心建設及數據服務進行了探討,主要從傳統的數據服務、數據中心的數據服務兩方面展開了論述。
數據服務 實時查詢 互連互通 業務對象 業務活動
石油企業數據中心的建設,從根本上解決傳統數據服務所面臨的問題,使石油企業的數據服務有了質的升華,從傳統的數據服務上升到依企業數據中心為依托的數據服務,從數據源頭上解決數據服務的及時性、完整性和準確性,為石油企業全面信息化的發展奠定了堅實的基礎。
石油企業在前期就意識到數據資料的重要性,為了保存好企業在科研或生產中產生的數據,在企業內部成立了檔案室,其目的首先是保存和管理好企業數據資料,其次是為有需要的員工提供資料借閱,這種員工本人親自到檔案室查找和借閱的方式就是傳統的數據服務(人工借閱資料)。
人工借閱資料一直沿用到現在,由于社會的進步和科技的發展,這種傳統的數據服務方式嚴重制約了企業的快速發展,主要制約了數據的以下幾個原則:
1.1 數據的及時性
由于生產或管理上的制約,科研或生產數據不能在第一時間被收集到檔案室,而是被動地等待業務人員把資料匯總過來,這樣數據從產生到采集入庫中間相隔很長一段時間,制約了數據的及時性原則。
1.2 數據的完整性
儲存在檔案室里的數據是根據管理的需要對資料進行編目的,編目比較單一,不是根據業務實際情況編目,而是檔案室為了管理或使用的便捷而進行的編目。數據資料的歸類方法不同,有的是根據資料本身的專業類別分類的,有的是根據作業本身進行分類的,一口井的資料根據不同的歸類方式進行保存和管理,在查找和應用時無法保證數據的齊全和完整,制約了數據的完整性原則。
1.3 數據的準確性
收集和匯總到檔案室里的數據,要經過專業的資源建設團隊進行資源建設,完成數據資料從非結構化文檔到結構化文檔的轉變。在資源建設過程中,沒有專業人員或專業軟件去審核,而是直接被采集到專業應用數據庫中,無法保證數據的質量,制約了數據的準確性原則。
企業在進入大數據時代,傳統的數據服務不能滿足現有的科研或生產需要,為了從數據源頭解決這一企業難題,提出數據中心建設項目,依托數據中心為企業提供數據服務,從而解決數據源頭采集、數據質量專業審核、數據實時查詢和數據推送。
2.1 數據采集
為了解決數據的及時性,改變原有的數據采集方式,變被動接收為主動采集,建立數據源頭采集系統,實現數據的源頭化采集。
數據源頭采集系統部署在數據產生的源頭,數據在產生或錄入時,依據數據采集規范,第一時間把數據資料采集或同步到采集系統中,完成數據資料的源頭采集,保證數據及時入庫。
2.2 數據質量檢查
為解決數據的準確性,使采集到數據庫中的數據都是準確的、可用的,需要建立一套數據質量審核系統。數據質量審核系統要完成數據的規范性和準確性審核。
針對數據本身的特性,制定相應的數據質量檢查規則,完成數據的規范性審核。數據本身由數據類型和數據值組成,根據數據類型的數字型和字符型進行質量檢查;根據數據值進行檢查,如井的頂界深度值一定不能大于井的底界深度值等。
制定數據的審核流程,讓數據產生的專業部門負責數據的審核,保證數據準確性。根據數據采集規范,劃分數據三級審核流程,保證數據的相對準確性。一級審核是專業工程師審核,二級審核是部門經理審核,三級審核是總技術師審核。
2.3 數據實時查詢
數據中心建設的最終目的是為了給業務人員提供數據共享和數據服務,由于數據中心數據庫建設分為兩部分,一部分是部署采集總庫;另一部分是部署對象數據庫。因為采集總庫和對象數據庫是不同類型的數據庫,所以提供的數據服務類型也不相同。依托采集總庫的數據服務是專業數據庫互聯互通,依托對象數據庫的數據服務是業務對象服務和業務服務。
2.3.1 專業數據庫互聯互通
企業前期根據管理和業務的需求已經建立的專業數據庫之間是相互獨立的,數據庫中的數據更是錯綜復雜,差異萬千。為了實現這些專業數據庫中的數據能相互共享,需要打通各專業數據庫之間的堡壘,建立互通機制。采集總庫的建設就是為了解決各專業數據庫互聯互通,實現各專業數據庫能關聯查詢。
采集總庫的建設首先是根據石油實際業務分析成果,參照現有在用專業數據庫數據表,整理出需要結構化管理的業務表,其次是把這些業務表與各專業數據庫中的數據表進行表間映射,完成專業數據庫到業務分析成果的映射工作,最后采集總庫投影,完成物理數據部署。采集總庫的數據表與各專業數據庫相互關聯,實現了各專業數據庫數據之間相互共享,在提供數據服務時,通過一個統一的數據查詢界面,能實現專業數據庫之間實時查詢或關聯查詢,查詢的數據很清楚是來自哪個專業數據庫或采集系統。對于這些打上數據來源標識的業務數據,業務人員在使用數據時就很清楚數據的價值,更有利于數據的使用。
2.3.2 業務對象服務
石油企業中的業務對象是對勘探開發業務范圍內所涉及到的事物進行的抽象,在石油企業相對比較固定,如鉆井工程中用到的井或井筒;油氣田生產業務所涉及到的設施油氣田或生產平臺等;地球勘探業務所涉及到的工區或線束;油氣田分析化驗業務中用到的樣品等。
如果把業務對象看作一個對象生命體,那它就具有周期性。我們可以利用對象的生命周期來組織數據和管理數據,實現業務對象與數據關聯查詢。對于單井來說,其所在不同的生命周期能產生出不同的業務數據,根據井的不同生命周期來組織數據,這樣業務對象-生命周期-業務數據三者之間就建立起了關系,業務人員可查詢業務對象所具有生命周期,也可查詢業務對象生命周期所具有的業務數據。
根據井的類型不同,可以把井分為探井和開發井,不同類型的井其生命周期也不相同。如探井的生命周期分為井位部署論證、井設計、施工、棄井和鉆后評價,而開發井的生命周期是井設計、建井、完井、生產和報廢。業務對象服務就是根據特定的業務對象,關聯出該業務對象的生命周期。
2.3.3 業務服務
業務服務是以業務資源編目的形式為業務人員提供數據服務,業務資源編目是通過業務分析方法,整理出來的企業業務賬單,其包含有業務域、業務、業務活動和業務活動成果資料。通過業務資料資源編目,企業的各項業務所有數據資料和產生哪些數據資料一目了然。業務人員要查詢數據時,根據不同數據需求,可以選擇不同的業務級別,查詢到所需要的業務活動,通過這些業務活動查詢到該業務活動所需的數據資料和自身所產生的數據資料。
2.4 數據推送
數據實時查詢只是被動的等待業務人員來查詢,為了實現數據價值最大化,可以根據業務人員使用數據的類型和業務范圍,預測業務人員業務數據需求,然后把業務或業務活動所需的數據推送給業務人員,滿足業務人員的數據需求,為業務人員在科研或生產過程中節約時間,提高工作效率。
2.4.1 關聯活動推送
所有的業務活動不是獨自發生的,一個業務活動的發生可能會影響其它業務活動或者是被其它業務活動所影響,所有業務活動之間是相互關聯的,只是這種聯系有的表現的很明顯有的表現的很隱蔽。根據業務活動之間這種關聯,可為業務人員提供關聯活動推送服務。如業務人員很關注巖心錄井這個業務活動,那么我們就把與巖心錄井業務活動有密切關聯的鉆井地質設計及其成果資料推送給業務人員。
2.4.2 主題推送
把勘探開發科研項目抽象成一個個主題,分析各個主題所涉及的業務活動,需要哪些業務活動成果資料等,然后把這些資料打包成一個個主題。根據實際業務場景把主題推送到對應的用戶登錄界面上,在科研或生產過程中,業務人員需要查詢該主題相關資料時,只需要選擇這個主題,就可以查詢到與這個主題相關的所有業務活動和業務成果資料信息,如石油科研機構有個綜合研究業務域中常用到的前期研究或者探井井位部署等,其中前期研究包含很多業務活動,查找資料比較麻煩,一旦建立前期研究主題后,在查詢這類資料時,就可以實現一鍵式查詢,實現數據主題服務的高效性。
數據中心建設是石油企業信息化建設過程中必不可少的重要環節,數據中心能有效地管理數據和提供數據服務,數據中心建設目的就是為利用或用活現有勘探開發數據,挖掘數據潛在的價值,為科研部門和生產部門提供基礎數據支持,為生產人員或科研人員提供數據服務,為實現石油企業的二次騰飛提供服務。
[1]陳付平,付保宇,凌雨,劉瑞超.石油勘探開發數據服務系統[J].計算機系統應用,2013(7):22-26.
[2]段鴻杰.油田企業數據中心建設思考[J].數字石油和化工,2007(6):7-10.
[3]余旭陽.關于數字油田的數據資源平臺建設.石油天然氣學報(江漢石油學院學報),2007(3):479-481.
圖四
(11)個人事務。1)查詢領導安排的工作;2)報告個人工作量;3)報告歸檔情況;4)申請計劃延期,并可查詢申請進度、申請是否審批;5)項目負責人和專業負責人可查看概預算數據,并輸入專業概預算數據;6)個人業績查詢。
(12)文件管理:技術資料、項目文件等各類文件的管理。
(13)消息提醒(飛秋自動發送消息提醒有關人員)。1)未完成工作;2)已完成,但基本工作量未填寫;3)缺少設計階段或者提資時間或者專業;4)缺少設計內容或者設計人;5)工作量系數、調整系數、質量評估應該大于0;6)項目數據完整,未做數據審核;7)數據已審核,未歸檔;8)已歸檔,未做歸檔審核;9)申請工作計劃延期,請審批;10)個人工作量排名。
研究如何更好的顯示員工的工作狀態和負荷狀態;研究如何更好的顯示項目進度,并對即將到期的項目預警;研究如何更好的提供管理層需要的相關信息用于幫助管理層決策。