張萍 凌艷璽 郭林 張佳怡 姬銀秀



摘要:針對(duì)渤海油田勘探開(kāi)發(fā)中積累的海量數(shù)據(jù)管理難度大、利用效率低的現(xiàn)實(shí),研制完成了渤海油田項(xiàng)目知識(shí)管理平臺(tái)。該平臺(tái)以勘探開(kāi)發(fā)生產(chǎn)項(xiàng)目日常管理為主線(xiàn),采用了AngularJS 2、restful、OpenCL并行與大數(shù)據(jù)分析等技術(shù)建設(shè)該平臺(tái),建成后平臺(tái)具有數(shù)據(jù)庫(kù)兼容性強(qiáng)、功能體系完整、可擴(kuò)展性強(qiáng)、輕量化等特點(diǎn),為勘探石油行業(yè)的科研及知識(shí)管理提供強(qiáng)有力技術(shù)保障。
關(guān)鍵詞:項(xiàng)目知識(shí)管理平臺(tái);數(shù)據(jù)庫(kù);OpenCL;AngularJS 2.0;大數(shù)據(jù)分析;輕量化(Web);可自維護(hù)
中圖分類(lèi)號(hào):TP311.13? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)30-0145-03
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Construction and Application of Project and Knowledge Management Platform for Bohai Oil field
ZHANG Ping1,LING Yan-xi2,GUO Lin2,ZHANG Jia-yi2,JI Yin-xiu2
(1. CNOOC Energy Tech-Drilling and Production Co., Tianjin300452, China;2. Tianjin Branch of CNOOC Ltd., Tianjin300459,China)
Abstract: In response to the fact that the management of the massive data accumulated in the exploration and development of the Bohai Oilfield is difficult and the utilization efficiency is low, the knowledge management platform for the Bohai Oilfield project has been developed.This platform takes the management of oil exploration, development and production as the main line, adopting AngularJS 2.0, RESTful, OpenCL (Open Computing Language) parallel computation, big dataanalysis and other technologies, integrating lots of characteristics, such as strong database compatibility, powerful function system, strong scalability and more lightweight. This platform provides powerful technical support for scientific research and knowledge management of petroleum exploration industry.
Keywords: knowledge management platform; database; OpenCL; AngularJS 2.0; big data analysis; lightweight Web; self-maintaining
1引言
渤海石油研究院經(jīng)過(guò)多年數(shù)據(jù)庫(kù)的建設(shè)與積累,形成了勘探庫(kù)、物探庫(kù)、測(cè)井庫(kù)、化驗(yàn)庫(kù)、文檔庫(kù)及儲(chǔ)量庫(kù)等多個(gè)數(shù)據(jù)庫(kù)系統(tǒng),每個(gè)數(shù)據(jù)庫(kù)不僅系統(tǒng)不同,前端的應(yīng)用也是相對(duì)獨(dú)立的,造成了各數(shù)據(jù)庫(kù)之間、各前端應(yīng)用之間均不能互相連接調(diào)用,嚴(yán)重影響了相關(guān)數(shù)據(jù)利用效率。為解決此問(wèn)題,基于“多庫(kù)合一”的思想研制了渤海油田項(xiàng)目知識(shí)管理平臺(tái)。該平臺(tái)的建成為項(xiàng)目日常管理、數(shù)據(jù)資料檢索等提供了便捷,并具備良好的可擴(kuò)展性和可自維護(hù)性。
該平臺(tái)設(shè)計(jì)為四個(gè)層級(jí):最底層為數(shù)據(jù)庫(kù)層,主要包括系統(tǒng)數(shù)據(jù)庫(kù)、項(xiàng)目管理與成果文檔數(shù)據(jù)庫(kù)、物探數(shù)據(jù)庫(kù)、中間成果數(shù)據(jù)庫(kù)、勘探基礎(chǔ)數(shù)據(jù)庫(kù)、化驗(yàn)分析數(shù)據(jù)庫(kù)、測(cè)井?dāng)?shù)據(jù)庫(kù);第二層為核心功能體系層,主要包括數(shù)據(jù)集成訪問(wèn)、知識(shí)成果管理、研究項(xiàng)目管理和日常工作管理;第三層為專(zhuān)業(yè)應(yīng)用子系統(tǒng)層,主要包括測(cè)井大數(shù)據(jù)分析、月報(bào)子系統(tǒng)、井位審核流程子系統(tǒng)、開(kāi)發(fā)圖件審核流程子系統(tǒng);最頂層是用戶(hù)層,面向科研人員和管理人員,如圖1所示。
2系統(tǒng)架構(gòu)
該系統(tǒng)使用B/S架構(gòu),即瀏覽器和服務(wù)器架構(gòu)模式。這種模式實(shí)現(xiàn)了交互操作輕量化,最大程度減少了操作過(guò)程,簡(jiǎn)化了系統(tǒng)的開(kāi)發(fā)和維護(hù)過(guò)程,從而提高效率[1]。系統(tǒng)前端頁(yè)面使用HTML5和(基于JavaScript的)AngularJS2框架[2]。使前端交互界面樣式豐富,交互操作響應(yīng)迅速。同時(shí)在構(gòu)建Web應(yīng)用程序時(shí),能靈活、快速構(gòu)建Web應(yīng)用,提高Web 開(kāi)發(fā)和維護(hù)速度[3]。系統(tǒng)后端服務(wù)使用私有云軟件架構(gòu),支持柔性部署。使后臺(tái)服務(wù)既可以部署在一臺(tái)服務(wù)器上,也可以部署在多臺(tái)服務(wù)器上,保持流量動(dòng)態(tài)平衡。同時(shí)應(yīng)用Web數(shù)據(jù)服務(wù)接口技術(shù),提供符合Restful標(biāo)準(zhǔn)的WebAPI和統(tǒng)一數(shù)據(jù)模型,與系統(tǒng)前端或其他系統(tǒng)無(wú)縫連接,來(lái)訪問(wèn)項(xiàng)目知識(shí)庫(kù)的數(shù)據(jù)、文檔、圖件和項(xiàng)目信息[4]。系統(tǒng)總體框架如圖2所示。
3功能實(shí)現(xiàn)及關(guān)鍵技術(shù)
根據(jù)對(duì)現(xiàn)狀及數(shù)據(jù)的流向和主要用途進(jìn)行分析,我們將多個(gè)數(shù)據(jù)庫(kù)進(jìn)行整理并分類(lèi),首先保留部分原有數(shù)據(jù)庫(kù)及其應(yīng)用,其次對(duì)現(xiàn)有的部分?jǐn)?shù)據(jù)庫(kù)進(jìn)行必要的整合,最后根據(jù)科研人員的實(shí)際需求,建立新的數(shù)據(jù)庫(kù)。該平臺(tái)建設(shè)的一個(gè)重要原則是具有可開(kāi)放性,為平臺(tái)的進(jìn)一步擴(kuò)充提供接口,還可以連接任意第三方的數(shù)據(jù)庫(kù)。同時(shí)底層數(shù)據(jù)庫(kù)之間呈網(wǎng)狀分布,通過(guò)完整、統(tǒng)一的數(shù)據(jù)字典進(jìn)行管理,實(shí)現(xiàn)各個(gè)數(shù)據(jù)庫(kù)之間資料的共享與利用。
3.1數(shù)據(jù)管理模塊
數(shù)據(jù)管理模塊具有數(shù)據(jù)加載、修改和刪除等功能,不僅包含在線(xiàn)表單式數(shù)據(jù)錄入方法,還可根據(jù)各類(lèi)結(jié)構(gòu)化數(shù)據(jù)表,定制數(shù)據(jù)加載模板,實(shí)現(xiàn)數(shù)據(jù)的批量加載功能。
該模塊除了能處理結(jié)構(gòu)化數(shù)據(jù)外,針對(duì)LAS格式的測(cè)井曲線(xiàn)數(shù)據(jù)文件,在數(shù)據(jù)加載入庫(kù)時(shí),將LAS文件的頭文件信息、數(shù)據(jù)信息分別保存到數(shù)據(jù)庫(kù)中,既保留了完整的原數(shù)據(jù)格式,又能滿(mǎn)足大數(shù)據(jù)分析時(shí)的需求。而對(duì)于文檔、圖件的管理,不僅可以實(shí)現(xiàn)批量加載,還可在瀏覽器中直接查看,同時(shí)為滿(mǎn)足文檔、圖件管理頁(yè)面的層進(jìn)關(guān)系,平臺(tái)通過(guò)可自定義視圖、索引等方式,實(shí)現(xiàn)頁(yè)面便捷化的管理功能。平臺(tái)中設(shè)立不同角色、不同權(quán)限的用戶(hù)安全體系,滿(mǎn)足不同用戶(hù)對(duì)數(shù)據(jù)進(jìn)行修改及刪除等功能的需求。
3.2工作流管理模塊
該平臺(tái)建立了多個(gè)精細(xì)化、專(zhuān)業(yè)化的工作流程,包括井位審核流程、地震采集設(shè)計(jì)審核流程、井地層成果審核流程、井地化成果審核流程、井儲(chǔ)層成果審核流程、圖件審核流程、化驗(yàn)送樣及取樣工作流程等。通過(guò)編寫(xiě)工作流服務(wù)引擎和輕量化(WEB)頁(yè)面,完成與之對(duì)應(yīng)的業(yè)務(wù)數(shù)據(jù)處理過(guò)程。每個(gè)工作流節(jié)點(diǎn)中,均包含過(guò)程的維護(hù)者、監(jiān)控者和實(shí)例化者,過(guò)程維護(hù)者對(duì)過(guò)程進(jìn)行維護(hù),過(guò)程監(jiān)控者可以對(duì)這個(gè)過(guò)程進(jìn)行完整的監(jiān)督和控制,過(guò)程實(shí)例化者可將過(guò)程模型轉(zhuǎn)化為一個(gè)過(guò)程實(shí)例。工作流引擎將項(xiàng)目流程歸類(lèi),為每類(lèi)流程模型開(kāi)發(fā)(定制)服務(wù)模塊。流程中涉及的每個(gè)活動(dòng)節(jié)點(diǎn)都單獨(dú)封裝成“申請(qǐng)-審核”結(jié)構(gòu)的模型。無(wú)論流程中涉及多少個(gè)節(jié)點(diǎn)、多少種數(shù)據(jù)模板,都可以通過(guò)配置文件定義實(shí)現(xiàn),從而滿(mǎn)足用戶(hù)可自維護(hù)的需求。工作流服務(wù)技術(shù)思路如圖3所示。
該平臺(tái)通過(guò)這些專(zhuān)業(yè)流程的建設(shè),在實(shí)現(xiàn)項(xiàng)目協(xié)作、項(xiàng)目管理、項(xiàng)目過(guò)程的追溯、知識(shí)成果的累積與保存的同時(shí),還能減少紙質(zhì)圖件的打印,降本增效,讓工作更環(huán)保。
3.3數(shù)據(jù)搜索功能模塊
該平臺(tái)在滿(mǎn)足常規(guī)數(shù)據(jù)查詢(xún)功能外,還支持自定義和常用分組查詢(xún)方式,并能在查詢(xún)結(jié)果中再進(jìn)行搜索。對(duì)查詢(xún)結(jié)果,除支持按數(shù)據(jù)項(xiàng)或按數(shù)值范圍分組統(tǒng)計(jì)外,還支持圖形顯示功能,包括柱狀圖、折線(xiàn)圖和餅圖等。對(duì)于查詢(xún)正在進(jìn)行中和已完成的工作流項(xiàng)目,平臺(tái)支持對(duì)該項(xiàng)目邏輯視圖中各項(xiàng)內(nèi)容的搜索,包括項(xiàng)目流程名稱(chēng)、登記時(shí)間、項(xiàng)目參與者、數(shù)據(jù)和文檔等。
基于平臺(tái)中不僅涵蓋勘探數(shù)據(jù)庫(kù)、測(cè)井?dāng)?shù)據(jù)庫(kù)、化驗(yàn)庫(kù)、儲(chǔ)量庫(kù)和物探數(shù)據(jù)庫(kù)等的各類(lèi)結(jié)構(gòu)化數(shù)據(jù),還包含各類(lèi)會(huì)議資料、成果文檔、技術(shù)交流文檔、培訓(xùn)文檔、各類(lèi)單井圖件、構(gòu)造圖件和工作流程等非結(jié)構(gòu)化數(shù)據(jù)。在平臺(tái)中快速搜索相互關(guān)聯(lián)的數(shù)據(jù)和文檔成為關(guān)鍵,通過(guò)給定井名、構(gòu)造名稱(chēng)、油田名稱(chēng)等關(guān)鍵信息,在全局范圍內(nèi)可將相互關(guān)聯(lián)的數(shù)據(jù)、圖件及文檔等信息顯示在一個(gè)頁(yè)面中,并能將集成數(shù)據(jù)查詢(xún)的結(jié)果進(jìn)行打包下載。
3.4大數(shù)據(jù)分析模塊
為最大限度地滿(mǎn)足科研人員的需求,本平臺(tái)還增加了大數(shù)據(jù)分析模塊,利用分類(lèi)與預(yù)測(cè)、聚類(lèi)分析、關(guān)聯(lián)規(guī)則、時(shí)序模式、偏差檢測(cè)等方法,挖掘測(cè)井曲線(xiàn)與地層巖性之間的對(duì)應(yīng)關(guān)系,為命中概率進(jìn)行巖性識(shí)別提供依據(jù)[5]。
通過(guò)搭建并行計(jì)算平臺(tái),實(shí)現(xiàn)數(shù)據(jù)分析與計(jì)算過(guò)程。為保證數(shù)據(jù)計(jì)算速度,平臺(tái)采用OpenCL并行計(jì)算技術(shù),充分利用GPU強(qiáng)大的并行計(jì)算能力以及與CPU的協(xié)同工作,進(jìn)行性能優(yōu)化,更高效地完成大規(guī)模的、并行度高的計(jì)算[6-10]。
大數(shù)據(jù)分析基本過(guò)程包括:定義挖掘目標(biāo)、數(shù)據(jù)取樣、數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、挖掘建模和模型評(píng)價(jià)。首先進(jìn)行前期準(zhǔn)備工作,將測(cè)井曲線(xiàn)名稱(chēng)和地層巖性名稱(chēng)規(guī)范化;然后,加入?yún)^(qū)域位置信息,形成區(qū)域位置-測(cè)井曲線(xiàn)-地層巖性結(jié)構(gòu)的關(guān)系數(shù)據(jù);最后,根據(jù)區(qū)域位置、深度段和測(cè)井曲線(xiàn),分析對(duì)應(yīng)區(qū)域位置和深度段的地層巖性的可能性。根據(jù)錄井?dāng)?shù)據(jù)得到有效的測(cè)井曲線(xiàn)組合與地層巖性的對(duì)應(yīng)關(guān)系,如:在某一個(gè)區(qū)域內(nèi),指定深度范圍的GR、ZDEN、CNCF等曲線(xiàn)數(shù)值組合,與玄武巖具有對(duì)應(yīng)關(guān)系,在 19 個(gè)相似測(cè)井曲線(xiàn)對(duì)應(yīng)的地層中,有 18 個(gè)地層都是玄武巖,通過(guò)大數(shù)據(jù)分析,新地層是玄武巖的命中概率是95%。分析過(guò)程,如圖4所示。
3.5可自維護(hù)模塊
該平臺(tái)界面呈現(xiàn)內(nèi)容全部可以通過(guò)調(diào)用配置文件實(shí)現(xiàn),而不用重新編輯程序。配置文件內(nèi)容根據(jù)實(shí)際情況可以進(jìn)行自定義,以數(shù)據(jù)查詢(xún)配置文件為例:
首先定義數(shù)據(jù)源配置表,將平臺(tái)底層的數(shù)據(jù)庫(kù)或其他第三方數(shù)據(jù)庫(kù)中的數(shù)據(jù)表進(jìn)行整理,將字段信息增加到數(shù)據(jù)源配置表中。配置好的數(shù)據(jù)源顯示在界面中時(shí),需要定義數(shù)據(jù)管理配置表。在數(shù)據(jù)管理配置表中,則定義了數(shù)據(jù)的具體顯示格式(表單形式或者網(wǎng)格形式)、表頭信息、頁(yè)面高度、頁(yè)面寬度等內(nèi)容。
當(dāng)整體結(jié)構(gòu)保持不變時(shí),快速搜索模塊、數(shù)據(jù)查詢(xún)模塊、文檔、圖件管理模塊和工作流管理模塊均能通過(guò)配置文件的方式進(jìn)行系統(tǒng)自維護(hù),實(shí)現(xiàn)快速更新的效果。數(shù)據(jù)安全方面,也可通過(guò)讀寫(xiě)日志實(shí)現(xiàn)對(duì)敏感數(shù)據(jù)(如:儲(chǔ)量數(shù)據(jù))的管理,避免因?yàn)榘踩颍姑舾袛?shù)據(jù)成為孤島。數(shù)據(jù)查詢(xún)配置文件,如圖5所示。
4平臺(tái)應(yīng)用效果
項(xiàng)目知識(shí)管理平臺(tái)使用最新IT技術(shù)、系統(tǒng)開(kāi)發(fā)框架及思想,完成了輕量化(Web)系統(tǒng)界面。包括快速搜索界面、數(shù)據(jù)查詢(xún)界面、文檔、圖件管理界面和工作流管理界面。其中快速搜索界面是在數(shù)據(jù)、文檔、圖件和工作流等全局范圍內(nèi)搜索并分頁(yè)顯示。該平臺(tái)推廣應(yīng)用近2年來(lái),登錄用戶(hù)涵蓋渤海石油研究院全部科研人員,保證科研人員在日常工作中產(chǎn)生的數(shù)據(jù)和文檔能及時(shí)加載入庫(kù),平臺(tái)中的數(shù)據(jù)不斷累積,又能最大限度滿(mǎn)足科研人員在搜集、整理數(shù)據(jù)時(shí)的需求。平臺(tái)主界面,如圖6所示。
工作流管理界面,從項(xiàng)目啟動(dòng)-項(xiàng)目數(shù)據(jù)錄入-項(xiàng)目參與者分配,到項(xiàng)目審核-項(xiàng)目進(jìn)度管理的各階段,都已實(shí)現(xiàn)輕量化操作。通過(guò)該平臺(tái)登記的井位審核流程已超過(guò)100口井,在滿(mǎn)足用戶(hù)科研生產(chǎn)與管理工作等需求的同時(shí)也保障了數(shù)據(jù)安全與有效。
5結(jié)論
項(xiàng)目知識(shí)管理平臺(tái)采用輕量化(Web)、可自維護(hù)系統(tǒng),使用戶(hù)操作更便捷,確保數(shù)據(jù)更安全。在不斷完善對(duì)專(zhuān)業(yè)數(shù)據(jù)的管理和分析能力的同時(shí),還實(shí)現(xiàn)了知識(shí)成果的累積與追溯。用?戶(hù)使用率的不斷提升,說(shuō)明系統(tǒng)定位是符合實(shí)際工作情況的。對(duì)管理人員而言,它是一個(gè)項(xiàng)目管理平臺(tái),既可以實(shí)現(xiàn)業(yè)務(wù)過(guò)程的實(shí)時(shí)管理,又可以實(shí)現(xiàn)對(duì)企業(yè)知識(shí)資產(chǎn)的有效利用;對(duì)科研人員來(lái)說(shuō),它既是一個(gè)工作平臺(tái),又是一個(gè)面向各種專(zhuān)業(yè)數(shù)據(jù)庫(kù)和項(xiàng)目數(shù)據(jù)庫(kù)的應(yīng)用界面。經(jīng)過(guò)多年的建設(shè)與應(yīng)用,本平臺(tái)對(duì)充分利用數(shù)據(jù)庫(kù)資源,提高工作效率,保障安全生產(chǎn),都發(fā)揮著越來(lái)越重要的作用。
參考文獻(xiàn):
[1] 陳志鵬,張捷,楊波,等.基于C/S 架構(gòu)的后備干部信息管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].工業(yè)控制計(jì)算機(jī),2016,29(10):85-86.
[2] 宋濤,王玉峰,呂思思.在下一代互聯(lián)網(wǎng)應(yīng)用中的AngularJS技術(shù)概述[J].科技視界,2016(19):237-237.
[3] 董英茹.簡(jiǎn)談AngularJS在下一代Web開(kāi)發(fā)中的應(yīng)用[J].軟件工程師,2015(5):30-31.
[4] 周紹景,應(yīng)杰,潘宏斌,等.RESTful架構(gòu)的應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用,2018,36(5):59-60.
[5] 張引,陳敏,廖小飛.大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J].計(jì)算機(jī)研究與發(fā)展,2013,50(S2):216-233.
[6] 李森,李新亮,王龍,等.基于OpenCL的并行方腔流加速性能分析[J].計(jì)算機(jī)應(yīng)用研究,2011,28(4):1401-1403.
[7] 楊海燕,史曉華,孫清越,等.面向OpenCL的GPGPU微基準(zhǔn)測(cè)試程序集的研究與實(shí)現(xiàn)[J].系統(tǒng)工程與電子技術(shù),2013,35(12):2631-2642.
[8] Khronosgroup.OpenCL-the open standard for parallel programming of heterogeneous systems[EB/OL].http://www.khronos.org/opemcl/.
[9] NVIDIA.NVIDIA GeForce 8800 GPU architecture overview,TB-02787-001_V01[R].Santa Clara, CA, USA:NVIDIA Corporation,2006.
[10] 崔繼岳,梅魁志,劉冬冬,等.面向OpenCL的MaliGPU仿真器構(gòu)建研究[J].西安交通大學(xué)學(xué)報(bào),2015,49(2):20-24.
【通聯(lián)編輯:王力】