張?jiān)隆±钣钚隆×簩W(xué)敏


關(guān)鍵詞: 油田工程技術(shù) 煤層氣 知識(shí)圖譜 智能檢索 檔案管理
中圖分類號(hào): G273.5;F276.1 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1672-3791(2024)01-0253-04
多年來,各油氣田公司在勘探開發(fā)研究與生產(chǎn)過程中積累了海量數(shù)據(jù)和研究成果,但仍面臨“有數(shù)據(jù)找不到、找到后無法用、知識(shí)經(jīng)驗(yàn)難共享、知識(shí)創(chuàng)新應(yīng)用難”等業(yè)務(wù)痛點(diǎn)[1]。隨著傳統(tǒng)油田企業(yè)檔案管理在數(shù)據(jù)利用方面的弊端日益凸顯,基于知識(shí)圖譜的勘探開發(fā)領(lǐng)域檔案管理系統(tǒng)構(gòu)建,將以更具邏輯性、強(qiáng)關(guān)聯(lián)性的方式,以更數(shù)據(jù)化、顆粒化的形式,更圖形化、可視化的狀態(tài),呈現(xiàn)數(shù)據(jù)之間的關(guān)系,為業(yè)務(wù)人員在勘探開發(fā)方案編制、油氣藏動(dòng)態(tài)建模、地質(zhì)工程一體化研究、數(shù)字孿生體建設(shè)等方面,提供高效快捷、隨時(shí)調(diào)用的數(shù)據(jù)信息,有助于節(jié)省業(yè)務(wù)人員搜集資料時(shí)間,提高勘探開發(fā)研究的精細(xì)度與符合率[2]。
1 煤層氣檔案知識(shí)庫建設(shè)方案
1.1 關(guān)鍵需求
1.1.1 檔案數(shù)據(jù)處理技術(shù)研究
對(duì)歷史檔案按照不同的業(yè)務(wù)維度進(jìn)行多維管理,構(gòu)建檔案知識(shí)圖譜庫,對(duì)結(jié)構(gòu)化數(shù)據(jù)實(shí)現(xiàn)相關(guān)結(jié)構(gòu)化數(shù)據(jù)映射導(dǎo)入;對(duì)檔案數(shù)據(jù)實(shí)現(xiàn)加工處理和知識(shí)充填,實(shí)現(xiàn)檔案資源信息的多維聚合。
1.1.2 檔案智能檢索技術(shù)研究
搭建統(tǒng)一搜索門戶,實(shí)現(xiàn)對(duì)檔案成果及相關(guān)數(shù)據(jù)信息的綜合查詢和融合搜索,支持搜索信息的關(guān)聯(lián)推薦。
1.1.3 檔案分析洞察技術(shù)研究
建立面向業(yè)務(wù)場(chǎng)景的可視化分析維度,優(yōu)選檔案資料全,數(shù)據(jù)質(zhì)量好的檔案成果,構(gòu)建面向業(yè)務(wù)應(yīng)用的標(biāo)簽體系和多維分析模型,支撐針對(duì)若干特定應(yīng)用場(chǎng)景的多維度業(yè)務(wù)數(shù)據(jù)分析需求[3]。
1.2 功能設(shè)計(jì)與建設(shè)內(nèi)容
1.2.1 總體思路
煤層氣公司勘探開發(fā)檔案知識(shí)庫建設(shè),按照“建、搜、用”總體思路,整體規(guī)劃、分步實(shí)施,持續(xù)迭代。依托煤層氣公司海量檔案知識(shí)資源,充分利用知識(shí)圖譜、自然語言處理、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等技術(shù),通過知識(shí)成果匯總、知識(shí)體系構(gòu)建、知識(shí)加工處理、知識(shí)圖譜構(gòu)建、知識(shí)融合,最終形成煤層氣勘探開發(fā)檔案智能管理系統(tǒng)。檔案知識(shí)支撐該系統(tǒng)能夠?yàn)楦黝悩I(yè)務(wù)場(chǎng)景提供智能應(yīng)用[4],實(shí)現(xiàn)檔案知識(shí)的有效支撐總體設(shè)計(jì)思路如圖1 所示。
1.2.2 總體架構(gòu)與數(shù)據(jù)架構(gòu)
本系統(tǒng)搜索功能的核心技術(shù)ES 和知識(shí)圖譜均采用源技術(shù)進(jìn)行二次自主開發(fā),并沒有采用國外商業(yè)軟件,實(shí)現(xiàn)產(chǎn)品、技術(shù)自主可控,從根本上避免卡脖子技術(shù),防止技術(shù)斷供。總體上分為數(shù)據(jù)層、平臺(tái)層以及應(yīng)用層3 個(gè)層面,通過“數(shù)據(jù)處理與管理—AI 賦能—數(shù)據(jù)應(yīng)用”的全鏈路打通,實(shí)現(xiàn)知識(shí)圖譜技術(shù)在勘探開發(fā)檔案管理領(lǐng)域創(chuàng)新性的落地化應(yīng)用[5],總體架構(gòu)與數(shù)據(jù)架構(gòu)如圖2 所示。
1.2.3 知識(shí)體系構(gòu)建思路
從對(duì)象域、業(yè)務(wù)域展開知識(shí)分級(jí)分類;基于企業(yè)數(shù)據(jù)模型(如EPDM 等),參考國內(nèi)外工業(yè)界和學(xué)術(shù)界的標(biāo)準(zhǔn),構(gòu)建形成統(tǒng)一的綜合知識(shí)屬性分類標(biāo)準(zhǔn);梳理知識(shí)與知識(shí)、知識(shí)與對(duì)象、知識(shí)與業(yè)務(wù)之間的關(guān)聯(lián)關(guān)系,形成關(guān)系網(wǎng)絡(luò)[6]。知識(shí)體系構(gòu)建思路如圖3 所示。
檔案文檔構(gòu)建關(guān)系是圍繞核心管理目標(biāo)的對(duì)象知識(shí)體系。在明確構(gòu)建范圍的基礎(chǔ)上,選取相關(guān)對(duì)象構(gòu)建對(duì)象知識(shí)體系。本項(xiàng)目中屬性來源于數(shù)據(jù)湖的表結(jié)構(gòu),數(shù)據(jù)從數(shù)據(jù)湖接入。
業(yè)務(wù)知識(shí)體系是按照業(yè)務(wù)所屬關(guān)系,針對(duì)業(yè)務(wù)管理流程進(jìn)行體系梳理,對(duì)勘探開發(fā)檔案按照業(yè)務(wù)維度進(jìn)行分類,對(duì)象與業(yè)務(wù)知識(shí)體系構(gòu)建思路如圖4 所示。
1.2.4 檔案分析研究思路
整合煤層氣公司勘探開發(fā)各類資料形成知識(shí)圖譜,建立面向業(yè)務(wù)場(chǎng)景的可視化分析維度,優(yōu)選檔案資料全,數(shù)據(jù)質(zhì)量好的檔案成果,構(gòu)建面向業(yè)務(wù)應(yīng)用的標(biāo)簽體系和多維分析模型,支撐針對(duì)特定應(yīng)用場(chǎng)景的多維度業(yè)務(wù)數(shù)據(jù)分析。檔案分析研究思路如圖5 所示。
1.2.5 主要功能
(1)實(shí)現(xiàn)煤層氣勘探開發(fā)檔案數(shù)據(jù)治理工作,探索出勘探開發(fā)檔案的數(shù)據(jù)治理方法。實(shí)現(xiàn)對(duì)歷史檔案數(shù)據(jù)按照不同的業(yè)務(wù)維度建立標(biāo)簽分類體系;實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)按照標(biāo)簽體系進(jìn)行多標(biāo)簽分類;實(shí)現(xiàn)對(duì)檔案文件的主題分類、檔案名稱、密級(jí)、保密時(shí)間、組織機(jī)構(gòu)、歸檔時(shí)間、編寫責(zé)任人等信息進(jìn)行抽取,支持對(duì)檔案文件元數(shù)據(jù)的快速查詢;實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)庫的建立,支持Excel 等格式的半結(jié)構(gòu)化數(shù)據(jù)入庫,并對(duì)接現(xiàn)有結(jié)構(gòu)化數(shù)據(jù)庫,支持相關(guān)結(jié)構(gòu)化數(shù)據(jù)映射導(dǎo)入;基于檔案分類管理及知識(shí)標(biāo)簽體系,實(shí)現(xiàn)檔案知識(shí)圖譜庫的構(gòu)建、檔案數(shù)據(jù)加工處理與知識(shí)充填,檔案資源信息的多維聚合。
(2)搭建勘探開發(fā)主干知識(shí)圖譜庫,形成一站式檔案檢索平臺(tái)。搭建統(tǒng)一搜索門戶,實(shí)現(xiàn)對(duì)檔案成果及相關(guān)數(shù)據(jù)信息的綜合查詢和融合搜索;實(shí)現(xiàn)基于關(guān)鍵詞、語義理解等多種方式的檔案信息的統(tǒng)一搜索和圖譜查詢,支持搜索信息的關(guān)聯(lián)推薦;按照不同的用戶權(quán)限、組織機(jī)構(gòu)等實(shí)現(xiàn)對(duì)檔案信息的授權(quán)管理。
(3)建設(shè)相似井知識(shí)推薦、致密氣開發(fā)特征指標(biāo)預(yù)測(cè)分析兩個(gè)典型應(yīng)用場(chǎng)景。
1.3 建設(shè)效果
從技術(shù)沉淀視角,為人工智能技術(shù)創(chuàng)新應(yīng)用建立堅(jiān)實(shí)基礎(chǔ)。初步實(shí)現(xiàn)煤層氣勘探開發(fā)檔案數(shù)據(jù)治理工作,探索出勘探開發(fā)檔案的數(shù)據(jù)治理方法;基于模塊化、服務(wù)化、組件化建設(shè)理念,平臺(tái)上沉淀形成一系列智能化知識(shí)管理共享應(yīng)用組件;在知識(shí)加工處理和應(yīng)用場(chǎng)景建設(shè)中,沉淀形成了一系列知識(shí)抽取、融合推薦及智能預(yù)測(cè)模型算法[7];提高了檔案知識(shí)應(yīng)用人員的檢索效率,提供多維一站式檢索能力;通過平臺(tái)建設(shè)積累經(jīng)驗(yàn),整合融合各類業(yè)務(wù)、技術(shù)及知識(shí)資源,為更大范圍創(chuàng)新研發(fā)建立基礎(chǔ)。
從系統(tǒng)建設(shè)視角,在公司智能化知識(shí)共享領(lǐng)域取得系列實(shí)質(zhì)性成果。在公司范圍首次研發(fā)形成“建、搜、用”三大類知識(shí)管理共享應(yīng)用平臺(tái),探索煤層氣勘探開發(fā)知識(shí)體系,完成了27 萬+檔案及結(jié)構(gòu)化相關(guān)數(shù)據(jù)接入,創(chuàng)新形成了主干圖譜庫;在公司范圍構(gòu)建了一站式智能搜索引擎,通過知識(shí)關(guān)聯(lián)分析形成了煤層氣公司勘探開發(fā)領(lǐng)域?qū)俚摹笆桶俣取保蝗诤隙喾N推薦邏輯,創(chuàng)新性地打造基于其 相似關(guān)系的知識(shí)推薦體系;融合知識(shí)圖譜和人工智能技術(shù)創(chuàng)新,落地形成了一系列可示范、可推廣的典型業(yè)務(wù)應(yīng)用場(chǎng)景。
從資源共建視角,為各類知識(shí)資源共享共建搭建平臺(tái)環(huán)境。提升煤層氣公司的檔案數(shù)據(jù)管理能力,提供更加靈活多維的知識(shí)管理能力;通過對(duì)檔案知識(shí)的深度挖掘,實(shí)現(xiàn)知識(shí)再利用,利用已沉淀的知識(shí)服務(wù)新業(yè)務(wù)場(chǎng)景[8]。
2 結(jié)語
煤層氣公司通過開展基于知識(shí)圖譜的檔案管理系統(tǒng)建設(shè),提升了檔案數(shù)據(jù)管理能力,為檔案知識(shí)資源的共享共建搭建了平臺(tái)環(huán)境。系統(tǒng)的體系架構(gòu)符合云原生、微服務(wù)發(fā)展方向,具有先進(jìn)性;通過系統(tǒng)對(duì)檔案知識(shí)的深度挖掘,實(shí)現(xiàn)知識(shí)再利用,提供更加靈活多維的知識(shí)管理和服務(wù)能力,為業(yè)務(wù)改革和技術(shù)創(chuàng)新提供有效支撐。