999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Neo4j圖數據庫的工程檔案知識圖譜構建及應用

2022-06-15 12:50:52趙雪芹楊一凡于文靜
檔案與建設 2022年5期

趙雪芹 楊一凡 于文靜

摘 要:文章對當前工程檔案知識管理現狀進行分析,認為其在知識開發方面存在局限。為推動工程檔案知識開發與利用,將Protégé工具與Neo4j圖數據庫相結合,對碎片化的工程檔案數據進行知識建模與關聯聚合,實現知識層面的數據融合與集成,構建可視化的工程檔案知識圖譜,為高效存儲、快速組織和精準表達工程檔案實體及數據關聯提供支持。在其應用層面上介紹相關服務功能,為工程檔案知識智能服務提供新方向。

關鍵詞:工程檔案;圖數據庫;Neo4j;知識圖譜;知識管理

我國社會經濟發展已邁入知識經濟時代,工程檔案管理工作的重心要從“檔案庫”轉向“知識庫”。傳統的工程檔案管理辦法重在檔案數字化建設,借助信息集成系統解決檔案資源分散的問題,忽視了工程檔案數據挖掘、語義分析等功能,致使工程檔案信息系統“弱智能化”。若對工程檔案進行本體構建、實體提取并聯結實體間關系,形成可視化的工程檔案知識圖譜,能直觀地觀察檔案實體間的關聯,快速便捷地定位到相應環節的具體行為,這種知識組織方式不僅能有效提升檔案管理工作效率,還有利于挖掘檔案數字資源的隱性知識,實現多源異構工程檔案知識的融合,為企業工程建設項目決策與預測提供有效參考。

筆者調研發現目前還未有從Neo4j圖數據庫視角構建工程檔案知識圖譜來提升工程檔案管理效率相關研究。為推動工程檔案資源管理精細化,本文借助“某江水資源配置工程”檔案資料,提出基于Neo4j圖形數據庫構建工程檔案知識圖譜,試圖以圖數據形式來存儲檔案資源,為工程檔案智能化管理提供新思路。

一、 工程檔案知識管理現狀及知識圖譜適用性分析

基于圖數據庫構建知識圖譜是否適用于工程檔案知識管理,還需結合工程檔案知識管理現狀及圖數據庫特性進行探討。

1. 工程檔案知識管理現狀分析

工程檔案所蘊含的工程建設知識、經驗等對工程建設過程回溯和新工程項目建設參考都具備重要意義。互聯網技術驅動下工程檔案管理模式雖有大邁步式突破,但在知識管理與服務上仍舊不足,具體表現在以下方面:

(1)工程檔案知識開發力度不夠。合理開發利用工程檔案知識是有效提升工程檔案價值的方式,也是社會發展過程中提高檔案工作地位的重要環節。從國家檔案局發布的《國家檔案局辦公室關于2021年度全國經濟科技檔案資源開發利用案例評選結果的通報》來看,目前紅色檔案、企業檔案科技開發力度較大,而工程檔案并不突出。工程檔案管理部門“重保存、輕利用”觀念亟待突破,需著力提升工程檔案知識挖掘程度和利用效率。[1]

(2)工程檔案知識語義關聯度低。現有的工程檔案管理系統雖然存儲了大量工程建設資料,絕大多數都按照檔號歸類齊整,但檔案資源間的聯系構建并不緊密,甚至沒有對其關聯關系進行梳理分析,各冊檔案間形成封閉狀態。[2]工程檔案知識未實現深度聯結,使得深層次、隱性化的知識難以被挖掘,工程檔案知識體系無法擴充和替代,降低了工程檔案知識成果的產出。

(3)工程檔案知識單元較為分散。工程檔案源于項目建設中不同部門的生產過程,也由不同的職能部門分管,即便當前多數工程檔案管理系統實現檔案資料統一管理,但工程檔案知識單元并未實現聚合。這導致用戶查閱某部分關鍵信息時,需要不斷瀏覽多冊檔案資料,不僅瀏覽了大量與目標信息無關的內容,還可能遺漏關鍵信息。

2. Neo4j圖數據庫的特點

Neo4j圖數據庫是一種利用圖形結構存儲和查詢數據的數據庫系統,其基本組成結構是:節點、關系和屬性。Neo4j與傳統的SQL等數據庫相比,具備圖形結構數據存儲和便利的功能,靈活的圖存儲結構能對數據結構較為復雜的關聯關系、動態關系變化較快的海量數據存儲和管理,解決了關系型數據庫存儲圖結構數據時出現的空間浪費等問題。它不僅能對數據關聯關系進行快速匹配、遍歷和查找,同時出于天生的可擴展性,還適用于高度關聯的數據關系建模。由于圖數據庫能處理關系高度復雜的數據,甚至能根據歷史數據預測未來走勢,因而被廣泛應用于社交網絡、地理空間、數據管理等多個領域。[3]

3. 知識圖譜在工程檔案知識管理中的適用性

一是能夠實現工程檔案資源的知識挖掘。工程檔案涉及圖紙、成本清單、會議紀要等多種形式,涵蓋大量知識,但現有的工程檔案管理系統缺乏揭示工程檔案多元化知識的功能。知識圖譜技術能夠從多源異構的工程檔案中細粒度化抽取和加工知識,有助于工程檔案資源進行有序化、條理化、系統化的知識組織,從“檔案”流向“知識”。二是能夠實現工程檔案知識的關聯與聚合。工程檔案雖來源分散、類型各異,但彼此間存在著較強的關聯性。基于圖數據庫方法構建工程檔案知識圖譜,將其關聯以圖的方式直觀呈現,還能在語義分析的基礎上建立起全面、完善的工程檔案知識體系,使得工程檔案管理系統更加智能。三是能夠實現工程檔案知識的動態更新。工程項目完工并不代表檔案資料收集工作結束,新的工程技術和突發情況需要及時補充到檔案資料中。圖數據庫的可添加性能夠使工程檔案知識圖譜根據數據的更新添加新的節點、屬性、關系,使得圖模型持續處于更新狀態,知識體系得以不斷更新與擴充。

二、 基于圖數據庫的工程檔案知識圖譜構建方法

本文在掌握工程檔案資源特性和檔案資源整合思路的基礎上,設計基于圖數據庫的工程檔案知識圖譜構建架構和知識模型。同時,為達到理論層面與實踐層面的契合,實現知識圖譜對工程檔案知識資源的組織,本文借助某水資源配置工程檔案資料,并依據保密原則,對關鍵信息采取模糊處理,定名為“某江水資源配置工程”進行實例驗證,以說明研究的可行性。

1. 工程檔案知識圖譜總體構建思路

在解讀“某江水資源配置工程”檔案資源的基礎上,首先分析該檔案內容結構特征并構建工程檔案知識模型,其次依據知識圖譜構建步驟,在Neo4j圖數據庫中實現“某江水資源配置工程”檔案知識圖譜。工程檔案知識圖譜構建流程如下:對工程檔案資料內容深刻解讀后,確立實體、屬性以及關系,并設計知識模型。根據知識模型要素從檔案內容中抽取出相關數據形成應用本體模型,將本體模型與知識表示中的三元組格式融合,隨后采用實體對齊、實體消歧等知識融合技術清洗數據,通過Protégé中導出的RDF文件與Neo4j元素映射形成工程檔案知識圖譜并挖掘檔案中的隱性知識。總體分為6個層次:知識建模層、知識抽取層、知識表示層、知識融合層、知識存儲層以及知識更新層。[4]

2. 工程檔案知識建模層

在構建工程檔案知識圖譜之前,要對工程檔案的內容結構及其關聯進行梳理。首先,對檔案內容進行拆解并構建聯系,分析檔案實體間的關聯才能準確了解具體事件中的真實情況。對檔案內容進行拆解并確定實體后,將原本復雜的關聯從文字抽象為“邊”,通過“邊”說明實體間的關系。本文對“某江水資源配置工程”檔案內容的概念和屬性梳理并解讀,最終確定將“工程項目”“檔案主題”“責任者”“項目時間”和“項目地點”5個核心概念[5]作為工程檔案內容本體,詳見表1。

其次,考慮到知識圖譜的查詢性和圖數據庫的屬性可添加性,分別對不同的實體添加了相應屬性,如人物實體具有姓名、性別、職稱等屬性。最終根據檔案內容關系將各實體進行連接,設計本文的工程檔案知識模型,如圖1所示。

3. 工程檔案知識抽取層

知識抽取是從工程檔案中抽取所需要的內容,包含實體、關系和屬性。首先,對“某江水資源配置工程”檔案實體的數據屬性和關系屬性進行梳理和抽取。數據屬性抽取,是對實體的相關屬性進行抽取,使實體描述更精確和完整。關系屬性抽取,是對實體間關系進行解讀,抽取實體與實體間的語義關系。依據確定的5個工程檔案本體核心類,利用Protégé工具對“某江水資源配置工程”檔案領域本體類與關系屬性進行創建[6],設置“are responsible for”“cooperate”“site”等11種關系。

其次,結合所構建的工程檔案知識模型,將“某江水資源配置工程”檔案中抽取的項目參建單位、建設地點、建設時間等關鍵實例數據導入,形成工程檔案領域應用本體。本文以“某江水資源配置工程”建設項目為核心,選擇“檔案主題”類中的“某江工程A河上游泄洪閘監測布置”“某江進口段B大堤防洪閘降壓站供電系統接線設計”等實例進行圖譜構建研究,將這些實例數據填充到本體5大核心類目中,結合Protégé對“某江水資源配置工程”應用本體進行可視化。同時,導出為RDF數據,為“某江水資源配置工程”檔案知識圖譜的構建奠定基礎。

4. 工程檔案知識表示層

在知識抽取層已通過Protégé將“某江水資源配置工程”本體實例導出為RDF文件,RDF采用三元組集合(資源subject-屬性predicate-屬性值object)的方式在知識圖譜中描述事物和關系[7],其中subject和object代表知識圖譜中的節點,predicate代表邊,因此在RDF圖數據模型中主要由邊和節點組成。三元組被用來表示實體間的關系,或者實體某個屬性的屬性值。

5. 工程檔案知識融合層

在知識抽取層中,由于文本表述錯誤、模糊等原因,所抽取的知識內容會存在重復或者沖突等歧義性問題,例如:實體簡寫重復情況,“中國建筑”和“中建公司”都代表“中國建筑集團有限公司”。因此,需要對所抽取的數據進行清洗和整理,常用的方法有:實體對齊、實體消歧、共指消解等知識融合技術。它們能夠將來自不同數據源的相同實體的差異化表達進行融合,幫助消除數據集中的噪聲數據、冗余數據,提升工程檔案實體質量。

6. 工程檔案知識存儲層

將上述過程中已經清洗好的“某江水資源配置工程”應用本體實例數據,在Protégé軟件中導出為RDF文件,并將該RDF文件與Neo4j元素進行映射,利用Cypher中的CREATE語句創建節點、MATCH語句創建節點間關系、MERGE語句創建節點與關系的屬性,Neo4j圖數據庫會依據模型結構構建“某江水資源配置工程”檔案知識圖譜(部分),如圖2所示。工程檔案內容除了儲存在圖數據庫中,還能通過網狀結構充分展現其關聯,通過數據挖掘或機器學習等方法挖掘隱性知識,為上層提供知識發現、知識搜索、知識推薦等工程檔案知識服務。

7. 工程檔案知識更新層

知識更新層主要是工程檔案知識更新和用戶知識需求更新。傳統的關系型數據庫根據事實關系所呈現是靜態的知識圖譜,僅反映某個階段的工程檔案知識,但工程竣工并不意味著檔案資料存儲結束,例如某些工程在數年后發生了緊急狀況或質量問題,檔案資料也需要更新后續的應急措施等內容。基于圖數據庫的可添加性,可隨時根據事態變化,對相應的節點、屬性、關系進行更新,動態的工程檔案知識圖譜解決了靜態圖譜的時滯性。在用戶知識需求更新方面,根據用戶查詢瀏覽痕跡對知識圖譜結構進行調整,填補用戶需要的知識內容,同時搭建時序圖譜使得用戶能夠依據時間維度來獲取所需的關鍵信息。

三、 工程檔案領域知識圖譜應用

通過Neo4j圖數據庫構建的工程檔案領域知識圖譜,根據知識圖譜的網狀結構梳理工程檔案知識間的邏輯關系,在此基礎上實現知識抽取和知識挖掘,豐富工程檔案知識庫體系,打造工程檔案知識搜索、知識推薦等系列功能,以期實現工程檔案智能服務模式。[8]

1. 工程檔案知識智能搜索

當前的智能搜索技術主要針對字面理解進行關鍵詞搜尋,不能分析用戶所輸入詞匯的語義內涵,導致檢索結果有偏差。使用工程檔案知識圖譜搜索知識時,能夠發揮語義解讀功能,真正理解用戶實際檢索需求,及時定位到相關實體或屬性上,使用戶獲取更精確、更全面的工程檔案知識。例如,在“某江水資源配置工程”中只要點擊該項目節點,便能獲取“施工單位”“項目編號”等屬性。

2. 工程檔案知識智能推薦

除了用戶對知識的主動搜索,知識獲取還能依靠系統的智能推薦服務。工程檔案知識圖譜對關聯的知識實體間的知識網絡結構梳理清晰,能結合用戶的知識搜尋記錄、知識單元訪問頻率等信息,利用智能知識推薦算法分析用戶知識需求,精確推薦用戶想要的工程檔案知識,還能向用戶推送其可能感興趣的工程知識內容,將用戶主動搜索模式轉化為系統主動推薦模式。

3. 工程檔案知識智能問答

工程檔案智能服務系統在處理用戶知識需求時,除了接收用戶主動輸入的關鍵詞搜尋,還能處理用戶在問答區的知識提問。工程檔案知識圖譜梳理存儲了全部檔案知識脈絡,對工程檔案知識單元了解全面。因此,通過嵌入語義分析系統,對用戶提問內容充分解讀,依據所存儲的知識單元,實現工程檔案知識智能問答,提升工程檔案知識服務質量。

4. 工程檔案動態知識導航

傳統的工程檔案智能服務系統在其檔案資源類別管理上使用的是靜態的導航模式,用戶使用知識導航功能難以全面瀏覽整個知識單元。創建動態的工程檔案知識導航后,用戶點擊某個知識實體,知識導航系統便根據關系和屬性引導用戶全面瀏覽相關的工程檔案知識體系。如在查詢“某江水資源配置工程”檔案時,選擇檔案主題下的“基本建設”類目,可展示該工程項目所涵蓋的所有基本建設類相關資料分布。

四、 結語

本文設計將工程檔案本體與Neo4j圖數據庫相結合,構建工程檔案領域知識圖譜,可實現工程建設知識的聚合組織與知識關聯,深度挖掘工程檔案價值。不僅能有效推動工程檔案數字資源的知識存儲與知識表示,面向用戶提供具有專業性、針對性的檔案知識關聯服務,而且為工程建筑行業開發檔案數字資源提供參考,具有良好的應用前景。本文所提出的方法為工程建設檔案知識挖掘和利用提供系統性和科學性的參考,但實現圖數據庫在工程檔案信息管理中的普及運用仍需要繼續探索,望能引起相關研究者與實踐者對檔案資源存儲及開發的關注。

注釋與參考文獻

[1]劉靖昌,李楊.知識圖譜技術在城市軌道交通企業檔案數字化的初探[J].城市軌道交通,2021(7):4.

[2]胡一鳴.煉油催化劑檔案專題數據庫的建設及應用[J].化工進展,2021(S2):192-197.

[3]張前進.基于Neo4j的智能學習系統語義鏈接圖式存儲研究[J].佳木斯大學學報(自然科學版),2017(2):299-301.

[4]熊回香,嚴舞月.基于知識圖譜的數字檔案服務模式探究[J].知識管理論壇,2021(4):204-212.

[5]羅倩.基于本體的工程檔案數據化模式與方法研究[D].湖北大學,2021.

[6]雷潔,李思經,趙瑞雪,等.面向科研檔案管理的知識圖譜構建與應用研究[J].數字圖書館論壇,2020(5):8-15.

[7]張維沖,王芳,黃毅.基于圖數據庫的貴州省大數據政策知識建模研究[J].數字圖書館論壇,2020(4):30-38.

[8]張慧穎,曹玉.國內檔案智慧服務研究綜述[J].山西檔案,2021(6):161-170.

主站蜘蛛池模板: 五月婷婷丁香综合| 成人在线天堂| 一本色道久久88| 欧美综合成人| 白浆免费视频国产精品视频| 2021国产精品自拍| 亚洲第一中文字幕| 精品国产一区二区三区在线观看| 久久久久国产精品熟女影院| 婷婷六月综合| 成人国产免费| 亚洲无码不卡网| 久久国产精品嫖妓| 午夜老司机永久免费看片| 中文字幕无码av专区久久| 国产精品无码制服丝袜| 99re热精品视频中文字幕不卡| 亚洲男人的天堂视频| 亚洲人成网站观看在线观看| 亚洲午夜天堂| 欧美成人日韩| 国产在线精品99一区不卡| 国产乱子伦手机在线| 欧美日韩专区| 国产一级做美女做受视频| 九色视频最新网址| 日韩毛片免费视频| 国产精品大白天新婚身材| 欧美色亚洲| 69国产精品视频免费| 国产亚洲欧美日本一二三本道| 亚洲综合亚洲国产尤物| 日韩精品专区免费无码aⅴ| 影音先锋丝袜制服| 国产精品美女自慰喷水| 亚洲成肉网| 久久婷婷六月| 婷婷色在线视频| 免费在线国产一区二区三区精品| 欧美福利在线| 日韩不卡高清视频| 欧美三级日韩三级| 婷婷午夜天| 国产精品亚洲一区二区三区在线观看| 久久永久精品免费视频| 久久久久中文字幕精品视频| 色婷婷电影网| 99免费在线观看视频| 激情国产精品一区| 特级aaaaaaaaa毛片免费视频| 免费观看男人免费桶女人视频| 毛片久久网站小视频| 国产一级二级在线观看| 日本欧美成人免费| 中文字幕无码中文字幕有码在线| 国产精品成人不卡在线观看| 99国产精品免费观看视频| 伊人久久大香线蕉aⅴ色| 无码在线激情片| 亚洲成综合人影院在院播放| 国产精品亚欧美一区二区| 欧美一级在线看| 免费网站成人亚洲| 在线观看国产精品一区| 亚洲天堂精品在线观看| 中文字幕第1页在线播| 国产精品久久自在自2021| 国产18在线| 99热这里都是国产精品| 99人体免费视频| 九九久久99精品| 萌白酱国产一区二区| 97精品伊人久久大香线蕉| 在线欧美日韩| 亚洲男女天堂| 欧美午夜在线观看| www.日韩三级| 99视频只有精品| 欧美精品xx| 亚洲av无码人妻| 波多野吉衣一区二区三区av| 国产精品手机在线播放|