999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高校檔案知識圖譜構建及系統實現探析

2023-09-10 18:23:27張雯君
蘭臺內外 2023年22期

張雯君

摘 要:隨著數字化進程的深入,智慧校園的廣泛建設,產生大量形式異構、內容繁雜的高校數字資源。高校數字資源在收集、檢索查詢上的功能缺失,導致檔案關聯度差,無法深度開發資源和信息共享。構建一種基于知識圖譜的檔案管理系統,解決高校檔案管理過程中知識關聯弱,檔案價值挖掘程度低等問題,為高校檔案智能管理提供新的思路。

關鍵詞:高校檔案;知識圖譜;檔案系統

知識圖譜這一概念起源于Google公司提出的“Google Knowledge Graph”,目的是優化搜索引擎,用來提供更復雜的關聯信息查找,從語義層面解析用戶的意愿,從而給出更加具有針對性的搜索結果。高校檔案記錄了學校在教學、科研過程中發生的多種活動,對于學校的管理和建設起著重要的作用。將知識圖譜技術與高校檔案相結合,有效開發和利用多種形式的高校檔案資源,從高校檔案數據中構建高校檔案本體關聯知識圖譜,以可視化的形式展示高校檔案,并基于知識圖譜展開有效的知識推理和語義檢索,實現高校檔案價值增值。

一、檔案知識圖譜研究應用

隨著人工智能的快速發展,知識圖譜在檔案學探索中的運用逐漸增多并不斷發展。參考現有的知識圖譜在檔案學中的應用,可以得到啟發。例如,利用知識圖譜做關鍵詞共現分析,得到所有檔案中共同出現的關鍵詞詞頻,以此研究檔案的熱點內容、共同特征等;繪制檔案關鍵詞共現的時間序列圖譜,展示不同時間段的檔案的熱點或共同特點;利用突現詞探測法了解檔案中出現的新內容,還可以結合時區圖得到一段時間內的檔案熱點內容,知識圖譜除了應用于語義搜索,還被應用于推薦系統、輔助決策等方面。

二、高校檔案知識圖譜構建的可行性

知識圖譜作為大數據時代一種可以揭示實體之間關系的技術,在知識的推理和語義檢索等方面展示了巨大的能量。能夠對檔案信息重新整合,將關系抽取出來,并利用可視化圖譜展現其系統化、有序化的知識組織。將知識圖譜運用在高校檔案管理系統中具有以下優勢:

1.知識圖譜可以實現信息共享,揭示數據之間的關聯性

高校檔案具有數據量大、內容豐富的特點,為了快速挖掘檔案資源信息,知識圖譜可以將相關聯的數據重新組織成一個網絡數據群,以可視化圖譜的方式展示其知識脈絡。這樣不僅可以實現不同資源之間的快速連接,還能夠讓需求者快速獲得檔案信息,使得資源共享服務得到最大化。

2.知識圖譜可以提升檔案利用效率

知識圖譜通過挖掘碎片化的信息、重新組合以及描述發展進程,了解實物之間的完整關系。因此,相比于傳統的檔案管理系統,知識圖譜可以提高檔案之間的利用率,實現查詢、檢索自動化,全面展示該領域中各要素的關聯情況、發展情況等。

3.知識圖譜可以展示檔案數據的動態特征

高校檔案隨著不同階段的加工往往會表現出動態的變化特征,知識圖譜的加入可以實現檔案數據的實時更新,對其開展動態調整從而保障檔案的完整性與準確性。

相較于其他內容的大數據,高校檔案數據記錄真實的教學活動和管理建設工作,經過嚴格的分類,其內容的表達也有嚴格的規范,有著較為完整的檔案元數據標準,為基于知識圖譜的檔案管理系統打下良好的數據基礎。目前,從高校檔案管理現狀以及系統需求分析,結合知識圖譜構建過程,以山東建筑大學檔案為數據源,開發具有智能采集與歸檔、碎片化加工、增強高校檔案資源間關聯關系性能等系統,提升高校檔案管理水平,并解決其管理過程中知識關聯弱,檔案價值挖掘程度低等問題。

三、高校知識圖譜構建方式和流程

1.高校知識圖譜構建方式

知識圖譜普遍存在兩種構建方式:一是自頂向下的構建方式,首要建立圖譜模型,構建知識圖譜本體,隨后將實體及屬性匹配設計到模式層本體中。自頂向下的方式,是垂直領域知識圖譜常用方式,因難度技術較低,需要依靠分類體系確定性高的結構化知識庫;二是自底向上的構建方式,利用公開的數據,運用知識提取出知識,選擇高質量的知識導入知識庫中,并加以組織。自底向上的方式,體系更加完備,具有較高的智能化,適用于非結構化的知識庫。高校檔案知識庫存在大量異構數據,較適用于自底向上的構建方式。

2.高校檔案知識圖譜構建流程

運用信息技術抽取非結構化、半結構化以及結構化數據的有效信息形成知識網絡是高校知識圖譜構建的基礎。高校知識圖譜的構建過程有三個階段,即知識抽取、知識融合與知識計算。知識抽取,即從高校原始數據中提煉出實體、屬性以及實體之間的關系;知識融合是指在完成知識抽取后,對新知識中相同的實體進行整合,或消除具有矛盾和歧義的知識;知識計算的過程就是對新獲取的知識展開篩選評估的過程,經過評估合格后的知識補充到知識庫中。

(1)知識抽取。 知識抽取是高校檔案知識圖譜構建的第一步,通過自動化或半自動化的知識抽取技術,從高校檔案原始數據中獲得實體、關系及屬性等可用知識單元,為高校檔案知識圖譜的構建提供知識基礎。

(2)知識融合。由結構化數據、非結構化數據等多源異構數據源抽取的知識存在冗余、語義沖突和知識重疊等問題。為了能夠更有效地構建知識圖譜,要應用知識合并技術從數據模式層融合和數據層融合兩方面實行融合,對知識實行實體消歧、沖突檢測、共指消解和實體整合處理。實體鏈接為知識融合的關鍵技術,主要包含實體消歧和共指消解。分別用于解決一詞多義以及指向同一實體有不同表述的問題。目前,實體消歧主要采用聚類法,而共指消解可以使用分類的方法和聚類的方法求解。

(3)知識計算。經過知識抽技術得到的知識,經過知識融合后,生成初步表達。然而,為了得到結構化、網絡化的知識網絡,產生更精準的模型,還需要展開知識計算。首先,知識計算需要構建本體,也就是通過人工編輯的方法或由數據驅動機器的方法構建特定領域的本體。其次,開展知識推理,運用推理技術從現有數據中獲取新關聯,完成新知識的補充。知識推理的知識開展質量評估,實現知識可信度的量化,保障知識庫的質量。

四、基于高校檔案知識圖譜的檔案管理系統設計路徑

1.國內高校檔案管理現狀分析

通過國內外高校檔案管理研究綜述,并調研山東大學、濟南大學以及山東交通學院等山東省內高校檔案管理現狀,在充分了解高校檔案資源專業性、綜合性等特點的基礎上,在研究中發現高校檔案管理經過近幾年的發展,信息化水平有所提升。但在高校檔案管理模式、檔案收集、加工以及存儲與利用、信息共享等方面還存在諸多問題。

(1)高校檔案管理模式。目前,國內高校仍以紙質檔案管理為主,相關檔案管理制度主要適用于傳統檔案管理。檔案信息化制度建設和技術建設方面成果較少。部分高校因信息化管理意識欠缺、經費不足以及技術能力薄弱、專業人員缺乏等問題,尚未開展紙質檔案數字化工作。對于已開展數字化工作的高校,仍有一半以上數據檢索需要靠人工完成,學生通過自行前往檔案館查閱,信息化還處于較低水平。

(2)檔案內容的完整性。高校檔案管理的第一步是檔案收集,檔案收集的完整性、可靠性和準確性決定了檔案利用價值。目前,高校檔案收集工作普遍存在檔案收集不當、內容缺失的問題。主要涉及三個原因,一是檔案收集制度不完善,缺乏有效的監督機制使得檔案未能及時歸檔;二是檔案的來源比較廣泛,分散于各個部門,加大了檔案收集的難度;三是檔案收集流程不規范,未做到應收盡收,存在缺少附件、日期不明確和內容缺失等問題。

(3)檔案的存儲與共享利用。一般來說,高校檔案分散存儲在不同部門,且各部門之間無法相互訪問,各部門之間缺少溝通與聯系,高校檔案管理存在著分散和多重管理的問題。解決這一問題,需要各類單位、機構、部門建立共享機制,實現資源共享。此外,由于檔案存儲不當,存儲流程細節不夠具體,極易造成檔案丟失。電子檔案的存儲會因為具有一定的開放性而遭到泄露和入侵。目前,各高校的檔案系統還未實現專業化與數字化,檔案之間的調用與查閱過于煩瑣,無法直接利用。因此,構建一個科學、系統的高校檔案管理系統是必不可少的。

2.系統技術支持及框架設計

面對海量的異構數據,高校管理者需要從管理軟件中解決檔案的智慧化收集和歸檔等問題。運用知識圖譜技術,匯集高校行政、人事、科研、資產和學生等各類的檔案,從而使之產生關聯,為高校高質量發展提供檔案數據支撐。

基于知識圖譜構建方式的利弊,選擇自下而上的構建方式,構建高校檔案管理系統。總體架構自下而上劃分為數據解析層、智能識別層、語義關聯層和智能管理層。

(1)數據分析層。數據分析層為高校檔案管理系統提供數據與收集規則。由于高校檔案資源分散于各個部門管理,且類型各異,有儲存在數據庫的結構化數據,也有以圖片、文本形式存在的非結構化數據。這些檔案沒有經過系統處理,加大后期檔案的識別與加工難度,因此,需要在數據解析層設計檔案收集規則。針對不同格式的數據源分別開發對應的解析工具,使用ETL引擎對來源數據實行解析、抽取和結構化處理,保證從各數據源采集的數據可以統一清洗、規范、管理和使用,并嚴格按照統一數據標準實行存儲。

(2)知識抽取層。在智能識別層主要提取檔案中不同類型的實體、關系與屬性值,并用三元組的表示方式揭示各檔案數據之間的關聯。例如,從結構化數據中生成檔案、人員、時間和具體發生的事情等實體,并獲取對應的屬性值。由于高校檔案數據量過大,可利用機器學習方法完成檔案資源關系的抽取,按照知識圖譜中知識抽取的步驟將這些內容存儲在數據庫中,并轉化為RDF三元組的形式,方便后續的管理與應用。

(3)知識關聯層。語義關聯層對抽取出來的信息實行知識融合和語義豐富化。從多個來源獲取檔案數據后,由于某些實體可能存在多種表達方式,因此,需要消除矛盾和歧義,并補充其屬性信息。在知識圖譜中,可視化直接提供了高校檔案的直接分析。根據建立的知識圖譜系統原型,使用相關的推理引擎對高校檔案中的關聯關系作出合理推理,以便后續的更新與管理。此外,可以利用文本相似度等方法對檔案中的內容作出相似度分析,豐富圖譜中檔案的關聯程度和數據信息。

(4)智能管理層。根據已經構建好的基于知識圖譜的高校檔案管理系統,在智能管理層融合數據解析模塊、語義識別模塊和語義推理模塊等。利用檔案數據的特性,對知識圖譜中的數據開展知識挖掘,形成高校檔案和其他數據庫的新關聯。此外,在可視化功能上,使用者利用檢索功能對想要查詢的檔案資源進行調動,通過系統內部的解析形成個人的檔案知識圖譜。

3.系統核心功能

(1)智能化采集與歸檔。目前,高校檔案資源主要包含紙質資源與電子資源兩種。其中,紙質檔案要利用掃描設備實現數字化。對于不同來源的信息數據利用智能化技術對檔案資源所包含的內容展開智能識別、采集,排除無效信息,滿足用戶的查詢需求。

(2)自動抽取與關聯。高校檔案種類多且繁雜,需要運用知識圖譜技術開展知識抽取。通過構建實體、關系、屬性的RDF三元組,利用實體抽取辨別實例數據是否被定義,利用關系抽取分析實體關聯程度,利用屬性抽取采集特定實體信息。

(3)語義增強。在傳統的檔案系統中,檔案之間的利用率極低,限制了檔案中真正有價值的信息流動。而基于知識圖譜的高校檔案管理系統可以利用語義技術促進檔案數據的關聯與利用,將檔案實行多元化語義關聯,方便系統管理員智能化組織檔案資源,以增強檔案資源語義性,形成高質量的高校檔案知識圖譜,提升檔案管理效率。

五、高校檔案知識圖譜構建思考

通過開展高校檔案知識圖譜應用研究,旨在推動高校檔案管理模式向語義關聯化與智能化發展。構建高校檔案知識圖譜及開發高校檔案系統時,還需要考慮幾個問題:(1)由于現有的知識圖譜繪制軟件較多,選擇合適的繪圖軟件變得很有必要。已有學者對使用率較高的幾個知識圖譜軟件的功能、優勢和缺陷進行了對比分析,使用者在選擇時仍要充分了解不同軟件的特性,充分理解其應用的主題,并做出最合適的選擇。(2)知識圖譜繪制軟件多數對中文數據的兼容性不強,通常需要對中文數據展開格式轉化。

參考文獻:

[1]董 偉,朱小梅,徐少同.基于知識圖譜的近10年國際電子政務研究進展分析[J]. 圖書情報工作,2012(13):19-25.

[2]張 璇,蘇 楠,楊紅崗,等.2000-2011年國際電子政務的知識圖譜研究——基于Citespace和VOSviewer的計量分析[J].情報雜志,2012,31(12):51-57

[3]趙范心.基于知識圖譜的檔案知識服務模式思考[J].辦公室業務,2022,(13):64-66.

(作者單位:山東建筑大學)

主站蜘蛛池模板: 欧美中文字幕在线视频| 91麻豆久久久| 久久久噜噜噜久久中文字幕色伊伊| 丝袜亚洲综合| 中文字幕不卡免费高清视频| 国产好痛疼轻点好爽的视频| 久久国产亚洲欧美日韩精品| 国产素人在线| 久久综合久久鬼| 美女内射视频WWW网站午夜| 四虎精品免费久久| 日本不卡在线播放| 中文字幕av一区二区三区欲色| 99伊人精品| 老司国产精品视频| 国产成人一区| 国产精品蜜臀| 亚洲综合一区国产精品| 2022国产91精品久久久久久| 亚洲国产天堂久久综合| 国产小视频在线高清播放| 亚洲成人动漫在线观看 | 国产白浆一区二区三区视频在线| 国产成人免费高清AⅤ| 国产极品嫩模在线观看91| 丰满人妻一区二区三区视频| 国产 在线视频无码| 国产伦片中文免费观看| a级毛片在线免费| 四虎永久免费在线| 久久久受www免费人成| 国产在线观看91精品| 日韩视频福利| 欧洲日本亚洲中文字幕| 91福利一区二区三区| 午夜视频www| 台湾AV国片精品女同性| 少妇精品在线| 国产精品视频第一专区| 欧美激情成人网| 日韩无码白| 欧美另类图片视频无弹跳第一页| 成人综合网址| 免费可以看的无遮挡av无码| 欧美成人国产| 丝袜亚洲综合| 国产午夜无码片在线观看网站 | 久久香蕉国产线看观看精品蕉| 成人永久免费A∨一级在线播放| 国产天天射| 精品国产香蕉伊思人在线| 永久免费无码日韩视频| 亚洲国产成人久久精品软件 | 国产免费福利网站| 亚洲视频免费播放| 中文纯内无码H| 久久人搡人人玩人妻精品| 老熟妇喷水一区二区三区| 国产成+人+综合+亚洲欧美| 亚洲无码日韩一区| 国内精品九九久久久精品| 免费在线看黄网址| 国产成年女人特黄特色毛片免| 午夜三级在线| 直接黄91麻豆网站| 在线观看免费AV网| 亚洲综合色区在线播放2019| 国产精品久久国产精麻豆99网站| 伊人激情综合网| 99热这里只有精品久久免费| 精品一区二区三区四区五区| 国产极品美女在线播放| 亚洲AⅤ综合在线欧美一区 | 大乳丰满人妻中文字幕日本| 亚洲经典在线中文字幕| 国产精品三级专区| 国产av一码二码三码无码| 高清不卡一区二区三区香蕉| 国产主播一区二区三区| 2020最新国产精品视频| 亚洲成人网在线播放| 欧美日韩第二页|