999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義網的數字圖書館信息檢索系統框架模型

2024-06-06 00:00:00楊鴻
科技創新與應用 2024年16期

作者簡介:楊鴻(1987-),女,講師。研究方向為圖書館學-醫學文獻檢索與利用。

DOI:10.19981/j.CN23-1581/G3.2024.16.028

摘" 要:面對互聯網技術的成熟化、普及化發展,數字圖書館成為了為人們提供信息資源的重要機構。然而面對數據異構化、分散化發展的大環境,數字圖書館的傳統信息檢索系統與用戶日益提高的信息檢索需求不再適應,難以正確判斷出用戶的檢索意圖,存在檢索效率低、檢測結果不夠準確的問題。基于此,該文結合語義網技術,對數字圖書館信息檢索系統框架模型進行模塊、流程、系統結構設計,并在此基礎上給出領域本體集成與構建、語義相似度算法優化的方法,旨在為數字圖書館信息檢索系統科學建設提供參考,從而最大化展現出數字圖書館的信息資源利用價值。

關鍵詞:語義網;數字圖書館;信息檢索系統;信息資源利用價值;系統框架模型

中圖分類號:G258.2" " " 文獻標志碼:A" " " " " 文章編號:2095-2945(2024)16-0120-04

Abstract: In the face of the mature and popular development of Internet technology, digital library has become an important institution to provide people with information resources. However, in the face of the development environment of data isomerization and decentralization, the traditional information retrieval system of digital library can no longer adapt to the increasing information retrieval needs of users, and it is difficult to correctly judge the retrieval intention of users. there are some problems, such as low retrieval efficiency and inaccurate detection results. Based on this, combined with semantic web technology, this paper designs the module, process and system structure of the framework model of digital library information retrieval system. On this basis, it gives the methods of domain ontology integration and construction and semantic similarity algorithm optimization, in order to provide reference for the scientific construction of digital library information retrieval system, and thus maximize the utilization value of digital library information resources.

Keywords: semantic web; digital library; information retrieval system; utilization value of information resources; system framework model

傳統信息檢索查詢模式智能化不足,信息資源共享未能實現,無法準確、快速檢索出用戶需求的信息資源。而語義網技術是基于機器理解人類語言的技術方法,可在Web基礎上,利用標準化、共同性機器可理解元數據等先進技術,調整傳統字詞匹配檢索模式,從語義層面理解用戶檢索意圖,以便為用戶提供更為優質的檢索服務。因此,有必要探尋基于語義網的數字圖書館信息檢索系統框架模型設計與構建方法,并解決集成構建領域本體、改進語義相似度算法等技術難題,從而為數字圖書館信息檢索發展中語義網技術的科學應用奠定基礎。

1" 基于語義網的數字圖書館信息檢索框架模型設計

1.1" 系統框架模型設計

數字時代背景下,打造數字圖書館,采用智能化、現代化方式為用戶提供信息資源,是圖書館穩定持續發展的必然出路,在此背景下,語義網技術應運而成。此技術可將信息檢索范圍延展至知識層面,并能對語義表達進行規范,通過人機交互為用戶提供知識共享、思想交流服務[1]。在語義網技術支持下,構建數字圖書館的信息檢索框架模型時,需要以可擴展標記語言(XML)、資源描述框架(RDF)、本體技術為基礎,并應用到知識管理等多個理論,本文設計的系統框架模型如圖1所示。

1.2" 功能模塊設計

1.2.1" 信息資源整合處理模塊

利用語義網技術創建信息檢索框架模型時,首先要合理構建本體模型,并運用先進技術完成領域本體創建過程,在此過程中,需要利用信息資源整合處理模塊處理各類信息資源。應引入專家支持,利用專家的知識經驗,獲取并理解各個相關領域的知識內容,并從中篩選認可度較高的詞語,然后對各個詞語間的邏輯關系進行分析[2]。此過程可納入用戶對領域知識的認知,使用領域本體標記文檔,再將其中的特征詞匯提取出來加以分析,并與概念集形成關聯,從而完成語義標引過程。此模塊采用元數據整合信息資源,面對規模化的數字資源,元數據標準無法有效統一,網絡中還存在一些半結構化數據,為提高信息提取的準確性,此模塊還引入了可擴展標記語言,在排除外界因素干擾的情況下,按照元數據處理規范,針對性獲取符合用戶需求的元數據,而后再將采集的數據匯總到一起,并存儲于元數據庫中。信息資源整合處理包含初步整序、粗粒度提取、細粒度提取、元數據獲取、元數據存儲5個步驟(圖2)。由于XML無法描述語義,需利用RDF定義概念模型,對資源間的關系進行描述,此技術采用XML這一語法基礎,利用命名空間思想完成描述過程,流程更簡潔,元數據處理更為快捷。

圖1" 基于語義網的數字圖書館信息檢索框架模型

圖2" 數字化文檔元數據提取過程

1.2.2" 用戶接口及查詢信息處理模塊

在語義網支持下,可創建具有人機交互功能的用戶接口,語義是用戶對現實世界計算機表示的解釋,在基于語義網的數字圖書館信息檢索系統中,用戶可在用戶界面中輸入自己的信息查詢關鍵詞,推理機收到查詢信號后,會先將用戶輸入的關鍵詞句轉化成為適合的本體查詢詞句,再利用信息資源領域本體,運用領域中的知識、自然語言分析關鍵詞句,計算語義相似度并推理語義,然后將語義相似度與用戶所查詢關鍵詞句的領域本體提取出來,進而分析出用戶的檢索意圖。此步驟完成后,若檢索意圖不明確,查詢請求處理子模塊會跳轉至用戶界面,讓用戶重新輸入關鍵詞句并向處理子模塊提交查詢任務;若檢索意圖已明確,則在返回用戶界面后,直接向系統檢索結構提交分析出的檢索請求。分析時,系統的領域本體會向推理機傳送與檢索請求相關的知識內容,再推理分析檢索請求詞句之間的關聯性,然后自動查找符合要求的信息。與此同時,還會結合推理情況,創建契合檢索要求的詞群或句群,然后根據檢索結果,構建一個邏輯清晰的檢索結果呈現模式,向客戶可視化展示檢索得到的信息資源。利用此種模式,用戶輸入關鍵詞句后,便可快速完成信息檢索,可降低檢索誤差、提高檢索效率。

1.2.3" 檢索匹配與輸出模塊

檢索匹配及輸出模塊是以上一環節分析得到的與檢索請求相符的詞群或句群為依據,結合已構建完成的領域本體,從知識庫中查詢用戶需要查詢的信息資源。接收到用戶接口及查詢信息處理模塊提交的檢索關鍵詞句群后,此模塊根據推理規則推理分析存儲于知識庫,由RDF、RDFS等技術描述的實例,準確輸出結果集,將搜尋到的與檢索請求相符的信息資源或文獻資料歸類到一起,再經過分析處理之后,與用戶輸入的檢索請求展開一致性、相關性對比,以對比結果為依據,判斷檢索結果與用戶需求是否相符,然后根據領域本體知識,利用語義相似度算法,對二者的相關度數值進行計算,并按相關度程序排列信息次序,然后再按照相似度由高到低的順序,經由用戶界面,將查詢到的信息資源結果反饋給用戶,如此便可完成用戶在整個數字圖書館的信息檢索過程。

1.3" 信息檢索流程設計

基于語義網技術的數字圖書館傳統信息檢索系統,需要立足語義層次、知識層次檢索信息資源,因而其檢索流程共劃分為4個步驟,一是根據元數據采集、處理標準,利用語義網技術統一數字圖書館各類信息的格式,并構建元數據庫,用于存儲處理后的信息。二是運用檢索工具,結合專家知識及經驗,以數據庫中的信息作為數據源,構建與存儲領域本體。三是以領域本體為基礎,根據用戶輸入的信息檢索關鍵詞展開推理分析,經過轉換格式后,再計算語義相似度,然后將符合要求的語義提取出來。四是根據提前設定的檢索表達方式,抽取領域本體知識中符合用戶需求的信息資源,然后根據各個資源與檢索關鍵詞間的語義相關度計算結果,排列各個信息資源的展示順序,按照相似度程度向用戶提供檢索結果[3]。

1.4" 信息檢索系統的結構

基于語義網的數字圖書館的信息檢索系統由4部分組成,一是數據提供者,主要是指數據庫機構及部門,負責設定數據庫的利用權限,定義數據庫語義映射,確保用戶能夠訪問信息資源,并為數字圖書館信息資源有效共享提供支持。二是領域專家,其將與程序員一起,利用程序員給出的元數據及其他信息,共同創建領域本體并為本體提供數據存儲、查詢及瀏覽服務。三是程序員,其是元數據的提供者,以元數據作為主要數據源,利用領域本體知識內容,設計與構建數字圖書館的信息檢索系統,應賦予系統語義查詢功能,還要合理設置系統的服務檢索功能,除此之外,還要對不同等級用戶的訪問、查詢等各個權限進行合理設定。四是用戶,其會通過用戶界面將自己的信息資源查詢請求提交給數字圖書館的語義查詢及搜索系統,得到系統執行檢索任務反饋后,從用戶界面查看反饋回來的信息資源。在此結構體系下,可幫助用戶精準、快速獲取所要查詢的信息資源。

2" 基于語義網的數字圖書館信息檢索模型構建關鍵環節

2.1" 領域本體集成與構建

2.1.1" 領域本體集成

領域本體有頂層本體、領域本體、任務本體、應用本體4種類型,而領域本體間具有3種不同的映射關鍵,一是單本體,二是多本體,三是混合本體。由于互聯網發展背景下,數字圖書館的信息資源會持續變化,并具備共享信息資源的需求,因而數字圖書館存在結構不同的信息,因此基于語義網的數字圖書館信息檢索模型不可應用單本體或多本體,而是應選用混合本體,以便提高數字圖書館信息內容的更新效率。集成領域本體時,除了要借助領域專家豐富的知識、充足的經驗之外,還需要運用語義網技術,并參照用戶關于領域知識的認知度、了解情況等內容,從而生成認可度較高的詞匯,確保用戶檢索請求可以得到準確、快捷的處理,同時也有助于提升用戶信息查找時需求表達的準確性,從而提高信息資源檢索查詢效率,實現信息資源有效共享。

2.1.2" 領域本體構建

本文結合運用骨架法、IDEF5法構建領域本體,引入螺旋模型思想,采用周期性方式、按螺線進行多次迭代,從而創建一個適應需求持續變化趨勢的領域本體。第一,要分析需求。面向客戶展開問卷調查,從而確定系統的應用目的、應用范圍、應用對象。根據調查反饋,考慮到目前數字圖書館掌握的信息類別及知識總量,合理確定領域本體的體積,選擇最為適合的表述語句,同時還需要明確創建領域本體的時間,并給出領域本體的更新間隔,將這些內容清晰列在領域本體構建計劃方案之中。第二,分析本體,根據需求分析及工作計劃書創建本體,以領域專家為核心,在程序員、用戶輔助下,運用訪談、調研、網絡查詢等多種方式獲取領域知識,并確定領域本體的核心概念及內在關聯,創建標準化語言,構建本體核心概念集[4]。第三,創建本體,根據本體分析結果、運用編碼工具及相關標準、采用形式化編碼形式編寫本體,以便簡化程序、奠定本體共享重用基礎。第四,驗證評價本體,利用骨架法的本體評價標準測試本體,分析術語是否存在歧義、術語邏輯關系是否一致。第五,本體進化,利用迭代技術持續優化已創建的本體,使之符合實用需求。

2.2" 語義相似度算法優化

2.2.1" 基于語義距離的算法優化

根據語義距離計算語義相似度,需要考慮到概念繼承性,還將二元關系鏈的長度大小納入考量。需要根據網絡的各個有向邊的重要權值完成語義相似度計算。計算公式為

sim(w1,w2)=■,(1)

式中:l代表網絡結構最大深度,Dis(w1,w2)代表w1與w2 2個概念節點間最短路徑的有向邊數目。但此計算過程較為粗糙,僅以節點間路徑作為依據,未能考慮到語義距離角度對計算結構所產生的影響。而節點所在層次表示的是語義深度,也是語義相似度的重要影響因素,若按照此算法計算語義相似度,計算結果可能會與實際形成偏差。為此,計算基于語義距離的語義相似度算法時,應將語義深度納入其中,語義深度的計算公式為

?琢=1-■,(2)

式中:Dep(w1)、Dep(w2)表示本體網絡結構中w1與w2節點的所在層數。設網絡根節點深度為1時,每個層次的節點深度均為1。

此外,網絡層次中節點地位也會影響計算結果,父節點與子節點是包含與被包含的關系,然而子節點的特征對于父節點而言并非完全適用,可能會出現高層級節點及低層級節點的相似度比低層級節點與高層級節點間相似度更低的情況。因此,計算語義相似度時,需考慮到網絡層級中節點所處地位,計算公式為

?茁=■。(3)

綜合考慮這些因素,可以將基于語義距離的語義相似度計算公式調整為

sim1(w1,w2)=■。(4)

利用此算法計算語義相似度,得出結果更加全面與精準。

2.2.2" 基于概念特征的算法優化

此算法是對概念的特定屬性值進行對比分析,從而判斷概念間的相似性。相同屬性量越多,得出的相似度結果越高。基于概念特征的語義相似計算公式為

sim1(w1,w2)=?茲f(w1∩w2)-?琢f(w1-w2)-?茁f(w2-w1),(5)

式中:w1∩w2代表w1與w2的共有屬性集,而w1-w2、w2-w1分別代表w1、w2 2個概念獨有的屬性集。然而領域本體中,除了術語間關系描述外,還會定義各個本體的屬性特征,若本體中不同概念具備相同屬性數目,則說明二者具有較高的相似度[5]。為簡化算法,應僅考慮本體屬性這一影響因素,因此,需要對基于概念特征的語義相似計算公式進行優化。由于領域本體中,不同本體的屬性數量并不一致,2個本體相同屬性及不同屬性數量的差值可能為負,此時,需要利用其他參數進行調節,但會導致計算過程相對復雜,且計算結果無法量化。因而,優化算法時,只考慮2個本體的共有屬性及概念集的總屬性量,不將二者不同屬性計入其中,則可將基于概念特征的語義相似度算法優化為

sim1(w1,w2)=■,(6)

式中:Attr(w1)與Attr(w2)分別代表概念w1與w2的屬性特征集合,Attr(w1+w2)則代表這2個概念的共有屬性特征集合,其中f(x)表示x的屬性數目。利用此算法可減少重復性計算,并提升計算結果的量化性。

2.2.3" 基于信息量的語義相似度算法優化

此算法是通過不同概念的共有信息量判斷二者相似度,計算公式為

sim(w1,w2)=■[-log p(w)],(7)

式中:sim(w1,w2)表示涵蓋w1與w2 2種概念的全部集合。但數字圖書館涵蓋多種類型、不向來源的信息資源,具有相對較大的領域本體構建體量,因而需要在信息量語義相似度算法的基礎上,結合運用基于語義距離的算法以及基于概念特征的算法。在這3種算法思想融合的基礎上,從語義距離、概念特征、信息量3個維度展開語義相似度計算[6]。因此應將基于信息量的語義相似度算法調整為

simw1,w2=■,

(8)

式中:?茲1、?茲2、?茲3表示不同類型的領域本體在各分析視角中的重要權值。此算法各部分相似度值域取值范圍均介于0與1之間,且值域范圍也為0到1,此算法可以根據實際情況調節各類領域本體的重要權值,在參數修正的基礎上可適用于多種不同情況。改進后的語義相似度算法綜合了3種算法的優勢,可提高語義相似度計算精準度,并能得出更加客觀、合理的計算結論。

3" 結束語

互聯網時代,數字圖書館建設實現了信息資源共享,為發揮數字圖書館的信息資源利用價值,需要同步更新與優化信息檢索系統。出于這一目的,本文運用語義網,設計契合數字圖書館用戶需求的信息檢索系統,給出了該系統的框架模型。模型創建時,采用可擴展語言,以資源描述框架為支持,模擬專家的知識及經驗,進而有效集成領域本體知識并科學建設本體結構。本文所設計的信息檢索系統,可在深度解析語義的基礎上實現信息快速檢索,能夠高效、精準查詢與利用數字圖書館的信息資源。

參考文獻:

[1] 佘俊,羅勇,余少鋒,等.基于語義理解和AI的電力設備信息檢索方法[J].電子設計工程,2022,30(22):89-92,98.

[2] 龍彥.基于語義的公共圖書館信息資源檢索平臺優化研究[D].湘潭:湘潭大學,2021.

[3] 張婷.旅游領域本體構建及語義檢索研究[D].太原:太原理工大學,2020.

[4] 簡芳洪.融合主題語義的信息檢索模型研究[D].武漢:華中師范大學,2020.

[5] 徐凱斌.基于潛在語義分析的多語種信息檢索系統的研究與實現[D].延吉:延邊大學,2019.

[6] 王浩林.基于張量分解和語義網的醫學信息檢索和推薦系統[D].北京:中國科學院大學(中國科學院重慶綠色智能技術研究院),2018.

主站蜘蛛池模板: 一级黄色欧美| 国产精品偷伦视频免费观看国产| 国产在线观看第二页| 亚洲一区二区三区香蕉| 国产在线无码一区二区三区| www.av男人.com| 爽爽影院十八禁在线观看| 国产精品自在在线午夜区app| 欧美在线视频a| 久久人搡人人玩人妻精品一| 欧美国产日韩一区二区三区精品影视| 亚洲伊人天堂| 亚洲一区二区三区国产精品 | 免费黄色国产视频| 国产靠逼视频| 国产呦精品一区二区三区网站| 精品黑人一区二区三区| 四虎影视库国产精品一区| 亚洲一级毛片在线观播放| 99久久国产综合精品2023 | 欧美人与动牲交a欧美精品| 国产精品人人做人人爽人人添| 成人综合网址| 成人国内精品久久久久影院| 天天综合网在线| 无码'专区第一页| 嫩草在线视频| 免费高清a毛片| 国产va在线观看| 亚洲色婷婷一区二区| 亚洲成人在线网| 国产a v无码专区亚洲av| 国产精品亚洲一区二区三区z | 日韩无码一二三区| 亚洲欧美日韩成人在线| 67194在线午夜亚洲| 一级全黄毛片| 91蝌蚪视频在线观看| 久久香蕉国产线看观| 国产精品区网红主播在线观看| 91区国产福利在线观看午夜 | 原味小视频在线www国产| 婷婷开心中文字幕| 精品久久久久久成人AV| 国产美女91视频| 国产亚洲精品自在线| 亚洲欧美自拍一区| 久久精品无码国产一区二区三区| 亚洲欧美一区二区三区图片 | 波多野结衣视频一区二区| 欧美一级黄色影院| 国产SUV精品一区二区| a欧美在线| 亚洲中文字幕无码爆乳| 国产一区二区免费播放| 国产精品人人做人人爽人人添| 久久精品人人做人人爽97| 中文字幕在线一区二区在线| 狠狠五月天中文字幕| 亚洲AV无码一区二区三区牲色| 久久精品国产在热久久2019| 日韩无码视频网站| 免费在线视频a| 久久狠狠色噜噜狠狠狠狠97视色| 成·人免费午夜无码视频在线观看 | 亚洲天堂日韩在线| 久久免费精品琪琪| 午夜在线不卡| 国产69精品久久久久妇女| 亚洲无码37.| 成人中文字幕在线| 一级看片免费视频| 欧美不卡在线视频| 国产欧美成人不卡视频| 国产福利在线免费观看| 日本亚洲欧美在线| 日韩无码黄色| 欧美一区精品| 特级aaaaaaaaa毛片免费视频| 国产欧美网站| 精品三级在线| 69av免费视频|