999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于領域本體的數字圖書館知識聚合服務研究

2021-07-08 06:31:02陸素梅
山東圖書館學刊 2021年3期
關鍵詞:概念圖書館資源

陸素梅

(南京師范大學泰州學院圖書館,江蘇泰州 225300)

用戶知識獲取的高階化需求以及數字化知識發現技術的勃興,正推動著數字圖書館知識服務朝向基于用戶知識期望、知識檢索習慣與知識獲取偏好的跨媒體聚合服務轉向。近年來,基于語義關聯、領域概念關聯的知識發現技術在數字圖書館知識檢索服務中的應用,一定程度滿足了用戶知識檢索的新需求[1-3]。然而,當前數字圖書館知識數據呈現出內在結構弱化與無序性增長的特點,不同類型資源數據間存在較為復雜的異質性結構,因而,面向文本語義的知識關聯方法僅能解決圖書館跨媒體資源檢索問題,無法化解資源在領域本體意義上的異構與互操作矛盾。依托領域本體構建的理論框架,采用領域概念關系聚類的體系化知識聚合方法,則能夠為用戶提供既可橫向擴散又可縱向深入的集約型、智能型與智庫型的知識服務。

1 本體理論概述

1.1 本體的概念

本體(Ontology)源于哲學概念,用于系統性解釋事物(客體)的本質[4]。后來,知識工程師借用了這一概念,用來描述客體知識的本質屬性。在知識工程范疇,本體是描述客體知識的一個概念框架,本體映射的是客體知識的概念及其相關關系的術語集:通過一系列術語(術語集)描述知識概念,術語對象或概念類型共享一個知識本體。本體具有顯著的結構化特點,它是本體知識庫構建的骨架和基礎。目前,國內外關于本體的研究較為廣泛,出現了諸多小分支,依據本體的應用主題,主要分支有領域本體、常識本體、語言本體等[5]。

1.2 領域本體概念

領域本體(Domain Ontology)是本體應用主題的最主要分支。在知識工程范疇,領域本體是對領域概念的系統性描述,其描述的是某一領域中知識概念之間的內在關系,包括領域概念、概念的屬性、概念間的關系、屬性和關系的約束等等[6]。領域本體具有顯著的領域特性,其能夠表示特定領域知識的系統性本質,因而,領域本體可以更為合理、更為有效地描述領域知識的概念體系,為領域知識檢索與系統開發提供理論架構。在知識工程開發與管理中,“領域”并沒有明確的邊界,其可以依據本體構建者的需求來設定,它可以是單一領域(通常為一個學科),也可以是多個具有一定聯系的領域組合,還可以是某個領域中的一個小分支。在實踐中,領域本體的構建往往需要經過一個不斷補充與反復調整的迭代過程,才能最終使領域本體中的概念貼近于待研究領域的客觀實體與關系法則[7]。故而,通過領域本體的構建,可以實現:(1)明確領域范疇內的知識專業術語、概念關系,使其系統化、形式化;(2)有效溝通領域知識,促進知識共享與知識利用;(3)為領域知識的深度應用及交叉運用提供可能[8]。

1.3 領域本體在數字圖書館中的應用意義

領域本體在知識工程建設中的應用越來越廣泛,從現有的國內外文獻來看,知識領域本體的研究涉及化學、計算機科學、生物學、醫藥學、圖書情報學、地理學等諸多學科領域[9]。在圖書情報學領域,領域本體的應用發展,或將促進了數字圖書館的服務變革。數字圖書館包含海量數據,不同來源、不同專業學科、不同介質的資源數據結合于一體,要怎樣使海量數據信息高效獲取、轉換和利用?是數字圖書館資源建設的重要命題。尤其是在學術科研領域,如何將多元異質、紛繁復雜的跨媒體資源有機整合起來,并深度發掘學術資源本體屬性以及多元學術資源之間的邏輯關系,以便高效實現學術知識統一認證、聚合檢索與個性化服務,具有重要的現實意義。毋庸置疑,領域本體理論為知識描述提供了構建框架,隨著用戶對學術資源的進階性要求,推進跨媒體資源的領域本體構建將成為知識系統開發不可或缺的步驟——領域本體理論在數字圖書館的應用,將大大推動數字資源建設,提高資源聚合、數據檢索以及知識服務的有效性、準確性與智能性[10]。

2 基于領域本體的數字圖書館知識聚合服務要素

基于領域本體的數字圖書館知識聚合服務是一項復雜的系統工程,既需要對跨媒體異質資源進行基于領域本體構建的規整化處理,形成系統性的數字知識表示機制(基本要素),又需要在知識本體與領域用戶需求的聚合交互基礎上(中介要素),實現平臺化聚合輸出(載體要素)。

2.1 基礎要素:知識表示

知識表示(knowledge representation)就是將知識客體與本體關聯起來,對異構化數據知識進行規整化描述,以揭示知識本、客體關系的邏輯機制[11]。知識表示是數字圖書館知識聚合服務的基本要素,其核心目標是通過對數字網絡知識、結構化數據知識等客體資源予以規整化處理,析出具有代表性與顆粒度的知識本體,并創建本體知識庫。領域知識的本體表示,通常要經過三個步驟:(1)領域知識客體規模化采集與篩選。在領域本體構建前須先確定本體覆蓋的領域知識客體范圍及應用目標。只有在確定領域范圍后,才能有針對性地對知識客體進行規模化采集、分類與篩選。(2)領域客體知識標引。對領域客體知識進行自動或半自動的多維度概念抽取,以促進客體知識從宏觀結構到微觀晶格的概念標引。在特定領域,這些概念往往就是與領域相關的專業術語:把領域中一些重要術語描述出來,有利于知識工程師更好地理解領域本體庫構建的目標與應用方向。(3)領域本體知識庫構建。領域本體知識庫是領域本體知識的一個數據集,其通過描述領域概念間的關聯機制,將領域概念進行分類組織,可實現領域本體知識模塊化[12]。

2.2 中介要素:聚合交互

領域知識與用戶畫像(用戶數據)的有效交互,是數字聚合服務的中介要素。在實踐中,聚合交互的實現需要滿足兩個要求[13]:第一個要求,即要在創建的領域本體知識庫中深度聚合領域關聯知識。該要求主要是為了實現領域本體知識的有序化聚類,如按照領域本體概念關系網絡對領域本體知識庫中同一類別的知識單元進行信息聚類,形成深度知識聚合網絡。第二個要求,即要在實現領域本體知識有序化聚類的基礎上,促進領域本體知識與用戶畫像(用戶數據)的有效交互。作為數字圖書館知識聚合服務實現的中介要素,用戶畫像與領域本體知識是聚合交互的兩大核心元素,如何實現二者的有機映射是該模塊的核心要求。

2.3 載體要素:聚合服務平臺

聚合服務平臺作為數字圖書館知識聚合服務中的平臺要素(也可以說是實踐要素、媒介要素),主要包括檢索平臺、專題庫平臺、場景化推送平臺等。依托聚合服務平臺,數字圖書館可以為用戶呈現可視化的聚合檢索、專題數據庫、場景化推薦等知識服務。(1)檢索平臺。檢索平臺是領域知識聚合服務輸出的初階平臺,旨在為用戶提供常態化的跨媒體聚合數據服務,以最大限度對領域數字資源進行模塊化聚類,實現基于一定約束條件的數字知識聚類輸出。(2)專題服務平臺。專題服務平臺是領域知識聚合服務輸出的中階平臺與核心服務窗口,旨在通過自動跟蹤知識數據與關聯聚合,為用戶提供領域知識情報數據庫、專家大數據庫等智庫或專題數據庫服務。(3)場景化推送平臺。場景化推送平臺是領域知識聚合服務輸出的高階平臺,旨在依托聚合服務交互機制,利用自媒體平臺、場景化智能推薦技術與情景感知技術來提供兼具實效性與人性化的知識服務,以增強領域知識聚合服務的靶向性。

3 基于領域本體的數字圖書館知識聚合服務實現路徑

通過對知識聚合服務基本要素的分析,可構建基于領域本體的數字圖書館知識聚合服務實現模型,如圖1所示,該模型由三大核心模塊組成。

圖1 基于領域本體的數字圖書館知識 聚合服務實現模型

3.1 知識表示模塊:構建基于領域本體的知識庫

目前,本體知識工程構建較常用的方法有:IDEF-5法、TOVE法、Methontology方法、骨架法和七步法等,其中骨架法是一種較為簡單高效的知識工程構建方法,其基本思路是:確定知識應用目的與范圍→對知識客體采集與分析→對知識客體標引(實現知識本、客體的映射)→本體知識庫構建。基于骨架法,領域本體知識庫的基本構建路線如下:

第一,對領域知識采集與處理。(1)領域知識采集的技術路線。在確立領域范圍的基礎上,利用爬蟲、知識挖掘等數據發現技術對分布異構的海量多粒度知識資源進行領域范疇的采集[14]:利用諸如程序調用、資源搜索、資源解析算法、情境識別跟蹤算法等爬蟲抓取工具進行領域知識采集;利用人工智能、機器學習等知識挖掘方法對非結構化的知識數據進行領域范疇識別,析出與領域范疇相關的知識類別、知識名稱、知識屬性、知識關系等數據。(2)領域知識分類的技術路線。利用聚類算法、分類算法等數學方法對領域知識進行分類[15]:利用聚類算法從海量多粒度的領域知識數據中識別出類別、名稱、屬性與關系等具有顯著性特征的關聯數據集,構建RDF三元組(Resource Description Framework,資源-屬性-值,一種基本的本體描述語言);利用分類算法對無序異構的數據集進行領域知識共現關系分類,生成基本的領域知識共現關系矩陣。(3)領域知識篩選的技術路線。借助程序模塊化技術與篩選算法對領域知識共現關系矩陣中的關系類型進行篩選:借助程序模塊化技術對領域知識共現關系矩陣中廣泛且具有復雜相互關聯特征的非結構化知識進行模塊化重組;基于領域本體的應用目標,利用篩選算法對模塊化的領域知識進行篩選,從元數據語義、領域詞匯主題、效用等方面初步實現結構化呈現,促進知識的螺旋式改進。

第二,對領域知識概念進行標引。利用標簽云軟件、映射工具對領域知識進行概念抽取與標引,賦予不同類型領域知識相應的概念標注并提取特征向量,以識別領域知識資源的內在邏輯關系。概念標引不僅是知識資源的描述,還是領域本體的構建過程,其有助于促進領域知識深層次隱性關聯的統一。如采用FCA-MERGE數據發現技術在客體知識與本體知識間建立映射關系的過程中,對知識客體進行著錄、標引,實際上就全面析出了數字圖書館知識彼此間的隱性關聯,實現了領域本體知識關聯挖掘的目的;利用改進tf-idf、互信息、PageRank等文本特征提取方法構建“領域術語詞典”的過程,實際上就實現了對領域本體的概念抽取與術語描述[16]。

第三,構建領域本體知識庫。領域本體知識庫通常呈樹狀結構,樹上的節點描述的是領域本體知識層次結構關系[17]。知識工程師只要將分類概念的屬性值添加到各層次分類概念中,便可以清晰地體現領域概念間的關聯關系。通常領域本體知識庫內的領域概念之間存在繼承關系、類屬關系、引證關系、等同關系、映射關系、論述關系等關聯關系。數字圖書館可利用統一建模語言(Unified Modeling Language,UML)、RSS聚合技術從不同的知識語境中挖掘知識資源所蘊含的領域本體概念,并采用面向關鍵詞、標題與主題圖的本體識別技術,生成實體標識一致、數據結構一致的高質量領域本體知識集合。為了提升領域本體知識庫質量,數字圖書館有必要采用大數據、本體匹配映射、行為認知、網絡演化分析等技術,基于知識名稱、概念抽取、術語描述三個維度對處于不同層次的領域知識概念進行深度挖掘,形成模塊化的知識網絡體系。

3.2 聚合交互模塊:構建領域本體知識與用戶畫像的交互路徑

促進用戶數據與本體知識庫之間的常態化交互是為數字圖書館用戶提供情景化、動態化、常態化的領域知識服務的中介節點。因此,聚合交互模塊的實踐核心是要構建領域本體知識與用戶畫像的交互路徑。

第一,深度領域知識聚合網絡的構建路徑。常見的聚合方法有兩種[18]。一種是基于領域關聯體系的聚合。即基于知識概念設定聚類閾值,將知識關聯聚合與閾值過濾相結合,提高標引知識網絡中個體數據的空間映射強度,賦予領域本體知識群聚性特征。一種是基于搜索引擎的關聯聚合。即憑借搜索引擎對領域本體知識進行二次組織與整理,形成深度知識聚合網絡。

第二,用戶畫像的路徑。用戶畫像的核心工作是給用戶貼“標簽”,通過用戶標簽賦予用戶數據以活力。用戶畫像構建技術主要有:基于詞袋模型的用戶畫像技術、基于知識圖譜的用戶畫像技術、基于矩陣分解的用戶畫像構建技術等,其中基于知識圖譜的用戶畫像技術應用較為廣泛。數字圖書館可利用平臺采集用戶小數據(包括用戶基本數據、瀏覽數據、檢索數據等),構建面向用戶畫像的知識圖譜[19]。即通過用戶行為關鍵詞的語義標引,生成可以表示用戶特性與用戶行為的標簽組合模型。用戶畫像是一個動態的模型,數字圖書館可以在服務過程中不斷完善用戶標簽組合,構建良性閉環。

第三,用戶畫像與領域本體知識的有效映射路徑。數字圖書館可利用大數據、機器學習等數據處理技術實現用戶畫像與領域本體知識的有效映射。新興的智能計算技術在“知識聚合—用戶畫像”交互應用中具有重要作用:大數據、機器學習、傳感器以及越來越容易獲得的高性價比大規模云服務,為數字圖書館構建“知識聚合-用戶畫像”交互機制提供強有力的新工具——先進的數據處理技術,提高了數字圖書館知識本體庫與用戶知識需求間的適配程度。如數字圖書館可以結合用戶訪問時間、訪問地點及訪問鏈接等信息構建知識鏈接結構序列拓撲圖,以提升用戶場景數據與知識資源的有效映射。

3.3 聚合服務模塊:多維度的知識聚合服務平臺構建與實現

基于領域本體的知識聚合服務平臺是數字圖書館為用戶提供領域知識聚合檢索、專題數據庫、場景化知識推薦等多維度領域知識服務的終端載體。

第一,領域知識聚合檢索平臺的構建與服務內容。數字圖書館可通過統計圖、網絡圖與過濾展示等方式為用戶創建友好交互的可視化窗口,并通過聚合檢索引擎與檢索窗口,為用戶提供高效的領域資源聚合、領域知識鏈接、領域知識概念圖等檢索服務[20]。檢索服務是一項約束性服務,數字圖書館基于本體知識庫與知識聚合、知識檢索技術,在對與作者、機構、主題相關的知識內容進行耦合性、定量化分析后,可為用戶提供基于約束條件的檢索服務:一方面,依托領域知識本體庫構建與關系結構的演化歷程,數字圖書館可基于用戶約束條件為用戶提供模塊化的知識檢索服務。另一方面,基于不同知識單元間耦合強度所形成的“知識簇”、基于知識檢索工具的映射功能,可將抽象的二維檢索結果轉化為直觀的圖形數據,讓用戶直觀地了解相關知識領域的發展軌跡,進而探測到對其有用的知識信息。

第二,領域專題知識服務平臺的服務輸出與技術要求。領域專題知識服務平臺的服務方向可以分為領域各學科專題知識服務、科研專題知識服務與信息素養專題知識服務等[21]。領域各學科專題知識服務主要包括領域內各個學科的資源導航數據庫服務、領域學科中的特色資源數據庫服務等;科研專題知識服務主要包括領域內科研咨詢專題庫服務、科研趨勢研判專題庫服務等;信息素養專題服務主要包括領域知識聚合的各類型數據庫使用、課程信息、論文寫作、應用軟件、投稿指南等服務。專題知識服務對數字圖書館提出了較高的技術要求,不僅要促進具有較高關聯性與聚合性特點的領域本體知識實現細粒度聚類融合,還需要以關聯展示方式向用戶提供多維交互的可視化集約知識。為了實現基于領域本體的專題知識服務,一方面,數字圖書館應利用Cosine算法、EM聚類算法、IDF加權算法對領域范疇內的各學科專題知識、科研專題知識、信息素養知識所蘊含的深層次信息進行解讀,生成具有個性化標簽的專題知識網絡圖譜。另一方面,數字圖書館還要采用大數據技術、嵌入技術將不同類別的專題知識聚合結果以協同嵌入方式提供給用戶,使用戶能夠快速全面地理解知識聚合結果的層級關系及鏈接分布規律。

第三,場景化領域知識推薦服務的實現路徑。在移動互聯網時代,用戶對數字圖書館知識聚合服務情境較為敏感,因此,提供與用戶知識利用情境相契合的場景化領域知識推薦服務也有必要。數字圖書館可憑借用戶畫像手段全面把握用戶對領域知識需求的發展趨向,利用移動智能終端、傳感器等情境感知技術,從海量的用戶使用數據中挖掘高頻使用場景及用戶行為軌跡,并以此為基礎創建用戶場景模型,以便當用戶進入某個特定場景時,實時推送與需求高度匹配的領域知識,動態滿足用戶對領域知識的需求[22]。

4 結語

全媒體時代,數字圖書館信息資源服務模式正不斷發生變化。數字圖書館通過領域本體的構建有助于海量數字資源實現從“無序”到“有序”的規整化聚合——將數字資源中零散的知識碎片高精度聚合起來,可幫助用戶準確分析其中有價值的信息,以滿足用戶多樣化的資源需求。然而,數字圖書館要實現領域知識細粒度聚合與智能化服務輸出,需要不斷提升資源、情境的實時把控能力,不僅需要實現領域本體知識描述、概念關系聚合與知識展示的深度融合,亦需要基于用戶感知有用性、易用性的雙重維度來拓展知識聚合服務的實踐路徑,有效激活知識聚合服務的系統性效能。限于研究專業的局限性,本文僅為數字圖書館提供了一個基于領域本體的知識聚合服務理論架構,該項服務若要真正付諸實踐,還需要知識工程師從技術領域給予全方位支持。

猜你喜歡
概念圖書館資源
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
基礎教育資源展示
一樣的資源,不一樣的收獲
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
資源回收
學習集合概念『四步走』
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
聚焦集合的概念及應用
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
飛躍圖書館
主站蜘蛛池模板: 18禁色诱爆乳网站| www成人国产在线观看网站| 欧美三级视频在线播放| 国产网友愉拍精品视频| 国产区在线看| 日本在线视频免费| 自拍偷拍欧美日韩| www.亚洲色图.com| 夜夜爽免费视频| 欧美激情视频二区| 亚洲激情区| 麻豆国产原创视频在线播放 | 国产在线91在线电影| a天堂视频| 国产在线精品人成导航| 91啦中文字幕| 国产精品视屏| 国产精品成人久久| 亚洲精品动漫| 一级全免费视频播放| 99在线视频精品| 久久精品人人做人人爽电影蜜月| 99久久精品国产综合婷婷| 色婷婷成人| 欧美亚洲日韩中文| 黄网站欧美内射| 国产福利不卡视频| 国产精品妖精视频| 亚洲色图欧美视频| 2021亚洲精品不卡a| 亚洲无码一区在线观看| 91福利免费视频| 国产成人高清精品免费软件| 国产精品免费电影| 国产h视频免费观看| 欧美激情成人网| 中国毛片网| 欧美国产综合色视频| 国产成+人+综合+亚洲欧美| 国产中文一区二区苍井空| 中字无码精油按摩中出视频| 国产毛片基地| 午夜色综合| 欧美丝袜高跟鞋一区二区 | 在线国产毛片| 亚洲精品波多野结衣| 亚洲午夜天堂| 五月天久久综合国产一区二区| 欧美yw精品日本国产精品| 五月婷婷欧美| 国产精品欧美激情| 色视频久久| 亚洲中文在线视频| 国产特一级毛片| 澳门av无码| 成人年鲁鲁在线观看视频| 狠狠操夜夜爽| 亚洲香蕉久久| 国产成人超碰无码| 91精品国产一区| 亚洲欧洲一区二区三区| 国产亚洲欧美在线专区| 日本在线亚洲| 欧美国产日产一区二区| 国产亚洲欧美日韩在线观看一区二区 | 亚洲毛片网站| 亚洲国产AV无码综合原创| 亚洲国产成人麻豆精品| 99精品视频九九精品| 草草影院国产第一页| 天堂岛国av无码免费无禁网站 | 美女视频黄又黄又免费高清| 国产精欧美一区二区三区| 国产网站在线看| 亚洲看片网| 国产男人天堂| 亚洲国产欧美目韩成人综合| 日韩123欧美字幕| 国产精欧美一区二区三区| 久久久国产精品无码专区| 国产福利拍拍拍| 在线看国产精品|