陳堅

摘 要:通過引入本體技術,建立一種穩定性強、安全性好的基于語義的檢索模型,可以實現對網上大量的沒有統一分類、無序混雜的網絡教育資源的檢索。該文在闡述語義網、語義檢索、本體構建、元數據標準等關鍵技術基礎上,分析了本體與元數據的關系,給出了基于本體的網絡教育資源語義檢索系統的設計模型。
關鍵詞:本體 語義檢索 網絡教育資源
中圖分類號:TP391.3 文獻標識碼:A 文章編號:1672-3791(2015)03(c)-0186-01
在進行信息檢索時,用戶希望系統過濾掉不相關的無用信息,盡快的檢索出所有感興趣的信息,從而獲取最有價值的信息,這樣可以最高效的解決問題,這就要求檢索系統在能夠準確的理解用戶的信息的同時還需要具有關于檢索信息源的語義知識。在上述的要求下就出現了以本體論作為核心構建,基于語義的信息檢索系統。
1 關鍵技術
1.1 語義網
語義網實質上是多種現存技術結合構成的有機整體,就是能夠根據語義進行判斷的智能網絡,實現人機之間的無障礙溝通。語義網的技術層次架構分為七層:Unicode和URI層、XML+NS+xmlschema層、RDF/RDF Schema層、本體層、邏輯層、證明層、信任層。
1.2 本體
本體的建模元語由概念(或類)、關系、函數、公里與實例這五個部分構成,但并不是簡單的組合,這些構成的元素間也有著內部聯系。能夠有很好的構建本體的方法,就能使本體更好的發揮作用,這就要求本體構建方法研究也就顯得極為重要。已有的本體構建方法有七種,與IEEE標準比較,七種方法中七步法優于IDEF 5法等其它幾種方法。
本體和元數據都是用于處理網絡信息的方法,在信息檢索與領域知識的組織管理上有著重要的意義。元數據是關于WEB資源和其它一些實體的機器可理解的信息。由于元數據的作用,可以在元數據的基礎上構建本體,并能構建出符合規范的本體。利用現在教育領域中已有的元數據規范的優勢,采用七步法構建領域本體。七步法構建本體的步驟與元數據的映射關系如表1。
對于語義檢索,根據建立的知識點和資源的語義以及兩者關系,結合本體規則推理和向量空間模型來計算相似度;在向量空間模型的基礎上引入本體對用戶查詢進行語義擴展,進而將相似度分為概念和屬性兩個方面來綜合計算,來實現檢索算法。
2 系統設計
影響網絡教育質量的關鍵性問題是教育資源的管理與使用,這就要求在對教育資源進行管理和使用中語義檢索系統應采用先進的本體技術并要具有以下功能。
教育資源檢索功能:根據用戶給定查詢條件,采用本體技術,查找資源庫中已有的各類教育資源;教育資源管理功能:教育資源的本體管理和對各類教育資源進行管理,具體包括對教育資源的增、刪、改、查的功能。
以上述的技術與方法為基礎,設計的基于本體的網絡教育資源語義檢索系統模型如圖1。
語義檢索系統可以分為以下模塊來進行設計:
(1)用戶模塊:用戶模塊包括用戶基本操作頁面及檢索請求(查詢輸入),系統可以分為擁有三種不同權限的用戶,分別是:學生(普通用戶),可以瀏覽并檢索網絡資源的功能,還可以對自己的資源進行增、刪、改、查的功能;教師(高級用戶),可以瀏覽和檢索全部網絡資源、管理學生用戶以及管理自己資源的功能;管理員(超級用戶)擁有檢索和瀏覽全部資源及管理全部資源的功能權限。
(2)檢索模塊:這部分的模塊功能包括分詞處理、生成查詢向量、生成語義資源向量以及檢索處理(計算相似度)幾個部分:①分詞處理:可以采用漢語詞法分析系統ICTCLAS進行處理,其主要功能包括中文分詞;詞性標注,命名實體識別并支持多種編碼格式等功能。②生成查詢向量:這部分的功能是為語義檢索做準備,會將分詞處理的結果,根據語義化查詢向量的方法,生成語義化的查詢組。③生成語義資源向量:這部分的功能是為語義檢索做準備,會根據用戶的需求,給建立好的資源本體中的資源屬性賦予權值,生成語義化的資源向量。④檢索處理:這部分的功能是根據檢索的算法,計算語義化查詢向量和語義化的資源向量的相似度,檢索出滿足條件的資源,再根據相似度的計算方法分別計算概念相似度和屬性相似度,來確定最后的相似度。
(3)本體管理模塊:本體是語義檢索的基礎,是整個系統中就最為重要的模塊。可以通過本體管理工具Jena API來實現。
(4)資源管理模塊:該模塊與本體管理模塊相連包括資源本身的管理和資源描述的管理,其中資源描述的管理在本體的管理中實現。
3 結語
穩定性、安全性好的網絡教育資源語義檢索系統,能夠幫助使用者全面地掌握有關的必要信息,增強決策的科學性;提高信息利用的效率,縮短獲取信息的時間,提高了工作效率,增強信息意識,熟悉檢索技巧,提高科研工作的成功率,進而促進整個社會的進步和發展。
參考文獻
[1] 林貴霞,胡德敏.基于本體的語義檢索模型設計與實現[J].微計算機信息,2011(3).
[2] 郭廣軍,王劍波,游新娥,等.基于本體和語義網的網絡教育資源檢索研究[J].華中師范大學學報(自然科學版),2011(4).