劉媛媛


摘要:在海量的互聯(lián)網(wǎng)教育資源中精準有效的檢索到所需要資源的是當前在線教育建設的難點,該文針對傳統(tǒng)網(wǎng)絡教育資源檢索的不足,提出了一種基于本體的教育資源智能檢索系統(tǒng),通過介紹系統(tǒng)的設計,以及描述了教育資源本體的設計方法和構(gòu)建的具體步驟,實現(xiàn)了教育資源領域的語義智能檢索,結(jié)果表明,該系統(tǒng)提高了教育資源檢索的查準率和查全率。
關鍵詞:本體;教育資源;信息檢索
中圖分類號 G203 文獻標識碼 A 文章編號:1009-3044(2017)35-0001-02
1 概述
隨著信息技術(shù)的飛速發(fā)展,教育與互聯(lián)網(wǎng)結(jié)合的越來越緊密,網(wǎng)絡上出現(xiàn)了豐富的網(wǎng)絡教育資源。如何在海量的互聯(lián)網(wǎng)教育資源中精準有效的檢索到所需要資源成為在線教育建設的難點。信息檢索是一條有效的途徑,但是傳統(tǒng)的信息檢索大部分都是根據(jù)關鍵詞來查詢信息,但是僅僅根據(jù)關鍵詞來檢索很難完全匹配用戶的查詢需求。這是因為關鍵詞無法準確的表示邏輯語義,難以完全表示用戶的查詢意圖,會檢索出許多無關內(nèi)容;關鍵詞無法精準的描述內(nèi)容關系,難以全面反映用戶查詢要求,會漏掉許多近似內(nèi)容。針對傳統(tǒng)檢索難以精準的查詢到所需教育資源的問題,本文基于語義,提出一種智能教育資源檢索系統(tǒng),幫助用戶精準有效的檢索到所需的教育資源。
2 基于本體的教育資源檢索系統(tǒng)設計
基于本體的教育資源檢索系統(tǒng)綜合應用本體理論,語義網(wǎng)絡技術(shù)和信息檢索等相關技術(shù)。基于本體的檢索是通過的構(gòu)建描述某個事物及其關系的具體的本體,并且將其應用到相應的信息資源檢索之中。具體在教育資源檢索系統(tǒng)中,首先需要有對教育資源及其相關關系進行定義和描述的本體,然后基于教育資源本體來進行語義的推理和解析,實現(xiàn)精確檢索。
基于本體的教育資源檢索系統(tǒng)由用戶交換、檢索引擎模塊、教育資源本體模塊、元數(shù)據(jù)庫模塊、網(wǎng)絡采集模塊和RDF實例模塊六個部分組成。其中用戶交互模塊提供友好的用戶查詢檢索頁面;檢索引擎模塊負責根據(jù)教育資源本體信息解析用戶的查詢請求,并向元數(shù)據(jù)庫請求用戶所需數(shù)據(jù),并返回給用戶;教育資源本體模塊定義教育資源本體內(nèi)容,在查詢檢索過程中負責語義分析和推理;網(wǎng)絡采集模塊負責采集網(wǎng)絡信息;RDF實例模塊負責對所采集的信息基于教育資源本體信息進行標注處理,生產(chǎn)相應的本體實例,并且形成對應的RDF實例文件;元數(shù)據(jù)模塊負責存儲生成的RDF實例文件。基于本體的教育資源檢索系統(tǒng)的系統(tǒng)結(jié)構(gòu)如圖1所示。
3 基于本體的教育資源檢索系統(tǒng)的實現(xiàn)
3.1 系統(tǒng)的功能
基于本體的教育資源檢索系統(tǒng)的主要目標就是能夠更加準確高效的檢索教育資源信息,即提高查全率和查準率,其主要功能是實現(xiàn)基于語義的查詢,使檢索上升到基于語義檢索和知識檢索的層次。基于語義的教育資源智能查詢主要實現(xiàn)如下功能:1)能夠通過本體,實現(xiàn)對用戶數(shù)據(jù)關鍵詞的語義解析,豐富查詢結(jié)果。2)能夠?qū)崿F(xiàn)對用戶輸入的關鍵詞及其同義詞的查詢,如用戶輸入“計算機網(wǎng)絡”,對應的搜索結(jié)果不但有“計算機網(wǎng)絡”相關教育資源,還會有“網(wǎng)絡技術(shù)”、“網(wǎng)絡科學”、“網(wǎng)絡應用”等同義詞的相關教育資源。3)能夠?qū)崿F(xiàn)對用戶輸入關鍵詞及其相關聯(lián)內(nèi)容的查詢,包括關鍵次的上層關系和下層關系(即父類和子類關系),如用戶輸出“程序設計”,對應的搜索結(jié)果不但有“程序設計”相關教育資源,還會有“軟件開發(fā)”這樣的父類資源,也會有“Java語言設計”、“C語言基礎”等這樣的子類資源。
3.2 系統(tǒng)實現(xiàn)步驟
(1) 創(chuàng)建本體
基于本體的教育資源檢索系統(tǒng)首先需要創(chuàng)建教育資源本體,包含設計教育資源本體和將其應用到檢索系統(tǒng)中。本體是一種形式化表示“知識”的工具,目前已經(jīng)廣泛應用在語義網(wǎng)絡、信息檢索、人工智能等領域。本系統(tǒng)設計的本體是應用在教育資源智能檢索中,雖然有許多理論研究者和實踐工作者將本體應用到教育領域,但是當前在網(wǎng)絡教育資源領域還沒有一個統(tǒng)一的標準和方法,因此需要根據(jù)具體的應用來進行設計。本體的設計方法主要有“迭代設計法”和“至上而下設計法”兩種。“迭代設計法”的步驟是首先設計一個初始本體,然后不斷的修正和完善該本體的細節(jié),使之逐步的滿足所要實現(xiàn)的目標。“至上而下法”的步驟是從根目錄開始,不斷豐富其層次結(jié)構(gòu),從而達到描述目標對象的目標。本文采用本體編輯工具Protégé進行本體模型構(gòu)建,包括定義本體的類、類屬性、類層次和實例,設計教育資源本體的主要步驟包含如下幾步:1)確定范圍,即確定教育資源本體的領域知識所包含的范圍;2)描述概念,描述教育資源本體的中的重要概念;3)確定類,定義教育資源本體中的類和類的關系;4)定義屬性,定義本體類的屬性。5)確定屬性約束;6)建立實例。
(2) 語義標注
在基于本體的教育資源檢索系統(tǒng)中,設計好本體之后,需要基于教育資源本體信息進行標注處理,生產(chǎn)相應的本體實例,并且形成對應的RDF實例文件。語義檢索需要針對統(tǒng)一格式的文檔,一般采用基于XML語法的文檔,該文檔采用RDF三元組的方式描述信息資源。本研究采用手動的方式對采集的信息資源進行語義標準,標準的結(jié)果存儲在基于XML語法的XML實例文件中。
(3) 信息檢索
根據(jù)檢索條件,基于教育資源本體,采用jena推理機進行語義推理,最終得到檢索結(jié)果。在創(chuàng)建了教育資源領域信息知識本體構(gòu)和語義標注后,使用Jena推理機將XML文件轉(zhuǎn)化為可供檢索程序應用的格式。Jena是一款開源的,由惠普公司開發(fā)的基于Java的語義網(wǎng)工具包,是用來創(chuàng)建語義Web系統(tǒng)的框架,它提供基于本體的語義檢索相關工具API。
3.3 系統(tǒng)的運行效果分析
該系統(tǒng)實現(xiàn)了對教育資源的語義查詢,不僅實現(xiàn)對用戶輸入的關鍵詞及其同義詞的查詢,還實現(xiàn)了對用戶輸入關鍵詞及其相關聯(lián)內(nèi)容的查詢,包括關鍵次的上層關系和下層關系。
4 結(jié)束語
本文基于教育資源本體理論,構(gòu)建了計算機網(wǎng)絡學科領域的知識本體,實驗證明,基于本體的教育資源檢索在查準率和查全率上都有顯著提升。與傳統(tǒng)教育資源檢索相比,基于本體的網(wǎng)絡教育資源檢索通過教育資源的本體信息在本體層來檢索教育資源,利用合理完善的教育資源本體描述,表達了教育資源概念(類)的語義含義和相互之間的內(nèi)在聯(lián)系,幫助用戶更精準的檢索到所需要的教育資源信息,更好地滿足用戶需求。
參考文獻:
[1] 杜小勇,李曼,王珊,等.本體學習研究綜述[J].軟件學報,2006,17(9):1837-1847.
[2] 張祥,李星,溫韻清,等.語義網(wǎng)虛擬本體構(gòu)建[J].東南大學學報:自然科學版,2015,45(4):652-656.
[3] 楊月華,杜軍平,平源等.基于本體的智能信息檢索系統(tǒng)[J].軟件學報,2015,26(7):1675-1687.
[4] 劉毅,王宇,楊德禮,等.本體進化驅(qū)動的個性化語義搜索研究[J].情報學報,2015,34(10):1048-1055.
[5] 畢魯雁,焦宗夏,范圣韜,等.基于本體映射的設計知識庫搜索方法[J].計算機集成制造系統(tǒng),2009,15(10):1890-1899.
[6] 李春,楊明,顧婷婷,等.基于本體的信息關聯(lián)搜索[J].中國新通信,2017,19(11):25-27.
[7] 萬靜,王文聰,易軍凱,等.一種基于本體的知識庫語義擴展搜索方法[J].計算機工程,2012,38(6):19-21,24.
[8] 劉志亮,張金隆.基于教育云的教育信息資源整合框架研究[J].情報雜志,2013,(10):164-167.DOI:10.3969.endprint