摘要:隨著互聯(lián)網(wǎng)的發(fā)展,傳統(tǒng)搜索引擎越來越不能滿足人們檢索信息的需要,而語義網(wǎng)技術(shù)又不夠成熟,在此情況下構(gòu)建領(lǐng)域本體庫用于領(lǐng)域檢索是一個行之有效的方法。文章基于語義網(wǎng)應(yīng)用基礎(chǔ)技術(shù),特別是本體技術(shù),構(gòu)建了一個計(jì)算機(jī)文獻(xiàn)檢索系統(tǒng)的框架,有一定的參考價值。
關(guān)鍵詞:本體;搜索引擎;JENA;RDQL;元數(shù)據(jù)
引言
傳統(tǒng)搜索引擎進(jìn)行信息檢索大都基于關(guān)鍵詞機(jī)械匹配技術(shù),將用戶輸入的檢索信息分割成分詞進(jìn)行匹配。由于參與匹配的是字符的外在形式,而不是它們所表達(dá)的概念,所以經(jīng)常出現(xiàn)檢索不全、答非所問的情況。產(chǎn)生這些問題的根本原因在于大部分Web頁信息基于HTML、XML語言,是一種無結(jié)構(gòu)或者半結(jié)構(gòu)的數(shù)據(jù),只能供人閱讀,計(jì)算機(jī)不能理解它們的含義。 科學(xué)家們正在研究新的技術(shù)以改變這種狀況,其中最令人矚目的就是語義Web技術(shù)。語義Web通過擴(kuò)展現(xiàn)有的萬維網(wǎng),在信息中加入表示其含義的內(nèi)容,使計(jì)算機(jī)可以自動對網(wǎng)頁信息進(jìn)行理解、分類和推理等,協(xié)助人們高質(zhì)量地完成各種工作。語義網(wǎng)上的信息檢索,能充分挖掘輸入的搜索信息的內(nèi)在含義,檢索出它的同義、近義、上位、下位等信息,還能進(jìn)行推理,這大大提高了信息查準(zhǔn)率,也提高了用戶滿意度。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文