999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

領域本體模型構建與信息檢索方法研究

2016-04-04 03:17:40郭維威褚洪波李曉艷田鐵剛尹衍林
時代農機 2016年1期
關鍵詞:信息檢索語義概念

郭維威,褚洪波,李曉艷,劉 鋒,田鐵剛,尹衍林

(黑龍江工業學院,黑龍江雞西 158100)

?

領域本體模型構建與信息檢索方法研究

郭維威,褚洪波,李曉艷,劉鋒,田鐵剛,尹衍林

(黑龍江工業學院,黑龍江雞西158100)

摘要:傳統的信息檢索主要是利用關鍵詞進行匹配檢測的,在信息檢索過程中時常出現檢索結果不全等問題。通過引入了本體論、構建本體框架,利用概念相似度的信息檢索方法,從而提高信息檢索的查全率和查準率。

關鍵詞:信息檢索;領域本體;概念相似度;語義距離

1 信息檢索問題與本體語義Web技術

(1)傳統信息檢索方法的缺陷。傳統的信息檢索主要是利用關鍵詞進行匹配檢測的,也就是將待檢測的信息分解成若干個關鍵詞進行檢索。在檢索過程中這些關鍵詞字符只能從字面上來理解其含義,而詞匯的內在概念無法表示出來,所以在信息檢索過程中時常會出現檢索結果不全、檢索結果還會出現一些用戶不需要的信息;同時檢索結果也很難檢索到關鍵詞背后潛藏的信息。產生上述問題的主要原因是傳統的檢索方法很少具有關鍵詞語義的邏輯推理能力,而且大部分網頁信息都是采用無結構或半結構的HTML和XML語言開發設計的,檢索中計算機只能按照其結構類型進行解析,而不能準確理解它們的內在含義。

(2)基于本體語義Web技術。為了解決傳統檢索方法中存在的這種問題,學者正在研究新技術和新方法,其中比較成功的是基于本體語義Web的技術?;诒倔w語義web技術是在萬維網的基礎上進行了擴展,在檢索信息中引入語義內容。該語義內容和關鍵詞很相近,或可以代替關鍵詞,通過語義內容檢索時可以對頁面信息分類理解,這樣就可以有效的協助用戶完成各項檢索操作?;诒倔w語義Web的檢索技術從根本上能夠克服傳統檢索模型僅提供基于關鍵詞檢索存在的缺點,能夠充分表示檢索信息的內在意義,并檢索出與輸入信息的同義詞與近義詞、上位與下位等信息,從而提高了對信息檢索的查全率和查準率,也提高了用戶滿意度。

2 本體定義及相關研究

(1)本體定義及領域本體。本體(Ontology)是“世界上客觀存事物的系統地描述,即本體可以理解為存在論”,對本體的定義有很多種,其中對其普遍的定義為“本體是具有明確的共享概念化的一種形式說明”。領域本體的定義過程具有樹狀結構,我們通過已經定義好樹狀層次結構,用來描述概念與概念之間以及領域本體中的各種關系,從而進一步實現各種應用之間的資源共享。領域本體具有很好的層次結構,該結構呈樹狀結構顯示,這種結構能夠有效的支持概念之間的邏輯推理,所以領域本體在信息檢索方面具有較好的應用價值。創建本體模型的工具可以選擇由斯坦福大學利用Java編寫開發的開放源碼本體編輯器Protege,它不僅可以建立本體的模型,還可以將已經建立的模型轉換為相應的文件并存儲在數據庫中,為以后檢索操作奠定基礎。

(2)研究的相關工作?;诒倔w語義的信息檢索過程中主要考慮到文檔的內部結構,可以利用集成化的、非形式化的和形式化的方法進行信息檢索。使用非形式化方法進行信息檢索時,主要是借助于語義空間模型,利用統計與概率分析方法為進行本體語義檢索,在語義空間模型的表示下,可以通過空間向量之間的相互乘積來計算索引項和文檔之間的語義關聯程度,進而完成信息檢索,使檢索結果更全面。按照自然語言的理解領域也可以完成信息檢索,其過程是首先通過深入的分析自然語言文本,然后通過分析來獲取完整的、復雜的語義信息。采用這種方法描述,可以在一個領域本體的支持下,利用概念層次結構表示的語義,這種方法得到的結果的查全率和查準率都比較低。在信息檢索中引入本體,將數據實現了語義描述,采用領域本體語義的信息檢索能取得較好的檢索效果。

3 領域本體模型的構建方法

領域本體模型構建時,首先要考慮到本體的組成部分。通常情況下,一個領域本體由以下幾個方面組成,即該領域本體的層次體系、對應屬性及屬性的取值范圍、本體層次間的語義關系、層次之間的推理規則。利用領域本體中類、關系、函數、推理規則和實例五個基礎說明來描述本體結構模型。其次在建立領域本體模型時要有相應的領域專家與知識專家的共同參與,其構建過程是一個繁瑣的手工過程;本體構建可以利用概念節點的有向圖來表示,每個概念由對象、事件和屬性三個部分組成,概念之間的關聯可以利用有向圖節點之間的連線來表示。構建本體時要明確本體包含的范圍,還要考慮到本體以后的重用,本體建構的具體過程有5個步驟。

(1)確定領域本體覆蓋范圍。明確需要建立本體的目的和任務,因為研究的領域越大,所需要建立的本體就越大,因此要根據需要來限定本體的研究。

(2)對待要建立的本體進行分析。定義本體中需要的專業術語,同時確定術語的含義以及術語之間存在的相互關系,在此過程中要求有領域專家和知識專家的參與,如果對該領域了解非常全面、詳細,那么所建立的領域本體也就越完善,檢索時更加準確。

(3)領域本體的表示。通常情況下采用語義模型表示本體,如概念及其屬性模型。

(4)領域本體建立的標準驗證。本體的建立要遵循清晰性、一致性、完整性和可擴展性四個標準。清晰性是指本體中采用的術語要專業,同時沒有二義性;一致性是采用的邏輯關系要一致;完整性是指領域本體中的概念及其屬性的描述要完整,要包含所建立領域本體內所有概念,雖然有一定的難度,但要不斷的維護和完善;可擴展性是指隨著領域的不斷發展可以隨時引入新的本體。

(5)領域本體的建立。對符合上述標準的予以建立,否則跳轉到第二步。

4 基于領域本體的信息檢索方法

概念相似度的計算主要有3種方法。

(1)基于距離的相似度計算。該方法的思想是利用概念之間層次結構中的幾何距離來量化的,這種計算方法依賴領域本體的基本結構,本體建構的是否嚴密將導致計算結果的精準度。

(2)基于信息內容的語義相似度計算。這種方法引入多個概念之間的公共信息,如果公共信息多,則說明這幾個概念具有高相似性,那么其語義相似度也就越大,相反則越小。如果某個概念出現的頻率很小,則認為概念的信息量就很大。

(3)基于屬性的相似度計算。通常情況下判斷事物之間是否具有聯系時,可以利用他們之間的特征來判斷,也就是利用他們具有的屬性來判斷其相似性。比如判斷兩部手機是否相似或相同,我們就可以利用其的品牌、屏幕的大小、相關配置和顏色等屬性來判斷,如果屬性都相同,則說明兩個事物相同,如果公共屬性很多,則說明兩者具有相似性。

參考文獻

[1]王兵.本體概念的語義相似度研究[J].世界科技研究與發展,2013,(1).

[2]劉鋒.一種優化的基于領域本體語義距離的概念相似度計算模型研究[J].曲阜師范大學學報,2015,(10).

[3]丁政建.一種改進的相似度計算方法[J].計算機工程,2010,(12).

The Resear
ch on the Construction of Domain Ontology Model and Information Retrieval Methods

GUO Wei-wei,CHU Hong-bo,LI Xiao-yan,LIU Feng,TIAN Tie-gang,YIN Yan-lin
(Heilongjiang University of Technology,Jixi,Heilongjiang 158100,China)

Abstract:Traditional information retrieval depends on keywords to do matching detection.Therefore,problems such as incomplete retrieval results occur a lot during the retrieval process.Through introducing the ontology,constructing ontology framework,and using the concept of similarity information retrieval methods to improve the recall ratio and precision of information retrieval.

Key words:information retrieval;domain ontology;concept similarity;semantic distance

作者簡介:郭維威(1978-),女,黑龍江雞西人,碩士研究生,副教授,主要研究方向:數據庫、軟件開發。

基金項目:本文系2014年黑龍江省教育廳科學技術研究項目“基于領域本體的語義web智能搜索模型的研究”的階段成果,項目編號:12543050。

收稿日期:2015-12-11

中圖分類號:TP391.3

文獻標識碼:A

文章編號:2095-980X(2016)01-0093-02

猜你喜歡
信息檢索語義概念
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
語言與語義
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
學習集合概念『四步走』
聚焦集合的概念及應用
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
基于神經網絡的個性化信息檢索模型研究
認知范疇模糊與語義模糊
教學型大學《信息檢索》公選課的設計與實施
河南科技(2014年11期)2014-02-27 14:10:19
主站蜘蛛池模板: 中文字幕色在线| 99九九成人免费视频精品| 99久久精品国产综合婷婷| 中文字幕乱码中文乱码51精品| 日韩午夜福利在线观看| 国产网站免费| a毛片在线免费观看| 精品无码国产一区二区三区AV| 亚洲国产AV无码综合原创| 亚洲第一天堂无码专区| 天天摸夜夜操| 91精品久久久无码中文字幕vr| 亚洲成肉网| 天天综合网色中文字幕| 国产精品免费电影| 亚洲大尺码专区影院| 亚洲天堂久久久| 欧美日韩高清在线| 福利姬国产精品一区在线| 19国产精品麻豆免费观看| 日韩第九页| 国产精品深爱在线| 亚洲成人动漫在线观看| 国产无吗一区二区三区在线欢| 国产成人精品高清不卡在线| 亚洲第七页| 国产女人水多毛片18| 狠狠久久综合伊人不卡| 欧美精品二区| 在线观看国产精品第一区免费 | 人人爽人人爽人人片| 精品久久国产综合精麻豆| 无码一区18禁| 国产精品亚洲一区二区三区z | 亚洲综合久久成人AV| 99久久亚洲综合精品TS| 国产精品一线天| 老司国产精品视频91| 国产亚洲视频在线观看| 亚欧美国产综合| 亚洲天堂精品视频| 天天操精品| 67194在线午夜亚洲| 国产精品国产主播在线观看| 青青久视频| 18黑白丝水手服自慰喷水网站| 激情无码字幕综合| 91亚洲精选| 97视频在线精品国自产拍| 久久人搡人人玩人妻精品一| 欧美亚洲第一页| 国产高清色视频免费看的网址| 亚洲国产精品日韩欧美一区| 欧美中出一区二区| 啦啦啦网站在线观看a毛片| 亚洲国产精品一区二区第一页免| 国产白浆在线观看| 露脸国产精品自产在线播| 四虎永久免费网站| 一级做a爰片久久毛片毛片| 欧洲av毛片| 国产精品乱偷免费视频| www.国产福利| 日本AⅤ精品一区二区三区日| 99在线视频网站| 国产一在线观看| 国产丰满大乳无码免费播放| 亚洲精品动漫| 激情無極限的亚洲一区免费 | 国产欧美视频在线观看| 真实国产乱子伦高清| 国产精选自拍| 成人精品亚洲| 国产精品妖精视频| 免费国产黄线在线观看| 国产麻豆另类AV| 国产成人精品在线| 97久久精品人人| 国产亚洲精品yxsp| 亚洲区视频在线观看| 永久成人无码激情视频免费| 亚洲成人福利网站|