陳志飛 岳琪 陳廣勝
(東北林業大學,哈爾濱,150040)
?
基于森林病蟲害領域本體的概念相似度算法改進1)
陳志飛 岳琪 陳廣勝
(東北林業大學,哈爾濱,150040)
傳統的基于本體概念的相似度算法過于依賴層次結構,且忽略了許多影響概念間語義相似度的因素。針對這一問題,通過引入邊權重關系、語義相關度影響因素,提出1種新的基于森林病蟲害本體的語義相似度的計算方法。結果表明:改進后的相似度算法比傳統算法更接近林業相關領域的專家經驗值,證明了該方法的準確性及有效性,體現了林業領域本體概念間的復雜關系。
語義相似度;本體;森林病蟲害
在當今知識型經濟社會,海量的林業信息已成為國家重要的戰略資源。然而,隨著信息資源逐漸增多,傳統的基于關鍵字層次的信息搜索已經不能滿足人們的需求,用戶無法準確得到基于真實語義的搜索結果。如何為用戶提供更準確、更全面的檢索方式已成為一個亟待解決的問題。隨著問題的出現,領域本體這一概念逐漸成為解決這一問題的方式。領域本體主要描述的是特定領域內概念與概念之間的關系[1]。它可以將人機交互通過語義連接的方式,使得信息檢索在各領域內具有更高的檢索效率及準確度。因此,在林業研究領域,基于本體進行信息檢索對解決復雜的林業問題是一個新的方向。
目前,很多學者對基于領域本體的信息檢索進行了研究,他們認為利用領域本體能夠針對復雜的問題進行高效的語義檢索,而語義相似度計算是基于本體信息檢索研究中的關鍵環節[2]?!?br>