高國偉 王亞杰 李永先



[摘要]隨著數據和信息的日益增長,找到恰當的知識已成為真正的挑戰和急待解決的任務。如何表示知識元則是實現知識檢索的關鍵問題,這一問題一直困擾著人們從數據檢索、信息檢索向知識檢索跨越。本文在對現有知識元表示研究評述的基礎上,提出了“概念、關系、問題”三元組的知識元表示方法,介紹了該方法的特點,并分別對概念、關系、問題表示進行了形式化描述,最后通過應用實例證明了該表示方法的有效性和實用性。
[關鍵詞]知識檢索;知識元;知識元表示;知識庫
DOI:10.3969/j.issn.1038-0821.2015.03.003
[中圖分類號]G302 [文獻標識碼]A [文章編號]1008-0821(2015)03-0015-04
知識元的表示是一個符號化和形式化的過程,如何構建相應的知識元形式化描述方法和知操作方法是實現知識檢索的關鍵問題。隨著知識管理領域的不斷發展,眾多學者提出不同的知識元表示方法,并在知識元研究領域取得了一定進展。文獻[2]提出用樹結構來組織和表示知識元;文獻[3]采用了框架表示法,利用二元組標記知識元;文獻[4]采用面向對象法,利用三元組表示數值型知識元的結構;文獻[5]采用基于本體的知識表示方法建立文本知識元的抽取實驗提出了四層知識元模型;文獻[6]采用謂詞邏輯表示法,利用五元組來表示知識元的結構;文獻[7]采用產生式表示法,利用六元組表示數值型知識元;文獻[8-9]定義了一個七元組知識元模型:KE:=(id,T,CT,st,tc,title,did);文獻[10]抽象地給出了一系列關于模型和知識的概念,進而提出了模型知識元的概念;文獻[11]給出面向非常規突發事件演化分析的知識元表示模型;文獻[12]通過不同層次模型參數與知識元屬性之間的映射,實現通過模型組合網絡進行模型組合。
以上研究為知識元表示方法提供了很好的研究思路和方法,但仍存在以下問題:(1)二元組、三元組表示方法局限于文本知識元的表示及建構,僅側重于對知識元客體的描述,忽略了對知識元之間關系的表達;(2)四元組、六元組、七元組的表示方法,使得知識元的結構化程度日益增高的同時,表達方式顯得冗長,知識元之間關系的描述工作量大,造成推理不完備的隱患;也增加了計算機對自然語言處理的難度,造成在實際的中文文本知識元抽取過程中,計算機對語義內容的誤解,使得知識元抽取的準確率下降,造成文本結構的破壞。
本文借鑒本體論和認識論,從客觀知識世界本原角度出發,從實體和關系層面約束知識元,進而對這些約束的知識元進行分析,在模型知識元的基礎上,進行相應擴展,提出了“概念、關系、問題”的知識元表示方法。該表示方法主要揭示了知識元屬性間約束,以及知識元之間的關系,對知識元的粒度性做出形式化的描述,從根本上提高了計算機對文本知識元抽取的準確率。endprint