(大連理工大學 系統工程研究所, 遼寧 大連 116024)
摘 要:在總結本體和基于范例的推理(CBR)各自的發展現狀,分析它們各自的特點、面臨的困難與不足的基礎上,從理論上分析了基于本體的CBR系統正在逐漸成為研究熱點的原因——發現本體與CBR相結合必然產生雙贏的局面;進而對國內外基于本體的CBR研究進行綜述,總結了存在的不足和面臨的主要困難,并提出了一個初步的解決策略和今后的發展方向。
關鍵詞:本體;基于范例的推理;基于本體的范例推理系統
中圖分類號:TP391 文獻標志碼:A
文章編號:10013695(2009)02040605
Survey on ontologybased CBR system
GAO Junjie, DENG Guishi
(Institute of Systems Engineering, Dalian University of Technology, Dalian Liaoning 116024, China)
Abstract:Based on summarizing the respective development and status of ontology and casebased reasoning (CBR), and analyzing the relevant characteristics and facing difficulties of them,found that ontology and CBR could benefit from each other in integrating environment, and that was why ontologybased CBR was becoming the hot topic.Summarized the existing researches about ontologybased CBR and the current deficiencies and facing difficulties,and then proposed a rough strategy to overcome the difficulties and the future development trend.
Key words:ontology; casebased reasoning; ontologybased CBR system
1 本體和CBR的發展與現狀
1.1 本體
1.1.1 本體的定義與表示
本體原本是哲學上的概念,20世紀90年代初被引入計算機界,并成為包括知識工程、自然語言處理和知識表示等諸多人工智能研究團體的熱門課題。人們對本體的認識和定義經歷了一個不斷深化的過程。1993年,Gruber給出了本體的一個流行的定義,即本體是概念模型的明確的規范說明;后來,Borst在此基礎上給出了本體的另一種定義:本體是共享概念模型的形式化規范說明;Studer對上述兩個定義進行了深入的研究,認為本體是共享概念模型的明確的形式化規范說明。這包含四層含義:a)概念模型是指通過抽象出客觀世界中一些現象的相關概念而得到的模型,概念模型所表現的含義獨立于具體的環境狀態;b)明確是指所使用的概念及使用這些概念的約束都有明確的定義;c)形式化是指本體是計算機可讀的(即能被計算機處理);d)共享是指本體中體現的是共同認可的知識,反映的是相關領域中公認的概念集,即本體針對的是團體而非個體的共識[1]。
本體的表示有多種,有僅表示概念的簡單表示,有表示概念和屬性的框架和語義網絡表示,還有能表達豐富語義的邏輯表示。但總的來說,本體的表示主要分三類,即基于人工智能的表示、基于圖的表示、與WWW相關的本體描述語言。在過去的二十多年里,首先出現的是Ontolingua、LOOM、OCML、Flogic等基于人工智能(AI)的傳統本體語言,它們多數基于框架模型和謂詞邏輯。這類表示語言的長處在于形式化的表示利于機器的自動處理,可以結合包含檢查、自動分類等算法;主要缺點在于形式化表示形式的限定,有些知識很難用謂詞邏輯準確地表示出來。基于圖的表示方法是另一種重要的本體表示方法,它的最大特點是直觀。WordNet采用語義網絡作為其詞匯的表示形式,是典型的基于圖的本體表示例子。隨著對WWW研究的深入展開,許多與WWW相關的本體描述語言如RDF、RDF Schema、SHOE、DAML、OIL和OWL相繼出現,這些語言除了SHOE的語法基于HTML外,其他語言的語法都基于Web信息交換標準語言——XML。
1.1.2 建模原語和層次模型
Perez等人[2]利用分類法組織本體,歸納出五個基本建模原語,即概念(concept)、關系(relation)、函數(function)、公理(axiom)和個體(individual)。其中,概念被用于一個廣義的理解。它可以指任何事務,如任務、方法、行為、策略和推理過程。從語義上講,它表示的是實例的集合,其定義一般采用框架結構,包括概念的名稱、與其他概念之間的關系的集合以及用自然語言對概念的描述。關系表達了在領域中概念之間的交互作用,形式上定義為N維笛卡兒積的子集R:C1×C2×…×Cn;在語義上關系對應于對象元組的集合。函數是一類特殊的關系,該關系的前N-1個元素可以惟一決定第N個元素。形式化定義為F:C1×C2×…×Cn-1→Cn。公理代表永真斷言。個體代表元素。概念與個體的對應關系如同類和對象的對應關系,前者是后者的抽象,后者是前者的具體化。個體繼承對應概念的語義信息。
圖1展示了本體信息的層次模型,可以完成領域內信息的記錄、語義解釋建模和推理,它分為邏輯層、原語層、概念層和數據層。其中,數據層對應的是本體中的領域個體;概念層則描述這些領域個體之上的語義概念以及相互之間的屬性關系和約束;原語層提供相關的建模原語操作,可以通過這些操作構建本體或者訪問本體,機器在原語層通過對個體、概念、關系等建模原語的操作接口得到數據以及相應的語義信息;邏輯層提供針對本體的推理,本體的描述語言常常是建立在描述邏輯之上的。通過邏輯層的推理,可以知道本體的那些表層標記下的更深層的語義信息。
1.1.3 本體的構建
出于對各自問題域和具體工程的考慮,構造本體的過程各不相同,目前沒有一個標準的本體構造方法。最有影響的是Gruber提出的五條規則:a)明確性和客觀性。本體應該用自然語言對所定義的術語給出明確、客觀的語義定義。b)完全性。所給出的定義是完整的,完全能表達所描述的術語的含義。c)一致性。由術語得出的推論與術語本身的含義是相容的,不會產生矛盾。d)最大單調可擴展性。向本體中添加通用或專用的術語時,無須修改已有的內容。e)最小承諾。對待建模對象給出盡可能少的約束。
目前本體構建基本還采用人工方式,公認在構造特定領域本體的過程中需要領域專家的參與。比較成型的本體開發方法有TOVE方法、METHONTOLOGY、本體生命周期法等。
當前眾多的本體構建工具,根據所支持的本體描述語言大致可以分為兩類。第一類包括Ontolingua、OntoSaurus、WebOnto等,其共同點是都基于某種特定的語言(Ontolingua基于Ontolingua語言,OntoSaurus基于LOOM語言,WebOnto基于OCML語言),并在一定程度上支持多種基于AI的本體描述語言。第二類包括Protégé系列、WebODE、OntoEdit、OilEd等,這些工具最大的特點是獨立于特定的語言,可以導入/導出多種基于Web的本體描述語言格式(如XML、RDF(S)、DAML+OIL等)。其中,除了OilEd是一個單獨的本體編輯工具外,其他都是一個整合的本體開發環境或一組工具,它們支持本體開發生命周期中的大多數活動,并且因為都是基于組件的結構,很容易通過添加新的模塊來提供更多的功能,具有良好的可擴展性。
1.1.4 本體分類與研究內容
本體描述的形式化程度可低可高(從自然語言到邏輯語言),但形式化程度越高,越便于機器的自動處理。本體的一般性(generality)層次也可低可高,Guarino據此給出了本體的一種分類,如圖2所示[3]。其中,頂層本體(又稱通用本體)用于描述非常通用的概念,如時間、空間、物質、對象、事件、動作等,其獨立于特定的問題和領域,可以在很大的范圍內共享。通過特殊化頂層本體中的概念,領域本體則研究與一個特定領域有關的術語或者詞匯(即陳述性知識),如醫學、生物、歷史、地理等;任務本體描述與一般任務或推理活動有關的概念(即過程性知識),如診斷、設計等。它們都可以引用頂層本體中定義的詞匯來描述自己的詞匯。通過進一步特殊化領域本體和任務本體,應用本體用于描述既依賴于特定領域又依賴于特定任務的概念,這些概念通常對應于領域個體執行特定的活動時所扮演的角色。
當前,知識工程領域對本體的研究主要包括三個層次的內容:a)本體論工程。研究和開發本體的內容,包括研究和創建特定領域的本體庫,研究和建立通用知識(或常識知識)的本體庫兩個方面。b)本體的表示、轉換和集成。研究用于表示各種本體的知識表示系統,提供形式化的方法和工具,使所建立的本體能夠方便地被共享和重用;提供不同的本體評價和比較框架,研究不同本體之間的轉換方法和不同本體的集成方法;提供不同本體之間的互操作手段。c)本體的應用。主要研究以特定領域本體或通用知識本體為基礎的應用。
1.2 基于范例的推理(CBR)
1.2.1 CBR的產生與理論基礎
在認知科學理論的啟示和支撐下,美國耶魯大學Roger Shank于1982年首次提出了CBR理論的認知模型及框架;此后,Kolodner等人以此為基礎,開發出了名為CTRUS的CBR系統。從此,CBR理論突破了認知科學的理論框架,開始走向人工智能領域的研究和應用。CBR實際上是通過接受以往范例的知識或信息用于新范例的求解過程。
通常認為Kolodner對現實世界的四個假設[4]是CBR方法的基礎,它們分別是:a)正則性。世界通常是正則的,在相同情況下執行相同的行為、操作,往往會導致相同或相似的結果。b)典型性。情況和事件往往是重復發生的,所遇到的情況和經驗很可能在未來環境中是典型的或相似的。c)一致性,也稱為相對穩定性。如果世界發生了一些小變化,對世界的觀念往往只需作稍許的變化即可,而不是進行大改變。d)易適應性。盡管現實世界中的情況和事件很少完全重疊,但是兩個事件差別很小的情況卻較為常見。通常認為較小的區別容易補償,即相對容易調整(或適應)。
1.2.2 CBR工作原理與過程
CBR工作原理是模仿人們的認知心理過程[5]。在CBR中,以范例為基礎進行推理,把人們以往的經驗存儲成一個個的范例,當面臨新問題時,對范例進行搜索,找到合適的范例作為參考,這其實是實現經驗的重用;如果對找到的范例有不滿之處,就可以進行修改以適應當前情況,修改后的范例將被再次存入范例庫,以便下次使用時作為參考,這其實也就是實現經驗的自學習。一個完整的CBR系統一般包括幾個循環過程,也稱為CBR的生命周期,如圖3所示。Aamodt歸納為“4R”[6],即retrieve、reuse、revise和retain,一般翻譯為檢索、重用、修改/修正、保留。
范例檢索是關鍵,其主要任務是檢索范例庫,計算范例庫中范例與問題范例的匹配程度,從而獲得新問題的相似范例。相似性度量方法是關鍵,常用的方法有最近鄰法、粗糙集方法、模糊方法等,不同的方法各有側重。其中,最近鄰法是最直觀、最通用的,它根據范例之間的語義距離推算出范例的相似度。范例重用就是在獲取的范例中重用相似范例的解答來解決問題,大致分為拷貝和調整兩部分。前者是拷貝重用范例的解決方案;后者是用戶通過了解過去范例對象的信息來判斷它與問題范例之間的不同,適當地調整以進行重用過去范例的相關部分。范例修改是當通過重用過程得到的范例解決方法不正確時,對問題范例解決方案的修改;范例存儲是為將來解決問題保留可能有用的經驗部分,也就是將新范例以范例對象的形式存儲于范例庫,并且以范例知識的形式存儲于領域知識庫中。
1.2.3 CBR分類與應用領域
根據數據源的不同,傳統CBR主要可分為以下三種類型: a)文本型范例推理方法。與傳統的信息檢索相似,直接操作文本文檔。其中沒有用于推理的領域模型,但是相似度可以通過文檔中的詞匯來測量。因此,范例檢索很像關鍵詞匹配,只是這里還要考慮文檔規模的匹配。b)對話型范例推理。在顧客/代理對話的過程中獲取知識,通過問題列表來表示范例,問題項根據范例的不同而不同。所有范例無統一的領域模型以及標準結構,這一方法對于需要重復處理大量簡單問題的領域非常適用。c)結構化范例推理(SCBR)。依靠事先定義好的屬性和值來表述范例。在不同的系統中,屬性可以被組織為表、一組關系表或者面向對象的形式。在必須使用除范例以外的其他知識以獲取好的結果的情況下,SCBR方法非常有用,已經成為應用最廣、研究最多的主流。
當前,CBR應用的領域已經涉及到故障診斷、決策支持、客戶服務、計劃、法律推理、類比推理等。這些領域有著共同的特點,即沒有很強理論模型、領域知識不完全、經驗知識豐富。廣義上講,CBR方法在應用上可分為兩類問題,即分類問題和綜合問題,后者比前者復雜。
2 本體與CBR的結合
2.1 本體的作用與面臨的困難
本體的目標是捕獲相關領域的知識,提供對該領域知識的共同理解,確定該領域內共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術語)和詞匯間相互關系的明確定義,即以實現知識的共享、集成和重用為目標。
本體的作用主要包括:a)實現領域知識的交流與共享。通過構建一個統一框架或者一個規范模型來減少概念和術語上的差異,使得工作在不同領域之中或者應用不同操作平臺的人員之間信息的共享和交流成為可能。b)實現領域知識的重用。通過維護、擴充領域本體,使得面向領域的應用系統的開發工作不必從頭做起,大大縮短了開發周期,節省了開發費用。c)知識的標準化。本體為人們描述目標世界提供了一組通用詞匯,而這種通用的詞匯正是實現知識系統化的基礎。通用詞匯和知識的系統化有利于實現知識的標準化。d)提高信息化的實施效率和質量。在軟件系統的設計和實施過程中,利用本體對需求解決的問題和任務進行規范描述,可以提高需求分析、信息獲取的效率,節約成本;利用本體的概念化表達可以實現對信息(或知識)的一致性進行自動或者半自動的檢查,從而提高了系統的可靠性。
然而,本體的研究和應用總體來說還處于發展初期,仍然存在大量問題需要進一步研究,并嘗試各種可能的途徑來解決。典型的問題主要包括本體構建、本體評價、本體進化和維護、本體集成四個方面。其中,當前最需要解決也是研究最多的問題仍集中在如何有效、方便地構建本體方面,這是因為一個完整、準確的本體是有效的知識集成系統的必要前提。然而,其面臨的主要困難包括:如何真正做到本體的詳盡性,如何確定最合適的本體描述粒度,如何將隱性知識以形式化的方式確切表示,如何通過自然語言處理、機器學習、聚類和統計學等方法輔助本體構建等。同時,本體的邏輯基礎大多是基于描述邏輯的,然而,嚴格的邏輯推理只能針對嚴格定義且固定的討論域,而且必須基于封閉世界假設的,這大大限制了基于本體推理的應用范圍。當前本體應用方面典型的成功案例不多,與相對成熟的技術相結合,建立成功、典型的工程應用是當務之急。
2.2 CBR的優點與不足
基于范例推理相對于傳統知識庫的優點很多,主要包括:不需要明確的領域模型,避開了知識獲取的瓶頸,因為知識獲取只不過是獲得過去發生的范例;可以在沒有明確模型的領域內得到應用;CBR系統在運行時可以很快地產生問題的解,僅需從范例庫中檢索相似范例;CBR系統的解釋更令人滿意,提供給用戶的是具體的范例容易理解;可以很快建立應用系統,因為范例庫可以不斷增長,所以即使僅有少量范例,CBR也可以運行;系統的維護更方便、簡單,可以通過獲取新范例來學習。正是由于這些優點,使得在不同的領域,CBR系統都有出色的表現,支持了企業的知識管理。
傳統的CBR系統主要存在以下不足:a)理論知識與范例以及資源之間缺乏連通性。現有范例知識管理系統缺乏理論知識和資源方面的支持,只是單純的范例分類管理。b)CBR系統工具化,缺乏可擴展性。一種工具只能用于特定領域的范例模型。c)范例檢索基本僅采用關鍵字檢索方式,不能保證檢索的查全率和查準率。CBR推理過程不具有重用性,相似的CBR推理過程需重復開發。d)范例的表示方法缺乏規范性、一致性和可擴展性,導致范例的共享性、重用性和互操作性差。相同領域的不同系統的信息描述模型不同,存儲管理各異,形成了一個個“信息孤島”,導致企業工作效率降低開發維護成本上升。
2.3 結合
德國的Ralph對SCBR與基于本體的知識管理(OBKM)間的關系作了詳細的對比分析發現[7]:一方面,SCBR與OBKM之間不僅在技術層面而且在方法論層面都有著相同之處;另一方面,它們又存在如表1所示的不同之處。
結構化范例推理基于本體的知識管理
孤立的,沒考慮系統間的合作共享開放的,系統間的合作集成很重要
沒有進行表示語言的標準化擁有W3C標準表示語言OWL
系統大都依賴屬性表示,以基于XML形式的,不能標準表達語義本體聲稱提供領域內標準化的概念模型
詞匯表不能提供領域內概念模型,僅能面向具體的任務本體應該是問題無關的(大都很難實現)
基于效用的推理,是非精確匹配的模糊推理基于邏輯的推理,可得到一個正確的、可證明的結果
在以上分析的基礎上,發現本體和CBR技術的結合可產生雙贏的局面。一方面,不同于基于邏輯的方法,CBR側重通過對象間的相似度評估進行模糊推理;CBR中發展成熟的基于模糊邏輯的推理技術可以很好地與邏輯推理相結合,從而彌補了嚴格的邏輯推理限制討論域且必須基于封閉世界假設的不足。同時,蘊涵豐富領域知識的遺留范例庫可以作為本體學習的數據源,這既可擺脫當前手工本體構造的困境,又可實現對以往具體范例知識最大程度的復用。另一方面,利用本體可以創建領域知識的語義模型,澄清了領域知識的結構,從而為知識獲取和表示奠定了基礎,可以避免重復的領域知識分析,通過統一的術語和概念使知識共享成為可能;使得同一領域不同系統間的信息可以語義共享或集成,在各個信息孤島間搭建了語義橋梁;通過它的語義自描述性自動識別范例模式,獲取范例信息,解決了范例輸入的瓶頸;還可以對CBR過程進行建模,使得開發過程中可以進行軟件復用。因此,本體與CBR技術的結合勢在必行。
3 基于本體的CBR研究現狀與不足
3.1 研究現狀
近幾年,國外基于本體的CBR系統的研究不斷,挪威的Aamodt開發的CREEK系統[8],將范例和能用知識結合起來,取得了成功;Wang等人開發的基于本體的電腦故障檢測系統[9]驗證了用CBR系統去支持知識管理生命周期活動的效果;Yang等人將基于本體的范例推理技術應用于常見問題回答服務領域,取得了不錯的效果[10];澳大利亞Woolongong大學的Kang和Lau對此進行了很多研究和應用[11],開發了基于本體的CBR的學生入學資格審核系統;西班牙的DiazAgudo等人對基于本體的CBR進行了一系列的研究,從最初的關于富含知識的CBR體系結構的理論研究,到目前基于本體的CBR系統的設計工具——jCOLIBRI的開發研究[12~14]。
國內基于本體的CBR的研究也處于快速發展的階段,出現了許多研究和應用成果。上海交通大學計算機集成技術與開放實驗室深入研究了基于本體的可重構知識管理平臺和可重構范例存儲技術[15,16];北京航空航天大學開發了一個基于本體的汽車故障診斷CBR系統,構建了一個基于語義Web的診斷范例表示及檢索模型[17];重慶大學提出了一個采用Web service技術的、開放的基于本體的分布式范例推理框架[18]。此外,國防科技大學、南京航空航天大學、大連理工大學等眾多研究者都對基于本體的CBR的體系結構、范例表示和檢索等問題進行了研究[19~21]。
3.2 不足
然而,基于本體的CBR系統仍處于研究的初期,面臨著不少問題,主要表現在體系結構、本體構建、遺留知識復用等方面。
當前基于本體的CBR的體系結構仍不統一、不完善,根據本體具體組織方式的不同,主要可分為三個逐漸進化發展的方法[22],如圖4所示。其中:a)單本體法使用一個全局本體作為所有源的通用語義模型,對應各個分布異構信息源。然而,各信息源的領域視角不同時,存在創建統一的全局本體十分困難;信息源發生改變時,全局本體也必須相應修改,不適合動態性較強的信息源的集成。b)在多本體法中,每一個信息源對應于一個局部本體,不同局部本體間建立映射關系,當每個局部本體更改時,只需修改受影響的關聯部分。然而,多本體法沒有共享的詞匯表,不利于本體間的互操作,建立本體間的映射難度較大。c)為了彌補單本體方法和多本體方法的缺點,人們提出了混合方法,其使用了共享詞匯表來描述領域內基本術語,每個局部本體都是建立在這個共享詞匯表基礎上使得局部本體間的互操作變得簡單。然而,其缺點在于現有本體重用困難,信息源內容改變時,其對應已有局部本體必須修改或重構使其與共享詞匯表一致,同時為了實現全局的統一,共享詞匯表也要相應地修改。
本體的構建是一種組織、團體意義上的決策行為是本體應用的前提和基礎。然而,當前本體的構建基本都是采用手工方式完成,十分耗時、費力,且易出現傾向性錯誤、動態更新困難等問題。具體存在以下困難:a)要真正做到本體的詳盡性以及實現有效的、及時的本體更新是非常困難的;b)本體的專業性很難保證,因為很難保證本體工程師對專業領域有較深入的理解或者就是領域專家;c)如果本體構建不是針對有限的特定應用,則很難確定本體的描述粒度;d)隱性知識的發現以及形式化表示困難。
總的來說,當前基于本體的CBR系統研究更多地側重體系結構、范例表示與檢索等問題的基礎研究,而對于從企業遺留的范例庫蘊涵的知識的提取、復用考慮不足。筆者認為可以將本體學習、概念聚類等領域的研究成果應用于遺留范例庫,輔助設計者完成本體構建,并實現范例知識的復用。
3.3 可借鑒的相關研究
3.3.1 本體學習
本體學習主要研究自動或半自動構建本體的方法,按學習數據源可分為基于文本、詞典、知識庫、半結構化數據模式和關系數據模式的本體學習。由于關系數據庫技術的成熟性和應用的廣泛性,企業已有CBR系統中范例被組織為關系表的形式最為常見,有著大量的應用。從關系數據庫學習本體的研究成果對于基于本體的CBR系統更有借鑒意義。當前,關于從關系數據庫學習本體,一些研究者提出了自己的解決方案。文獻[23]提出先將關系數據庫模式翻譯為一個中間模型,再由中間模型翻譯成本體模型;文獻[24]通過對主鍵、數據、屬性的相關性分析,采用一定的映射規則完成向flogic本體的轉換,理論上可獲取更多的語義信息;文獻[25~27]提出通過相應的一組學習規則從關系數據庫模式信息提取OWL本體的方法。
3.3.2 形式概念分析
形式概念分析(FCA)是一種擁有良好數學基礎的概念聚類技術,用于概念的發現、排序和顯示,所有概念連同它們之間的泛化/例化關系構成一個概念格。概念格可以用于許多機器學習的任務,并已經在信息檢索、數字圖書館、軟件工程和知識發現等眾多研究領域得到應用。以下簡要介紹其理論部分[28]。
定義1 形式背景(formal context)通常被定義為一個三元組K=(G,M,I)。其中:G是對象集合;M是特征集合;I是G與M之間的一個二元關系,即IG×M。(g,m)∈I被讀做對象g具有特征m。
定義2 當且僅當AG,BM,A′=B并且B′=A時,(A,B)被稱為形式背景K的一個形式概念。其中,A′={m∈M|g∈A:(g,m)∈I},
B′={g∈G|m∈B:(g,m)∈I} 。集合A和集合B分別被稱為形式概念(A,B)的外延和內涵;K的所有形式概念的集合被標記為CS(K)。
定義3 概念格CS(K)上最重要的結構是由超概念—亞概念關系(又稱為泛化—例化關系)產生的,其定義如下:如果AC,則形式概念(A,B)是形式概念(C,D)的亞概念,記為(A,B) ≤(C,D)。通過這個關系得到一個有序集CS(K)=(CS(K),≤),這是一個完全格,被稱為形式背景K的概念格。每個形式背景K的概念格是惟一的,并且概念格中的每個節點都是一個形式概念。從一個形式背景生成概念格的過程就是一個概念聚類過程。
已有研究者將FCA理論引入本體自動構建、合并和映射等研究工作中,例如FCAMerge是目前較出名的FCA在本體合并中的應用[29]。但是總的來說,FCA和本體的結合研究仍處于起步階段。
4 展望與思考
可以看出,基于本體的CBR系統已經逐漸成為了研究熱點和發展趨勢,并擁有廣闊的應用前景。當前的研究方向和問題主要集中在體系結構的完善、本體的輔助構建、遺留CBR中知識的復用以及相應的范例推理策略研究。
針對當前基于本體的CBR研究存在的問題與不足,筆者作出了一個初步的構想,如圖5所示。在改進混合方法的基礎上,采用兩層本體的知識集成方法作為系統體系結構;通過從關系數據庫模式、元組集向OWL本體映射的方法自動構建局部本體,從而充分復用遺留范例系統中的知識;通過基于FCA的概念聚類過程,整合局部本體概念間的層次結構關系,輔助完成領域本體的半自動構建以及領域本體與局部本體概念間的映射關系確定;采用加權概念語義的相似度計算方法使得范例檢索更合理、更精確[21]。
5 結束語
本文首先回顧了本體與CBR的理論基礎和研究現狀;其次,在分析了本體與CBR各自的優點、面臨的問題的基礎上,討論了它們相結合必將產生雙贏的局面;最后,概括了基于本體的CBR的研究現狀與不足,并在介紹了相關可借鑒研究的基礎上進行了下一步研究的展望和思考。
參考文獻:
[1]李善平,胡玉杰.本體論研究綜述[J].計算機研究與發展, 2004,41(7):10411052.
[2]GRUBER T R.A translation approach to portable ontology specifications[J].Knowledge Acquisition,1993,5(2):199220.
[3]MIZOGUCHIR.Tutorial on ontological engineering,part 1:introduction to ontological engineering[J].New Generation Computing,2003,21(4):365384.
[4]LEAKE D B.Casebased reasoning[M].Cambridge:AAAI Press/MIT Press,1996.
[5]LENZ M.Casebased reasoning: from foundations to applications[M].Berlin:Springer,1998.[6]AAMODT A,PLAZA E.Casebased reasoning: foundational issues, methodological variations and system approaches[J].AI Communications,1994,7(1): 3949.
[7]BERGMANN R,SCHAAF M.Structural casebased reasoning and ontologybased knowledge management:a perfect match[J].Journal of Universal Computer Science,2003,9(7):608626.
[8]AAMODT A.Knowledgeintensive casebased reasoning in CREEK[C]//Proc of the 7th European Conference on Casebased Reaso-ning.Berlin:Spring,2004:291305.
[9]WANG S L,HSU S H.A Webbased CBR knowledge management system for PC troubleshooting[J].The International Journal of Advanced Manufacturing Technology,2004,23(78):532540.
[10]YANG Shengyuan,LIAO Penchin,HO CS.An ontology supported casebased reasoning technique for FAQ proxy service[C]//Proc of the 17th International Conference on Software Engineering and Know-ledge Engineering.2005:639644.
[11]KANG S,LAU S.A framework for casebased reasoning integration on knowledge management systems[C]//Proc of the 7th Pacific Asia Conference on Information Systems.2003:13271343.
[12]DIAZAGUDO B,GONZALEZCALEROP A.An architecture for knowledge intensive CBR systems[C]//Proc of the 5th European Workshop on Advances in Casebased Reasoning.London:SpringerVerlag,2000:3748.
[13]DIAZAGUDO B,GONZALEZCALEROP A.Knowledge intensive CBR through ontologies[J].Expert Update,2003,6(1):4454.
[14]DIAZAGUDO B,GONZLEZ CALERO P A.CBROnto: a task/me-thod ontology for CBR[C]//Proc of the 15th International Confe-rence on Florida Arthficial Intelligence Research Society.Menlo Park:AAAI Press,2002.
[15]王英林,王衛東,王宗江.基于本體的可重構知識管理平臺[J].計算機集成制造系統,2003,9(12):11361144.
[16]許文華,王英林,張申生.基于本體的可重構實例存儲技術[J].計算機工程,2004,30(24) :125127.
[17]李紅,任成梅.基于語義Web的診斷案例表示及檢索模型研究[C]//信息系統協會中國分會第一屆學術年會.北京:清華大學出版社,2005:535538.
[18]丁劍飛,何玉林,李成武.基于本體的分布式CBR 設計系統[J].計算機工程,2007,33(21) :183185.
[19]劉芳,姚莉,王長纓.基于語義Web 的案例表示和CBR系統結構研究[J].計算機應用,2004,24(1): 1719.
[20]張月雷,左洪福. 基于本體的案例表示和CBR 系統結構研究[J]. 山東理工大學學報:自然科學版,2006,20(4):4851.
[21]GAO Junjie,DENG Guishi.The research of applying domain ontology to casebased reasoning system[C]//Proc of International Confe-rence on Services Systems and Services Management.2005:11131117.
[22]WACHE H,VOGELET,VISSER U,et al.Ontologybased integration of information:a survey of existing approaches[C]//Proc of IJCAI Workshop on Ontologies and Information Sharing.2001:108117.
[23]UPADHYAY S R,KUMAR P S.ERONTO:a tool for extracting onto-logies from extended E/R diagrams[C]//Proc of ACM Symposiumon Applied Computing.New York:ACM Press,2005.
[24]曹澤文,張維明. 一種從關系數據庫向Flogic本體轉換的方法[J].計算機科學, 2007,34(4):149155.
[25]LI Man,DU Xiaoyong,WANG Shan.Learning ontology from relatio-nal database[C]//Proc of the 4th International Conference on Machine Learning and Cybernetics.Guangzhou:[s.n.],2005:34103415.
[26]HABEGGER B.Mapping a database into an ontology: an interactive relational learning approach[C]//Proc of the 23rd International Conference on Data Engineering.2007:14431447.
[27]XU Zhuoming,ZHANG Shichao,DONG Yisheng.Mapping between relational database schema and OWL ontology for deep annotation[C]//Proc of International Conference on Web Intelligence.Washington DC:IEEE Computer Society,2006:548552.
[28]GANTER B,WILLE R.Formal concept analysis:mathematical foundations[M].London:SpringerVerlag,1999.[29]STUMME G,MAEDCHE A.FCAMerge:bottomup merging of onto-logies[C]//Proc of the 7th International Conference on Artificial Intelligence.2001:225230.