鄒軍華
摘要 在知識工程方法建立本體的基礎(chǔ)上,闡述建立課程本體的詳細(xì)步驟,并以O(shè)WL為本體構(gòu)建語言,給出“數(shù)據(jù)庫原理”課程的部分課程本體實(shí)例。
關(guān)鍵詞 課程本體;OWL;數(shù)據(jù)庫原理
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-489X(2009)06-0026-02
Creation and Description of Course Ontology//Zou Junhua
Abstract Based on the ontology creation methodology of knowledge engineering, this article describes the steps of course ontology creation, and gives a case of creating course ontology.
Key words course ontology;OWL;database principle
Authors address Faculty of education, Hubei University, Wuhan 430062
本體已經(jīng)成為人工智能和知識工程中一種重要的工具,在知識的獲取、表示、分析和應(yīng)用等方面具有重要的意義。本體研究促進(jìn)知識工程中對本質(zhì)知識的獲取[1-2]。本體是語義的基礎(chǔ),可以為語義Web成功增值[3]。作為一種知識表示方法,本體與謂詞邏輯、框架等其他方法的區(qū)別在于它們屬于不同層次的知識表示方法。本體表達(dá)了概念的結(jié)構(gòu)、概念之間的關(guān)系等領(lǐng)域?qū)嶓w的固有特征。本體表述的語義更明確、一致和規(guī)范,因此也更有利于知識的表達(dá)、交流和共享。
1 本體構(gòu)建的方法
知識工程方法通過7個(gè)步驟完成本體的開發(fā):確定本體的領(lǐng)域范圍和使用目的、重用已有的本體、窮舉該本體中的重要的詞匯、定義類和類的層次結(jié)構(gòu)、定義類的屬性、定義類屬性的值域、創(chuàng)建實(shí)例。在該方法中,步驟4~6通常需要同時(shí)進(jìn)行,相輔相成。如何將已有的詞匯區(qū)分是否是類或者類的屬性是一項(xiàng)復(fù)雜的工作。本文在這個(gè)方法的基礎(chǔ)上,針對課程的特點(diǎn),提出課程本體的開發(fā)方法。
1.1 重用已有的本體和專業(yè)敘詞表在開發(fā)新的本體前,從目前在進(jìn)行或者已完成的相關(guān)工作中學(xué)習(xí),并且從已有的資源中進(jìn)行提取和擴(kuò)充。在已有本體的基礎(chǔ)上進(jìn)行改進(jìn)比創(chuàng)建新的本體要容易得多,因此,重用已有的本體非常重要。目前在網(wǎng)絡(luò)上已經(jīng)有不少成熟的本體資源可以使用,如Ontolingua本體庫、DAML本體庫、WordNet;同時(shí)還有很多公開的商業(yè)性質(zhì)的本體資源,如UNSPSC、RosettaNet、DMOZ等。
除了應(yīng)用已有的本體資源,還可以利用專業(yè)敘詞表、術(shù)語詞典等。專業(yè)敘詞表和術(shù)語詞典,不但包含該領(lǐng)域中相對完整的術(shù)語,而且都經(jīng)過領(lǐng)域?qū)<叶嗄甑挠行蚪M織,不僅可以為領(lǐng)域Ontology中概念的創(chuàng)建提供指導(dǎo),而且敘詞表中的限義詞、含義注釋、等級關(guān)系、詞間關(guān)系,也為領(lǐng)域Ontology概念中的屬性、實(shí)例以及關(guān)系的創(chuàng)建提供了線索及指導(dǎo)。專業(yè)敘詞表和術(shù)語詞典是構(gòu)建課程本體的必備基礎(chǔ)。
1.2 從課程中提取重要的概念和術(shù)語該步驟主要列出課程中最基本、最有代表性的術(shù)語,那些需要被學(xué)生了解和學(xué)習(xí)的概念以及需要注釋和解釋的詞匯。需要指出的是,在這個(gè)步驟中只需要窮舉出所有可能重要術(shù)語,不必考慮概念是否重疊,也不必考慮概念之間的關(guān)系和屬性。
1.3 定義課程本體之間的通用關(guān)系從語義上講,概念間主要有4種基本關(guān)系:attribute of(高度是桌子的屬性)、instance of(實(shí)例與概念之間的關(guān)系)、kind of(家用計(jì)算機(jī)是計(jì)算機(jī)的一種)和part of(CPU是計(jì)算機(jī)的組成部分)。根據(jù)這4種基本關(guān)系,本文給出本體之間的通用關(guān)系(如表1所示)。
1.4 挖掘課程本體中的特殊關(guān)系結(jié)合特定的課程,分析和挖掘出特殊的關(guān)系和屬性。如“數(shù)據(jù)庫原理”中的數(shù)據(jù)庫設(shè)計(jì)部分,數(shù)據(jù)庫設(shè)計(jì)的6個(gè)步驟:需求分析、概念設(shè)計(jì)、邏輯結(jié)構(gòu)設(shè)計(jì)、數(shù)據(jù)庫物理設(shè)計(jì)、數(shù)據(jù)庫實(shí)施和數(shù)據(jù)庫運(yùn)行維護(hù)。這些概念之間的關(guān)系就可以用一個(gè)新的關(guān)系——前驅(qū)(后繼)關(guān)系——來描述。

1.5 分析、改進(jìn)和評價(jià)改進(jìn)是構(gòu)建課程本體過程的一個(gè)組成部分,在構(gòu)建的過程中不斷改進(jìn)原有的結(jié)構(gòu),在不斷改進(jìn)的過程中構(gòu)建起整體的結(jié)構(gòu)。改進(jìn)的方法包括合并、編輯及自然語言處理的一些方法。在改進(jìn)的過程中要注意系統(tǒng)整體的一致性。對本體進(jìn)行分析和評價(jià),確定本體結(jié)構(gòu)是否能準(zhǔn)確反應(yīng)出課程本體的本質(zhì)和聯(lián)系。分析、評價(jià)與改進(jìn)共同構(gòu)成本體的維護(hù)過程。
2 用OWL描述課程本體
2.1 OWL本體描述語言面向網(wǎng)絡(luò)的本體語言O(shè)WL(Web Ontology Language),是W3C組織推薦的國際通用的標(biāo)準(zhǔn)本體描述語言。它建立在XML/RDF(Resource Description Frame)等已有標(biāo)準(zhǔn)基礎(chǔ)上,通過添加大量的基于描述邏輯的語義原語來描述和構(gòu)建各種本體。所以基于OWL建立的本體有很豐富的語義表達(dá)能力并具有完善的推理機(jī)制,比之用其他本體描述語言(如XML、RDFS)建立的本體能更清晰完整地表達(dá)領(lǐng)域內(nèi)的概念和概念之間的聯(lián)系。OWL有3個(gè)表達(dá)能力遞增的子語言:OWL Lite,OWL DL和OWL Full。OWL Lite是表達(dá)能力最弱的子語言,提供類分層的能力和簡單的約束功能。OWL DL在可判定性的前提下,提供盡可能大的表達(dá)能力,但在某些表達(dá)方面仍有一些限制。OWL Full包含OWL的全部語言構(gòu)造成分并取消OWL DL中的限制[4]。
2.2 用OWL描述“數(shù)據(jù)庫原理”課程本體“數(shù)據(jù)庫原理”是計(jì)算機(jī)、信息管理與信息系統(tǒng)、工業(yè)工程以及電子商務(wù)等專業(yè)的必修課程,所以本文選取這門課程作為范例。由于篇幅所限,本文僅以這門課程中的數(shù)據(jù)模型為例來說明如何用OWL來描述課程本體[5],以便學(xué)生更好地理解各個(gè)概念以及概念之間的關(guān)系。
1)定義數(shù)據(jù)模型類。
<o(jì)wl:Classrdf:ID= “數(shù)據(jù)模型”>
<o(jì)wl:ObjectPropertyrdf:ID= “數(shù)據(jù)結(jié)構(gòu)”>
</owl:ObjectProperty >
<o(jì)wl:ObjectPropertyrdf:ID= “數(shù)據(jù)操作”>
</owl:ObjectProperty>
<o(jì)wl:ObjectPropertyrdf:ID= “完整性約束”>
</owl:ObjectProperty>
</owl:Class>
上述定義表示的語義是數(shù)據(jù)模型有3個(gè)屬性:數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作和完整性約束。
2)定義關(guān)系模型類。
<o(jì)wl:Classrdf:ID= “關(guān)系模型”>
<rdfs:SubClassOfrdf:ID= “數(shù)據(jù)模型”>
<o(jì)wl:ObjectPropertyrdf:ID= “關(guān)系數(shù)據(jù)結(jié)構(gòu)”>
</owl:ObjectProperty >
<o(jì)wl:ObjectPropertyrdf:ID= “關(guān)系操作”>
</owl:ObjectProperty >
<o(jì)wl:ObjectPropertyrdf:ID= “關(guān)系完整性約束”>
</owl:ObjectProperty>
</owl:Class>
上述定義表示的語義是關(guān)系模型,是數(shù)據(jù)模型的子類,它是數(shù)據(jù)模型之一,與數(shù)據(jù)模型之間的關(guān)系是繼承關(guān)系,反映的是概念之間的層次關(guān)系,并且關(guān)系模型由關(guān)系數(shù)據(jù)結(jié)構(gòu)、關(guān)系操作和關(guān)系完整性約束3個(gè)要素組成。
3 結(jié)束語
目前關(guān)于本體的研究愈來愈受到重視,研究的重點(diǎn)多集中于領(lǐng)域本體的建設(shè)上面。用本體來描述課程的概念以及概念之間的關(guān)系,將會促進(jìn)學(xué)生的理解,也會方便教師的教學(xué),具有很好的理論和實(shí)踐價(jià)值。但是,在課程本體的創(chuàng)建過程中,還有很多問題有待探討和解決,比如動(dòng)態(tài)知識的描述以及課程本體的自動(dòng)創(chuàng)建等。本文在知識工程方法建立本體的基礎(chǔ)上,闡述建立課程本體的可行步驟,并且給出數(shù)據(jù)模型的課程本體實(shí)例。
參考文獻(xiàn)
[1]李善平,等.本體論研究綜述[J].計(jì)算機(jī)研究與發(fā)展,2004(7):41-44
[2]杜小勇,李曼,王珊.本體學(xué)習(xí)研究綜述[J].軟件學(xué)報(bào),2006(9):1 837-1 847
[3]何琳.領(lǐng)域本體的關(guān)系抽取研究[J].現(xiàn)代圖書情報(bào)技術(shù),2008(4):35-38
[4]OWL Web Ontology Language[EB/OL].http://www.w3c.org/TR/owl-features/
[5]王珊,陳紅.數(shù)據(jù)庫系統(tǒng)原理教程[M].北京:清華大學(xué)出版社,1998:9-30