【摘要】根據教學規律和教學系統化設計理論,提出一種適用于教學領域的本體構建方法——ISD本體構建方法。該方法系統性強,融合學科教學特點。使用該方法成功構建了“C++程序設計”雙語課程資源本體庫,解決了實際知識向形式化編碼的轉化等問題,使本體的重用成為可能。
【關鍵詞】課程教學;領域本體;構建方法;C++程序設計
【中圖分類號】G420【文獻標識碼】A 【論文編號】1009—8097(2010)04—0033—05
引言
現代教育技術的發展推動著教育教學諸多方面的變革,同樣也面臨著一些問題。各教學系統因不同開發者使用不同系統工具和開發軟件,相同系統間資源表示方式不同,不便于知識繼承和共享,造成教學資源的重復建設,成為人們關注的焦點之一。
領域本體及語義網技術逐漸被應用于教育教學領域,促進了知識的共享和重用。本體是實現語義網的基礎,因此,很多教育技術研究人員開始使用和開發各種教學本體,以實現教學資源在語義層面上的共享和重用。然而,目前的學科領域本體數量很少,能夠實現共享和重用的學科本體庫更是捉襟見肘,遠遠達不到當前教學資源實現語義共享的需求。快速而高質量地構建各學科領域本體急待解決,以促進教學資源實現更大程度的共享,早日實現語義功能。
一 領域本體
本體,在信息科學領域,指的是概念化的明確的規范說明,能夠以一種明確的、形式化的方式來表示領域知識,促進知識共享。本體用來表示特定領域內部不同主體之間進行交流的一種語義基礎,領域本體就是本體中的一種。
領域本體是在特定領域中可重用的本體,提供了該特定領域的概念定義和概念之間的關系,是領域知識規范的抽象和描述。
教學領域本體是對學科概念的一種描述,任一門課程中的概念及其關系都能構成本體。在通常情況下,教學資源領域本體是以某學科知識章節的縱向聯系和知識間的橫向聯系兩維度為主線進行構建的。將課程中的知識點看作一個概念,知識點之間的關系表現為概念之間的關系,每個概念還與網絡中的學習資源相關聯。教學領域本體最終目的是捕獲領域知識,提供人機對知識的共同理解。
本體構建和構建方法息息相關。好的方法是本體構建的保證。遺憾的是,目前國內外還沒有專門的學科本體構建方法,故學科本體的構建速度和質量不高。
二 基于ISD的領域本體構建方法
教學領域本體的構建,某種程度上是教學系統化設計(Instructional Systematic Design,ISD)的過程。教學系統化設計是運用系統方法對學習過程和學習資源進行統籌安排,對教學目標、知識內容、教育者和學習者進行分析,編制教學資源,并對教學過程進行評價。本文對目前已有的本體構建方法進行了分析和比較,并將教學系統化設計理念融合到教學領域本體中去,結合教學的實際需要,確立了構建教學領域本體的設計原則,提出了一種適用于教學領域的方法,即基于ISD的本體構建方法。
1 構建原則
為保證本體的科學性和規范化,任何本體的構建都要按照知識概念的標準化表達和構建步驟的規范化過程這兩個基本原則進行。同時,為體現具體學科特點,本體構建要遵循明確性、一致性、可進化性,以及對知識進行合適的粒度劃分等原則。其中,明確性是指概念應盡可能的完整并能有效表達課程特性,保證其唯一性和確定性;一致性是指要始終保證概念在邏輯上的一致性,以確保最后推理結果的正確性;可進化性是指概念可根據特定的要求進行擴展和進化,以與知識更新同步;合適的知識粒度是指知識粒度的劃分要與教學步驟相對應,在保持知識的局部完整性的前提下,將學科知識點表示到對應的教學步驟中。
2 構建方法
目前,人們常使用復用已有本體和利用本體工具等方法來構建本體,具體各不相同。常見的本體構建方法有“骨架法”、“評價法”等。但是,這些方法或多或少地存在著需求不充分、建設過程缺少規范性、缺乏評價標準等不足。同時,這些方法各自適合不同領域,不能滿足學科本體的具體要求。本文結合教學普遍規律,從教學系統設計的具體過程出發,依據本體建模的基本的建模元語類(或概念)、關系、實例等,提出了一種新方法(圖1)。該方法可以從抽象到具體、自頂向下地建構學科領域本體,通過各種知識獲取方法獲得學科領域的主要概念和關系,用精確的語言加以描述,能夠生成學科本體的核心語義內容。
(1) 教學領域本體需求分析
充分理解構建學科本體的需求,是本體構建的必要條件。
第一,在教學領域構建學科本體的目的。開發課程本體是為了形成對具體某課程知識組織結構的共同理解與認識,以滿足異構系統間的信息交互和集成,提供基于語義的信息服務,為進一步建立個性化的課程資源管理系統服務。
第二,教學領域本體所涉及的具體學科。學科知識的范圍和邊界是模糊而交叉的,應把所有涉及到的學科或交叉學科都考慮在內,避免知識的缺漏。
第三,教學領域本體的使用對象是學生、教師,還是其他人。
第四,構建過程的時間分配。要考慮到課程知識的復雜性,不要求大求全,要以實用為基本原則,按工作量大小和難易程度合理分配時間。本體的進化需要更長的時間。
第五,本體描述語言的選擇。本體描述語言的選擇直接影響本體模型的表達能力和可擴展能力。目前的形式化本體描述語言主要有RDF、RDFS、OIL、DAML、OWL等,推薦使用W3C最新的描述標準。
(2) 建立核心本體庫
首先,獲取概念并定義類。通過收集學科領域的知識信息,充分了解知識的組織結構,從學科領域專家、專業權威書刊、網絡以及已有的相關本體中獲取學科的重點概念,并對這些概念進行分析抽象和歸納,依據概念唯一性、同級概念間互不相交、并集覆蓋整個父類概念范圍的要求,并形成以繼承關系為主要關系的層級模型。這些模型化的概念被抽象為本體中最基本的類。類是本體的核心。定義本體的類,應能表示出類的最突出的屬性,一個概念只能創建一個類,創建一個類應能增加其父類不具備的新屬性。
其次,確定類的屬性。概念層次結構是本體的骨架,類的屬性和概念間的關系才是本體的血肉。類的屬性用來描述概念的內部結構關系,是區別類的重要標志,包括類的固有性質和與其它個體的基本關系等。不同的類有不同的屬性,一個類可以有多個屬性。一般,屬性的表現形式有屬性名和屬性取值。類的屬性和類一樣,也具有很強的繼承性,這樣就減少了屬性冗余,增強了概念的表達能力。確定了類的屬性以后,對概念進行歸納和分類,逐步建立起類的層級化的分類模型。
根據教學知識點與教學資源之間的映射關系,學科領域本體中知識點類的屬性可以定義為知識點同義詞(Synonym)、教學目標(TeachingGoals)、知識點大小(KnowledgeScale)、重要程度(SignificanceLevel)、知識點之間關系、與章節的關系、與資源的關系(hasResource)等基本屬性。
再次,建立類之間的邏輯關系。一個概念的定義和描述往往會涉及到多個其他概念。概念之間具有關聯性,這一關聯就是概念間的關系。概念的關系可以是多個,一個關系包括關系名和關系取值等。學科概念模型中的類除了具有父子關系(SubClassOf)外,還要構建符合教學步驟和教學規律的其他關系,據此,本文定義了學科知識點之間的六種基本關系(表1)。所有關系形成了一個復雜的網狀結構。網狀結構與樹狀結構相結合,使得整個教學領域知識本體庫成為一個語義復雜、完整但又清晰的、便于理解的語義網結構模型。在具體應用中也可以根據需要選一個或多個,或建立其他關系。
最后,創建類的實例。明確了本體的概念及概念間的關系,類的層級模型和類之間的關系建立之后,添加實例并建立一個實例集。實例反映了具體概念的知識表示,每個實例是由實例名和實例url地址組成。
(3) 進行形式化編碼
確立了建模元語與概念之間的關系以后,接下來就要對本體進行編碼了。本體最終是為了讓機器理解教學中的概念及關系,也就是用計算機可識別的語言將本體描述出來,并將編碼的過程和結果存儲。本體編碼就是將教學實際資源和本體進行關聯,使類之間形成一個復雜的網狀關系。在具體應用中,本體有非形式化語言、半形式化語言、形式化語言等形式,學科本體可以用自然語言、框架、邏輯語言等形式來描述本體。
OWL(Web Ontology Language,網絡本體語言)是一種形式化本體描述語言,是W3C最新的一種語義網本體語言,它提供了豐富的類公理,功能上超越了XML、XML Schema、RDF等,能準確描述知識的類、屬性和實例及其復雜的邏輯關系,支持良好的知識推理,彌補了RDF與XML。因此,本文推薦使用OWL來描述本體。
(4) 調試和集成
本體的構建和描述離不開本體構建工具的支持。Protégé體系軟件是斯坦福大學為知識獲取而開發的一個工具,是開放的模塊化的,支持RDF Schema、帶DTD的XML文件、XML Schema文件等格式的存儲和導入。表2是Protégé與其他工具的比較。
從Protégé與其它工具的比較來看,Protégé具有很多獨特的優點,因其開放性、不斷更新性、可擴展性、良好的互操作性、界面友好性及對中文的良好支持等多方面的優點,成為人們構建本體的首選工具。
(5) 本體評價
構建完成的本體需要評價。但是目前沒有標準化的本體評價方法。本文綜合現有的本體評價方法,結合教學課程本體構建實踐,認為教學領域本體構建應該從正確性、清晰性、一致性、可擴展性和有效性等方面進行評價。
(6) 本體進化
學科知識是無邊界和不斷擴展的。因此,進化是領域本體建設的重要環節。教學領域本體的構建是個不斷進化和衍生的過程,在核心本體建好的基礎上,不斷修改和完善來擴展和進化本體,才能逐步建成一個較為完整和實用的教學領域本體來。
三 基于ISD的領域本體構建方法應用實例
“C++程序設計”課程隨著教學內容的發展變化,教學資源不斷更新。采用本體標準化的描述方式,建立通用的規范的教學資源庫,實現資源的廣泛共享和重用,是該課程資源庫建設與發展的重要方向。本文以“C++程序設計”雙語課程為例,采用ISD本體構建方法,以課程知識的縱向和橫向關系相結合的方式,構建了該課程本體。
1 需求分析
理清本體的實際需求,是成功構建的必要條件。第一,開發“C++程序設計”雙語課程資源本體的目的是為了形成對該課程知識組織結構的共同理解與認識,滿足異構網中雙語教學資源信息的交互和集成,并能提供基于語義的信息服務,為進一步建立個性化的“C++程序設計”雙語課程資源管理系統奠定基礎。第二,所建本體主要為雙語教學資源的共享服務,所涉及學科領域是“C++程序設計”課程領域。第三,該課程資源領域本體面向對象是C++程序設計課程的學習者、本學科教師、其他學習者。第四,選用OWL語義描述語言。
2 建立核心本體庫
(1) 獲取概念
“C++程序設計”雙語課程知識豐富。本文以Nell Dale等編著、高等教育出版社出版的《C++程序設計(第三版 影印版)》教材為基礎,參照國內C++程序設計課程的知識結構,按照教學規律和步驟,將知識進行了三層粒度劃分(詳見圖2),分別是根節點、頂層核心概念集、第一級子概念集,并歸納出五個頂層概念,分別是程序基礎、面向對象、數據結構、程序舉例、學習資源,一級子概念20個,二級子概念100多個,基本覆蓋整個“C++程序設計”雙語課程的全部知識內容,可作為該課程資源本體未來進化的種子。
按照教學系統設計理論,對這些核心概念進行擴展,建立整個本體概念模型:把“C++程序設計”作為根結點,向下擴展為五個頂級概念,頂級概念繼續向下擴展,以此建立的層次結構以樹型結構呈現。圖3是使用Protégé4.0對頂級概念“學習資源”的下級概念(包括案例、課件、文檔、指導、材料、測試等六個子概念)建成的類層級圖。
(2) 確定類的屬性和關系
根據課程需求,將知識間的關系定義為知識點之間、知識點與教學資源之間等的映射關系,定義了同義詞(hasSynonym)、資源(hasResource)、程序舉例(hasCaseStudies)、重要程度(SignificanceLevel)、等基本屬性(圖4)。定義了該課程本體的類之間的同位知識(ParaConcept)、上位知識(SuperConcept)、下位知識(SubConcept)三種最基本的關系。其他屬性和關系可具體定義,如知識點名稱、教學目標、知識點大小規模、重要程度、交互類型、知識點之間關系、與章節的關系等,以使本學科的知識點在橫向上緊密聯系起來。
(3) 創建類的實例
屬性和關系建立后,接下來添加實例。本文為Classes類建立了三個實例,分別是classLoan、classTime、classString,如圖5。
3 “C++程序設計”雙語課程教學資源領域本體的OWL實現
本文通過使用Protégé4.0進行建模,按照教學具體要求和學科知識組織結構,形成能覆蓋整個學科領域的概念結構。由于篇幅限制,這里只給出圖4的OWL描述代碼。圖4基本實現了本體概念、屬性及其關系的復雜關系,是整個本體的縮影,可以用來說明所建本體的科學性和可用性。
xmlns=http://www.qrnu.edu.cn/bilingual-teaching/C++.owl# xml:base=\"http://www.qrnu.edu.cn/bilingual-teaching/C++.owl\" xmlns:rdfs=\"http://www.w3.org/2000/01/rdf-schema#\" xmlns:owl2=\"http://www.qrnu.edu.cn/bilingual-teaching/C++.owl#\"> 四 總結 本文開發完成了“C++程序設計”雙語課程教學資源領域本體,共包括概念82個、上下位關系102個、屬性50個,包括了該課程領域的幾乎全部重要概念之間的關系,描述了知識點之間的語義關系。該本體概念層級多樣化,具有良好的完整性,概念間的關系在邏輯上比較嚴密和一致,且可擴展性較強,支持語義邏輯上的推理,方便以后的進化,為下一步實現資源管理的語義檢索功能奠定了基礎。 構建教學領域本體最終是為了在實際教學資源管理中予以應用,以實現共享,促進資源的語義管理。教學本體在實際應用中的問題,是進一步的研究工作。 參考文獻 [1] 楊建學.領域本體構建在學習資源管理中的應用[D].長沙:湖南大學,2006.5. [2] 王梅. OWL領域本體構建方法研究[J].圖書情報工作, 2006,(12):30-33. [3] 馬文峰,杜小勇.領域本體評價研究[J].圈書情報工作, 2006,(10):68-71. [4] 王秀芳,徐峰,魏莉.淺談網絡教學資源本體的構建[J].山東電大學報,2007,(1):11-13. [5] 劉光蓉.“C程序設計”課程內容本體構建[J].電化教育研究,2008,(12):42-45. [6] 潘穎,歐啟忠,肖耿毅.面向語義的課程知識本體的構建[J]. 電化教育研究,2007,(2):19-21.