李愛國
(陜西工業職業技術學院陜西咸陽712000)
在教與學的活動中,師生是活動和認知的主體,而知識便是活動的客體,教學的精髓是師生針對知識所進行的系列活動。在這個過程中,教師如何針對教學任務及學習對象的特點分解及合理組織教學計劃表述的知識是整個教學活動能否成功的關鍵。同理,對于ITS系統,建立學科知識庫和專家知識經驗庫是實現智能教學導航,從而實現個性化教學的基礎。專家知識、經驗庫就是從領域或學科的專家、教學專家那里獲得專門的知識、經驗,然后用一定的形式表示知識,最后存儲到數據庫中而形成的。該庫實際上是教學、學習中的知識和經驗的存儲器。系統對學生幫助的大小、是否有效,基本上取決于系統的專家知識庫。知識庫中的知識越完全,越能真實的再現專家的思維過程、方法等,則學習系統的智能水平就越高。
領域知識庫存放的是有關教學內容的專業知識及關于知識的知識即元知識。整個領域知識庫中的領域知識按用途分成兩類:
<領域知識>:=<教學內容知識>|<元知識>
<元知識>:=<知識點的屬性描述>|<知識點之間關系的描述>
因此,領域知識庫包括元知識庫和教學材料庫兩個部分,而元知識庫又包括知識點屬性庫和知識點關系庫,它們構成了個性化教學系統中的主要知識表示。領域知識庫的設計應該滿足如下條件[1]:
1)必須便于領域知識庫的管理和維護;
2)要充分保證ITS的核心問題——智能導航的需要;
3)必須體現知識的本來面目,讓人一目了然。教學系統是由知識工程師和領域專家協同完成,因此必須充分保證平臺的通用性及開放性,選用恰當的設計平臺,進行合理的設計至關重要。
在智能網絡教學系統中,不論是哪一類知識,知識點是系統處理的單元,要建立一個完整的領域知識庫首先必須把該領域的知識劃分成知識點,并建立知識點之間的關系,劃分方式和大小對領域知識庫中知識點的應用起著決定性的作用。
定義1知識點(Knowledge Point簡稱KP)[2]是教學活動過程中傳遞教學信息的基本單元,包括理論、原理、概念、定義、范例和結論等[3]。
定義2領域知識教學過程中最基本的教學單元稱為原子知識點(Atom_KP)。在教學過程中,該知識點作為一個整體進行教授;對教學而言,原子知識點在內容上具有不可劃分性。
定義3在領域知識庫中,由兩個或兩個以上的知識點組成的知識點稱為復合知識點(Compound_KP)。組成復合知識點的知識點可以是原子知識點,也可以是復合知識點。本文中的復合知識點主要是指單元知識點(Unit_KP)和節知識點(Section_KP)。
為了準確合理的描述教學內容,需要對其進行必要的分解,并在此基礎上知識點相互之間的關系。一般來說,劃分知識點時應注意以下幾點:
1)應遵循一般的教學規律,滿足相應的教學需要,便于實現啟發式教學和個別化教學。
2)首先把整個教學內容分解為若干單元知識點,各單元之間既相互獨立又相互聯系,這樣有利于使學習者對教學內容有更大的選擇自主權。然后再把各個單元知識點分解為若干個節知識點,而節知識點又可再分為一個一個的教學內容的最小單元—原子知識點,分解時應注意保持知識點內容的完整性和一致性,這樣就形成了一個樹形的層次結構。
3)教學知識點的劃分涉及到知識點的粒度劃分。對知識的劃分并非越小越好,如果知識點劃分的太小,那么它們之間的關系就會很復雜,反而不利于教學規則的制定和系統智能的實現。表示知識的最終目的是將它們組織成教學內容進行教學,因而將知識表示到對應教學步驟這一程度就完全可以了,基本原則是保證知識內容的局部完整性和利于組織教學步驟。知識點的大小相差可能很懸殊,例如,一章可劃為一個大的知識點,其中一節的內容又可細劃為較小的知識點,一節中的定義、定理等還可以劃為更小的知識點。
通過對知識點的分析,我們將知識點之間的關系分為兩種:
1)層次關系
層次關系包括父子關系和兄弟關系。將知識點以一定的順序串接起來就可形成復合知識點,則復合知識點與子知識點的關系即為父子關系。處于同一層上,知識點之間無父子關系或明顯相互關聯關系,學習時可不分先后次序,它們之間就構成兄弟關系。層次關系可以用一種稱為順序鏈(Sequence Link)[4]的鏈接來表示。
2)支持關系
在學習某一知識點之前必須先學習相關的另一些知識點,則這兩者之間就存在一種邏輯支持關系。我們把后者稱為前者的前導知識點,而前者就是后者的后續知識點。知識點之間的這種邏輯支持關系是有向的,其方向是由支持者指向被支持者,因此可以用一種稱為支持鏈(Sustain Link)[5]的鏈接來表示知識點之間的這種邏輯支持關系。
由教學過程本身可知,知識點之間這種支持程度是一個模糊概念,所以我們將其分為5級,即:聯系不緊密、聯系不太緊密、一般、聯系比較緊密和聯系緊密,用一個隸屬度函數μ(x)sus={0.2/1,0.4/2,0.6/3,0.8/4,1/5}來度量,μ(x)sus的值越大說明知識點之間的聯系越緊密。對于文獻中所定義的參考關系,我們只需將μ(x)sus的值取得小一些,其實質可仍然看作是一種支持關系。
因此,知識點之間的關系可表示如下:
<知識點關系>:=<層次關系>|<支持關系>
<層次關系>:=<父知識點>|<子知識點>
<支持關系>:=<前導知識點>|<后繼知識點>|<支持程度>
由以上的分析可知,知識點之間的關系無法用一種單純的樹形結構來表示,因為單純的樹形結構只能表示層次關系,卻很難清楚地表示知識點之間的支持關系,而若用單純的網狀結構來表示,則會造成知識點之間的層次關系不明顯,并且會使推理算法過于復雜。因此,在這里我們采用一個總體樹/局部圖的知識組織模型,如圖1所示。

圖1 領域知識庫的知識組織模型Fig.1 Knowledge of the field of knowledge organization model
從圖中可以得知,節點1是節點2、3的父節點,2、3節點是1節點的子節點。2、3節點與1節點是“與”關系;4、6節點與2節點是“或”關系;1節點是2、3節點的前驅知識,而節點3表示的知識點又是4、5、7、8節點的前驅知識,4、5、7、8節點表示的知識點是3節點的后繼知識。
該知識組織模型具有以下特性:
1)層次越高,其整體性越強,即所囊括的內容越多,所表述的內容越抽象;
2)層次越低,其部分性越強,即所表述的內容越具體,所說明的只是問題的一個方面。
3)它是在對樹型結構的擴充,將樹型結構和網狀結構很好的融合在了一起,既有樹型結構直觀、算法設計簡單的優點,同時又很好地表達了知識點之間的各種關系,便于在知識點基礎上進行各種不同條件的推理、具有較好的可擴充性和靈活性。
知識點的屬性包括知識點編號、類型、難度、重要程度和要求掌握的水平等。知識點編號的目的是用于檢索和查找,故應具有唯一性,是精確概念。知識點類型可以按照加涅(Gagne)分類理論分為:事實、概念、規則、高級規則和認知策略[4]。雖然分類具有很大程度的模糊性,但是由于知識點類型的劃分與學科建設有關,我們在具體的ITS教學/學習系統中就把它看作是精確概念。其它屬性認為是模糊對象,其中,知識點難度和重要程度分為3級,用隸屬度函數表示分別為:μ(x)ease={0.30/1,0.60/2,1/3}和μ(x)imp={0.30/1,0.60/2,1/3};要求掌握水平用定義模糊中心數(c,r,p)的方法來表示,可以更科學和更準確地描述教學大綱對知識點的掌握要求。(c,r,p)可以解釋為:落在以c為中心,r為半徑的“超球”之中的可能度為p。具體的(c,r,p)求取方法是根據積累已經通過考試學生的成績構造數據樣本,進行統計分析求得。我們可以粗略認為通過考試即達到教學大綱的要求掌握水平。假設樣本服從正態分布,我們可以根據積累樣本數據,求出均值1、樣本方差S21,并確定一個檢驗置信度P1(例如取0.05水平)。用(1,S21,P1)作為(c,r,p)的估計,描述教學大綱對知識點的要求。由此,我們可以得出知識屬性庫的關系模型,這是一個模糊值關系數據模型。在該關系模型中,為了考慮各知識點與其教學材料的關系,除了知識點屬性值外,還設有一個課件名稱域。用SQL語言描述模型如下:

知識點之間的關系可以用知識點之間的鏈接數據庫來表示。在某一學科中各知識點的鏈接關系描述了該學科的知識體系[6]。知識點的鏈接關系是雙向的,有上行和下行之分。一個知識點的上行知識點,即樹結構中的父結點;下行知識點,即樹結構中的子結點。由教學和學習過程本身可知,知識點之間關系的緊密程度不同,我們可以把它處理成一個模糊對象,用鏈接確信度來度量,用S(x)表示且0<S(x)<1。S(x)=1表示一個知識點與另一個知識點最緊密鏈接;S(x)=0表示沒有鏈接,在數據庫中不保存。例如,我們可以定義:

知識點鏈接數據庫的具體內容,用SQL描述如下:

在這樣的一個鏈接關系數據模型中,會出現一個父結點和多個子結點的情況。另外,也會有一個父結點和一個子結點,多個父結點和一個子結點,以及沒有父結點或者沒有子結點的情況等。
領域知識庫由知識體系庫和教學材料庫組成。
教學材料庫的主要目的是構成學習環境并向學習者提供支持學習過程的各種條件,該庫的主要內容為與各知識點對應的相關課件,當通過某種搜索策略得到一個待學習的知識點編號時,就可以從知識點屬性庫中獲得與該知識點相關聯的課件名稱,并可以以此名稱作為入口參數,來調用已經編寫好的多媒體課件,進行教學講解或練習等教學、學習活動[7]。
因此,整個領域知識庫的結構如圖2所示。

圖2 領域知識庫的結構模型Fig.2 The structural model of domain knowledge base
由于領域知識庫構建方式具有高度的人為依賴性,因此,構建的技術及策略并沒有固定的形式。建議將構建過程[8]區分為規劃、設計、測試修正、布署及整合擴展等階段進行,為獲得Ontology所須要的概念及其關系,利用正規概念分析法將真實世界的認知予以收集,并發展常用的邏輯類型模式,以降低轉換為信息系統格式的障礙。
[1]鄧志鴻.Ontology研究綜述[J].北京大學學報,2002,38(5):731-783.
DENG Zhi-hong.Ontology research[J].Peking University,2002,38(5):731-783.
[2]劉紅閣,鄭麗萍,張少方,等.本體論的研究和應用現狀[J].信息技術快報,2005,3(1):1-12.
LIU Hong-ge,ZHENG Li-ping,ZHANG Shao-fang,et al.Ontology research and application status[J].Information Technology Letters,2005,3(1):1-12.
[3]李善平,胡玉杰,郭鳴,等.本體論研究綜述[J].計算機研究與發展,2004,41(7):1041-1052.
LI Shan-ping,HU Yu-jie,GUO Ming,et al.Ontological research[J].Computer Research and Development,2004,41(7):1041-1052.
[4]王曉東,高宏卿.基于Ontology的智能系統開發[J].河南師范大學學報,2005,33(1):25-28.
WANG Xiao-dong,GAO Hong-qing.Ontology-based intelligent system development[J].Henan Normal University,2005,33(1):25-28.
[5]汪方勝,侯立文,蔣馥,等.領域本體建立的方法研究[J].情報科學,2005,23(2):241-244.
WANG Fang-sheng,HOU Li-wen,JIANG Fu,et al.The method of domain ontology[J].Information Science,2005,23(2):241-244.
[6]陳蘭,左志宏,熊毅,等.一種新的基于Ontology的信息抽取方法[J].計算機應用研究,2004(8):155-170.
CHEN Lan,ZUO Zhi-hong,XIONG Yi,et al.A new Ontology-based information extraction[J].Computer Application Research,2004(8):155-170.
[7]李健康,張春輝.本體研究及其應用進展[J].圖書館論壇,2004,24(6):80-86.LI Jian-kang,ZHANG Chun-hui.Ontology research and application progress[J].Library Forum,2004,24(6):80-86.
[8]Gillam L,TariqM,Ahmad K.Terminology and the construction ofontology[J].Terminology,2005(11):55-81.