[摘 要] 當下的網絡課程沿用了傳統文獻信息組織使用的知識組織形式,由于使用環境的改變,網絡課程在網絡環境下的知識表示、重組、聚類、檢索、編輯及布局等方面存在局限。文章提出在敘詞表和網絡課程原有信息的基礎之上,使用主題圖技術對網絡課程知識組織方式進行重組,對知識點進行多粒度、多層次的組織,實現網絡課程知識點語義關聯和智能分類,為個性化學習等學習模式提供支持。
[關鍵詞] 主題圖; 網絡課程; 知識組織; 敘詞表
[中圖分類號] G434 [文獻標志碼] A
[作者簡介] 朱珂(1982—),男,河南洛陽人。講師,博士研究生,主要從事教育信息處理、知識管理研究。
隨著信息技術的發展,出現了以Web2.0、Web3.0、面向服務的體系結構(SOA)、Web Service技術、網格技術、對等網、普適計算、云計算、社會計算等為代表的新技術和系統架構。這些技術產生和應用促進了學習資源分布和全面共享的問題解決,并催生出新的教育應用模式。
網絡課程的大量涌現為解決教育資源分布不均衡、實現教育資源的共建共享、構建學習型社會提供了一個很好的思路。在快速建設的同時,也暴露出了一些問題,較為突出的是沿用了傳統文獻信息組織使用的知識組織形式(如分類法、索引、標題表等),使得網絡課程在數字網絡環境下存在電腦無法處理與互操作、知識結構不清晰、檢索功能薄弱等問題。[1]解決這些問題,將對推進我國網絡課程的建設具有重要的意義。
一、網絡課程知識結構分析
網絡課程知識結構近年來成為研究的熱點。從國內外多年的研究來看,大致可以分為基于超文本的知識結構、基于XML的知識結構和LMS學習平臺。綜合來看,這些知識結構均存在一定問題。
1.基于超文本的知識結構受到HTML語言的局限,結點和鏈的類型較少,缺乏有效的信息組織和揭示工具,無法完整地表示領域知識。
2. 基于XML的知識結構不能把知識點與網絡上豐富的學習資源建立起直接的聯系,不利于學習者知識的拓展;另外,由于在以XML構成的網絡課程領域知識中缺乏知識類型的定義,進行知識的檢索時只能基于知識點的內容進行,文獻之間的知識和內容的相關性只能人為地去理解,這使得用戶對有效信息的查找、管理變得低效而困難,而最終呈現給用戶的信息的可信程度、正確程度、可管理程度大大降低,不能根據學習者的不同特點來展現同一知識點的不同表現形式,從而降低了資源的使用潛力。
3. LMS能夠在一定程度上實現個性化教學,但是在知識點的粒度上還不夠精細,對于知識點的定位也不夠精確,很難為用戶提供多粒度、多層次以及體現知識內部關聯的知識導航。目前較為成熟的LMS如Moodle、Sakai、Blackboard、LAMS等的資源組織及其管理機制主要以“資源、索引和元數據目錄”三要素為核心,多數內置的搜索引擎采用自動索引、自動文摘技術,在文檔的自動處理、索引的自動生成上,采用的僅僅是識別文檔中的關鍵字、關鍵詞,資源之間關鍵詞的相關性并沒有很好處理,很難根據用戶的需求和認知結構提供個性化的知識導航。
通過對“國家精品課程資源網”中網絡課程的分析可以發現,目前只有部分課程給出課程單元數、學時數、每一章節的學習目標,存在以下問題:沒有明確學習者學習課程單元所需要的知識水平;課程的組織是按照紙質文檔書籍的線性排列方式,不是層次狀或網狀的,也不支持學習單元知識點之間的關聯查詢、檢索功能,學習單元之間的切換只能采取前進、后退或從頭開始的方式實現,不便于跳躍性學習;學習者只能靠記憶來確定自己的學習位置,系統不能記錄學習者的學習路徑、學習心得,學習者一旦中斷學習進程,只能重新從頭開始進入;沒有便捷、智能的關聯檢索方式來幫助學習者使用課程內外相關的資料。[2]
互聯網為學習者提供了豐富的超媒體資源,為學習者創造出了一種由他們自行控制的學習環境,但如果缺乏良好的知識組織,就會使學習者迷航,產生一種無所適從的感覺,從而降低學習的效率,久而久之,會使學習者的信心受到影響。Gayle等人的教育實驗顯示,在基于網絡的學習中高分組的學習者是靠自信、系統指示與練習為基礎來決定的,他們較少依靠好奇、熟悉和興趣等來產生學習決定,而且在學習之后的測驗中所得分數也比較高。[3]為此有必要在內容、結構等方面對傳統知識組織系統進行改造,創建可應用于網絡數字環境、支持網絡知識智能檢索、導航的網絡知識組織系統。
二、知識組織及主題圖的介紹
知識組織和主題圖這兩個概念作為圖書情報學領域的專業名詞,有必要首先進行簡單介紹。
(一)知識組織
知識組織是指對知識客體所進行的諸如搜集、整理、加工、整序、揭示、控制、提供等一系列組織化過程及其方法,它包括主觀知識(隱性知識)的組織和客觀知識(顯性知識)的組織兩方面。對隱性知識的組織表現為知識的自組織過程,對顯性知識的組織表現為外在的、社會的控制與組織過程。[4]
在傳統文獻中,書后索引、術語匯編和敘詞表是三種常見的知識組織法,以下簡要說明這三種知識組織方法及其與主題地圖的聯系。
1. 書后索引
一本書若是沒有索引,就好比一個國家沒有地圖。一個傳統的索引事實上就是一本書的知識地圖,羅列了這本書所有的主題,并給予相關的指引,如頁碼、同義詞等。以《劍橋學習科學手冊》的中文索引詞“信息”為例[5] 。
信息(information),81
數據(data),參見(see also)data sets
環境(Environment and),20-21
信息與通訊技術(ICT and),301,529
交互分析(interactional analyses),83
其特點包括有:區別不同的主題類型及資源指引;采用“見”(See)來處理同義詞;采用“參見”(See Also)來指引到相關主題;區別同音異義、同形異義、同音同形異義詞;資源指引不僅包含頁碼,還能添加章節、附注等信息。一本書的索引同時具有主題、資源指引要素,與主題地圖較為接近。
2. 術語匯編
術語匯編是基本詞匯與定義的列表,屬于單一類型的索引,并且只有一種資源指引,也就是該術語的定義。一個術語匯編同時具有“見”與“參見”來鏈接相關主題,有的還會提供相關信息,如發音等,但重點在于主題名稱與其定義,這樣的結構也非常適合使用主題地圖模型來實現。
3. 敘詞表
敘詞表是信息表示工作過程中廣泛采用的文獻主題標引和檢索工具。它對自然語言進行詞量、詞類、詞形、詞義及詞間關系的全面控制。敘詞表是特定領域中相互關聯詞匯的網路,重點在于詞匯間的關聯性(Relationship or Association)。選擇一個特定詞匯后,敘詞表會提供相同意義、同類型事物的上位詞與下位詞以及在其他方面相關的詞匯。更重要的是敘詞表將詞匯歸類,不僅說明詞匯間具有關聯性,更指出如何或為何相關,使得指引更為容易。目前在敘詞表中通用的關聯類型有上位詞、下位詞、等同詞、相關詞等。[6]
敘詞表提供了比較規范和全面的檢索詞體系,對多義詞和同義詞進行了控制,這些特點保證了信息組織、信息檢索的檢全率和檢準率。敘詞表從出現至今,經過長期的發展和完善,已在傳統文獻標引和檢索中取得巨大成功,正在向網絡應用發展。例如:英國國家數字檔案館NDAD[7]、ERIe數據庫[8]、MeSHDtabase[9]、Web of Knowledge的INsPEC[10]、Engineering Vinage[11]等國外文獻數據庫均采用敘詞表作為知識組織的基礎。
與一般網頁信息更新速度快、類型復雜、質量參差不齊等特點相比,網絡課程中的信息更符合敘詞表規范化控制、學科屬性單一的特點。網絡課程制作教師可利用其領域知識背景,在網絡課程知識的組織過程中,依據敘詞表通過人工或自動化方法確定文獻的敘詞描述,形成敘詞字段,確定網絡課程主題詞及詞間關系,從而準確、規范、全面地描述知識主題。
(二)主題地圖
索引(Indexes)、術語表(Glossaries)與敘詞表(Thesaurus)是構建圖書文獻及其他資源知識架構的常用方法。在人工智能領域中,有一種知識表示法(Knowledge Presentation,簡稱KR)的技術稱為語意網絡(Semantic Network),是由概念與概念關系組成概念圖作為人與電腦的溝通方法。語意網絡可有效表示人類專家的知識,在人工智能應用中常被用來建構專家系統中的知識庫,以支持推論引擎的推理與運作。主題地圖(Topic Maps)則是一種類似語意網絡的知識表示模式,結合了傳統索引、圖書館學與人工智能等領域的優點,在信息世界中,猶如GPS(全球定位系統)提供尋址與鏈接的功能,可以有效地組織知識以利于探索、推理,解決大量無序信息所帶來的問題。[12]
雖然主題圖是用來表示巨大、復雜的知識結構的,但其核心概念只有三個: Topics(主題)、Associations(關聯)、Occurrences(資源指引),以下分別進行簡要介紹。
1. 主題(Topics)
在主題地圖中,知識的基本單元稱為“主題”。Topic這個詞來源于希臘語“Topos”,代表“Location”和“Subject”。主題可以是任何對象,例如人、概念、實體等,而不管他是否存在或者是否有具體的特征。凡是能引起使用者討論的對象都可以抽象為一個主題。主題根據類型劃分為群,稱之為主題類型(Topic Types)。每個主題有三個主題類型的主體特征:主題名稱(Topic Names)、主題資源指引(Occurrences)和關聯中的角色(Roles in Associations)。
2. 關聯(Association)
主題之間可利用“關聯”來顯示其語意關系。例如“羅貫中”和“三國演義”兩主題之間具有“寫作”關系。不同于資源指引連結到文件來源,關聯表現出一個包含信息本質、呈現信息主要價值的知識基礎。一個主題關聯并未限制相關主題的數量。在主題地圖中,關聯同時也被視為一個主題,也有關聯類型。如“寫作”即可視為一種關聯。關聯類型把具有相同關系的主題匯集成群,有助于增加主題地圖的表達能力。我們可以將存在于主體間的各類關系,通過關聯的組織與聯接而形成關于某一領域知識的知識網絡。如果進一步將知識網絡和知識推理結合起來,主題圖就能提供知識創新與知識更新的能力。
3. 資源指引(Occurrence)
一個主題可同時擁有一個以上的“資源指引”,表示連結一個或多個可尋址(Addressable)的信息資源。如某人的個人簡介、出版著作、科研論文等。資源指引內含在主題地圖內,也可以獨立在主題地圖之外,經由統一資源標示符(URI)識別存取。資源指引可以是不同類型的任何成員。在主題地圖標準中,將資源指引類型視為一個角色,如同主題類型,資源指引角色也被視為主題。
圖1 主題圖知識結構示例圖
本研究嘗試以主題地圖來表現網絡課程中的知識結構,利用主題地圖提供用戶自行定義結構的方式,確立各主題詞的詞間關系,提供使用者以瀏覽的方式來了解知識間的關聯結構。
三、使用主題圖重構網絡課程知識組織方法
本研究的技術路線是首先確定網絡課程的敘詞表,描述詞間關系。其次使用主題圖語法進行標準化描述,在此基礎上使用Ontopia公司的Omnigator軟件作為主題地圖的處理器,進行網絡課程知識的組織、管理,以提供導覽式在線學習。
1. 在網絡課程知識領域范圍內確定敘詞表
以“教育信息處理”網絡課程為例,網絡課程涵蓋的信息內容為主題詞的范圍內,以主題詞“教育信息處理”為中心,選取十個與“教育信息處理”相關的主題詞,在對這十個主題詞及其替代詞進行關聯分析后,歸納出其詞間關系,見表1。
2. 依據XTM(XML Topic Maps Specification)語法編寫主題圖代碼
XTM是一種基于XML的主題圖語法,可以用來構建國際標準化組織制定的ISO/IEC 13250-2中定義的數據模型實例,它定義了可替換語法到數據模型的映射。
首先,將各個主題詞以
的主題。
1
2
3
<!--定義主題名稱-->
4
5
6
7
<!--主題鏈接地址-->
8
9
10
接著,我們便可以著手建立各個主題詞的關聯。在建立關聯之前,必須先將關聯類型定義為一個主題詞,并以
最后,便可將兩個不同的主題詞以
19
20
21
22
23
24
25
27
<!--EIM表示教育信息處理-->
28
29
30
31
33
<!--EIS表示教育信息科學-->
34
35
XTM具有結構明晰、語法簡單等特點,按照語法規范編寫網絡課程的主題代碼難度不大。另外近年來一些公司開發了主題圖制作的可視化工具。例如Ontopia公司主題地圖工具套件,用戶可以在可視化的界面進行制作,進一步降低主題圖制作的技術難度。接下來進行的主題圖發布、展示也采用這個工具套件。
3. 主題圖的發布與展示
我們使用Ontopia公司開發的主題地圖處理器Omnigator將完整的 XTM文檔發布到網站服務器上,就完成了利用主題圖技術對網絡課程進行知識重組的過程。
圖2顯示了“教育信息處理”網絡課程中主題詞匯、主題詞間的關聯性、在關聯中所扮演的角色以及資源指引的類別。為用戶展示了以搜索主題詞為中心的知識結構,為個性化學習、自適應學習流等應用提供給了一種知識組織解決方案。
四、基于主題圖知識組織的網絡
課程在個性化學習中的應用
課程多元化改革的方向和意圖是通過知識組織、呈現方式的改進,支持符合學生個體差異和興趣的學習過程。我國全面實施的基礎教育課程改革的重點之一就是轉變學生的學習方式,力圖通過建立課程標準、強化信息技術等一系列措施,針對不同的個體,選擇適合的學習方式,設計、實現個性化的學習方式。
圖2 教育信息處理課程主題圖示例
國內學者對個性化學習的特征從內到外、從硬件到軟件進行了較為全面的分析,針對學習資源特別指出:首先,個性化學習強調學習資源的學習性與整體性。學習性是指學生的學習內容應遵循知識的邏輯、個體的心理發展規律和學習者的認知特點,是學習者預期學習結果的序列化。其次,個性化學習強調學習資源的動態性和生成性。學習資源的動態性,一方面是指構成個性化學習資源的各要素之間關系是不斷生成變化的;另一方面針對不同的學習領域、不同的學習層次、不同的學習環境,學習資源要保持動態的調整。知識的快速更新,需要新的學習資源組織方式。
基于主題圖的網絡課程知識組織方式符合個性化學習需求。以學生進行“教育信息處理”課程學習為例。如圖3所示,課程為“信息熵”概念提供了多路徑學習流程,學習者可根據測試工具的結果或系統依據學習者模型特征動態決定學習活動及各個活動發生的時間次序和邏輯關系。如正常的學習流程為“信息熵→熵模型→教育中量/質的數據信息量分析→CAI課件信息量分析”。如果學習者在研究CAI課件的信息量分析時對計算課件的相對熵感興趣,則學習流中可加入相對熵、冗余度的概念。同樣如果學生對教育信息科學的基本概念缺乏理解,則可以將相關資源連接作為學習的預備知識進行呈現,達到精確控制知識點和路徑的目的。課題組還在“翻轉課堂”的課堂模式中進行應用,較好地實現了學生課前自學中自定步調、知識定位的功能。由于篇幅限制,將在另文詳述。
圖 3 主題知識學習流程圖示例
五、結 語
主題地圖作為一種結合了知識工程和信息組織的新技術,為我們構建結構明晰、智能檢索的網絡課程知識組織結構提供了新的研究方法。本研究使用主題圖作為網絡課程的知識組織方法,借助傳統文獻敘詞表完成了主題選擇及詞間關系的制定。在主題圖的知識表示框架中,其設置規范、嚴格的詞間關系是實現擴檢和縮擴并保證檢準率的基礎。用戶使用領域主題詞進行搜索就可以方便地獲得與該主體詞直接或間接相連的多個詞,包括等同詞、上下位詞以及相關詞。這些詞都與中心詞有著密切的聯系,利用它們可以檢索出更多與用戶檢索目的相關的結果,同時也保證了檢索的準確性,有效解決了網絡課程中知識結構表達無序,無法進行語義檢索的問題。在后續研究中,將通過大規模數據,在系統平臺上進行進一步實驗,探索更多的改進方法。