[摘 要] 泛在學習環境下的學習資源存在分散無序、共享性差、聚合性不足等缺陷,學習資源的深度聚合問題已成為教育技術研究熱點之一。學習資源動態語義聚合是要自動生成具有內在邏輯關聯的資源結構體,且可以隨著資源之間關聯關系的變化而動態更新和發展。資源聚合有兩種主要形態,分別是主題資源圈和有序知識鏈。重點對其實現的關鍵技術進行了介紹,并依托學習元平臺對資源動態語義聚合的效果進行了初步驗證。
[關鍵詞] 學習資源; 資源聚合; 動態語義; 語義關聯
[中圖分類號] G434 [文獻標志碼] A
一、 引 言
網絡技術的飛速發展,推動了網絡信息資源的爆炸式增長。網絡資源是指通過互聯網傳播共享、以文件目錄為主要存儲組織結構的內容,[1]包括電子書、講義、視頻、音頻等多種形態。網絡資源具有信息量大、內容豐富多樣、使用方便、更新及時等優勢,[2]但也存在無序組織、混亂、難以管理等弊端。[3]泛在學習時代的到來正在催生海量學習資源不斷地產生,進一步凸顯了當前網絡學習資源分散無序、共享性差、聚合性不足的缺陷。如何將四處分散而又具有內在語義聯系(相同話題、相同/相反觀點、先備/后繼知識等)的學習資源個體進行自動聚合?該問題已引起教育技術學、圖書情報學、計算機科學等領域研究者重點關注。鑒于此,本研究將對數字學習資源的動態語義聚合方法和技術進行探索,期望能對當前數字化學習領域的資源建設提供借鑒和參考。
二、 相關研究
數據挖掘領域產生了大量聚類算法,突出的成果有DBSCAN算法、STING算法、K-MEANS算法和BIRCH算法。[4]以這些聚類算法為核心的聚類分析技術,目前主要用于網絡文檔的自動分類。近年來,隨著聚類分析技術的逐步成熟和推廣應用,教育技術學領域的少數研究者也開始研究該技術在試題分組、[5]學習者分類、[6][7]課程資源分類、[8]知識分類[9]等方面的應用。然而,資源聚合不是簡單的數據聚類,聚合的目的是對有內在邏輯關聯的資源個體間進行聚集和融合,使其成為有助于促進學習的、有意義的資源結構體。數字化學習領域的資源紛繁復雜、媒體形式多樣,上述聚類算法難以直接遷移應用。
在圖書情報領域,資源整合是數字圖書館建設中的基礎工程,[10]已有很多學者對網絡資源的整合問題進行了研究。李強對高校圖書館與院系資料室整合機制進行了探討。[11]單永剛提出一種基于元模型的數字資源整合方法。[12]王浩對基于MAP(Millennium Access Plus)工具的數據庫資源整合方法進行了介紹,指出該工具可以屏蔽多個數據庫之間的異構性,對數據庫資源進行有效整合。[13]圖書情報領域在資源整合方面的代表性成果是兩大學術文獻服務平臺,分別是CNKI(http://www.cnki.net/)和CALIS(http://www.calis.edu.cn/)。從上述研究和實踐領域成果可以看出,圖書情報領域進行的資源整合研究,最終目的是將異構數據庫中的信息進行集中以促進信息流通和共享。這里的資源整合不等同于資源聚合,整合僅僅將分散的資源統整到一起,而聚合則是整合基礎上的進一步細分。如果說資源整合是物理反應的話,那么資源聚合則是一種化學反應。聚合的結果是要形成新的、更能體現知識體系的資源結構體。雖然部分學者對資源聚合技術也進行了探索,如基于RSS的信息聚合、[14][15]基于Portlet與Web Service的信息聚合、[16]基于語義的資源聚合[17]等,但從探討的內容上來看,仍然屬于資源整合層面的研究。
綜上所述,我們認為上述資源聚類與資源整合方面的研究還未上升到“聚合”層次。面對急速擴展的學習資源空間,如何構建資源的動態語義聚合方法與技術,目前鮮有學者進行此方面的研究。因此,本研究希望能在學習資源語義關聯基礎上,探索一種學習資源的動態語義聚合方法,在一定程度上解決數字化學習資源分散無序、檢索困難等現實問題。
三、 資源動態語義聚合概念界定
學習資源的動態語義聚合不是簡單地將多個學習資源組成一個資源集,而是通過技術手段將多個語義上具有強邏輯關系的資源按照特定的組織方式自動聚合成資源群(資源集合),且聚合結果不是一成不變的,會隨著資源之間關聯關系的變化而動態更新和發展。區別于數據挖掘中的文本自動分類或聚類,聚合的目的不是為了進行分類,而是自動生成具有內在邏輯關聯的資源結構體(如圖1所示)。資源動態語義聚合的價值和意義,主要體現在兩個方面:一是可以實現多個小粒度的具有內在邏輯關系的資源單元集中呈現,通過資源的內聚,減輕學習者“機械性”檢索資源的負擔;二是可以將碎片化、零散性的知識組織成更加完整的知識單元,有助于學習者系統、全面地進行知識建構。
微型化已經成為當前數字化學習資源發展的重要趨勢[18],泛在學習環境下需要海量的、內容豐富的、體現個性需求的、富交互的微型學習課件[19]。那么,資源的聚合是否與當前學習資源微型化的發展趨勢相悖呢?微型化和聚合并不是互不相容的矛盾體,而是相互作用的連續體。學習資源的聚合并非否定微型化學習資源的價值,而是更強調在資源微型化、碎片化基礎上的再次聚合。從生態學的視角來看,學習資源的語義聚合也是資源生態系統進化的需要。資源個體間動態建立有意義的關聯,并在此基礎上進行動態聚合,將大大促進資源種群的形成與良性發展。
四、 資源聚合形態設計
根據資源聚合結構的不同,可以將學習資源聚合分為兩類:一是學習資源的自動聚類,借鑒數據挖掘領域的聚類思想,實現學習資源的自動分類,形成若干個主題資源圈(Theme-based Resource Circle,TRC),比如將所有關于就業求職的資源自動組合成“就業求職類”主題資源圈;二是基于資源關聯信息,自動將分散的資源結點進行結構化的邏輯組合,形成有序知識鏈(Orderly Knowledge Chain, OKC),比如可以將一元二次方程的概念、求解方法、測試試題、案例分析等資源根據“前序—后繼”的語義關系自動聚合成“一元二次方程求解教程”的知識鏈,學習者可以按照順序將各個知識點集中起來系統學習。
(一)主題資源圈
主題資源圈是具有相同主題、語義高度相關的多個資源個體的聚合。這種資源聚合形態的特點是資源間不存在上下位的層次關系,同屬于某一主題,采用平行的列表方式進行呈現(如圖 2所示)。
主題資源圈在教學應用模式上和專題學習網站類似,有利于開展專題學習。有研究者指出,[20]基于網絡的專題學習能很好地結合傳統教育與研究性學習的優點,是一種值得推廣的數字化學習方式。主題資源圈通過聚合具有內在語義關聯的資源個體,形成一個龐大的、內容豐富但主題一致的資源池,可以供廣大學習者(不僅限于學生)進行開放探究學習。與傳統專題學習網站的區別在于,它是系統根據資源內在的語義關聯度自動聚合而成,而非依靠人工進行資源素材的搜集、組織、整理而成。
(二)有序知識鏈
有序知識鏈是多個具有前后序關系的資源個體的聚合。鏈條上的知識點具有顯性的前序、后繼關系,也就是說,按照正常的學習流程,需要先學完前一個知識點,方可進入到下一個知識點的學習(如圖 3所示)。
以“一元二次方程”為例,從定義到解法再到初級應用、高階應用等,資源之間具有明顯的前后關系。網絡學習者在超媒體信息空間學習的時候,存在迷航和信息超載兩大問題。[21]有序知識鏈是一種序列化結構,學習路徑常常是固定的,學習者可以按步驟進行學習。因此,有序知識鏈可以起到知識導航的作用,使學習者明白當前在“哪里”,下一步該到“哪里”去,以減少網絡學習中的“迷航”。
五、 資源聚合技術實現
(一)總體技術框架
本研究采用的技術路線如圖 4所示。應用動態語義關聯技術[22]可以在資源空間的結點間建立起豐富的語義關系,形成資源語義關聯網絡。資源語義關聯網絡實際上是采用有向圖表示的關系空間(如圖 5所示)。聚合引擎從大量的關系中挖掘出更大粒度的有意義的資源結構體,依據設定的聚合規則生成主題資源圈和有序知識鏈兩種資源聚合結構體。
(二)主題資源圈聚合
主題資源圈聚合的基本實現思路是:采用BFS (Breadth First Search)在有向資源關系圖中尋找具有相似關系的資源結點,依據相似關系衰減函數計算兩兩結點之間的關聯程度,將滿足最低閾值要求、高度相似內聚的結點自動聚合在一起,最終生成若干個主題資源圈。
由于相似關系具有對稱性,即,另外,相似的程度常常通過相似度來表征。因此,可以將圖 5中所有的相似關系提取出來,兩個結點間的相似關系通過帶有權重的無向邊來表示,權重為結點間的相似度。相鄰接的兩個相似結點間關系為直接相似關系(如圖 6中的A和B),反之,通過中間結點建立起來的相似關系為間接相似關系(如圖 6中的A和C)。
相似關系具有部分傳遞的特性,也就是說如果A和B相似,B和C相似,則A和C也存在某種程度的相似。這里設定一個相似度衰減函數Damp用來表示相似關系的傳遞衰減性。如果A和C之間不存在直接邊(相似關系),則A和C之間的相似度為從A到C最短路徑上的Damp值。
Damp(A,B,C)=Sim(A,B)×Sim(B,C)
Sim(A,C)=Damp(shortestPath(A,C))
舉例說明,如圖 6中從A到C之間存在兩條路徑,A→B→C和 A→D→E→C,其中A→B→C為最短路徑,因此A和C的間接相似度為0.91×0.95= 0.8654。
主題資源圈作為相似資源的聚合,需要滿足兩個基本條件:
條件1:圈內的任意兩個資源存在相似關系,且相似度大于閾值?茲;
條件2:圈內的資源數量不少于?棕,即一個資源圈最少包含?棕個資源。
依據上述對相似關系的分析和主題資源圈聚合的兩項基本條件,提出表1主題資源圈的動態聚合算法。
(三)有序知識鏈聚合
有序知識鏈聚合的基本實現思路是:從整個資源語義關系圖中提取出表示有序關系(前驅、后繼、是基礎)的所有資源結點和邊,組成知識序列有向圖G(如圖7);深度優先遍歷(DFS, Depth First Search) G,將所有知識路徑找出來,生成若干個有序知識鏈。
表征知識前后順序的有序關系主要有三種類型,分別是isSubsequentOf(后繼)、isPreviousOf(前驅)和isbasisfor(是基礎)。其中,isSubsequentOf是isPreviousOf的相反關系,即isSubsequentOf(A, B) = isPreviousOf(B, A);isBasisFor和isPreviousOf是等價關系,即isBasisFor (A, B) = isPreviousOf(A, B)。為了程序處理的方便,需要將知識序列有向圖G中的所有isSubsequentOf替換為isPreviousOf,且要更改有向邊的方向,將所有的isBasisFor直接替換為isPreviousOf,有向邊的方向不變。
有序知識鏈作為具有前后學習順序關系的知識點(資源)的聚合,需要滿足兩個基本條件:
條件1:從學習的邏輯上來講,知識鏈中的資源存在一定的先后學習順序,即資源之間具有理想的線性學習路徑;
條件2:知識鏈中的資源數量不少于?棕,即一個有序知識鏈最少包含?棕個資源。
依據上述對有序知識關系的分析和有序知識鏈聚合的兩項基本條件,提出如下有序知識鏈的動態聚合算法(見表2)。
(四)資源聚合結果展現
主題資源圈的可視化展現,有助于學習者直觀地發現資源結點之間語義相似的緊密程度,發現資源圈中的核心結點(圖中度數最大的結點,與其他結點間的關聯數最多);有助于學習者依據資源間的語義相似程度,快速選擇自己感興趣的資源進行學習;同時也給對學習者帶來與傳統樹狀目錄式學習不一樣的學習體驗,激發學習興趣。
可以采用Flex技術進行主題資源圈中資源結點的網狀展現(如圖8所示)。圖的中心結點顯示的是主題資源圈中最核心的資源,該資源與其他資源都具有較高的相似度。結點連線上顯示資源的語義相似度,線的不同長度表征不同的語義相似度大小。資源結點越相似,連線越短,反之則越長。基本信息模塊顯示主題資源圈包含的主題詞(表征核心內容的特征詞)、結點數量、平均相似度、聚合時間等信息。
區別于主題資源圈的網狀結構,有序知識鏈采用線性結構顯示(如圖 9所示)。系統自動聚合的有序知識鏈主要從語義的先后順序上進行資源的重新組織,重在為學習者提供最佳的學習路徑。學習者既可以根據自身需求進行線性的連續學習,也可以選擇性地進行跳躍式學習。
圖 9的基本布局和主題資源圈類似,畫布中間采用有向知識鏈條的方式展示資源結點間的語義順序。其中,顏色的方塊有特定的含義,紅色表示已經學完的,綠色表示正在進行的,灰色表示未開始的。點擊“顯示進度”可以查看學習者在某資源上的學習進度。右側基本信息模塊顯示有序知識鏈包含的主題詞、知識點數量、已學完/進行中/未開始的知識點數量、聚合時間等信息。
六、 資源聚合效果檢驗
本研究選擇學習元平臺(Learning Cell System, 以下簡稱LCS)[23]為實驗環境,驗證上述學習資源動態語義聚合的效果。LCS是為泛在學習環境設計開發的一種新型開放知識社區,官方網址為http://lcell.bnu.edu.cn。LCS以學習元[24]作為基本的資源單元,學習元是一種語義化組織的學習資源,多個學習元可以聚合成知識群。自2011年9月上線以來,截止到2013年3月30日,LCS已有注冊用戶8204人,13766個學習元,1365個知識群。
本研究截取2012年1月1日到2012年3月1日時間段的聚合數據進行分析。LCS中資源動態語義聚合的統計數據顯示,該時間段內共聚合32個知識群,包括12個主題資源圈,20個有序知識鏈。
截止到2012年3月1日,LCS共產生了333個知識群,其中人工創建301個,自動聚合生成32個。通過動態語義聚合方法生成的知識群占系統總知識群的9.61%,也就是說LCS中有近十分之一的知識群是自動生成的。
筆者對自動生成的32個知識群的聚合效果進行了逐個檢查,發現其中的11個主題資源圈和17個有序知識鏈都得到了比較滿意的聚合結果,準確率達到了87.5%。就目前的動態資源聚合數據而言,雖然數量較少,僅占系統總量的9.61%,但聚合的效果是比較理想的。
實際上,LCS中動態語義聚合的結果和本文第五部分中設定的聚合要求直接相關,通過修改聚合的相似度閾值?茲和資源數量閾值?棕可以產生不同的聚合效果。?茲和?棕的值越高,聚合的數量會越少,但準確性會越高,反之亦然。目前,LCS設定的?茲=0.35、?棕=5。后期可以根據LCS運行的需求動態調整。
選取系統聚合生成的“《兩只小獅子》教學設計 相關資源聚合”知識群為例(如圖10所示),進一步分析LCS中資源動態語義聚合的效果。該知識群動態聚合的時間為2012年2月16日,共包含6個學習元。分析這六個學習元的內容,可以發現全部都是關于《兩只小獅子》的教學設計方案,創建者為不同學校的多名語文教師(民生小學的趙桂祥、麗景小學的張榮華等),聚合的結果很理想。
“《兩只小獅子》教學設計相關資源聚合”知識群將同一篇小學語文課文的教案進行自動聚合,可以為同學的學習和其他教師的備課提供寶貴的參考資料。另外,若某語文教師訂閱了該知識群,當增加新的《兩只小獅子》的教學設計資源時,該教師可以第一時間通過E-mail得到通知。
七、 總結與啟示
泛在學習環境下的學習資源聚合研究有兩個層次,一是宏觀層面的海量資源的有效匯聚,即將分散在互聯網各個角落的學科資源進行有意義的聚合;二是微觀層面的資源結構體的有效聚合,即形成一個個獨立的、具有內在強語義關系的資源群。本研究進行的是微觀層面的探索,提出兩種學習資源動態語義聚合的方法和技術,分別是主題資源圈聚合技術和有序知識鏈聚合技術。下一步,需要重點優化資源聚合算法,提高其運行速度,并將該聚合方法應用到其他資源管理系統進行聚合效果的檢驗。
本研究對于學科資源深度聚合問題的后續研究有兩點啟發:(1)學科資源結構體的有效聚合,能夠更高效地支持學習,比單純地將分散資源匯聚起來更有價值和意義,因此,需要在宏觀研究基礎上深入開展微觀層面的資源聚合研究;(2)隨著語義網技術的逐步成熟和推廣,學習資源的語義化組織已是大勢所趨,因此,學習資源的聚合研究需要適當引入語義技術,以提高資源聚合的質量和效果。
[參考文獻]
[1] 陳翀, 閆宏飛. 網絡資源命名及用戶命名行為的分析[J]. 情報學報, 2009, 28(4):582~592.
[2] 張佳. 中國高等院校檔案學網絡教學資源的現狀和發展趨勢[D].鄭州:鄭州大學, 2012.
[3] 薩蕾. 網絡信息資源的規范控制探究[J].圖書館建設, 2009, (12): 42~45
[4] 賀玲, 吳玲達, 蔡益朝. 數據挖掘中的聚類算法綜述[J]. 計算機應用研究,2007, 24(1):10~13.
[5] Félix Castro, Alfredo Vellido, Angela Nebot, Francisco Mugica.Applying Data Mining Techniques to e-Learning Problems[J]. Evolution of Teaching and Learning Paradigms in Intelligent Environment, 2007,(62): 183~221.
[6] Paraskevi Tzouveli,Phivos Mylonas, Stefanos Kolliasa. An Intelligent e-Learning System Based on Learner Profiling and Learning Resources Adaptation[J]. Computers Education, 2008, 51(1): 224~238 .
[7] 張弛, 陳剛, 王敏娟, 王慧敏. 移動學習中片段式學習資源的設計研究[J]. 開放教育研究, 2009, 15(3):67~72.
[8] 趙立江. 個性化學習系統的聚類技術[J]. 計算機輔助工程, 2006, 15(3): 59~61.
[9] 王勛, 劉君強, 魏貴義.智能學習中的知識表示和知識聚類[J]. 計算機工程與應用, 2003, 39(7): 75~77.
[10] 胡翠紅. 基于5S理論的數字圖書館資源整合研究[J].現代情報, 2011, 31(1):44~46.
[11] 李強. 高校圖書館與院系資料室整合機制探討[J]. 現代情報,2012, 32(3):170~172.
[12] 單永剛. 基于元模型的數字資源整合方法的研究與實現[J]. 現代情報, 2011, 31(6): 76~79.
[13] 王浩. 圖書館網絡信息資源整合工具——MAP及其啟示[J]. 現代情報, 2010, 30(5): 73~77.
[14] 陳峰, 熊勵. 基于RSS信息服務聯盟的內容聚合技術研究[J]. 計算機技術與發展, 2009, 19(1):9~12.
[15] 戴明陸.基于RSS的內容聚合在學術領域的應用研究[D]. 長春:吉林大學, 2009.
[16] 杜豐, 邸德海, 楊潔. Portlet與Web Service實現校園門戶的信息聚合[J].中山大學學報(自然科學版), 2009, 48(z1): 192~294.
[17] 賀德方,曾建勛. 基于語義的館藏資源深度聚合研究[J]. 中國圖書館學報, 2012,(7): 79~87.
[18] 顧小清, 李舒愫. 共建微型移動學習資源:系統設計及實現機制[J]. 中國電化教育, 2010, (2): 74~79.
[19] 楊現民, 余勝泉. 生態學視角下的泛在學習環境設計[J]. 教育研究, 2013, (3): 74~79.
[20] 姜春霄, 馮秀琪. 專題學習網站調查及相關研究[J]. 中國遠程教育,2006,(4): 42~48.
[21] 雷菡. 基于概念地圖的網絡化學習路徑控制研究[D]. 重慶: 西南大學, 2007.
[22] 楊現民, 余勝泉, 張芳. 學習資源動態語義關聯的設計與實現[J]. 中國電化教育, 2013, (1): 70~75.
[23] 楊現民, 程罡, 余勝泉. 學習元平臺的設計及其應用場景分析[J]. 電化教育研究, 2013, (3): 55~61.
[24] 余勝泉, 楊現民, 程罡. 泛在學習環境中的學習資源設計與共享——“學習元”的理念與結構[J]. 開放教育研究, 2009, 15(1): 47~53.