盧淑怡,李美子,許 多,張 波,2,3
(1.上海師范大學 信息與機電工程學院;2.上海師范大學 人工智能教育研究院;3.上海智能教育大數據工程技術研究中心,上海 200234)
知識爆炸時代,高等教育已進入知識量大、學科交叉強、知識更新速度快的階段,對學生專業知識交叉融合學習提出了更高要求。高校培養復合型人才過程中亟需為學生構建全面綜合知識能力體系[1]。然而,傳統教學模式跨課程知識的關聯學習程度較低,無法為學生提供快速知識關聯獲取工具,主要表現為以下3 個方面:①傳統高校學科專業設置的課程銜接緊密度低,跨課程綜合課程少[2];②獨立授課導致課程內容差異大,缺乏知識連貫性;③不同課程、教材間術語名稱不同、知識點表達不同,學生受自身知識限制,難以發現知識點間隱性和長路徑關聯。這些原因共同導致知識點不連貫,造成學生所學知識點在跨課程的宏觀角度上呈相對離散的狀態。
因此,實現學科專業知識融合學習,應從智能輔助工具的角度探索創新途徑[3-5]。當前,主要的知識融合技術利用數據融合方法,根據知識融合數據特征,將數據融合方法應用于知識融合[6]。然而,該技術需要處理海量的龐雜數據并達到復雜的知識融合目標,當計算量過大時將難以及時動態反饋調整,無法保證知識融合效率[7]。
目前,知識圖譜技術被廣泛應用于知識表示、知識問答和知識推理等任務,具有大范圍、多樣性和可解釋性的優點,其中知識實體呈顯性連接狀態,能提供良好的關聯檢索與推理能力[8-11]。因此,從跨課程知識關聯的角度將課程內知識點實體及其關聯關系構建知識圖譜,將不同課程知識圖譜中的知識點實體建立連接,實現跨課程知識點實體融合,達到跨課程知識點實體連接的目標,進而完成跨課程知識推送,滿足學生交叉融合學習的要求[12-14]。
基于上述考慮,本文提出一種基于知識圖譜的高校跨課程知識推送工具設計方法及其應用案例。該工具首先構建了高校教育學科知識圖譜(Educational Cause Knowledge Graph,ECKG)的基本框架,實現了學科層、課程層和知識點層的3 層知識圖譜架構;其次,在ECKG 上設計跨課程知識推送算法,從“標準+個性”角度提供課程間連接的知識推送方法;最后,通過ECKG 應用案例為智能化知識融合學習提供支持。
高校教育學科知識圖譜是一種對零散知識進行整合并描述知識間相互關聯的方法。本文通過對ECKG 的形式化構建,關聯整理高校教育資源的教育知識點的知識體系和邏輯結構。
隨著教育革新和社會發展需求,學科交叉與課程融合趨勢在高校教育中逐漸興起。許多專業課程存在交集,但不同專業考察的側重點不盡相同,相較于其他傳統學科知識圖譜,本文從節點類角度出發,將ECKG 層次結構分為學科、課程、知識點3層,如圖1所示。

Fig.1 Hierarchy structure of ECKG for Science and Engineering subjects in universities圖1 理工學科的高校教育學科知識圖譜ECKG層次結構
由圖1 可見,3 個層次間通過包含關系自上而下進行N-N映射。每個子類將繼承父類的相應祖先類別,通過自上向下的分層構建保證ECKG 的知識覆蓋范圍。具體的實體與關系描述如下:①學科層實體包括依據學術性質而劃分的科學門類和門類下的具體教學科目,學科門類和教學科目通過組成的關系進行1-N連接;②課程層的實體根據不同教學目標和教學形式,分為理論類課程、實踐類課程和綜合性課程,各類課程通過前驅關系連接或獨立,以更好地挖掘課程和知識點之間的隱性關系;③知識點層的實體包括不同粒度知識點,在關系層面本文以近年來廣受認可的牛頓平臺(Knewton Platform)為基礎,主要考慮知識點間的組成、評價、前驅、分類這4種邏輯關系。
圖1 為理工學科為例的ECKG 層次結構示例。其中,學科層中包含理科、工科兩大科學門類;科學門類又由各種不同的教學科目組成;教學科目包含多門課程,因此將學科層和課程層相聯系;課程層與知識點層自上而下挖掘潛在關聯知識,通過多維角度提高學科素養。ECKG 的意義在于打破學科、專業、課程間的界限,依據知識點間邏輯關系、組織結構等進行整理關聯。
圖2 展示了本文所提理論構建的部分ECKG。具體的,ECKG 通過挖掘教育資源,整合知識點間存在的關聯,將不同學科專業知識點構建為一張有向的知識網絡。

Fig.2 Partial ECKG圖2 部分ECKG
如圖3 所示,ECKG 應用流程由3 個部分組成。具體為:①層次化知識圖譜模塊。ECKG 抽取不同學科、專業學習資料數據,整理關聯得到的知識點,整合出知識網絡構建ECKG;②標準化知識查詢模塊。通過知識快速定位算法查詢知識點或知識間的關聯;③個性化知識推送模塊。對歷史數據進行挖掘分析,構建個性化的學習模型,智能化分析用戶可能感興趣的知識點,針對用戶學習習慣進行推送。綜上所述,該應用從“標準(基于關鍵詞的知識快速定位查詢方法)+個性(教育知識點智能推送算法)”的應用角度,從課前、課中、課后3 個時段全方位輔助學生進行針對性學習。

Fig.3 Application process of ECKG圖3 ECKG應用流程
由于海量的教育知識點及知識點間錯綜復雜的關系會使學生在學習時無法清晰地厘清知識間的關聯,學生也無法在規模龐大、結構復雜的知識圖譜中快速尋找知識點間的關系。因此,本文提出利用關鍵詞定位目標節點的檢索方法,相較于傳統方法節省了遍歷索引所耗費的時間。算法描述如下所示:
步驟1:對大規模RDF 數據圖進行子圖劃分。將ECKG 劃分為多棵知識樹,分別構建知識點索引與關系索引進行分布式檢索。其中,知識點索引包含頂點下標和標簽,關系索引包含關系下標和標簽及相關聯的父節點下標。圖4 為索引關系示例,假設圖4(a)為一個劃分后的知識樹,圖4(b)就是針對該樹構建的索引關系。該方法在實現查詢時既能提升大規模RDF 數據圖的檢索速率,又能降低索引的存儲空間。

Fig.4 Index relationship圖4 索引關系
步驟2:構建最小知識子樹。遍歷每棵知識樹的節點,定位所有關鍵知識點,假設關鍵知識點≥2,尋找連通該知識點的最短距離,構建最小知識子樹。并通過知識點索引與關系索引尋找最小知識子樹的根節點。若關鍵知識點為1,則直接進入下一階段。
步驟3:構建候選知識子樹遍歷最小知識子樹的邊,定位關系關鍵詞。對于未被定位的關系關鍵詞,通過索引查尋最小知識子樹根節點和葉子節點連邊是否包含關系關鍵詞。若包含,將對最小知識子樹進行拓展;若不包含,則記下不被包含的關系關鍵詞個數。當關鍵知識點為1,將直接遍歷相關聯邊查找關系關鍵詞。
步驟4:評分規則。對構建的候選知識子樹進行評分計算,返回前k個結果供用戶選擇。本文評分函數考慮了候選知識子樹的緊密度及精準度,評分函數公式如式(1)所示:

其中,t為候選知識子樹根節點,num(ε)代表ε個數,sp(a,b)代表a到b的最短距離,α、β在實際應用中調整緊密度和精準度對評分結果的影響程度。
假設已完成對ECKG 與RDF 數據圖劃分得到i棵知識樹,并且識別問題關鍵詞得到n個知識點關鍵詞構成集合和m個關系關鍵詞構成的集合集Rk=結合上文對答案快速定位方法的具體描述,給出快速定位答案的算法偽代碼描述。
算法1基于關鍵詞的答案快速定位算法

針對以人為本的智慧教育學習理念,本文提出一種對歷史記錄和特征挖掘進行智能化知識推送的算法。該算法結合用戶檢索記錄,以每次定位答案中心知識點為基準,構建個性化模型計算中心知識點相關性,圍繞中心知識點間的最短路徑挖掘用戶檢索規律,并結合節點重要性增加可推薦知識間的區分度,從而構建個性化知識智能推薦模型。具體算法流程如下:
步驟1:確立中心知識點oi、知識點集C。通過尋找子圖每個點到其他關鍵知識點的距離并求和,分別計算各知識點的中心度core(ex),選取core(ex)最大的知識點o為中心知識點。

其中,N(ex)為ex的鄰居節點,l(ej,ek)=0 代表ej、ek不存在連邊,l(ej,ek)=1 代表ej、ek直接相關聯。同時,從平均路徑長度dist、支持度wl兩個因素分析一定時間內用戶搜索歷史的知識點集。

對不同關系的支持度表示如下:

其中,num(r)代表關系r在路徑中出現的次數。
步驟2:計算中心知識點的相關性sim(oi,oi+1)。不同用戶的個性化學習方式導致知識相關性不僅與知識圖譜中知識的位置相關,本文提及的知識相關性即在個性化模型限制下從當前中心知識點游走到另一個中心知識點的概率。

步驟3:計算候選知識點的中心度core(ex)。中心知識相關性主要考慮歷史中心知識點間的路徑關系,從而預測可推薦中心知識點,但可能面臨預測結果較為粗糙的情況,此時將難以區分部分節點可推薦度。為此,本文對知識點集合C中的節點進行中心度計算,提高推薦度的劃分效果。
步驟4:利用T(oi+1)對答案進行打分并排名,將前top-k的知識點返回給用戶。

結合上文對個性化教育知識點推送方法的具體描述,給出智能推送算法的偽代碼描述。
算法2個性化的教育知識點智能推送算法


以計算機學科的跨課程教學為例,包含算法、概率論、高等數學等課程,證明ECKG 知識推送工具應用及其教學模式改革的有效性。在傳統課程學習的3 個階段,學生通常會遇到以下問題:
(1)課前預習時,無法明確跨課程知識點間的關聯關系。學生在預習時,無法將預習知識和已學知識融會貫通,給預習增加很大的困難。通常看似無關的知識點卻內含強關聯,使學生不得不翻閱不同課程教材尋找他們之間的聯系。
(2)課中學習時,無法快速回顧某個確切的知識點內容。教師在授課時,經常通過拓展延伸、反問學生的方法推進課堂教育進程。例如,運用計算曲面積分方法可得出答案,學生則需要快速反應計算曲面積分的方法。
(3)課后復習時,無法對薄弱知識進行針對性鞏固提高。學生在復習時,遇到多個薄弱知識點,無法尋找核心知識進行梳理復習,復習效果較差,知識結構體系散亂。
在應用ECKG 工具后,學生在教學活動中將化被動為主動,從課前—課中—課后3 個階段完善自身知識體系,教師也可逐漸改變傳統教學設計。具體的,學生前期通過ECKG 了解知識結構關系,教師通過翻轉課堂等形式激發學生學習積極性,達到更好的教學效果。以下將從具體實例分析入手,展示ECKG 如何運用本文設計的算法幫助學生掌握知識點間的關聯性,應用流程實例如圖5所示。

Fig.5 Example of knowledge recommendation process based on knowledge graph圖5 基于知識圖譜的知識點推送流程實例
高校教育知識繁多復雜、專業性強,不同課程間存在許多關聯知識點,厘清知識點間的關聯是學好該知識點的重要保障。通過ECKG,即使用戶提出跳躍性問題,依然能尋找出知識間的關聯。首先,用戶提出問題,例如匹配分析法與樸素貝葉斯分類器間有何關聯。ECKG 提取匹配分析法與樸素貝葉斯分類器的知識關鍵詞,利用算法1 對關鍵詞進行定位。根據算法1 評分方法計算3 顆知識樹中的候選答案評分排名為a<b<c。假設系統返回用戶兩個答案,則用戶將會收到評分最高的兩個答案,即圖5 所示的兩個關聯。通過該知識關聯查詢方法,可解決學生在預習時遇到的問題,將所學知識與預習知識有機連接。
知識點的查詢過程本質上是關鍵詞的快速定位問題。例如,用戶希望了解混雜因素的評價方法,首先系統將提取混雜因素、評價的知識關鍵詞定位知識樹,然后以該知識點為中心檢索直接相關的關系評價,得出知識點為匹配分析法和多元回歸法,最后通過該方法解決學生在課上遇到的問題,輔助學生高效、快速地理解課堂知識。
除了根據ECKG 中直接關聯的知識點進行推送外,智能化推送算法還可根據知識點間的隱性關聯進行知識推送。假設用戶先后依此檢索了多元回歸法、匹配分析法、樸素貝葉斯。首先,基于檢索記錄的知識智能推送算法2,尋找知識點間的最短路徑。然后,根據數據分析知識點間最短路徑長度均值為2,尋找所有距離樸素貝葉斯為2 的知識點。假設前驅與評價評分各為0.5,其他關系評分皆為0,去除已出現的知識點匹配分析法,對知識點間最短路徑進行打分排序。最后,將最高分伯努利模型推送至用戶。
如此,可使用戶更明確自身學習路徑和下一步的學習知識點。通過該方法在標準的基礎上增加個性功能,使每個學生可針對性地發現自身所需鞏固的知識點。
本文提出利用知識圖譜對高校教育知識點進行組織和整理構建ECKG,并結合ECKG 上的知識檢索及智能化數據挖掘技術進行多角度知識應用。通過本文的論述與假設,可展望通過ECKG 及知識檢索技術對高校教育知識進行挖掘,不僅能打破高校教育中課程、專業的限制,還能直接對知識間的關聯進行宏觀梳理,使其更適應人工智能化教育時代的技術融合,從而促進高校環境下智慧教育生態的形成。
但對高校教育學科知識圖譜的落地還存在以下難題:①對于大體量數據,已有深度學習技術在教育資源抽取時仍需大量人工操作,亟需一種自動化程度更高的構建方法;②對于高校教育知識的隱性推理仍是一個值得深入探究的問題,如何最大幅度利用隱性關系挖掘出更多有利信息是當前知識圖譜領域尚未解決的問題之一。