沈紅葉,肖 婉,季一木,劉尚東
(1.南京郵電大學 教育科學與技術學院;2.南京郵電大學 計算機學院,江蘇 南京 210023)
隨著教育大數據發掘、人工智能技術發展,互聯網教育邁向智能教育發展的全新階段。知識圖譜作為人工智能的關鍵技術,在金融反詐、搜索優化、智能推薦等方面初見成效,在教育領域也逐漸顯示其優越性。國家《新世紀人工智能規劃》特別強調,要深入研究知識圖譜構建與教學、認知進化和邏輯推理等核心技術,就要建立涵蓋幾億級認知實體的復合、多學科專業、多數據源的知識圖譜[1]。
由此可見,知識圖譜通過處理大量復雜數據,建立數據間的聯系,實現對教育知識領域模型的抽取、融合和應用,是人工智能重要的技術應用。研究者指出,知識圖譜作為人工智能知識組織與表示的最新技術[2],是數字化教育時代具有潛力的發展方向,為數字化教育教學提供了信息控制和認知控制結合的新信息處理方式。本文研究近10 年國內教育知識圖譜的相關實證研究成果,系統梳理了教育知識圖譜的實踐研究和應用現狀,并分析其具體優勢與現存問題,旨在為教育知識圖譜的理論研究、技術開發和實踐應用提供參考建議。
本文通過系統性文獻綜述方式展開研究。首先采用選定的搜索策略評估與甄別文章;然后針對精準的研究問題,提出嚴格的納入排除準則;最后利用標準化技術篩選、整理所選文獻資料,最終得到研究問題的答案[3]。其中,研究采用的系統性文獻方法含有多項指標,例如根據文獻標題、研究方法、研究結論等4 個篩選階段,明確展示了文獻的納入排除總體過程及明確原因,為研究結果的準確性奠定了基礎[4]。
為了解教育知識圖譜的實證研究現狀與進展,本文確定了以下3 個研究問題:①教育知識圖譜有哪些類型;②教育知識圖譜應用于哪些實踐領域;③教育知識圖譜當前面臨何種挑戰。
1.3.1 檢索策略
為了更高效地獲取國內近10 年教育知識圖譜的高精度實證研究論文,以中國知網CNKI(新版)數據庫為文獻搜索源,利用高級檢索方式,將時間界定為2012-2021 年,以“知識圖譜”并含“教育”為主題詞進行檢索,共獲取論文881篇。
1.3.2 篩選標準
為了提高文獻分析的精確度與可信度,本文基于研究問題制訂了文獻納入/排除準則(見表1)。其中,第1-3 條是系統性文獻綜述法中為提高樣本準確度和權威性而廣泛使用的準則;第4 條旨在聚焦教育知識圖譜作為主要研究對象的文獻,剔除了僅將知識圖譜視作可視化工具的研究文獻。

Table 1 Document inclusion/inclusion criteria表1 文獻納入/排除標準
1.3.3 篩選過程
通過PRISMA 法(見圖1)篩選文獻。該方法是國際上常用的系統性文獻綜述篩選方法,主要包括以下4 個步驟:

Fig.1 PRISMA flow chart圖1 PRISMA流程
步驟1:篩選文獻標題,排除不相關和重復的文獻,獲得符合要求的文獻881篇。
步驟2:通過二次檢索和滾雪球方式篩選出文獻207篇。
步驟3:通過制定的納入/納出標準,篩選文獻摘要、方法、結果和討論,獲得文獻112篇。
步驟4:最后通讀全文,選取符合要求的文獻56篇。
1.3.4 數據分析
針對最終獲取的56 篇文獻,基于研究問題,從教育知識圖譜的類型、構建技術、應用場景、主要優勢、面臨挑戰等維度對其進行編碼分析,如表2所示。

Table 2 Analysis framework表2 分析框架
學科知識圖譜是一種可視化工具,將學科問題的邏輯關系作為核心,然后與對應的知識結構建立聯系[5]。首先,由不同學科專業領域的專家共同建立的學科專業認知本體,形成跨學段、跨專業的學科專業知識圖譜結構。然后,將已形成的學科知識體系下分為若干個基本知識模塊。接著,逐級向下將基本知識模塊分割為若干個基本知識點。最后,通過學科知識聚合功能模塊整合各主數據庫的學科知識,在集成過程中判斷數據質量,當數據品質滿足一定條件后,才納入學科知識圖譜[6]。
學科知識圖譜采用自上而下的設計和建構方法,依據學科知識結構,由學科專家精密審核討論所建構,因此數據質量要求嚴格,所構建的知識圖譜具有一定的權威性。但學科知識圖譜需依賴現有知識結構與專家人工審核,屬于一種靜態知識圖譜,無法自動化動態修改知識結構及知識點。此外,由于對知識庫內容粒度模糊,缺失學習者學習能力刻畫,所構建的知識圖譜在實踐應用中局限性較大,無法提升學生學習的靈活性及擴充性。
群體知識圖譜建立過程是構造社群認同的知識圖譜,參與的每個成員通過互動交流、協商與合作方法,動態建立知識圖譜的過程,是一種典型的動態知識圖譜[7]。首先,由小組成員每個人發表己見,構建小組成員自身理解的知識圖譜。然后,對小組成員構建的知識圖譜進行集中討論,當發現較大問題時刪除或修改構建的知識圖譜節點。最后,重新構建信度知識圖譜,再進行討論,直至爭議很小,才形成最終的群體知識圖譜[8]。
在群體構建知識圖譜實踐過程中,學習者可清晰地闡述自身觀點,并可視化當前群體知識圖譜的構建現狀,讓學習者實時了解構建進度,出現問題能及時討論解決,為后期工作提供便捷,避免出現低質量沖突的問題。再者,群體知識圖譜提出了需要探討的認知聚焦點,不會發生討論內容過于脫離當前的主題的情況,不僅能提高討論效率,還能提升問題討論交互的質量。現有研究表明,馬寧等[8]依托學習云平臺,設計構建了知識圖譜協同構建工具促進學習者的知識增長。姜強等[9]基于ARCS 動機建模技術與認知建構理論,建立了動態知識圖譜增強學習者自身的主動性,提升了學習者的在線學習體驗感。
群體知識圖譜能實時根據討論內容進行動態構建,經過小組成員協商對群體知識建構與智慧發展具有一定的促進作用,但群體知識圖譜的結構仍存在缺乏細化的問題,將影響進一步發現語義信息。此外,群體知識圖譜對原始數據具有一定的要求,只有適用于高質量和深度的討論內容,才能建構出有意義的群體知識圖譜。
多模態知識圖譜指以抽取課程資源中的知識實體為節點,依據知識實體間的層級關系生成三元組,并根據三元組生成表示知識實體間相互關系的知識圖譜[10]。首先構建面向學科的知識實體語料庫,然后對于課程資源的知識實體生成多模態知識圖譜。通常,教師根據課本大綱目錄依次教學知識點,但并未明確闡述章節間的邏輯關系、章節與整書內容知識存在的關聯、章節內容中細小知識點間的關系。即使在平時教學場景中會產生豐富的課程資源,且這些資源也是多個模態的集合,但并未得到充分融合,與知識點間的聯系也并不緊密,無法幫助學生有效理解相關知識點。
如果深層次挖掘專業教材與網上課程資源,多模態課程知識圖譜可較好解決上述問題,能有效關聯一門課程的知識點,讓學習者明顯了解該課的整體框架與邏輯。祁曉慧[11]運用CNN+BiLSTM-CRF 模型結合學科詞典,實體鑒別數據結構課程講義及簡書網站文字信息,通過Attention+BiLST 模型進行知識點間的關聯,并在此基礎上利用語言辨識程序將課堂語言信息辨識為文本,以鏈接實體對應的語言信息,形成涵蓋語言與文字信息的多模態課程知識圖譜。
傳統知識圖譜大多面向文本信息源,從知識融合角度而言,內容上關聯的課程知識能夠相互連接,但由于各課程教學內容各不相同、知識結構存在差異,難以實現各學科知識關聯。為此,利用多模態知識圖譜技術,一方面可加快融合相關聯的課程知識;另外一方面也可讓學習者所學的知識融匯貫通,更好地服務自身后期發展。然而,現階段多模態知識圖譜的高效融合一直是研究難點之一,未來可在多模態知識圖譜的融合技術層面進行突破。
學習認知地圖是將人的認知過程與知識圖譜相結合,相較于普通知識圖譜更關注學習者的思想動態變化。首先,教師根據教學大綱梳理教學內容,創設在線課程。其次,教師確定知識點間與所學課程、內容相互間的關系與權重。接下來,利用數據挖掘到的學習者與已完成學習活動和未達標內容之間的關系,得到與所學內容之間的關系規則。第三,利用相關規則將與所學內容間的影響關系轉換為與所學內容不同或相關的重要知識點間的關聯關系。最后,得到重要知識點間的先修關聯性,形成認知地圖[12]。學習認知地圖提高了學習者自身的主動性,鼓勵了學習者在學習活動中自主學習的行為習慣。萬海鵬等[13]從學習者模型內容開放的視角設計構建學習認知地圖,該模型可記錄學習者的學習認知情況,及時推送適合的學習資源與方式,合理規劃學習路徑。
學習認知地圖在學科知識圖譜的基礎上融入學習者認知過程,能更好地呈現學習者對學科知識點的掌握情況,可視化學習者的認知結構。由于學習認知地圖面向學科知識點進行認知結構構建,有利于教師實時掌握學習者的過程性學習情況,及時作出適合學習者的教學路徑規劃。該模型相較于前兩類知識圖譜而言,融合了學科知識圖譜的權威性及群體知識圖譜的動態性優勢。
教育知識庫是一種系統的知識圖譜類型,可將散亂、無序的教育數據整合為結構化、便于搜索、編輯、存儲的知識形式[14]。首先,針對所給問題,篩選其中的描述信息并搜集實體集。然后,按照所有被搜索的實體集合信息,從知識框架中推選候選答案集合的子圖。最后,根據問句描述信息尋找實體的候選實體代表得分,進而預測答案[15]。Peng 等[16]為了加強對多模態知識庫與多模態信息處理的研究,提出一個多模態實體標記和多模態知識庫,加快了對知識點搜索的進度。
教育知識庫的產生為系統化知識管理及在線教育智慧問答提供了條件,能給學習者帶來良好的互動體驗、精準的智能答疑與指導等服務,是當前在線教育領域中的重點研究內容。目前,我國基于問答的教育知識庫系統的研發工作仍然較少,無法適應當前教育教學平臺的發展需要。教育知識庫應用在技術上還有所突破的地方,無法精確解答搜索結果,而是推出了不相關或相關性不大的答案。其中,教育知識庫包括基于問答的方式,例如作業幫、小猿搜題等;基于知識內容的方式,例如百度百科、維基百科等。教育知識庫能方便學習者在海量數據中快速查找相關性最強的答案,大幅度提高了學習者的學習效率。未來若能在技術上實現突破,可能會使得搜索出的答案與學習者需要的答案在一定程度上實現相符的效果。
學習者畫像構建是從學習者的基本特征及行為樣本中提煉出的學習者特質來進行標記的活動[17]。當前在線學習中存在學習者個性特征缺失、對學習者在線學習的針對性服務不足、在線學習效率低下的問題。學習者畫像構建可精準分析學習者學習特征、學習風格及學習興趣,從而提供精準的教學服務,但當前學習者畫像構建由于活動資料的稀疏及保護隱私問題,使構建的圖像無法相當精確。趙玲朗等[18]提出借助知識圖譜幫助學習者建立完善的體系結構,也可實現規模化教育與個性化學習的有機結合。李振等[19]提出將知識圖譜運用于學習者畫像建模與分析,不僅能概括和語義關聯、基于知識圖譜的標簽,還能基于知識圖譜標簽傳播提高數據的可用性及標簽的可理解性,從而將學習者畫像的建模從基于行為的建模轉向基于語義的建模。
將知識圖譜技術應用于刻畫學習者畫像,不僅具有較高的準確率與覆蓋率,還對學習者理解抽象概念、提取知識邏輯結構具有突出優勢,還能有效提升學習者的理解能力與邏輯概括能力。
學情分析與評價是指為了合理引導學生,檢測、評價和研究學生的狀態[20]。學情分析與評價診斷是學生學習過程中的重要檢測手段。當前,學情分析與評價診斷存在許多教師輕視學情分析與評價診斷、傳統專家憑借自身經驗評價診斷學習者學習情況的問題,分析評價手段單一,會造成一定偏差。如果只利用一種模態數據反映學習信息會存在一定的局限性,利用知識圖譜能實現更精確的學情分析與評價。黃梅根等[21]建議應用知識圖譜的系統診斷,在該系統中針對選擇題的難易程度進行分類設置,使選擇題難易程度的評價更精確、客觀、科學。然后,運用數據挖掘方法研究學習者真實的學習情況,并與學科知識圖譜進行比較,不僅能通過考試記錄、錯題本、學習筆記的行為軌跡挖掘學習者對知識點的掌握情況,還可挖掘出一些隱藏問題,例如學生學業情況、認知能力等。鐘薇等[22]指出利用多模態生物技術和教學平臺日志追蹤學生的學習軌跡,以此獲得學習者認知水平的信息。張家華等[23]提出通過文本、音頻和視頻挖掘用戶情感信息的開源工具,然后使用知識圖譜對其可視化,為全面表達學習者學情信息創造了可能性。通過以上方法會使數據分析結果更客觀,更符合有個性化學習特征的學生。對于近期不能完成的學習任務,可利用知識圖譜尋求原因,尋找自身學習存在的薄弱點環節,推進學生學習進展。
當前,學者們對學情分析與評價診斷仍處于探索階段,無法更深層次透徹追蹤學生的學習情感,可添加眼動儀等設備追加學生心理狀態變化,使學習者學情分析與評價診斷更準確。
智能教育的主要技術特點之一就是按需推送,根據學習者特點提供教學信息資料、教學信息服務、教學用具、教學活動等,以滿足學習者個性化成長與發展的需要。隨著在線學習盛行,豐富的網絡學習資源給學習者提供了便利,但并未針對性地提供符合學習個人特點的學習資源,導致學習者迷失在大量的學習資源中。
學習資源推薦技術能為學習者提供針對性的知識信息。研究表明,傳統推薦技術面臨冷啟動、數據稀疏、目標不適用教學場景的問題[24]。樊海瑋等[25]提出與知識圖譜相結合的在線學習資源推薦算法解決數據稀疏問題,這一研究也表明學習資源推薦算法融入知識圖譜技術對學習者自主學習具有重大意義。
基于知識圖譜的學習資源推薦能從海量資源中挖掘資源關系,進行有效推薦,既節省了大量時間也提高了查尋效率。通過可視化知識圖譜方式推薦相較于純文本方式,可極大吸引學習者興趣,但基于知識圖譜的學習資源推薦仍存在不足之處,例如當一門課程學習資源特別多,且資源間聯系十分密切,雖然可看出課程知識點間的規律,但會十分雜亂。此外,知識圖譜呈現的普適性也存在一定問題。當前,教育知識圖譜在學習資源推薦的應用中仍處于初步探索階段,在傳統學習資源推薦中存在數據稀疏問題,應在采集多模態數據集方面多加關注。通過融合教育知識圖譜與多模態數據,推薦更符合學習者的學習資源。
個性化學習隨著大數據技術快速發展,逐漸發展成教育技術的新范式,但當前海量學習資源充斥在學習者周圍,會使學習者難以選擇學習資源,增加其學習負擔。個性化學習路徑規劃可根據學習者當前知識掌握情況,提供更符合學習者的學習路徑規劃,實現精準的個體化教學。研究表明,個性化學習路徑規劃常見問題包括數據量過大和冷啟動[26],或無法適應個性化教育自主學習選擇的復雜性。即使依靠深度學習、增強學習等個性化教育自主學習選擇方式,也無法融合教學中的領域知識點(例如學習者的認知狀況、能力或掌握信息資源的難易等)。劉鳳娟等[27]從自我決定理論視角,建立基于知識圖譜的個性化教育教學模式,學習者可在教學過程中充分了解自身認知能力,從而進行有效學習。
知識圖譜作為一個建立和體現教育知識點的重要工具,體現了教育知識點的先后順序及其認知依賴關系,提供了較完備的教育方法系統。根據知識圖譜進行個性化教學資源推薦和個性化教學路徑規劃,遵循了經驗認知法則和教育基本邏輯,可克服目前個性化學習選擇方法中缺少范疇認識的主要問題。綜上,利用知識圖譜可通過知識點間所蘊含的前驅與后續關聯,綜合學習者的認知風格、當前認知狀況等特點,為學生推送個體化、有針對性的復習資源與練習途徑。
在大數據環境背景下,智能化管理海量的知識數據資源,將有助于知識傳播,提高了知識資源查找效率,但僅靠人工方法,會耗費大量人力物力,因此利用互聯網技術讓知識資源得到合理的規劃與使用。知識圖譜不僅能管理知識資源,還能管理高校資源,例如學生管理及教師管理。當前,復雜的多類型大數據分析存在多源異構問題,張金福等[28]將知識圖譜技術應用于高校知識資源管理,實現知識資源間的流通、關聯,可有效提升高校知識管理工作的工作效率,降低工作人員的負擔及人工成本。
通過知識圖譜等技術工具管理零碎化知識點,并建立知識點間的相互聯系,集成移動學習流程中的破碎化信息內容,使其相互融入連貫,更具條理化、系統性,從而建立按學習者個人實際需求進行整理的知識系統。通過可視化的個人知識點圖譜可讓學習者充分了解自身所掌握的知識結構,明確自身專業知識的不足之處。此外,學習者通過觀看個人總體知識點圖譜能清楚地認知自身需要掌握哪些相關聯知識點,在碎片化復習的同時高效掌握所需知識點。最后,高校知識資源管理是一個動態管理過程,知識結構會隨著知識的發現、擴充,不斷更新變化,產生的數據也會實時更新、補充,將知識圖譜應用于高校知識管理無疑是一種高效的管理方式。
當前,為迎合學習者解答疑問的需要,系統開發者在知識問答系統中融合了圖像語音文本等多模態信息,一方面為學習者提供解題思路,另一方面融合文本圖像視頻為學習者提供多重選擇。傳統問答系統只呈現了文本信息解答,無法幫助學習者理解自身存在的疑問,但融合多模態信息既能滿足學習者求知欲,還可更精準地刻畫學習者的需求。教育知識圖譜能在海量且復雜的數據中提煉學習者所需知識點間存在的關系,從而為學習者呈現出結構清晰的問題解釋。Kim 等[29]為了融合從長課文中提取知識特征與視覺特征,提出基于圖卷積網絡的新模塊FGCN。Wang 等[30]提出一種基于注意力的加權上下文特征(MA-WCF)的可解釋多模態系統,可根據問題和圖像本身特征及它們上下文特征的重要性,自適應分配權重,為學習者匹配更精準的回答。
知識問答系統中,學習者可通過圖片語音或文字形式檢索答案,融合多模態知識圖譜技術會呈現多種模態的結果,為學習者提供更符合的問題解釋。同時,融合多模態知識圖譜一方面能滿足學習者對問題的解釋;另一方面對學習者而言是一種加深自身理解的方法。現階段,知識問答系統相較于傳統知識問答系統,更偏重于讓學生理解、掌握核心知識,幫助學生最大程度上解惑。
知識圖譜在教育領域應用的優越性逐漸顯現,為未來教育走向大規模個性化與精準化提供了可能性,但在教育領域應用中仍面臨教育資源數據集質量不高、多源知識圖譜融合難度大、教育知識圖譜的評估方法單一3 方面的挑戰。
當前,深度學習與機器學習在人工智能領域得到廣泛應用,但需要使用大量數據集。由于教育領域對數據集質量具有一定要求,現階段數據集均由專業教師或學科專家人工提供,損耗了大量人力、物力資源。同時,教育知識圖譜由教師、專家根據自身判斷所構建的教育知識圖譜,缺乏一定的權威性。此外,在構建教育知識圖譜的過程中研究者會帶入自身認知,造成誤差,這也是教育資源數據質量不高的原因之一。
學習資源是構建學生學習認知的基礎,能幫助學生快速了解所需掌握的知識點,開闊學生視野。學習資源在未來教學中,將對社會學習者公開,結合學習者的學習情境進一步提供更好的學習體驗。雖然,很多教育機構面向不同學科及不同學段構建教育知識圖譜,但如何有效融合來自不同數據源的教育知識圖譜,讓知識圖譜技術在教育領域有的放矢,將是一大挑戰。這主要涉及專業知識圖譜本體與知識圖譜知識點層面的融入,由于不同課程中同一主要知識點的名稱也可不同,因此要求對二者中不同內容的主要知識點加以標準化管理。此外,由于各課程學科內涵均有所不同,甚至主要知識點間的關聯程度也不同,這些因素均增加了主要知識點融入的難度。
由于在教育領域對知識的要求質量較高,需要通過專家或教師進行評估,將耗費大量人力、物力,還會由于主觀判斷導致評估的知識圖譜存在偏差。因此,制定統一的評估標準至關重要,關乎教育知識圖譜數據是否準確,能否構建有效的教育知識圖譜。
教育知識圖譜作為人工智能應用于教育的關鍵賦能技術,為實現大規模個性化教學與精準化教學提供了可能。目前,知識圖譜技術雖然在教育領域逐漸顯示其優越性,但仍存在較大的發展與挖掘空間。
在圖表構建中,整體教育認知圖譜對多模態認知圖譜的需求較為明顯,仍需進一步優化教育領域知識點復雜度、對知識點的粒度分類難度、知識點間的相互關聯豐富性,將整體認知圖譜應用于整體教育智慧中將具有重要的實踐意義。
未來發展過程中,教育知識圖譜也將向教育認知圖譜進階,逐步適應學生個性特征,實現大規模個性化學習。