(曲阜師范大學,山東 濟寧 273165)
千人一面的教學方式已不能滿足當今社會學生、家長以及老師的需求,教育界研究專家認為可以利用人工智能和大數據優勢和特點,徹底改變傳統的課堂教學模式,實現更加個性化的學習和教學方式。使用個性化的學習方式,學生能夠有針對性地解決自己學習過程中的薄弱部分;且個性化的教學方式使老師能夠依據學生的學習習慣和特點,有指向性地進行教育輔導,從而提高教學的效率[1]。
學習是知識不斷積累疊加的過程,隨著學習的不斷深入,知識內容會愈加復雜,近年來熱門的知識圖譜則能夠利用可視化技術,將紛繁的知識、資源變為層次遞進的結構化框架,促進學習者更好地進行優化決策。但現有的個性化教學系統或平臺大都著眼于教學方法、手段的改革,從教學過程中的施教方式進行改善,盡管起到了一定的作用,但是在能否真正做到因材施教方面還有待進一步研究。
對此,本研究擬以《數據挖掘》課程為例,基于知識圖譜理論,構建適用于教學的知識圖譜模型、建立起知識點和課程內容之間的關系,形成個性化教學模式,以期促進個性化教學、精準教學的發展,有利于提升我國的教學質量,同時促進國民素質提高。
個性化的教學方式能夠充分尊重學習個體自身特有的價值,發掘個體的不同潛能,培養學生的獨特性,促進現代教育的自由、和諧發展。[1]早在美國著名教育家杜威的《明日的學校》一書中就提到了“自由與個性”[2],隨著科技的不斷發展,國外個性化研究取得了新的成績。美國匹茲堡大學PeterBrusilovsky教授開發了包括InterBook、ELM-ART、KnowledgeSea、AnnotatEd、TaskSieve在內的多種個性化學習系統。荷蘭愛因霍芬科技大學DeBra教授研發了AHA!;澳大利亞墨爾本皇家理工大學Wolf教授開發了iWeaver;希臘雅典大學Papanikolaou研究開發了INSPIRE。[3]Blackboard是美國利用現代科學技術和傳統教育技術相融合創立的數位教學平臺,和其他平臺相比,Blackboard開發了課程管理模塊,針對不同的課程設計了與之對應的功能,滿足了學生多樣的學習需求,為教師的教學方式、學生的學習方法、師生間的互動提供了更有效、便捷的方式[4]。
當前國內實施個性化教學的方式主要集中在以下幾個方面:就具體課堂教學活動安排提出的實施辦法;以教師作為基本的組織者形成的個性化教學方式;分析個性化教學中所涉及的各類主體因素從而研究出教學模式。[5]迄今為止,中國網絡教學平臺的最成熟的代表是由清華大學開發的清華教育在線(THEOL),該平臺不拘泥于傳統教育理念,將信息化教學模式和現代化教育理念相融合,從而建立與自身需要相符合的網絡平臺。但從另一種角度來看,THEOL缺少相對應的課程評價體系,一定意義上講仍存在不足。“Vclass”網絡教育平臺是一個基于多媒體通信的師生遠程教學互動平臺,由北京師范大學現代教育技術研究所研究開發。“Vclass”可以利用網絡直播教學,因此不是輔助性教學系統,而是真正意義上的網絡教學平臺。
本文研究的是以學生、課程為中心,依托知識圖譜技術,融合線下教學與在線課程相結合的一類個性化教學方式。
知識圖譜(Knowledge Graph)研究起源于 2003 年美國加利福尼亞的 Mapping knowledge domains 國際研討會[6]。按照知識圖譜的知識范疇不同分類,可以分為通用知識圖譜以及領域知識圖譜[7]。知識圖譜并非一個全新的研究領域,2006年,Berners-Lee提出了數據鏈接(linked data)的概念,并致力于推廣和完善相關的技術標準如URI、RDF、OWL[8]。我國對知識圖譜的研究也取得了一定的進展,構建出了包括GoogleKnowledge Graph、搜狗“知立方”、百度“知心”和復旦大學GDM實驗知識圖譜等幾類知識圖譜。知識圖譜在互聯網、金融、軍事、農業、人文社科以及醫療等行業應用較為廣泛。在教育教學領域,知識圖譜的出現為個性化教學注入了新鮮力量,翻轉課堂、高等教育、網絡課程等方面均涉及知識圖譜。總之,國內外對于知識圖譜的研究依然處于一個非常重要的發展階段,如何將知識圖譜應用于各個領域仍值得更深一步的探索。
知識圖譜是從語義的角度表示人們的先驗知識,是一種基于圖形的數據結構,旨在描述現實世界中現存的各類實體或者概念及其關系,形成一個網狀的知識結構。在錯綜復雜的信息和海量的數據中,知識圖譜通過進行有效的加工、處理(結構化、語義化)和整合,把這些紛繁多樣的數據提取轉換成簡易的實體、關系、實體三元組模型,構成由節點(Point)和邊(Edge)組成的數據結構圖,點代表了現實世界中存在的實體,而邊是實體之間的相互關系。現代科學技術知識資源類型繁雜,知識圖譜采用數據挖掘、信息處理、圖形繪制等技術,將數據優化處理,更好地展示了信息數據之間的關系[9]。
在個性化教學過程中,本文設計了一種內容合理、概念和關系豐富、推理功能強大的知識圖譜,融合了課程內容知識圖譜、學生知識圖譜等。G=(C,R,A)的三元組是知識圖譜元模型的一種通用的表示方式,C={c1,c2,c3...cn}代表的是自然界中的實體,R={r1,r2,r3...rn}代表的是實體之間的關系,AC×R×C 則是知識庫中三元組的集合[10]。該研究從上述三元組模型出發,提出了一種新型知識圖譜構建方法,將語義和術語分離,使得在知識圖譜構建中語義更為清晰,而且知識共享更有優勢。基于該方法對教學相關的概念與關系進行分析,建立各類規則,分別對課程內容、教師和學生的知識圖譜進行構建。現階段,知識圖譜主要包括自頂向下和自底向上兩種構建方式,由于信息抽取技術的不斷發展,自底向上的構建方式變得更加熱門。本項目采用該方式,利用信息抽取技術先從非結構化語言中抽取實體,再進行抽象,歸納出實體間的結構關系,從而進行本體的構建[11],最后將知識圖譜呈現出來。
4.2.1 命名實體識別
命名實體識別(Named Entity Recognition,NER)是自然語言處理中一項常見的、熱門的問題,能夠從文本的非結構化的內容中識別抽取出實體,按照需要將其歸納到對應的實體類型當中。[12]傳統命名實體識別主要包括有基于機器學習的識別算法[13]和基于規則的識別算法兩類。有關命名實體識別技術的發展,早期為基于規則和字典方法,此后發展為傳統機器學習方法(HMM,MEMM,CRF),接著是深度學習方法(RNN-CRF,CNN-CRF),到近期的注意力模型、遷移學習、半監督學習等。這些方法均為非結構化的文本分析提供了有效的技術支持。如今,命名實體識別技術在知識圖譜構建、機器翻譯、知識庫構建等領域有著較為廣泛的應用。[14]
4.2.2 關系抽取
實體關系抽取是自然語言處理的一個重要組成部分和信息抽取的關鍵環節。已經完成實體識別之后,通過對語言文本進行建模,抽取出實體與實體之間的關系,提取出有效的信息[15]。形式化的實體對關系可被描述為關系三元組
本文以《數據挖掘》這門課程為例,建立其知識圖譜。擬按照領域本體構建、眾包半自動語義標注、外源數據補全和信息抽取(實體識別、關系抽取)的步驟對課程進行知識圖譜的構建。[17]首先,以多家權威《數據挖掘》教材為依據,利用相關方法,參考不同種類知識圖譜的本體結構,完成面該科目的知識圖譜構建。其次,把處理過后的自然語言作為標注對象,采用領域本體作為標注依據,進行語義標注,隨之形成標注數據。接著,憑借形成的學科知識圖譜的本體結構,處理結構化的外部數據源,從而得到外源數據。最后是包括命名實體識別和關系抽取的信息抽取。其中,訓練數據就是得到的標注數據,再根據得到的知識圖譜的本體結構,抽取出需要的實體和關系,最終形成了該課程內容知識圖譜。

圖1 數據挖掘課程知識圖譜部分展示
學生知識圖譜指的是將學生相關信息、知識基礎、課程內容掌握情況等信息構建成知識圖譜,將學生信息、對知識掌握情況更有特點、更清晰地展現出來。隱馬爾可夫模型(Hidden Markov Model,HMM)[18]是一種可以描述不可觀測變量或者是隱藏變量的時序概率模型[19],本項目采用此模型來對學生的學習狀況展開分析研究,進而完善學生個人知識圖譜。知識圖譜的形成過程就是對該課程學習的過程,即在個人知識圖譜的基礎上通過教師的講解,逐步掌握課程知識圖譜中的概念和關系以豐富個人知識圖譜。再結合完成作業、實驗報告等任務情況進行分析,用于學生的個性化教學。
本文以《數據挖掘》這門課程的學習為例,闡述知識圖譜驅動的個性化教學模式。
首先,教學組的教師在對教材進行充分的分析,而后在此基礎上,對課程內容知識點及其關聯進行抽取并構建課程知識圖譜,如圖2所示。

圖2 最小二乘法圖譜(《數據挖掘》部分圖譜)
其次,課前借助課程圖譜,獲取與所要講解新知識點相關的已學知識點,并發布這些已學知識點相關的預習題目,以了解每位學生對這些知識點的掌握情況。并根據預習結果進行課程內容調整。

圖3 課程內容的動態調整
第三,課堂教學,借助知識圖譜,由已學知識點引入新知識點。再對新知識點的定義進行講解,并沿知識圖譜中的知識點關聯延展到其他新知識點,便于學生理解課程內容的知識體系。
第四,課下根據每位學生對學習的知識點掌握情況,由個性化學教學平臺發布適合每位學生的個性化作業,教師根據學生情況,精準輔導,實現真正的因材施教。作業題目是以課程知識圖譜為核心,每個作業與一個或多個知識點相關聯;每個知識點和一個或多個作業題目相關聯。
第五,課程總結,完成本課程的教學工作后,個性化教學平臺會為每位學生進行畫像,即形成每位學生的知識圖譜,直接展示學生的知識掌握情況。
綜上,知識圖譜驅動的個性化教學模式,是由課程知識圖譜為核心,將知識圖譜融入教師備課、課堂教學、課下作業布置及課外輔導等一系列教學環節當中,實現了教學的精準化、個性化。

圖4 個性化教學平臺主頁展示
該項目在對學生數據、課程數據以及教師數據分析的基礎上,建立個性化教學知識圖譜,將學生、課程和教師相關信息關聯起來,通過添加規則,自動為學生提供感興趣的學習內容,提高了教學的針對性。
班級授課的教學方式往往容易忽視學生個性發展[20],該項目為教師展示了學生學習情況的個性化信息,并作為教學過程中的參考,同時為教師提供針對不同學生的教學方法,為個性化教學提供輔助。學生個體知識圖譜形成之后,教師更能整體了解把握其學習狀況,合理安排授課時間、內容,高效率完成課堂活動,提升課堂質量。
以《數據挖掘》課程為例,本項目對相關專業課程體系中的內容建立關聯,形成課程知識圖譜和完整的知識點庫。課程圖譜簡潔直觀地把該課程每部分知識點以網絡的形式展現出來,便于學生學習。知識點庫將該課程所有的知識點清晰地呈現在使用者面前,學生能夠快速高效地查找到每一個知識點,及其相關知識點的類型、內容和講解視頻。此外,課程圖譜將和學生、教師圖譜相銜接,針對學生不同的興趣等建立個性化規則,提供個性化的課程服務。
學生知識圖譜可清晰地呈現學習結果,打破了傳統學習模式,學生可根據自身掌握情況選擇性學習,提高學習效率。教師通過查看學生知識圖譜,則可以根據每位學生的特點、知識掌握情況進行有針對性的教學輔導,做到因材施教。在教育領域,智能化將是未來發展趨勢。本項目從數據的采集出發,經過對數據的分析,對知識進行表示、推理,從而為個性化教育提供智能化支持。可以說本項目是對個性化教育智能化的一個試點,將對個性化教育智能化發展起到一定促進作用。
本文將知識圖譜引入教學當中,設計了一種知識圖譜驅動的個性化教學模式。首先根據教學的特殊性,建立了知識圖譜的CRA模型,并基于該模型構建了課程知識圖譜和學生知識圖譜。課程知識圖譜對課程內容的知識點進行梳理,建立起知識點間的關系。學生知識圖譜則是根據學生對課程內容的學習情況展開構建,并對學生進行精準畫像,其中包含學生對知識點的掌握情況、個人實踐能力情況等。本文將課程內容知識圖譜引入教學的各個環節中,即在備課、課堂教學、課下輔導等方面均以知識圖譜為指導,實現了對學生的精準化和個性化教學。