吳彥文,孫晨輝,李 斌
(華中師范大學物理科學與技術學院,湖北武漢 430079)
傳統教學模式由于受時間和空間限制無法滿足學習者日益增長的個性化學習需求。為此,部分高校紛紛推出適宜于學生的在線學習平臺,用于日常輔助教學,但隨著平臺資源的日益增長又出現“資源過載”現象,學習者一直處于“碎片化學習”狀態,不利于知識體系構建。
康德認為,人類記憶中知識經驗是以圖的形式存儲的,只有當新概念與原有知識概念建立聯系才能產生意義[1]。利用知識元關聯可以幫助學習者建立知識體系,通過系統學習、實踐、反思轉化,將新知識與自身已有知識進行整合與關聯,最終內化為能夠獨立輸出的知識系統。人工智能發展到認知智能階段,學科知識圖譜以其特有的語義關聯、知識推理以及可解釋性等特征,同智慧教育高度切合,在學習者模型建立、在線學習平臺、智能答疑系統等方面起著重要作用。與此同時,作為現今主流的學習資源推薦方法,協同過濾算法已在眾多在線教育平臺中得到運用且表現不俗。然而協同過濾算法只考慮用戶和資源之間的二元關系,所呈現的推薦結果欠缺知識元之間的關聯性,大量碎片化知識學習不利于構建學習者知識體系。
基于學習資源關聯的推薦是知識圖譜和個性化推薦技術相互融合的結果,可以充分發揮二者雙重優勢。因此,本文通過設計基于知識圖譜的學習資源關聯推薦模型,結合模擬電子技術基礎課堂教學實踐經驗開展實證研究,以驗證該模型在構建知識體系及提升學習效果方面的有效性。
協同過濾算法作為智能領域最成功的一項技術,最早由Palo Alto 研究中心提出[2]。協同過濾推薦算法主要有基于用戶的協同過濾算法和基于物品的協同過濾算法兩種,其本質都是基于鄰域的推薦算法[3]。
在線教育平臺中,基于內容的推薦方法和傳統的協同過濾推薦算法應用最為廣泛[4]。近年來,基于協同過濾算法的推薦系統發展迅速,是個性化在線學習重點研究方向。熊回香等[5]融合基于內容與協同過濾推薦思想,利用LDA 進行相似度計算得出資源與用戶的近鄰集合,并抽取資源內容關鍵詞進行資源推薦,但由于缺乏一些個性化特征,最后的推薦結果個性化程度并不高;何娟[6]綜合分析學習者個人和學習者群體閱讀特征,借助用戶畫像,構建學習者個人畫像與群體畫像,依據學習者借閱行為特征為其推薦圖書,但模型建立技術不夠新穎且特征單一;徐海玲等[7]在分析用戶行為屬性的同時在建模過程中加入需求屬性,通過概念格方法挖掘用戶之間的關聯,以此提升用戶群體模型構建的準確性,但該模型在構建過程中用戶動態數據采集不及時,導致模型更新缺乏實時性。以上基于協同過濾算法的學習資源推薦大多只利用了用戶—學習資源評分矩陣,在推薦結果精準度和召回率方面表現得差強人意。因此,更多的研究采用混合推薦方法進行學習資源推薦。劉忠寶等[8]參考物理學的物質擴散理論設計學習資源推薦模型,該模型在為學習者推薦學習資源時的同時兼顧資源熱門性、新穎性,但存在一定的數據稀疏問題;孫承愛等[9]依據圖書特點設計一種個性化閱讀系統,系統融合興趣標簽和協同過濾算法,充分考慮用戶的興趣特征,但興趣特征信息來源于顯式反饋,對用戶隱式反饋數據缺乏分析;付芬等[10]通過隱式行為反饋方式獲取用戶隱式興趣特征,加入到用戶資源評分矩陣中,并改進傳統的相似度計算方法,實現在線學習平臺的資源推薦功能。
協同過濾推薦算法以及混合推薦算法一直是在線教育領域研究熱點,并在學習資源推薦方面取得很好效果。然而,這些推薦方法大多只考慮學習者與資源之間的二元關系,沒有對學習資源中的知識進行關聯分析。趙國慶等[11]通過3 種概念構圖任務對教師學科知識進行評價,結果顯示小學數學教師同樣存在學科本體知識不足、知識碎片化程度嚴重及知識結構不甚合理等問題。因此,在學習資源推薦過程中加入知識點關聯分析顯得尤為重要。在線學習資源大多以文檔、PPT、視頻等多模態形式存在,這些資源因其數據結構的無序性而被定義為非結構化學習資源,但這并不代表這類學習資源是沒有結構的,事實上任何學習資源內部以及資源與資源間都存在聯系。因此,如何從這些非結構化數據中抽取知識是實現資源關聯和多模態資源推薦的重要前提。Goole 公司為了提高搜索效率于2012 年5 月提出“知識圖譜”[12]。知識圖譜可從非結構化學習資源中抽取實體、關系等要素,利用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識之間的聯系,是海量知識的一種表征形式[13]。知識圖譜可以運用深度學習實現知識的自動推理,避免大量人工操作,在海量學習資源處理過程中有著先天優勢。Yang 等[14]提出一種知識抽取框架,實現數字預組裝階段校驗報告中關鍵信息的抽取,分享和反饋文本的重要內容,大大提高生產效率,節約成本。領域知識圖譜構建有助于知識體系構建,Kim[15]利用產品知識圖譜描述電子產品、電子產品標準以及各種產品之間的關系,為商家展示更有效的產品信息傳遞渠道。基于這一特性,研究者們期望將知識圖譜技術應用于在線資源組織與推薦中。如陸星兒等[16]建立基于心理學課程的知識圖譜,為MOOC 提供教學新思路。
本文利用學科知識圖譜構建方法,對在線平臺資源進行組織,挖掘資源之間的關聯關系;通過構建基于知識圖譜的學習資源關聯推薦模型,實現學習者—學習資源—知識元三者關聯。在學習者模型及學習者群體模型構建中加入學習者偏好屬性,引入學習行為等隱式反饋數據填充偏好屬性,以此實現學習資源的精準推薦,幫助學習者更系統地學習課程,提升學習效果。
本文借助知識圖譜強化知識元內聯,結合學習者畫像構建學習者—學習資源—知識元(實體)關聯,系統構建思路如圖1 所示。

圖1 基于知識圖譜的混合協同過濾推薦流程
本文通過非結構化學習資源的知識圖譜構建,實現異質資源的知識融合;基于學習者資源交互行為構建學習者動態模型,利用協同過濾算法為學習者推薦學習資源;在推薦列表產生過程中借助學習資源知識圖譜的知識元關聯性優化推薦列表。
學習者畫像構建是一個不斷完善的動態過程,通過對學習行為、學習偏好等數據分析,突出學習者個體差異,為每個學習者打上標簽,從而不斷提高個性化程度,為學習者更加精準地匹配學習資源。本研究通過對學習者學習傾向、先前學習經驗、學習風格、學習態度等分析,描述學習者個體差異。以華中師范大學云課堂作為知識庫,在動態學習者畫像構建過程中整合華中師大云課堂相關平臺數據。通過對數據進行統計、分類/聚類分析,細分學習者并勾勒出個體學習者及群體學習者畫像。
學習者畫像構建數據來源見表1。

表1 學習者畫像數據來源
動態學習者畫像建立步驟:
(1)整合學習者數據,如在云課堂、信息門戶、移動信息平臺以及其它平臺上的學習者個人信息、課程信息、好友信息、資源交互行為等動態數據。
(2)利用數據挖掘、數據分析等技術對這些信息進行抓取、清洗、轉換、分類、聚類等處理。學習者畫像標簽即從學習者動態行為數據中挖掘信息,進行聚類操作[17]。通過標簽建模分析,進一步區分個體學習者和學習者群體。學習者群體畫像構建過程中需要對學習者群體基本屬性、學習者之間社交關聯、資源瀏覽、學習評價等行為進行相似度分析,進而對個體學習者聚類分析形成學習者群體。除此以外,動態學習者畫像模型要求不斷根據學習者基本信息的變化及動態行為數據調整標簽。
(3)根據所建立的學習者畫像構建預測模型,為個體學習者和學習者群體提供有針對性的個性化服務,并不斷根據學習者反饋調整畫像。
根據動態學習者畫像形成預測模型,該預測模型可預測學習者需求偏好、潛在的學習資源需求以及響應和服務,將學習者感興趣、有知識關聯的學習資源呈現給學習者,學習資源推薦流程如下:首先采集和處理學習者畫像數據及學習資源的知識元關聯數據,然后建立標簽細分個體學習者和學習者群體,最后將學習資源在學習者之間進行匹配、呈現,如圖2 所示。系統需要依據用戶行為數據實時調整學習者畫像,確保資源推薦的準確性、有效性。

圖2 動態學習者畫像視角下學習資源推薦
依據基于知識圖譜的學習資源關聯推薦模型,借助華中師范大學師大云課堂平臺進行課程教學設計,并展開實證研究。云課堂資源種類涵蓋授課視頻、授課講義(PPT、PDF 文件)、試題題庫及大量的課后拓展資源等,是打破時空限制的混合式教學方式。借助師大云課堂移動學習平臺,筆者結合近5 年的實際教學經驗開展面向電子信息類專業的模擬電子技術基礎課程教學實驗。
從平臺獲取學習者相關數據,根據線下課程的反饋和測試成績驗證學習效果與推薦模型的有效性。學習效果體現在兩個方面:①直觀的學業成績;②課程學習的滿意度評價[18]。通過文獻分析法可知學習效果影響因素主要包括:先驗知識、認知風格、學習態度、難易評價、學業成績、學習滿意度6 種。因此,本研究將期末學習成績和學習滿意度作為因變量,選取先驗知識、認知風格、學習態度、難易評價4 個影響因素作為學習者畫像特征要素,探究模型的學習效果。
(1)數據采集。該門課程開設兩個班級,選修學生共84 名。本研究選取A、B 兩個班級進行對照實驗,其中A班43 人作為平臺實驗者,B 班41 人作為對照組。實驗數據來源由平臺數據和調查問卷數據兩部分組成。
(2)數據分析。根據學習者畫像特征對A、B 兩個班級學習群體進行分析,然后以學習成績和學習滿意度作為評價標準檢驗學習效果。
為了解A、B 兩個班級學習者群體特征,本研究從先驗知識、認知風格、學習態度、難易評價4 個角度對A、B 兩個班級進行學習者畫像特征描述,以期末學習成績和學習滿意度作為評價標準,具體數據如表2 所示。
從表2 可知,A 班在先驗知識方面比B 班略有優勢,認知風格方面兩個班級都偏好視頻學習資源,學習態度方面都表現積極。因此,兩個班級在學習者特征刻畫方面基本一致。經過一個學期的教學實驗,A 班學生在難易評價中選擇好學的比例明顯高于B 班,期末考核后,A 班成績達到良好及以上的人數比B 班多出9 人,沒有出現不合格學生,同時有接近91.7% 的學生在期末評課環節選擇滿意,表明本文基于知識圖譜的學習資源關聯推薦方法在一定程度上提高了學習效果。

表2 實驗數據統計分析
針對當前推薦算法僅關注學習者和資源二者關系,導致學生處于“碎片化學習”而缺乏系統性學習問題,本文提出基于知識圖譜的學習資源關聯推薦模型。該模型通過學習資源知識圖譜構建,實現知識元關聯的可視化描述,并借助動態學習者畫像進行學習資源的精準匹配。選取模擬電子技術基礎課程在A、B 兩個班級進行對照實驗,實驗結果證明,基于知識圖譜的學習資源關聯推薦模型能在一定程度上提高學習效果。本研究還存在不足之處,如進行模電知識圖譜構建過程中,融合異質資源數量不足(僅融合了百度百科和師大云課堂的相關資源),缺乏資源準確性審核環節。后續工作重點將著眼于高質量學習資源知識圖譜構建,確保資源正確性和豐富性。本模型還可應用于在線學習平臺,但由于在線學習平臺學習者體量巨大,學習背景不一致且缺乏教師干預指導,需要在模型中加入認知診斷機制,根據學習者認知能力推薦學習資源。