李春英,李琨
(北京開放大學北開業務部,北京 100081)
學習分析作為教育技術領域的一項新技術,自2011年《地平線報告》發表之后,始終受到教育領域學者的密切關注。 目前學習分析的概念尚未形成定論,研究者們從不同的角度來解釋學習分析的內涵。首屆“學習分析與知識”國際會議正式提出:“學習分析是對學習者及其學習情況的數據進行測量、收集、分析和報告,從而了解和優化學習過程及其環境。”[1]國內顧小清等學者認為學習分析技術是收集與學習者相關的學習數據, 利用不同的數據分析方法和模型進行數據解釋,用分析結果解釋學習者的學習過程和情境,從中獲知一定的學習規律,也可將結果反饋給學習者,為其提供學習幫助[2]。 在傳統教學中,由于手工搜集和數據處理技術的限制,教師對教學過程的分析和評價結果往往是無窮無盡的。 隨著教育信息技術的更新迭代和在線學習用戶的增多,人們可以用更便捷的技術軟件或工具進行多維度、多層次的數據采集,這為學習分析的發展提供了更有力的技術支持。 該文通過文獻計量分析,了解學習分析的現狀、研究熱點和趨勢,為以后的研究提供依據。
文獻計量分析是常用的學術文獻研究方法之一, 實現相關領域文獻的定量分析是其主要特點。CiteSpace 是美國德雷克塞爾大學陳超美教授研發的一種文獻計量分析工具。 該文利用CiteSpace5.1.3R3 對中國知網(CNKI)10年來發表的668篇文獻進行可視化分析,并通過關鍵詞共現分析、聚類分析和突出詞分析對, 揭示國內學者在學習分析方面的現狀、熱點和發展趨勢。
為了更好地把握“學習分析”研究的發展現狀和熱點,以中國知識網為研究數據源,期刊檢索的檢索條件為:關鍵詞“大數據”和“學習分析”。 自2011年學習分析概念被正式提出以來,我們以2012年為研究起點, 涵蓋2012—2019年主題=漢英擴展(大數據+學習分析)期刊文獻檢索,通過檢索共獲得919篇文獻。為確保文獻的典型性,通過人工篩選和剔除重復文獻、新聞報道、公告等,獲得了668 篇有效文章。
對668 篇文獻相近關鍵詞和機構進行的合并處理,轉化為可識別的CiteSpace5.3 標準格式;導入可得到關鍵詞的共現分析、聚類分析、凸顯詞分析結果并以知識圖譜顯示;結合不同文獻的分析結果,可以得出“學習分析”研究的現狀和熱點。
2.1.1 研究總體情況分析
文獻量和走勢圖在一定程度上能夠反映出學習分析的整體發展趨勢。 將檢索出來的668 篇文章進一步進行計量可視化分析(見圖1),可以清晰地發現發文數量發文機構、發文期刊、發文作者和發文關鍵詞呈現連續增長趨勢。
從時間上看經歷逐年上升的態勢, 可以分為三個階段。
(1)研究啟蒙階段(2012-2013年),李青等人于2012年發表的《學習技術研究與應用現狀述評》是學習分析領域在國內的首篇文章[3],由于學習分析在國內外都處于探索階段,基本上處于理論研究階段,實際應用較少。
(2)快速發展期(2014—2017年)有關學習分析研究呈現快速增長,學習分析技術于MOOC、MOOCs、電子書包等在線教育領域等方面進行了應用。
(3)融合發展期(2018—2019年)。2018年《教育信息化2.0 行動計劃》等文件出臺后,學習和分析發展迅速,進入融合創新和發展階段。學習分析所提供的多維度的數據為教學管理、教學決策提供重要依據。
2.1.2 機構文獻分析
通過統計一個機構發表的論文數量, 可以揭示其在某一學科研究的連續性、深度和貢獻[4]。 該研究通過檢索和數據分析, 篩選后得到的668 篇文獻共涉及86 個研究機構。 發文數量7 篇以上研究機構為,東北師范大學(47 篇)、北京師范大學(27 篇)、華東師范大學(24 篇)、華南師范大學(11 篇)、陜西師范大學教育學院(10 篇)、江蘇師范大學(10 篇)、首都師范大學(9 篇)、中國科學院(8 篇)江南大學(8篇)、華中師范大學(7 篇)、北京大學(7 篇),11 家機構占總發文量的25%;通過CiteSpace 軟件分析學習分析研究合作機構的知識圖譜。 共有86 個節點,32個連線,節點密度為0.008 8。這一數據表明,研究機構間合作并不多見。師范類大學、開放大學系統的發文的數量和質量占有較大優勢, 對該領域的研究起到帶動和引領作用。
2.1.3 文獻作者分析
對于作者發文量的分析可以反映該作者在相關科領域研究的持續性、深度及貢獻度[5]。 該研究通過檢索和數據分析, 篩選后得到的668 篇文獻共涉及188 人。 發文數量≥4 篇14 人, 僅占總人數的6.45%,姜強(11 篇)、趙蔚(10 篇)、楊現民(7 篇)、張海(7 篇)、祝智庭(7 篇)、顧小清(4 篇)等是學習分析領域的高產作家。通過CiteSpace 軟件分析研究人員合作的知識圖譜。 共有214 個節點和91 個連接,節點密度為0.005 2。 這些數據表明,研究人員共同發文是很常見的,但是不同機構間作者合作較少,還沒有形成有凝聚力的科研群體。
2.2.1 關鍵詞共現分析
關鍵詞是一篇學術論文中最能揭示論文研究領域、中心內容的代表性詞匯,是學術論文的核心,[6]因此, 高頻關鍵詞可以反映相關領域的理論框架以及研究熱點;通過Citespace 可視化學習分析共現詞分析圖譜(見圖2)。 學習分析、大數據、教學大數據、數據挖掘、學習分析技術、個性化學習、MOOCs、機器學習、智慧教育、人工智能、在線學習、深度學習、教學模式、智慧課堂、翻轉課堂都是該領域的研究熱點。

圖2 學習分析共現詞可視化圖譜
2.2.2 關鍵詞聚類分析
關鍵詞聚類分析是一種探索性數據挖掘技術,其主要作用是對某一領域的關鍵詞進行識別及分類。將采集的數據結構化,從而探索該領域的主題分布和組織結構。通過Citespace 軟件的關鍵詞聚類功能, 得到關鍵詞聚類知識圖譜, 該圖譜模塊值Q(Modularity)為0.864 7,S 值(Mean Silhouette)為0.517 5。一般而言,當Q 值>0.3 時,說明網絡結構劃分具有顯著性;當S 值>0.5 時,聚類結果具有合理性[7]。該次聚類分析共得到17 個聚類圖譜,主要聚類為教育數據、混合式學習、學習者分析、自適應學習、智慧課堂、教育數據挖掘、教學改革、學習分析技術等,經過提升分析歸納為學習分析理論及框架研究、 技術研究和應用研究三大類熱點。
2.2.3 學習分析領域的研究熱點
(1)熱點一:理論及框架研究。
理論研究是開展實踐應用的基礎和依據。 學習分析理論研究體現在學習分析理論基礎、模型框架、發展趨勢等方面。 一是學習分析建立的理論基礎,George Siemens 、Macfadyen 從不同角度推動學習分析的發展,如數據挖掘、網絡技術、學習理論、組織行為理論、教學理論、社會網絡等。 這些都從理論上為學習分析的研究和應用提供了支持。 二是學習分析框架和模型的研究。 國內外學者從不同角度構建了學習分析模型和框架。 George Siemens 提出學習分析過程模型,Elias 提出學習循環改進模型,Khalil 提出學習分析生命周期模型, 李艷燕等提出國內學習分析框架要素; 姜強等提出個性化自適應在線學習分析模型, 這些模型對研究者設計和應用學習分析系統具有指導意義。
(2)熱點二:技術層面研究。
學習分析是指通過技術、 算法和教學理論的結合對數據進行分析。各環節都離不開技術、工具和系統的支持。一是學習分析技術系統的研究,學習分析的關鍵因素是數據,數據的收集、預處理、分析等環節直接影響到學習分析效果, 而技術的升級迭代為數據的處理提供有力支撐。 二是學習分析的方法和工具。學習分析方法主要包括內容分析、社會網絡分析、文本挖掘、情感分析、視覺分析、系統建模以及統計分析聚類、預測、關系挖掘、文本挖掘等一系列數據挖掘方法。 目前如何在具體的操作環境中使用上述工具還需要更深入的研究, 這也是學習分析技術未來的研究方向之一。
(3)熱點三:應用研究。
學習分析應用是學習分析的目的所在。 近年來國內學習分析應用研究呈現出種類多,輻射廣的特點。 包括以下內容:一是學習分析環境研究,學習環境的構建是實現教與學方式變革的外部條件。 包括智慧教室、智慧課堂、智慧學習平臺,如MOOC、moodle、Blackboard、Sakai、實踐教學平臺等。 二是個性化自適應學習的應用研究: 大數據技術為針對學生自身特點制定個性化自適應的學習路徑提供了可能性。三是學習行為應用研究,在大規模的在線學習環境中, 通過對學生學習行為數據的深入挖掘和分析,構建學習者行為分析模型,關注學習者的需求和學習過程的動態路徑,提供個性化的教育服務供給,實現學習效果的最大化。
凸現詞是指在一定時期內從大量主題詞中檢測出的變化率高的詞。 該研究確定研究前沿的方法為凸顯詞分析法。在CiteSpace 中,選擇Burstness,取Y為0.1,最終得到8 個凸顯關鍵詞。 結果見圖3。

圖3 凸顯關鍵詞圖譜
2012—2016年凸顯詞為電子書、MOOC、翻轉課堂、知識圖譜。 2018—2019年凸顯詞為智慧課堂、深度學習、人工智能、機器學習,表明這四個關鍵詞是學習分析前沿熱點。機器學習是人工智能的核心,能夠實現對教育大數據分析和預測。 機器學習先后經歷了淺層學習和深層學習兩個發展階段。 深度學習已在政府、學校、社會機構等各個層面引起了廣泛的關注和重視[8]。追求深度學習已成為推動教育技術應用的最新趨勢。
經過以上對學習分析相關文獻進行的可視化分析和研究,筆者認為今后應注意以下2 個方面。
第一,師范類大學、開放大學系統發文的數量和質量占有較大優勢。第二,同一機構內部的合作占比很大。 第三,學習分析涉及多個主題,需要跨學科的研究。 第四,我國研究分析的深度還不夠,研究還不成熟。數據挖掘、學習分析技術和學習行為建模的應用研究是目前我國學習分析領域的研究核心。 智能學習、深度學習、人工智能和機器學習將是未來的研究方向。
(1)加強對學習分析在實踐中的應用研究。學習分析技術研究在理論研究不斷深入同時, 應重點關注學習分析技術教學實踐,為教學、管理及決策提供指導。 (2)注重學習分析的信息與隱私安全。 數據存儲分析是一把雙刃劍, 在給利益相關者提供服務的同時,也存在信息與隱私泄露的風險,優化教學與保護個人隱私之間的平衡是學習分析面臨的一大挑戰。 (3)探索多模態學習分析工具的使用。 學習行為是一個極其復雜的過程, 從單一模態來研究學習行為具有一定片面性, 可穿戴技術的發展為多模態學習分析提供了技術支持,通過心率監視器到、視覺跟蹤器、 表情識別設備等多模態數據感受器可采集多模態的學習者的心率、專注時間、肢體語言、表情等數據及情緒心理變化, 深入研究學習心理對學習效果的影響。