◆馬卉 王曉春 張功云
基于知識圖譜的國內學習分析研究熱點及趨勢分析*
◆馬卉 王曉春 張功云
學習分析,作為一個新興的交叉研究領域,受到國內外教育研究者的廣泛關注,成為當前教育技術領域的研究熱點。為探究國內學習分析技術的研究熱點和發展趨勢,基于科學知識圖譜的基本理論與方法,利用可視化網絡分析軟件CiteSpace對中國期刊全文數據庫中收錄的144篇國內學習分析文獻樣本的關鍵詞進行分析。
學習分析;知識圖譜;可視化分析;CiteSpace;關鍵詞分析
隨著教育大數據的迅猛增長,學習分析(Learning Analytics)[1]作為一種新興的交叉技術,通過深度挖掘、分析學習者學習行為和學習過程數據背后所隱藏的含義,得出有效的結論來指導和干預教學、優化學習和學習環境,更好地為教育決策和學生學習提供服務[2]。由于學習分析技術的這種實際應用價值,使其受到國內外教育研究者的廣泛關注,成為教育信息化領域研究的熱點問題之一。
2010年,加拿大阿塞巴斯卡大學G.Siemens教授[3]在博客中宣布將于2011年2月舉辦第一屆學習分析國際會議并解釋何為學習分析,由此拉開學習分析技術領域形成的序幕。2011年,美國新媒體聯盟公布的地平線報告[4]把學習分析技術列為未來4~5年被廣泛應用的技術。2012年,Educational Technology & Society[5]出版了10篇關于學習與知識分析的系列專題論文。2013年,由國際知名學者組成的、經過法律批準的學習分析技術研究學會(SOLAR)[6]正式成立,并于同年開始舉辦學習分析暑期學院。2014年,《學習分析》雜志[7]正式出版第一卷第一期,學習分析技術在國際上不斷壯大與發展。
從2012年開始,國內也掀起了學習分析技術的研究熱潮,并出現一些有關學習分析綜述的文章:顧小清等[8]分析了學習分析技術的前世今生、關鍵技術以及應用趨勢;李青等[9]總結了學習分析技術的技術來源、方法和工具;吳青等[10]介紹了學習分析的源起、主要研究內容、實現技術與應用等;王良周等[11]從大數據視角分析了學習分析的相關概念,綜述了學習分析的框架、技術和應用;等等。但這些綜述多以介紹國外的學習分析技術為主,對國內發展情況的介紹相對較少,而且這些綜述以人工梳理為主。
為了更全面、完整地把握國內學習分析技術的研究熱點和發展脈絡,本文利用科學知識圖譜技術,對中國期刊全文數據庫(CNKI)中的學習分析相關文獻進行可視化分析。
數據來源 中國知網(China National Knowledge Infrastructure,CNKI)的中國期刊全文數據庫是目前世界上最大的連續動態更新的數據庫(每日更新),收錄的期刊文獻全面且質量較高[12],能夠較為全面地反映國內學術研究情況,故本研究選其作為數據來源。在檢索時,以“學習分析技術”“學習分析”或“Learning Analytics”為檢索詞,在篇名和關鍵詞中進行精確檢索(時間跨度為2010—2015年,檢索時間為2016年5月20日),共獲得191篇文獻。為了保證研究的準確性,在此基礎上剔除重復、主題不相關或相關度小的文獻,最終選擇144篇作為有效文獻。
*項目來源:本文受到北京市教育科學“十二五”規劃重點課題“基礎教育學校課堂教學實驗研究”(基金編號:ABA150008)、北京市教育委員會科技計劃面上項目“移動終端授課環境下學生行為的實時分析與可視化技術”(基金編號:KM201410028018)資助。作者:馬卉、張功云,首都師范大學教育技術系,研究方向為教育信息化績效技術;王曉春,博士,首都師范大學教育技術系碩士生導師,研究方向為教育信息化績效技術(100048)。
研究方法與工具 本文的研究和分析是以科學知識圖譜為基礎,以采集到的144篇國內學習分析研究文獻為對象,通過關鍵詞分析,借助關鍵詞共現圖譜和關鍵詞時序圖譜來探究該領域的研究熱點以及主題演化趨勢。
美國費城德雷克賽爾大學陳超美博士開發的信息可視化軟件CiteSpace是一種知識圖譜可視化工具,包含了關鍵詞共現分析等多種功能[13],能夠滿足本文的可視化分析需求,因此被選為本文的研究工具,在本文出現的各種知識圖譜都是借助CiteSpace 3.8.R6繪制的。
關鍵詞共現分析 雖然關鍵詞在一篇文章中所占的篇幅不大,卻是作者對于文章核心的概括和精煉,是一篇文章的精髓,因此,常用高頻關鍵詞來探測某領域的研究熱點[14]。本文以關鍵詞(剔除了檢索詞“學習分析”“學習分析技術”和“Learning Analytics”)為節點,設置Top N per slice為30,Threshold Interpolation為{(2,2,30),(4,3,20),(4,3,20)},采用最小生成樹法(Minimum Spanning Tree),繪制關鍵詞共現網絡圖譜,共得到98個節點,88條連線,結果如圖1所示。

圖1 國內學習分析研究關鍵詞共現圖譜(2010—2015年)
如圖1所示,圖譜中的節點大小代表關鍵詞頻度,節點越大,說明該節點對應關鍵詞出現的頻次越高;內部不同年輪的顏色代表出現的相應年份,年輪越多說明研究時間跨度越長,年輪越厚說明該關鍵詞在當年的研究熱度越高。外部年輪為紫色的節點,與其他節點相比,具有高中介中心性。中介中心性高的節點,對其他節點之間的聯系起到控制作用,反映了其在整個網絡中的重要地位[14],說明此節點代表的關鍵詞主題性強。為了突出重點,圖中顯示了頻次≥3的關鍵詞。
由圖1中節點大小可知,關鍵詞大數據出現的頻次最高,其次是數據挖掘、個性化學習、教育數據挖掘、在線學習、社會網絡分析等,這說明它們具有學習分析領域最高的研究熱度。由圖譜還可以發現,數據挖掘、大數據、個性化學習等關鍵詞對應的節點外部年輪為紫色,這表明它們具有高中介中心性,但依據關鍵詞對應的節點在圖譜所處的位置不難發現,數據挖掘的中介中心性高于大數據。這說明與大數據相比,數據挖掘雖然中介中心性高,主題性強,但沒有大數據受到的關注度高,這與大數據研究在當前學習分析研究領域中的研究熱度有關。同時,這也說明關鍵詞出現的頻次與其中介中心性兩者之間并不一定嚴格呈正相關,關鍵詞的中介中心性并不一定隨著其出現頻次的增加而增長。
為進一步探究學習分析領域內關鍵詞頻次與中介中心性的關系,從而反映出學習分析的當前研究熱點和主題性,在對圖1知識圖譜進行宏觀分析的基礎上,對關鍵詞的頻次和中介中心性進行二次統計,結果如表1所示。對比表中關鍵詞的頻次和其相應的中介中心性發現,關鍵詞數據挖掘出現的頻次為20,低于大數據的24,但數據挖掘的中介中心性為0.43,高于大數據的0.36,因此,大數據具有更高的熱度,這與從圖譜中觀察到的結果一致。

表1 關鍵詞頻次及其中介中心性對照表(頻次≥3)
同理,通過對比關鍵詞頻次排名和其中介中心性排名可知,大數據、教育數據挖掘、在線學習、社會網絡分析、智慧教育、教育大數據、MOOCs等關鍵詞相對于主題性而言,都表現出更高的研究熱度。
通過對圖1和表1中學習分析高頻關鍵詞的語義關系做進一步分析發現,教育大數據是大數據的下位詞,教育數據挖掘是數據挖掘的下位詞。在學習分析研究中,大數據往往特指教育大數據,數據挖掘也往往特指教育數據挖掘,二者既是獨立研究領域,又是學習分析的技術支撐基礎,成為除學習分析和學習分析技術之外出現頻次最多的關鍵詞,而且具有較高的中介中心性。個性化學習、智慧教育、智慧學習是學習分析技術的研究目的,個性化學習研究有著悠久的歷史,智慧教育、智慧學習是近幾年的研究熱點,它們與學習分析技術相互促進、相互發展。學習過程,作為學習分析技術的主要研究對象,在國內學習分析研究中也是備受關注。MOOCs和MOOC是同義詞,二者是在線學習的下位詞,在線學習又是在線教育的下位詞,從而反映出學習分析的實際應用主要集中在在線教育領域。特別是MOOC的迅速發展為學習分析提供了大量的真實數據[15],成為當前學習分析應用的主要實踐基地。
社會網絡分析[16]作為一種新的分析方法,被應用于學習分析領域,不僅可以將學習者個體作為研究對象,通過社會網絡分析算法分析學習者在學習群體中的活躍程度、影響力、與同伴的交互狀況等,還可以將學習網絡作為研究對象,發現和分析學習社群,關注群體學習過程中的信息產生及流動,成為當前學習分析技術的研究熱點。
關鍵詞時序分析 為考察國內學習分析研究主題的變化趨勢,借助CiteSpace軟件繪制國內學習分析研究的高頻關鍵詞時序圖譜(頻次≥3),具體如圖2所示。為便于分析,本文將學習分析技術的研究分為2012年、2013—2014年和2015年三個階段。
2012年標志著國內學習分析研究的起步,其研究論文的核心關鍵詞為大數據、數據挖掘,它們主題性強,說明二者是國內學習分析技術的研究基礎;通過對相關論文的研讀分析發現,這一年的研究以理論研究、總結和吸收國外學習分析思想為主。而另外三個重要關鍵詞為學習行為、學習過程和個性化學習,分別代表學習分析技術的數據來源、分析內容和主要目標,充分體現了學習分析技術研究的內涵。
2013—2014年,學習分析技術開始向細粒度的學習分析主題發展,研究內容由理論研究轉向實際應用層面。在這一階段,2012年的核心關鍵詞——大數據和數據挖掘演化為教育大數據、教育數據以及教育數據挖掘,充分體現了研究者對學習分析領域的進一步思考和定位。在此階段,學習分析逐漸被應用于MOOC、MOOCs、電子書包等實際應用中,由此表明此階段學習分析的應用與實踐主要集中于在線教育領域。此外,該階段學習分析技術研究的目的是實現智慧教育,并開始關注學習分析中的關鍵技術。
2015年,國內學習分析的研究目的從2013—2014年的智慧教育向智慧學習和教學設計等更細粒度聚焦,并開始注重學習環境優化、教學優化和學習優化;同時該階段的研究也不再停留于對學習者學習行為數據的淺層分析,而是引入社會網絡分析等先進模型對各種數據背后所隱藏的含義進行深度分析,并結合智慧學習實現學習優化和環境優化。
從2012—2015年的研究主題變化趨勢來看,首先,未來幾年的學習分析技術研究將更加細化,與學習分析相關的具體應用分析、經驗和案例分析將成為熱點;其次,在技術方面,社會網絡分析與學習分析技術的結合研究才剛剛起步,因此,基于社會網絡分析或基于各種先進算法與模型的學習分析研究也將會是近期的研究熱點;最后,依據G.Siemens教授[17]的分析,學習分析學與機器學習、教育數據挖掘、統計學、學習科學、學習心理學等領域密切相關,特別是隨著具體應用的展開,學習科學、學習心理學與學習分析的結合研究也將成為近期國內的研究熱點。
本研究在中國期刊全文數據庫中,選擇以2010—2015

圖2 國內學習分析研究高頻關鍵詞時序圖譜
年為發表時間,以“學習分析”“學習分析技術”“Learning Analytics”為檢索詞在篇名和關鍵詞中進行精確檢索,收集文獻樣本,借助CiteSpace III的可視化分析功能,從文獻計量學的角度以知識圖譜的方式展現國內學習分析領域的研究熱點和主題演化趨勢,得出以下結論。
1)通過對研究熱點及研究主題的演化分析發現,學習分析技術經歷了從理論到實踐、從總體框架到細節的研究發展過程。其中學習分析技術的研究基礎是大數據、數據挖掘,當前的主要應用領域是MOOC等在線教育領域,應用目的從開始的個性化學習向智慧學習、教學設計等具體目標轉變,研究內容也從關鍵技術概述向社會網絡分析等具體模型的應用方向發展。
2)依據應用研究的科學發展規律,學習分析技術的研究將更加細化,注重與實際應用的結合;技術方面注重社會網絡分析等新技術的引入與利用;從G.Siemens教授的分析來看,學習科學、學習心理學與學習分析的結合研究也將成為近期國內的研究熱點。
[1]Greller W, Drachsler H. Translating Learning into Numbers: A Generic Framework for Learning Analytics[J].Educational technology & society,2012,15(3):42-57.
[2]Ferguson R. Learning analytics: drivers, developments and challenges[J].International Journal of Technology Enhanced Learning,2012,4(5-6):304-317.
[3]Siemens G. What Are Learning Analytics?[DB/OL].[2016-05-20].http://www.elearnspace.org/blog/2010/08/25/what-arelearning-analytics.
[4]The Horizon Report 2011 edition[DB/OL].[2016-05-20]. https://library.educause.edu/resources/2011/2/2011-horizon-report.[5]Journal of Educational Technology & society[DB/OL]. http://www.ifets.info/issues.php?id=56.
[6]Society for Learning Analytics Research (SoLAR)[DB/OL].[2016-03-10].https://solaresearch.org.
[7]Journal of Learning Analytics[DB/OL].[2016-03-10]. http://epress.lib.uts.edu.au/journals/index.php/JLA/index.
[8]顧小清,張進良,蔡慧英.學習分析:正在浮現中的數據技術[J].遠程教育雜志,2012(1):18-25.
[9]李青,王濤.學習分析技術研究與應用現狀述評[J].中國電化教育,2012(8):129-133.
[10]吳青,羅儒國.學習分析:從源起到實踐與研究[J].開放教育研究,2015(1):71-79.
[11]王良周,于衛紅.大數據視角下的學習分析綜述[J].中國遠程教育,2015(3):31-37.
[12]中國期刊全文數據庫:簡介[DB/OL].[2016-05-20]. http://www.cnki.net/jianjie/jj1.htm.
[13]Chen C. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientifi c literature[J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.
[14]劉澤淵,陳悅,侯海燕.科學知識圖譜方法與應用[M].北京:人民出版社,2008.
[15]Milligan S. Crowd-sourced learning in MOOCs: learning analytics meets measurement theory[C]//Proceedings of the Fifth International Conference on Learning Analytics And Knowledge. ACM,2015: 151-155.
[16]Cela K L, Sicilia M á, Sánchez S. Social network analysis in e-learning environments: A Preliminary systematic review[J]. Educational Psychology Review,2015,27(1):219-246.
[17]Siemens G. Learning analytics: envisioning a research discipline and a domain of practice[C]//Proceedings of the 2nd International Conference on Learning Analytics and Knowledge. ACM,2012:4-8.
Research Hotspots and Trend Analysis of Learning Analytics in China based on Mapping Knowledge Domain
MA Hui, WANG Xiaochun, ZHANG Gongyun
Learning analytics, as a new intersectant research field,has attracted wide attention among educational researchers and is becoming a current research focus in educational technology fi eld. To explore the research hotspots and the development trend on Learning Analytics in China, based on the basic theory and method of mapping knowledge domain, analyze keywords from 144 pieces sample literatures within Chinese Journal Full-Text Database(CJFD)with a visibility network analysis software, CiteSpace.
learning analytics; mapping knowledge domain; visual analysis; CiteSpace; keywords analysis
G652
B
1671-489X(2016)18-0001-04
10.3969/j.issn.1671-489X.2016.18.001