李夢凡 陳靜遠 鄭州鐵路職業技術學院 信息化辦公室 任新社 河南大學 商學院
隨著物聯網、移動通訊、云計算等新一代信息技術在教育中的應用,與教育相關領域的數據量日益增加。為了教學決策和優化學習,研究者開始關注如何將教育領域內的數據轉變成信息和知識。在此背景下,本文利用知識圖譜分析法,通過分析國內教育大數據領域已有的研究能明確研究現狀,探索研究前沿和熱點,為研究者提供參考和借鑒。
本文以CNKI作為數據源,選擇“主題”檢索,檢索條件為“教育&大數據”、“教學&大數據”、“學習&大數據”、“教師&大數據”、“學生&大數據”、“學校&大數據”,文獻類型為論文,獲得有效文獻273篇。
本研究將定量研究和定性研究相結合,以CiteSpace和R等統計分析軟件作為研究工具,以“教育大數據”相關的文獻作為研究對象,從發文量、發文期刊、發文作者等方面了解教育大數據研究領域的概況;然后通過文獻共被引分析,以了解教育大數據領域的前沿;最后通過關鍵詞共現分析,探索教育大數據研究領域熱點。
由于某一研究領域內文獻在時間與數量方面的變化關系可以直觀的反映出該領域內學術研究的理論水平和發展速度,因此對該領域文獻的分布做歷史、全面的統計,繪制相應的曲線,有利于預測該領域的發展趨勢和動態。如圖1所示,從2013年教育大數據進入學術界的視野以來,國內關于教育大數據研究的發文量逐漸成上升趨勢,2015年開始,教育大數據研究進入快速發展期,文獻量快速增長,形成了教育大數據的研究熱潮。

圖1 教育大數據研究發文量年度分析
發表文獻數量在一定程度上能展現作者的學術研究能力。從表1可以看出,江蘇省教育信息化工程技術研究中心的楊現民占據首位。根據文獻統計顯示,在教育大數據研究領域內,發文量在3篇及以上有24位學者,共發表101篇文章,占文章總量的36.99%,這也就說明在該領域還沒有形成核心作者群。
本文通過CiteSpace對作者進行共現分析,繪制作者合作網絡圖譜(見圖2)。結果顯示,網絡節點數量為26,連線數量為24,網絡連接密度0.0738,其中的大部分主要作者都有一定的合作關系。合作關系較為緊密的有以楊現民為中心、以趙蔚、姜強為中心、以劉清堂為中心的科研團隊。

表1 教育大數據研究排名前十的發文作者

圖2 教育大數據研究者合作網絡圖譜
選取教育大數據載文量排名前十的主要來源期刊見圖3,其中載文量均在6篇以上。由清華大學主辦的期刊《現代教育技術》在教育大數據研究方面載文量最多,達34篇。其次,《中國電化教育》31篇,再次是《電化教育研究》29篇。可以看出,教育大數據研究主要來源期刊主要集中在教育技術領域,這說明,教育大數據研究的主力多集中在教育技術領域。此外,思想政治教育、外語教學等相關期刊也有一定數量的教育大數據相關研究。

圖3 教育大數據研究排名前十的來源期刊
引文頻次表明了一個研究領域的活躍度,節點頻次越高說明該節點的文獻在該時期內越受到關注,從而被認為是該領域的前沿文獻。本文對已選取文獻中的參考文獻進行共被引分析,將這些文獻以一年為時間分割,分析每個時間分區中前50個節點數據,得到共被引頻次高的文獻,見表2。

表2 教育大數據研究共被引高頻次文獻

大數據時代區域教育均衡發展新思路 2 0 1 4 1 1 1 0 李國杰,程學旗9 劉雍潛,楊現民大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考2 0 1 2 1 1 1 1 胡弼成,王祖霖2 0 1 5 9 1 2 張燕南,趙中建“大數據”對教育的作用、挑戰及教育變革趨勢——大數據時代教育變革的最新研究進展綜述大數據時代思維方式對教育的啟示 2 0 1 3 9 1 3 柯清超 大數據與智慧教育 2 0 1 3 8 1 4 劉鳳娟 大數據的教育應用研究綜述 2 0 1 4 7 1 5 何克抗 大數據面面觀 2 0 1 4 7
教育大數據興起的背景、理論基礎、基本概念以及對教育教學的意義等是教育大數據研究的基本問題,也是開展教育大數據研究和實踐的基礎。教育大數據是大數據的一個子集,指在教育領域內產生的大批量大數據,其具有數據來源渠道多樣化、自動跟蹤和留存學習者行為痕跡等特性,并對獲取數據進行整理、分析、建模,真正意義上實現學習者個性化學習、提高教學質量、促進教學公平;成為教育決策的依據;為教育評價提供新的思路;同時改變教育技術的研究范式。
教育大數據的應用與實踐指導是教育大數據研究的重要方向。2012年10月,美國教育部發布《通過教育數據挖掘和學習分析促進教學》的報告中指出,教育數據挖掘和學習分析是目前教育大數據應用的兩大方向。當前,教育領域對教育數據挖掘和學習分析技術寄予深切的期望,希望利用海量的教育數據為教育教學變革提供依據和條件,促進教育發展。但同時我們也應該注意到,教育大數據應用和實踐過程中依然面臨諸多挑戰,包括安全隱私、數據準確性、信息共享性、數據管理等方面的問題。
教育研究者與實踐者熱切關注教育大數據在具體教學情境和實踐中的應用模式和效果。其中,姜強、趙蔚等人針對教育大數據具體實踐應用開展相關研究,在深入探索教育大數據的應用方式、效果等方面具有一定的優勢,可供相關研究的設計、實施以及結論驗證參考和借鑒;但是考慮到這些研究中研究對象和研究情境的特殊性,其研究結論的信效度需要進一步深思和考量。
教育研究者通過教育大數據的述評和反思獲得該研究領域的發展脈絡,為推進教育大數據研究的發展和創新提供有利條件。在分析和反思已有研究基礎上,筆者發現教育大數據的相關研究主要集中在概念、內涵等理論層面,而在研發教育大數據分析工具和教育大數據相關實證研究方面,其研究基礎依然比較薄弱。
一篇文獻的核心主題和內容都是通過關鍵詞來體現的,因此關鍵詞頻次直接反映該領域研究熱點的總體概況。本文以一年進行時間分割,選取2013-2017的文獻中每個時間分區中前50個節點數據進行關鍵詞共現分析。通過關鍵詞共現分析,得到前30個高頻關鍵詞表(見表3)。

表3 教育大數據研究高頻關鍵詞
根據高頻關鍵詞,本文將教育大數據研究的熱點主題確定為教育大數據內涵界定、教育大數據中主要技術應用、教育大數據應用探索研究、教育大數據對師生能力的要求四個大類。
“大數據”、“教育大數據”、“大數據時代”、“大事件思維”、“教育變革”等作為高頻詞,可以看出教育大數據研究目前的研究重點在于基礎理論的討論,包括教育大數據的時代背景、教育大數據的內涵、特征,以及教育大數據對于教育領域的影響和意義等。其中,對“教育大數據”內涵的定義是其熱點主題,而且目前并沒有統一定論。有研究者依據教育大數據的來源,將教育大數據分為廣義和狹義,認為廣義的教育大數據泛指所有來源于日常教學活動中人類的行為數據,具有層級性、時序性和情境性的特征;狹義的教育大數據是指學習者行為數據,它主要是來源于學生管理系統、在線學習平臺和課程管理平臺。這樣的界定有利于研究者明確教育大數據研究的對象和范疇,避免教育大數據研究領域的泛化,有利于教育大數據研究的理論價值和實踐意義的實現。
從“學習分析”、“數據挖掘”、“教育數據挖掘”、“大數據分析”、“大數據評價”、“量化自我”、“教育治理”、“應用研究”、“在線教育”、“智慧教育”、“教學變革”等高頻詞可以看出,教育大數據實踐應用探索相關研究主要包括學習分析技術、數據挖掘技術、以及教育治理等方面的研究,同時教育大數據的應用推動了教學變革和智慧教育發展,為在線教育提供新思路。教育大數據最終要是要應用于教育實踐,探索其在實踐中的應用技術以及途徑是至關重要的。
由于“個性化學習”、“個性化教育”、“自適應學習”、“個性化”等作為高頻詞,可以發現教育大數據實現學習者個性化學習也是研究熱點之一。作為教育者關注的重點內容之一,個性化學習如何有效的實現是一個無法回避的關鍵議題。借助于教育大數據技術,教師可以準確了解學生的學習需求以及個性特征,從而為學習者提供個性化的指導。有研究者提出,個性化的自適應學習將成為教育技術研究的下一個范式。教育大數據為個性化的自適應提供技術支持,可以有效地實現個性化的自適應學習。
由于信息技術的發展,教育數據激增,教育大數據也產生了巨大的能量。教育大數據是目前作為教育領域研究熱點之一,教育大數據為教育信息化的進一步發展提供條件。通過分析了當前教育大數據的研究現狀、研究前沿和熱點,本研究期望為以后的研究提供參考,然而由于本研究主要分析已發表文獻,存在一定的局限性。首先,一些實踐研究雖并非以論文成果的形式存在,也同樣具有參考意義,而本研究中卻沒有體現這部分研究成果;其次,知識圖譜軟件作為研究工具,還是存在一定的不足。在未來的研究中,將更加注重教育大數據在教育中實踐模式和案例的研究,利用教育大數據為教育教學提供服務。