李惠婷



【摘要】? ? 教育大數據對教育的變革與發展有著巨大的潛在價值。文章采用高頻關鍵詞共現法,對中國知網收錄的329篇教育大數據研究文獻進行了可視化分析,歸納了研究熱點。研究結果表明:教育大數據技術、教育大數據促進教育變革、教育大數據驅動教育治理、教育大數據應用伴隨的風險、倫理等內容是國內教育大數據研究的新趨向。
【關鍵詞】? ? 教育大數據? ? 可視化分析? ? 個性化學習
引言
教育大數據是教育中的大數據,是大數據家族的重要組成部分。近年來,教育大數據因其所蘊含的巨大潛在價值受到了人們的廣泛關注。2016年,教育部《教育信息化“十三五”規劃》中明確提出,要“積極利用云計算、大數據等新技術,創新資源平臺、管理平臺的建設、應用模式”[1]。2018年,教育部《教育信息化2.0行動計劃》再次提出,要“充分利用云計算、大數據、人工智能等新技術,構建全方位、全過程、全天候的支撐體系,助力教育教學、管理和服務的改革發展”[2]。在實踐層面,有關教育大數據的應用探索正在取得積極進展,如一些地區將教育大數據納入區域教育云應用框架[3],積極探索大數據支持下的智慧決策等。雖然我國關于教育大數據的研究起步較晚,但近幾年的研究已經積累了一定的研究成果。為全面把握國內教育大數據研究現狀,本文應用書目共現分析系統Bicomb2.0、SPSS軟件對我國教育大數據的研究熱點和發展趨勢進行了分析。
一、研究設計
1.1研究方法
本研究應用Bicomb2.0、Ucinet6、SPSS Statistics 21等軟件,通過高頻關鍵詞共現矩陣分析技術、社會網絡分析技術,對教育大數據的研究熱點和研究趨勢進行分析。
1.2數據來源與分析
本研究以中國知網(CNKI)為數據檢索源,限定檢索類別為期刊,以“教育大數據”為檢索關鍵詞,在文獻分類目錄社會科學II輯中進行篇名檢索(檢索日期為2020年8月1日),共檢索到中文文獻341篇,除去資訊、信息、重復文獻外,共保留有效研究樣本329篇(其中核心期刊研究論文類文獻109篇)。期刊文獻刊載數量年度變化如圖1所示,呈逐年上升趨勢,說明這一主題正在受到越來越多研究者的關注。
1.3研究過程
參照Bicomb2軟件應用說明,本研究的研究進程包括:(1)根據研究主題在中國知網CNKI期刊數據庫中檢索,將檢索出的文獻以“Note-First”格式導出;(2)將檢索導出的文獻數據導入Bicomb2軟件,提取文獻關鍵詞,并進行清洗和統計分析,確定高頻關鍵詞;(3)使用Bicomb2軟件分別生成高頻關鍵詞詞篇矩陣和共現矩陣;(4)應用Ucinet6軟件對高頻關鍵詞共現矩陣進行社會網絡分析,生成高頻關鍵詞社群圖;應用SPSS Statistics 21軟件對高頻關鍵詞詞篇矩陣進行聚類分析,生成高頻關鍵詞聚類樹圖譜;(5)依據社會網絡分析和聚類分析的結果,分析教育大數據的研究熱點和趨勢。
二、研究熱點分析
2.1確定高頻關鍵詞
首先通過Bicomb2書目共現分析系統提取出所有關鍵詞,然后對關鍵詞字段按照升序排列后進行清洗整理操作,重點對同義詞進行替換操作,如將“MOOC”、“MOOCs”替換為“慕課”、將“大數據安全”替換為“數據安全”、將“大數據分析”替換為“數據分析”等等。在反復修訂、對比、校對的基礎上,最終提取到672個不同關鍵詞,結合研究需要,將出現頻次 ≥4次的37個關鍵詞確定為高頻關鍵詞(見表1)。高頻關鍵詞詞頻累計為545,占詞頻累計百分比的41.63%。包含高頻關鍵詞的文獻總計311篇,占樣本總量的94.53%。這說明對所選37個高頻關鍵詞的相關分析能夠在很大程度上反映我國教育大數據的研究熱點。
2.2高頻關鍵詞共現分析
高頻關鍵詞共現矩陣能夠反映出行關鍵詞和列關鍵詞共現的次數,本研究中,應用Bicomb2軟件將高頻關鍵詞生成共現矩陣(見表2)。通過對共現矩陣中的關鍵詞共現次數的對比分析發現,教育大數據與學習分析、數據挖掘、大數據、教師、教育信息化、人工智能等的共現頻次較高,依次為17、15、13、8、8、7,這表明教育大數據與學習分析、數據挖掘、大數據、教師、教育信息化、人工智能等的關聯程度較高。
為進一步探尋高頻關鍵詞之間的內在聯系,分析教育大數據的研究熱點和趨勢,本研究以Bicomb2軟件生成的關鍵詞共現矩陣為基礎,通過Ucinet6軟件的內部集成工具NetDraw繪制了高頻關鍵詞社群圖,如圖2所示。
在圖2所示關鍵詞社群圖中,每一個方塊均代表一個關鍵詞,方塊越大,表明關鍵詞出現的頻次越高,方塊越靠近中心位置表明方塊所代表的關鍵詞在社群圖中的中心度越高;每一個雙向箭頭表示箭頭兩端的關鍵詞之間存在著共現關系[4]。
由圖2可知,教育大數據、大數據、人工智能、學習分析、個性學習、數據采集、高等教育等關鍵詞靠近社群圖中間位置,說明教育大數據的研究重點主要集中于由這些中心點所構成的主題中。
2.3高頻關鍵詞聚類圖譜及分析
高頻關鍵詞的聚類分析能夠進一步直觀地反映出關鍵詞之間的親疏關系,有助于分析教育大數據研究熱點。本研究應用SPSS Statistics 21軟件對Bicomb2 所生成的37個高頻關鍵詞詞篇矩陣進行了聚類分析,選擇組間聯接的聚類方法和二分類“Ochiai”的度量標準,可生成圖3所示高頻關鍵詞聚類樹圖譜。
由圖3高頻關鍵詞聚類分析結果的連線可以看出,教育大數據的高頻關鍵詞聚合在5個類團,具體如下。
(一)教育大數據發展研究。主要包括大數據應用技術發展趨勢研究,關鍵詞有大數據應用技術、國家工程實驗室、大數據技術、教育大數據、發展趨勢、電子書包、自適應學習等;教育信息化數據治理研究,關鍵詞有教育信息化、數據治理等。
(二)教育大數據來源研究。主要包括智慧校園建設與教學管理研究,關鍵詞有智慧校園、教學管理等;基于智慧校園的學習行為分析研究,關鍵詞為學習行為分析。
(三)教育大數據挖掘研究。主要包括智慧教育支持下的精準教學策略研究,關鍵詞有精準教學、策略、智慧教育;數據分析技術支持下的個性化學習研究,關鍵詞有個性化學習、人工智能、數據分析;數據挖掘技術支持下的學習分析研究,關鍵詞有學習分析、數據挖掘、教育數據挖掘、慕課等。
(四)教育大數據應用之個性化教育研究。主要包括基于可視化分析技術的個性化教育,關鍵詞有可視化分析、個性化教育;高校大數據應用可視化分析研究,關鍵詞有高等教育、分析、大數據、教育、應用、思想政治教育、可視化等。
(五)教育大數據應用之決策服務研究。主要包括高職院校大數據平臺應用研究,關鍵詞包括高職、數據采集、大數據平臺等;教師教學決策研究,關鍵詞包括教師、教學決策、深度學習等。
三、研究趨勢分析
結合當前研究熱點,研究者通過對高頻關鍵詞的閾值進行調整,形成新的關鍵詞群,在與原來高頻關鍵詞分析對比的基礎上,認為教育大數據的研究趨勢將聚焦在以下幾方面:
(一)教育大數據相關技術研究。教育大數據相關技術主要有數據采集技術、數據挖掘技術等,教育大數據的價值源自于海量化的數據,數據的采集是教育大數據價值挖掘的第一步,是教育大數據分析的前置性工作。教育大數據包括了整個教育教學過程中所有的動態和靜態數據,數據采集難度大,既要延用傳統的方式收集數據,如可對考試成績等數據進行批量化導入;還需應用人工智能、可穿戴設備等技術,應用傳感器“伴隨式收集”數據,如學生學習過程中的參與度數據等。所采集到的數據質量在一定程度上影響著教育大數據的價值,在教育教學活動中,通過物理感知、視頻錄制、圖像識別、平臺采集等技術手段,采集到高質量的數據,是一個值得關注的主題。教育數據挖掘是教育數據采集完成之后所進行的重要工作,通過對教育大數據有選擇地采集、存儲及分析,才可以實施基于全數據和真實數據的建模和預測[5]。決策樹算法、分類、聚類等數據挖掘技術在學習分析中的應用,為診斷學習問題,預測學習績效,做出合理決策等提供了技術支撐。
(二)教育大數據促進教育變革研究。教育大數據能夠促進學習者的個性化發展。當前,個性化教育是世界范圍內強勁的時代潮流,以班級授課制為核心的傳統人才培養模式已難以適應信息化、知識化社會對個性化、創造性人才的需求。而教育大數據是發掘學習者學習特征的重要渠道,通過對學習者學習軌跡、學習過程中產生數據的伴隨性收集、處理和分析,能夠準確挖掘出學習者的學習特點、個性特征,為開發學習者的潛能、提升學業表現提供數據支撐,進而為人才的個性化培養提供可行路徑。教育大數據還將重構學校的教學評價方式,依靠經驗所進行的教學評價終將為基于數據的評價所替代,大數據所記錄的學習者的學習活動軌跡,為開展過程性評價提供了便捷條件。例如,在線學習平臺能夠記錄學生作業完成情況、課堂言行、師生互動等數據,教師可基于此類數據對學生的學習情境進行評價。
(三)教育大數據驅動教育治理研究。由于教育大數據在學情監測、學習預警、學習分析等方面的巨大應用價值,有利于學習管理的精準化和科學化。我們完全可以預測,在大數據時代,傳統的學校治理模式必將迎來全新的發展機遇,由傳統的學校管理模式向基于大數據技術的學校治理模式轉型勢在必行。在大數據驅動下,可通過建立校園管理大數據監測平臺,從實時動態的數據中挖掘有用信息,學校的行政管理、科研管理、教務管理、人事管理、后勤管理等工作將更為高效,各項決策將更為科學。例如,可以通過學生校園餐廳消費系統的數據,評估校園飯菜的質量,以及進行家庭經濟困難學生的認定等。
(四)與教育大數據應用相伴隨的風險、倫理等問題研究。技術是一把雙刃劍,大數據技術也不例外。教育數據的源頭來自廣大學生、教師、家長以及學校,數據繁雜多樣,其中部分數據會涉及個人隱私[6]。如何保護學習者的個人隱私、如何保證學習者在數據收集過程中的知情權、如何防止大數據可能帶來的不公平現象等,都是大數據應用所面臨的現實問題。面對大數據應用所伴隨的數據鴻溝、隱私泄露、數據失信等潛在風險,亟需建立數據采集倫理規范等類似規范標準,探尋用戶隱私數據的政策保障機制,增強傳統倫理和大數據技術的內在契合度。
參? 考? 文? 獻
[1]教育部.關于印發《教育信息化“十三五”規劃》的通知[EB/OL]. http://www.moe.gov.cn/srcsite/A16/s3342/201606/t20160622_269367.html,2016-06-07.
[2]教育部.關于印發《教育細心和 2.0 行動計劃》的通知[EB/OL]. http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html,2018-04-13.
[3]曹曉明.教育大數據驅動下的現代學校治理[J].教育信息技術,2018(03):3-7.
[4]李運福,楊曉宏,周效章.我國在線課程評價研究熱點可視化分析與啟示[J].中國遠程教育,2018(07):70-78.
[5]王鑫.基于教育大數據的教學改革研究[J].教育理論與實踐,2019,39(25):54-58.
[6]邢蓓蓓,楊現民,李勤生.教育大數據的來源與采集技術[J].現代教育技術,2016,26(08):14-21.