999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

國際教育大數據研究的熱點、前沿和趨勢

2019-04-01 06:23:04蔣鑫洪明
中國遠程教育 2019年2期
關鍵詞:數據挖掘

蔣鑫 洪明

【摘要】大數據技術通過不同視角對教育數據進行處理和分析,將教育的實時決策、學習的個性化變成現實。以WOS數據庫為數據來源,運用文獻計量法、可視化分析法和內容分析法,對國際教育大數據研究領域的現狀進行分析發現:教育大數據文獻發文量呈現增長態勢;美國和中國學者的科研產出較多,而新加坡學者顯示出較強的國際交流潛力與實力,由此形成“三足鼎立”之勢;高等院校則成為國際教育大數據研究的主要機構群體;國際上已經形成一支以揚納基斯、馬爾達尼為代表的核心作者群,但核心作者之間分散性明顯、連接性較弱;研究熱點涉及大數據理論、處理技術以及學習方式等方向;發展脈絡顯示國際教育大數據研究已經實現了由“技術主體”向“學習服務”的理念轉變,由宏觀理論探討轉向對微觀具體問題的探究,隱私安全、數據挖掘必將受到持續關注。國內學者需要對照國內研究現狀,借鑒國際經驗,立足自身研究特色,加強交流,避免研究出現“偏向”。

【關鍵詞】? 教育大數據;對比研究;數據挖掘;學習分析;文獻計量法

【中圖分類號】? G434? ? ? 【文獻標識碼】? A? ? ? 【文章編號】 1009-458x(2019)2-0026-13

一、引言

教育大數據是大數據的一個重要子集,特指教育領域的數據集合(裴瑩等, 2017)。隨著教育信息化的不斷推進、教學方式的不斷變革,越來越多的數據出現在學習、教學以及學校管理之中。面對海量數據,大數據技術通過不同視角對教育數據進行處理和分析,將教育的實時決策、學習者的個性化學習變成現實(鄭燕林等, 2015; 張洪孟等, 2015)。在以互聯網、數據挖掘、學習分析等綜合技術為基礎的大數據時代,教育正悄然發生著深刻的變革,人類的學習和思維方式也在發生著重要的變化。在這一背景下,世界范圍內,許多國家的高校、科研院所等相繼成立了大數據研究機構,從不同視角開展對教育大數據的研究工作(McKinsey & Company, 2011)。不僅如此,2017年12月8日,習近平總書記在實施國家大數據戰略第二次集體學習會上強調:“我們應該審時度勢、精心謀劃、超前布局、力爭主動,深入了解大數據發展現狀和趨勢及其對經濟社會發展的影響,分析我國大數據發展取得的成績和存在的問題,……更好地服務我國經濟社會發展和人民生活改善。”那么在這種背景下,國際上有關教育大數據及其相關問題的研究究竟是一種怎樣的狀態?它經歷了怎樣的演變軌跡?其熱點和前沿為何?國內教育大數據研究又存在哪些特點?本文試圖從文獻分析的角度,對上述問題做出回答。

二、數據來源和方法

(一)數據來源

本次研究選擇了Web of Science(WOS)平臺下的核心數據庫作為文獻搜索來源。在檢索詞的確定方面,除選定“大數據(big data)”與“教育(education)”“教學(teaching)”“學習(learning)”的組合外,還采用了美國教育部在2012年10月發布的《通過教育數據挖掘和學習分析促進教與學》報告中的兩個重要概念“數據挖掘”“數據分析”(胡弼成等, 2015),增加了對“數據挖掘(data mining)”與“教育(education)”以及“數據分析(data analytics)”與“教育(education)”兩項復合檢索。本研究將文獻檢索的時間截止日設定為2017年12月31日,在去除重復文獻后,最終篩選出436篇論文,作為本次研究的主要數據來源。

(二)研究方法

本研究主要采用三種分析方法。一是文獻計量法。主要統計和分析國際上教育大數據研究文獻的發文時間、來源國家、發文機構、作者發文量以及被引頻次,對教育大數據的研究現狀做出客觀評價。二是可視化分析方法。即借助CiteSpace可視化軟件生成教育大數據“文獻關鍵詞聚類圖”與“引文文獻共被引區視圖”,以此探索教育大數據研究的歷程與現狀,并對未來發展的趨勢進行預測。三是內容分析法。由于高被引文獻是構成教育大數據研究的重要知識基礎,具有重大的學術價值,因此對高被引文獻內容進行分析和描述是有必要的,這有助于我們深度了解國際教育大數據研究的熱點與前沿。

三、研究結果分析

(一)發文量年度變化趨勢分析

發文數量可顯示某一學科領域受關注的程度,逐年連續的發文量可反映該學科領域受關注程度的變化。圖1統計出WOS核心數據庫所收錄的歷年教育大數據文獻走勢。數據顯示,WOS核心數據庫收錄的最早的有關教育大數據的論文可追溯至2002年,該論文由斯洛文尼亞學者烏爾班契奇(Urbancic, T.)等撰寫,篇名為“基于網絡的數字挖掘分析與決策支持的教育(Web-based analysis of data mining and decision support education)”。他在該篇文獻中認為,數據挖掘可以實現知識從學術到教育應用的轉移,可為教育提供參考性決策,但卻未對“教育數據挖掘”的概念進行明確界定(Urbancic, T., 2002)。這篇論文發表后的大約5年里,WOS核心數據庫再也沒有教育大數據主題的論文出現,直至2007年才出現第二篇同類題材的論文。從2007年到2012年,雖然每年都有同類主題的論文問世,但每年的發文量均不超過10篇。而2013年是一個轉折點,當年發文量直接突破10篇,達到21篇。此后每年都保持快速增長勢頭,其峰值在2016年達到140篇。

按照研究文獻的時間分布,可大致將教育大數據研究劃分為三個階段。從2002年到2006年為首篇之后的零增長階段,該階段教育大數據研究成果零星,雖目前僅有一篇可查閱,但該篇文獻卻為教育大數據研究奠定了基礎;從2007年到2011年為緩慢增長階段,是教育大數據研究的起步階段,研究成果雖總體數量不多,但已開始呈現出逐年遞增的潛在趨勢(見圖1);從2012年到2016年為快速增長階段,相關文獻劇增,反映出國際范圍內關于“教育大數據”的研究在這一時期開始呈現“井噴之勢”,至今尚未出現回落或“拐點”,國際對教育大數據的關注仍處于持續升溫的過程中。

(二)文獻來源的國別分析

文獻來源的國別統計可反映出各國對教育大數據研究的貢獻大小,了解教育大數據研究的熱點區域。本研究收集的436篇論文共來自58個國家(地區),區域分布較為廣泛。表1統計了教育大數據研究領域發文量居前十位的國家,這十個國家的作者共參與了414篇論文的發表,占論文總量的95.0%。從表1來看,中國、美國發文量分別高達146篇和131篇,遠高于其他國家,在教育大數據研究領域具有絕對領先地位,展現出較強的科研產出能力及學術研究實力。

在被引頻次方面,436篇樣本文獻共被引用2,422次。被引頻次最高的是美國學者,達到855次;被引頻次最少的有捷克、奧地利等19個國家,被引頻次均為0次。可以看出,教育大數據雖然已經成為世界各國的研究熱點,但總被引頻次卻差異較大,論文認可度高低不同。美國學者在教育大數據研究成果國際化方面展現了相當的實力,這與美國教育技術在全球占據顯著優勢的學術地位或有密切關系。而中國學者研究成果的總被引頻次為563次,高居第二位,呈現出一定的發展潛力。

從篇均被引頻次看,新加坡學者被引頻次最高,平均每篇論文被引用達到14次,德國、西班牙學者緊隨其后,分別達到7.38次和7.07次。可見,新加坡學者研究成果質量較高,在國際范圍內獲得了較高的認可度,具備了強勁的交流潛力和現實交流能力。而中國學者雖在發文量上優勢較大,但在篇均被引頻次方面與新加坡、美國等國家學者存在一定的差距,僅為3.86次,研究成果質量仍需進一步提高。

(三)核心作者分析

學科領域核心作者在很大程度上影響著學科發展的方向和速度,因此,對核心作者論文發表情況進行分析則具有指標性的價值和意義(張敏等, 2014)。經統計,教育大數據研究領域的這436篇核心文獻中共有1,232位作者。我們引入國際上比較流行的核心作者計算公式——普萊斯(Price)公式作為遴選核心作者的量化標準:Ni=0.749[Nm],其中Nm為教育大數據最高產作者的發文量,Ni為能夠入選核心作者的發文量最低標準。在本研究中,最高產作者為來自美國的揚納基斯(Giannakis, G. B. )教授,共有6篇教育大數據文獻發表。經過計算,入選核心作者的最低發文量為Ni=1.83≈2篇。經過統計分析,共有104位作者發文量不少于2篇,約占作者總數的8.44%,另有1,128位作者均只有1篇有關教育大數據的論文發表。從以上數據可以看出,目前國際上從事有關教育大數據研究的作者雖然較多,但大多為尚未形成長期、穩定的研究方向的瞬時作者。不僅如此,當我們利用CiteSpace軟件,選擇作者為節點類型,形成教育大數據核心作者共現圖譜(圖2),可以看到,作者之間未形成中心性,這一點從圖2也可得到印證,作者群“孤島”較多,104位核心作者僅有42條連線,說明作者群之間缺乏跨地區的交流和協作。

根據普萊斯理論:“核心作者的發文量約為發文總量的50%,大約10%的杰出科研工作者發表論文約占全部論文的一半”(趙新亮等, 2017)。本研究中發文量超過2篇的104位作者共有228篇論文發表,從這個角度而言,教育大數據研究領域的國際核心作者群已經形成。圖3為教育大數據研究發文量排名前九位的高產作者統計。

如圖3所示,美國學者揚納基斯發文量最高,他共參與了6篇有關教育大數據論文的發表。這說明他對教育大數據問題保持著較高的研究興趣,科研產出較多。揚納基斯來自美國明尼蘇達大學,他與馬爾達尼(Mardani, M.)合作在數據挖掘方向進行了大量研究,共同嘗試以回歸、分類、聚類的方式對大數據進行提取分析,在教育大數據領域影響力較大,他們共同為教育大數據領域的理論發展與實踐探索做出了巨大貢獻。

(四)文獻發表機構分析

文獻標屬來源機構統計可以幫助我們確認教育大數據研究的熱點機構。表2篩選出了發文量居前十位的機構。在這前十位的機構中,僅有中國科學院一家是科研機構,而其余九家均是高等院校。由此可見,國際上,高等院校已經構成了教育大數據研究成果的主要來源。究其原因,一方面從人力資源的角度來看,高校院系擁有對教育大數據應用領域更為關注的學術“領軍者”及高端學術人才,如圖3中所示的揚納基斯等人,他們既能接觸到國內外相同或相近研究領域的最新動態和前沿成果,又具有很高的學術熱情和科研能力;另一方面從學術氛圍的角度來看,隨著教育信息化的不斷深入,高校環境為大數據在教育領域的應用提供了“沃土”,高校院系和教育者根據自身發展的需求,重視對新興領域的挖掘開發和科學研究,塑造了良好的學術氛圍。

從地域分布看,在教育大數據研究發文量居前十位的機構中,有五所高校來自美國,可見美國高校對教育大數據保持了較高的研究興趣,在全球教育大數據研究領域占有強勢學術地位,尤其是排名第一位的明尼蘇達大學,其名下的教育大數據研究論文高達8篇,科學產出能力較強,而核心作者揚納基斯和馬爾達尼教授均是來自此大學,充分顯示該校在教育大數據研究領域的國際性影響力與實力。另外,中國的三所機構,中國科學院、華中科技大學、大連理工大學,均榜上有名,發文量分列第二、三、六位。可以看出,來自美國、中國的學術機構已經發展為國際上教育大數據研究的主體力量。

從被引頻次看,來自中國科學院的研究成果總被引頻次最高,達到169次,可以看出中國科學院的學者對教育大數據的研究成果較受國際學者的認可。2014年,中國科學院成立了大數據挖掘與知識管理重點實驗室,較早地對數據科學理論、智能知識管理以及諸多交叉領域開展了理論和應用研究。從篇均被引頻次看,來自中國科學院的學者的研究成果同樣也是名列榜首,這也說明了中國科學院學者在研究方向、視角、范式等方面均保持較高的國際水準,較受國外學者的歡迎,在教育大數據研究的國際舞臺中扮演了重要角色。

(五)教育大數據研究的熱點分析

關鍵詞是對整篇文獻的概括,關鍵詞出現頻次的高低可以在一定程度上作為判斷某研究方向在領域內是否為研究熱點提供了重要的論證依據。而中心度是衡量研究熱度的另一重要指標,在某種意義上而言,中心度度量節點在系統中的重要程度,體現著關鍵詞節點在不同聚類之間的樞紐作用。這兩個指標可以為確定研究熱點提供重要參考,而從二者的一致性和差異性可以有效地探尋出國際教育大數據不同研究方向之間的耦合關系,為我們深入分析國際教育大數據研究的熱點和現狀提供有價值的參考和論據。本研究借助CiteSpace軟件,通過關鍵詞的聚類功能對436篇樣本文獻進行關鍵詞共現分析,形成了教育大數據研究關鍵詞聚類圖,如圖4所示。

在圖4中,一個節點代表一個關鍵詞,節點越大說明關鍵詞出現的頻次越高,而中心度則是衡量節點權利大小的重要指標,是體現節點在網絡中相對地位和重要性的度量,顯示著關鍵詞節點在不同聚類之間或者界面上的樞紐作用。將關鍵詞的中心度與頻次之間的一致性及差異進行對比,可以有效地探尋出教育大數據熱點領域之間的關系。表3為CiteSpace軟件統計出的頻次排名前20位的關鍵詞。

關鍵詞出現頻次越高,說明這個關鍵詞在所有文獻中出現的概率越高,那么這個關鍵詞涉及的方向可能越受學者們的關注,越可能是研究的熱點問題。由圖4所示,關鍵詞“大數據(big data)”的節點最大。據表3所示,該關鍵詞出現頻次為154次,由于“big data”是數據來源的重要檢索詞之一,因此其出現頻次最高并不足為奇。而“機器學習(machine learning)”“數據挖掘(data mining)”的頻次分別居第二、三位(40次和39次),說明這兩個關鍵詞在教育大數據領域較受學者們關注,反映這兩個關鍵詞相關的研究方向為教育大數據研究領域中較為核心的研究內容,借助數據處理技術實現教育數據的挖掘可能是目前國際教育大數據研究的重要方向。另外,關鍵詞“分級(classification)”“回歸(regression)”“學習分析(learning analytics)”“學校(school)”“分析(analytics)”“深度學習(deep learning)”“安全(security)”“教育(education)”“模式(model)”的出現頻次也超過10次,可以推斷,在教育大數據研究領域中,這些關鍵詞所代表的研究方向也受到國際學者的較多關注。

在中心度值方面,“數據挖掘(data mining)”值最高,達到0.32,這說明數據挖掘在整個網絡結構中處于最為重要的地位,連接教育大數據領域各個研究熱點的“橋梁”作用明顯。結合其出現頻次可知,數據挖掘是教育領域大數據研究的重要熱點方向;“機器學習(machine learning)”和“學習分析(learning analytics)”的中心度值分別居第二和第三位,均為0.28,說明“機器學習(machine learning)”和“學習分析(learning analytics)”在教育大數據研究領域的內部連接作用也較強,表現出較強的關聯性。這也可能預示著,在教育信息化背景下,機器學習或許可為海量數據精確、高效地分析并服務學習提供重要的參考路徑。“機器學習(machine learning)”在網絡結構圖中不僅中心度值較高,節點位置較為重要,而且在教育大數據領域出現頻次較高,說明機器學習即是目前教育大數據研究的熱點領域,也是研究的核心方向。而機器學習又作為人工智能的重要分支,其相關理論或可為教育大數據研究發展提供重要的理論借鑒與支撐,應引起我們的關注。

此外,在本研究中,我們也發現存在中心度和頻次不一致的情況,這是由于關鍵詞的頻次和中心度是從不同視角反映教育大數據研究領域的熱點分布情況,而二者的對比恰可幫助我們把握教育大數據研究領域的重點。在表3中,關鍵詞“云計算(cloud computing)”“高等教育(higher education)”中心度值分別為0.27、0.25,排名靠前,說明云計算、高等教育在關鍵詞聚類圖中的地位較為重要,溝通和連接教育大數據領域內部不同熱點方向的作用明顯,但出現頻次卻僅為9次、8次,體現了這些研究內容在溝通與連接其他研究熱點方面雖然有重要的橋梁作用,但被關注的程度還有待加強。國際學者應提高對大數據背景下高等教育、云計算研究的重視,促進教育大數據研究的完善。

美國新媒體聯盟2016年發布的《2016 地平線報告(高教版)》指出,個性化是在開放環境中實現教育公平的重要手段,個性化要求教學不按照同質的教學資源開展同質的教學,在未來五年內,如何通過技術滿足所有學生的個性化學習需求仍將會是世界范圍內的難題(NMC Horizon Report, 2016)。對高等教育的關注度不夠突出,可能與目前的研究與應用主要局限于進行技術上的個體嘗試,尚未實現整體化、規模化推廣有關(金慧等, 2016)。而對云計算進行追本溯源,其最初是作為一種新型的商業數據處理模式出現的,它可將計算任務分布在由大量計算機構成的資源池上,有效地幫助用戶根據需要獲取計算力、存儲空間和各種軟件服務。隨著在線教育的逐漸推廣,研究表明,以云計算處理教育數據可有效改善在線課程中固有的師生交互低下的劣勢,幫助教師及時調整授課內容,從而確定最有效的課程元素。而目前教育大數據研究者對云計算的關注熱度不高,可能與云計算主要作為典型的商業計算模型,而尚未探討出合理處理教育領域大數據的有效模式有關(張懷南等, 2013)。

另外有一些關鍵詞“分級(classification)”“回歸(regression)”的中心度值不高,說明這些領域關聯度相對較弱,但出現頻次卻較高,體現了國際學者對數據處理技術的重視,這種反差現象應引起我們的警覺。學者應注重大數據與云計算相融合,增加對大數據技術服務高等教育領域、改善學習效果的關注,避免陷入“唯技術”的窘境,促進教育大數據研究的全面發展。

綜上所述,借助關鍵詞頻次和中心度的統計與分析,我們可以概括出目前教育大數據研究的國際熱點主要聚焦于以下幾個方面。

一是關注教育大數據的基礎理論和應用。代表關鍵詞有“學校(school)”“大數據(big data)”“高等教育(higher education)”“風險(risk)”等。這個方向的焦點總體看來可以劃分為兩個方面:首先是教育大數據的基本概念、內涵等方面,對教育大數據的基本特征和作用進行研究和概括;其次是教育大數據的應用研究,主要是在高等教育、基礎教育領域的應用探究,重點探討了信息化時代背景下大數據技術對傳統教育的顛覆和對教學改革的推進。

二是聚焦大數據處理技術在教育領域的應用。代表關鍵詞有“數據挖掘(data mining)”“機器學習(machine learning)”“教育數據挖掘(educational data mining)”“分布式(distributed)”“云計算(cloud computing)”“可視化(visualization)”等。這個方向的研究者主要對數據的分析技術進行探討,關注如何依靠數據技術實現對海量教育數據的分析和挖掘。分布式、可視化、數據挖掘是目前大數據技術服務教育領域的主要方式,尤其教育數據挖掘、機器學習預示著基于海量學習數據的統計分析基礎上實現智能化的發現和預測,可能代表著未來教育的潛在模式。

三是關注大數據背景下學習方式研究。代表關鍵詞有“深度學習(deep learning)”“在線學習(online learning)”“電子學習(e-learning)”“學習分析(learning analytics)”“效果(effect)”“績效(performance)”等。這方面重點分析基于大數據技術的個性化學習模式給教育帶來的巨大變革,推進深度學習、實踐以及問題解決為導向的教學模式改革。隨著互聯網等技術在教育中的不斷應用,新型學習方式不斷涌現,電子學習、在線學習等改變了傳統的教育方式,也促進新型而適宜的教學模式和學習環境的形成與構建。大數據技術可以深入學習情境,發現隱性規律,為教育者提供有關學習者學習風格、學習行為等的重要信息,實現教育決策的科學與精準預測。

(六)教育大數據研究演進脈絡分析

數據演進脈絡可以直觀地反映出教育大數據研究的發展軌跡,對于我們把握教育大數據研究的發展趨勢和前沿都有著重要意義。引用文獻和關鍵詞變化可為數據演進脈絡梳理提供重要參考。其中引用文獻又作為論文來源的重要知識基礎,對我們分析論文背后關注方向的轉變具有重要的參考價值。

我們將樣本數據導入軟件,設定參數運行程序,形成文獻共被引網絡圖譜(如圖5)。

在網絡圖譜中共形成節點257個,每個節點代表一篇引文文獻,節點的大小代表引文被引用的頻次高低,引文之間的引用關系則通過連線表示。我們按照被引頻次,篩選出被引高于10次的9篇引文文獻,將這9篇文獻作為國際教育大數據研究的高被引文獻,按照時間排列如表4所示。

從被引頻次看,這9篇引文文獻反映了國際教育大數據研究領域的高影響力文獻和前沿文獻,可視為國際教育大數據領域重要的知識載體。借助引文文獻年份的變化可以窺探出國際教育大數據研究領域關注熱點的演變,歸納出教育大數據研究的發展脈絡和前沿。

此外,根據關鍵詞的首次出現年份,我們編制出關鍵詞時間統計表,通過關鍵詞中心度值的變化分析,可為梳理教育大數據研究的發展脈絡提供內容觀測的時間窗口。

高被引文獻構成了國際教育大數據研究的知識基礎,而關鍵詞的演變在一定程度上可以反映出教育大數據研究的熱點演變。根據圖1及我們所做的分析,教育大數據研究比較關鍵的年份為2002年和2013年,這兩個年份可以視為教育大數據研究開始出現和大規模發展的重要時間節點;而從表5高頻關鍵詞中心度大小看,教育大數據研究具有重要影響力的節點出現在2008年、2010年和2013年,這些年份分別出現了“數據挖掘(data mining)”“高等教育(higher education)”和“機器學習(machine learning)”這三個較為重要的高頻關鍵詞,高頻關鍵詞每年的變化代表著研究內容的不斷切換。依據高頻關鍵詞在不同時段的集合和聚類,我們可將國際教育大數據研究發展分為以下幾個階段:

1. 第一階段(2002年至2008年):教育大數據研究的萌芽階段

數據處理技術是這一階段探討的重點主題,這一點集中體現在關鍵詞“數據挖掘(data mining)”之中,其中心度值最高達到0.71。這一階段發表的高被引的文獻開啟了國際教育大數據研究的先河,新加坡南洋理工大學黃廣斌(Huang, G. B. )和加拿大多倫多大學辛頓(Hinton, G. E. )的被引論文是這一時期的代表。黃廣斌(Huang, G. B., 2004)提出可通過優化算法改進“極限學習機”,從而促進學習者快速有效的學習;辛頓(Hinton, G. E., 2006)強調用“喚醒算法”(wake- sleep)促進學生的深度學習。由此可見,從算法等技術的角度實現挖掘數據是這一時期學者的主要探討方向。雖然在這一時期尚未明確提出“教育大數據”“教育數據挖掘”的概念,但已有學者從技術的視角,嘗試了數據處理技術在教育領域應用的可能性,開啟了國際教育大數據研究的先河,迪恩(Dean, J., 2008)在“Mapreduce:Simplified data processing on large clusters”一文中,對Map-reduce程序進行了編譯,可將其應用于數據處理,該模型極大簡化了傳統的并行計算編程模型,提高了并行計算的效率。該篇文獻被引頻次高達26次,可見該文獻成為較多后續研究的基礎文獻,受到較多關注。不過,結合圖1可知,這一階段學者們的發文量尚十分有限,教育大數據發展尚處于技術孕育的萌芽階段。該階段主要是學者對大數據應用于教育領域的思考,雖然首次出現了物聯網、數據挖掘等關鍵詞,但研究并不深入,研究的內容也較局限于各種數據處理技術及其對教育的影響和啟發。

2. 第二階段(2009年至2010年):教育大數據研究的興起階段

基于前期技術的鋪墊,這一時期開始進入“教育數據的發現階段”。從表5可知,這一時期關鍵詞“高等教育(higher education)”“教育(education)”中心度值較高,分別達到0.25和0.16,關鍵詞“技術(technology)”表明學界對傳統數據挖掘技術依然保持關注,而“教育(education)”和“大數據(big data)”等關鍵詞的出現則代表著這一時期學者們就信息化時代背景下大數據技術對傳統教育的顛覆和對教學改革的推進的可能性進行了探討,教育大數據的研究開始逐漸向“發現教育數據”階段過渡。西班牙學者羅梅羅(Romero, C. )等作為較早注意到教育數據作用的權威,最早對教育數據挖掘(EDM)的概念進行定義,明確提出如下觀點:教育大數據技術能夠深入探尋學生的學習情境;海量數據可為教育規律的發現提供重要的樣本基礎;基于數據驅動的挖掘機理和學習分析可以對學習行為做出精準的分析(Romero, C. & Ventura, S., 2010)。除此之外,黃曉英(Huang, X. Y., 2010)對教育數據挖掘在高等教育領域的應用前景也進行了分析,認為數據挖掘可以用于對學習者課堂復雜行為的預測,數據處理技術可以幫助教育者還原教育本質,塑造民主、和諧的課堂氣氛。不僅如此,關鍵詞“評價(evaluation)”的出現說明,學者對大數據重塑教育評價系統的關注,打破以考試和作業為指標的傳統衡量方式,將傳統的單一的經驗式評價轉變為基于教育大數據的過程式評價,挖掘更為隱性的學習者特征。總之,這一時期的關鍵詞主要集中在“教育(education)”“評價(evaluation)”等主題中,表明此階段大數據研究開始擺脫單純對技術的依賴,逐漸向學習方式和教學活動領域滲透。

3. 第三階段(2011年至2012年):教育大數據研究的初步發展階段

這一時期的研究熱點由大數據技術教育應用的可行性探討轉向大數據技術對教育決策的支持探究,開啟了由“發現數據”向“挖掘數據”轉變的初步嘗試,開始聚焦教育數據挖掘技術的預測和決策功能。與上一階段不同的是,這一時期關鍵詞主要集中在“知識(knowledge)”“發現(discovery)”“學生(student)”“決策(decision)”等方面,表明研究開始側重對教育數據的升華,以及大數據技術在教育具體方向的嘗試性應用。大數據在教育領域的應用從本質而言就是數據經過分析處理后,逐步提升為信息和知識,實現從底層向頂層的升華(王萍,? 2015)。2011年。麥肯錫報告正式標志著“大數據時代”的來臨。美國政府率先做出回應,2012年,奧巴馬政府在白宮網站發布了《大數據研究和發展倡議》,宣布投資2 億美元到大數據領域,以推動轉變現有的教學與學習方式,這一舉動引發世界的關注。如何直接使大數據技術在短時間內對教育產生深刻影響,實現下層抽象數據由向上層知識的轉換則引發了學者更深層次的思考。印度學者夏爾馬(Sharma, M., 2011)認為,預測功能是大數據技術在教育中最直接的應用,他嘗試以自組織樹算法(SOTA)對學生在線學習日志中的數據進行分析,并成功對學生成績進行了預測,實證結果表明,預測成績與學生真實成績呈現出高契合度。在教育領域應用抽象數據,實現預測導向,對數據處理技術也提出了更高的要求,關鍵詞“技術(technology)”的持續出現也印證了這一點,數據挖掘技術依然受到學者的重視,但與之前不同的是,這一時期學者賦予技術更明確的針對性,以已有的技術模型和方法評估學生的學習進程,并嘗試對學習績效進行預測進而發現潛在的問題成為這一時期學者探究的關鍵。黃廣斌通過改良極限學習算法完善了自適應學習系統的架構,實現了更有效的基于數據驅動的挖掘機理和學習分析,為在學習情境中實現精準預測奠定了重要基礎(黃廣斌, 2012)。總之,此階段學者圍繞數據的預測和決策功能的探討,是教育數據服務教學的最初嘗試。

4. 第四階段(2013年至今):教育大數據研究的深入發展階段

教育大數據研究在這一時期開始呈現多元、深入的發展趨勢,研究聚焦開始轉向更為具體的微觀層面,基于上一階段對教育數據利用的初步探究后,學者對如何進一步實現數據的有效利用進行了更多維的探討。關鍵詞“雅虎(Yahoo)”“智慧(smart)”“個性化學習(personalized learning)”“安全(security)”等代表的諸多相關領域受到關注。隨著人工智能等信息技術的快速發展,實現尊重個體學習差異的個性化教學成為大數據時代進行教學策略動態調整的新要求。舍恩伯格(2013)在《大數據時代》中提出:“傳統教育策略的制定主要以教師的教學經驗為參照,進而實現對學習者學習行為的判斷,而大數據對學生學習過程的重塑主要是基于三個特征:預測、個性化和反饋。”美國教育技術辦公室基于不斷變化的技術環境發布的“國家教育技術規劃”持續受到國際的關注,其在2016年發布的第五份“國家教育技術規劃”中就曾明確指出,大數據技術在基于海量學習數據的統計分析基礎上,實現教學智能化的發現和預測,可以有效和有針對性地輔助學習者的個性化發展。不僅如此,有效利用數據也逐漸滲透到數據發現所隱含的倫理道德規則之中。個性化服務意味著教師要盡可能地滿足學生特定的學習需求,不可避免地要對學習者的學習行為相關數據進行收集、分析和挖掘,而個人數據的收集必然涉及數據隱私問題。在開放環境下合理開展教學活動需要教師有特別的數據智慧,這種智慧不僅要求教師具備基于數據確認學生學習需求、實施教學方案的數字素養,而且更需要遵循數據開放邊際的倫理要求。關鍵詞“雅虎(Yahoo)”“安全(security)”的出現在一定層面上反映了學界對2014年的雅虎數據泄露事件引發數據安全的擔憂,美國也重新對《家庭教育權利和隱私權法》(FERPA)和《兒童在線隱私權保護法》(COPPA)等數據安全法案進行再授權,強化了學生數據保護的法律規范和問責機制,為大數據保護的法制健全樹立了典范(王正青, 2016)。學界對數據安全問題的關注在高被引文獻中也得到體現,吳信東(Wu, X. D., & Zhu, X. Q., 2014)等提出了一種數據挖掘模型,該模型將數據溯源、數據水印、身份認證、數據發布匿名保護、社交網絡匿名等技術納入其中。該篇文獻被引頻次在關鍵文獻中高居第二位,這也預示著教育數據安全、隱私等具體問題在近年里受到關注。總之,在數據處理技術不斷成熟的背景下,在不違反倫理原則的前提下,進一步挖掘教育數據的利用價值,更有效地服務個性化學習也必將是未來學習關注的焦點。

綜上所述,從演進脈絡看,國際教育大數據發展依次經歷了在數據挖掘技術中孕育、可行性探討、依托成熟技術模型實現教育決策、基于數據的個性化服務四個時期,在這個發展脈絡中,技術始終扮演著重要角色。研究聚焦也實現了三個方面的變化:一是由“技術主體”向“學習服務”理念轉變;二是由自上而下的宏觀理論探討轉向對自下而上的微觀具體問題的關注;三是從關注教育數據挖掘的內涵轉向如何合理、高效地實現教育大數據服務。這三個方面的變化也代表著教育大數據的研究正不斷走向深化。此外,經過軟件探測,筆者發現(如圖6),數據挖掘將依然是未來國際教育大數據研究的前沿方向,必會持續受到學者的關注。

四、結論與反思

(一)結論

本文基于WOS數據平臺,通過文獻計量方法并使用CiteSpace軟件對國際教育大數據研究的現狀、熱點以及發展脈絡進行了分析。在基于關鍵詞共現知識圖譜和引文共被引圖譜的基礎上進行動態信息挖掘,并對關鍵文獻進行了深入閱讀分析,形成以下結論。

第一,從文獻發表時間分布看,截至目前可大致分為三個階段:從2002年到2006年為首篇之后的零增長階段,從2007年到2011年為緩慢增長階段,從2012年到2016年為快速增長階段。最早的關于教育大數據的研究文獻出現在2002年,但由于當時教學理念、技術支持等因素的限制,尚未得到廣泛的推廣和關注,可以說,從發文量上看,2002年、2013年是國際教育大數據研究發展具有標志性的時間節點。截至今日,國際針對教育大數據的研究仍處于快速發展期。據統計,由于文獻入庫的延遲, 2017年1月1日至12月31日已有96篇文獻入庫,可以預測未來對教育大數據的研究仍將呈現增長態勢。

第二,從熱點區域和機構看,美國、中國、新加坡已經成為教育大數據研究的熱點區域,美國、中國學者的科研產出較多,而新加坡學者研究成果的質量較高,呈現“三足鼎立”之勢,這三個國家成為教育大數據領域具有奠基性意義的區域;而高等院校則成為國際教育大數據研究的主要機構群體,來自美國明尼蘇達大學、中國社會科學院的學者發文量、總被引頻次以及篇均被引頻次均名列前茅,其成果受到國際學者的格外關注,已經成為國際上教育大數據研究的主體力量。

第三,從核心作者看,目前在國際上已經形成了一支教育大數據研究核心作者群,這些核心作者碩果累累,其研究成果的質量也處于較高水平,來自明尼蘇達大學的揚納基斯、馬爾達尼是其中較有影響力的研究者代表,他們的研究成果受到國際教育大數據領域學者的較多關注,其研究方向在一定程度上可代表領域內的熱點與前沿問題。但在今后的研究中,應引導相關領域的學者們共同關注和探索教育大數據研究,廣泛開展地區之間的學術交流,共同探討教育大數據研究的可持續發展之路。

第四,從研究熱點和前沿看,可歸納為三個方面:教育大數據的理論應用探討、大數據處理技術在教育領域的應用以及大數據背景下的學習方式研究。它們共同構成了國際教育大數據領域的研究熱點。從中心度和頻次的對比看,數據挖掘技術是教育大數據領域關注的重點方向,而大數據背景下對高等教育、云計算研究的關注有待進一步提升。結合梳理出的關鍵文獻,整體來看,教育大數據的研究主題已經開始偏向于實踐領域,將已有的數據挖掘模型應用于教育數據的處理,進而實現教育的預測和評價導向已經成為國際學者關注的熱點,數據挖掘技術仍將獲得持續性關注。

第五,從教育大數據研究的發展脈絡看,教育大數據在本世紀初開始萌芽,期間經歷了大數據技術在教育領域的興起與初探,目前已經走向深入發展階段,學者開始聚焦數據的安全和隱私等具體問題。從每個階段的研究重點和轉向看,國際教育大數據研究實現了從對單純數據挖掘技術的依賴向依托數據挖掘技術教育決策應用的過渡,其中形成的一些經典文獻對我們豐富教育大數據研究的理論積淀、把握發展方向都有重要的借鑒意義。

(二)反思

橫向來看,我國目前已經成為教育大數據研究的熱門區域,不僅發文量名列前茅,而且涌現出如中國科學院等研究成果優質的科研學術機構,在國際教育大數據的研究舞臺上占據了重要地位。欣喜之余,我們也要對我國研究成果的不平衡現狀保持清醒。我國學者對教育大數據的研究成果的整體篇均被引頻次僅為3.86次,與新加坡學者的14次、美國學者的6.53次均有一定差距,而中國科學院學者研究成果的篇均被引頻次卻高達24.14次,可見中國學者的教育大數據研究成果質量差異較大,除個別機構外,整體呈現學術交流能力不強的現狀。

目前,國內已有學者對我國教育大數據研究現狀進行了分析,按照研究方法可大致將其分為兩類:一是采用傳統文獻綜述方式,以劉鳳娟等為代表;二是采用知識圖譜方式,以王娟、裴瑩等為代表。其中知識圖譜的方式又可基本分為SPSS和CiteSpace兩種方式,其數據來源均以中國知網為基礎。綜合他們對國內教育大數據研究的梳理,對比本研究,我國教育大數據研究的特色和不足初見端倪。

其一,從發展脈絡看,我國教育大數據研究發展稍顯滯后。劉鳳娟(2014)采用文獻分析法對我國教育大數據研究發展脈絡進行梳理,依據文獻發文量,她認為2012年我國的教育大數據研究開始萌芽,有5篇相關論文收錄;而2013年之后,我國教育大數據研究論文數目開始倍增,教育大數據研究正式起步。而裴瑩等(2017)通過區視圖利用知網收錄的文獻對我國教育大數據研究發展脈絡也進行了梳理,將國內的研究分為三個階段:開始應用階段(2013年)、興起階段(2014年)、深入發展階段(2015至2016年)。綜合以上兩位學者采用不同方法梳理出的結果并與本研究對比,可得出以下兩點結論:①國內外相關研究的關鍵時間點基本一致。2013年是我國教育大數據研究發展具有里程碑意義的時間點,而本研究梳理出的國際大數據研究的關鍵時間點為2002年、2013年,國內發展基本符合國際發展趨勢;②國內研究發展推進稍顯滯后。本研究顯示,國際教育大數據研究可追溯至2002年,2013年步入深入發展期,至今已完成了從可行性探討向關注教育大數據應用的轉變,而裴瑩等人的研究揭示出,國內教育大數據的研究自2013年開始萌芽,雖2015年進入深入發展階段,但至今仍處于可行性的理論性探討階段,實證研究廣度不夠(裴瑩等, 2017)。以此推斷,國內發展時間和研究范式均體現出一定的滯后性。

其二,從研究熱點和前沿看,國內研究特色明顯,對主流問題關注尚可,但對部分前沿問題聚焦不夠。有相關學者雖采用不同方法,但均對國內教育大數據研究熱點前沿問題進行了關注。崔曉鸞(2016)采用SPSS軟件的聚類功能分析出國內教育大數據研究的熱點方向為理論研究、以思想政治教育為代表的高校教育改革研究、個性化學習研究;而王娟(2016)采用CiteSpace軟件分析出,“學習分析”“機器學習”“數據挖掘”“慕課”“教學改革”“高等教育”“思想政治教育”等為國內研究的熱點詞匯,而“數據挖掘”“高職教育”則是國內研究的前沿突顯詞;裴瑩(2017)根據CiteSpace分析的關鍵詞,將國內研究領域概括為大數據技術、學習方式探索、個性化教學改革、學習行為分析等幾個熱點方向。對比表3國際研究熱點高頻關鍵詞及其分析可以發現:首先,國內研究熱點與國際關注的主流方向基本一致,關鍵詞“數據挖掘”“學習分析”“機器學習”“高等教育”等均為國內外學者關注的高頻詞匯,可見,國內外學者對主流方向的關注基本趨同;其次,國內研究前沿多元,關注特色明顯,在研究前沿突顯詞方面,“數據挖掘”“職業教育”是國內學者關注的前沿方向,而國際僅探測出“數據挖掘”這唯一突顯詞,從這個角度而言,國內研究發展的潛在趨勢更為多樣。不僅如此,關鍵詞“思想政治教育”均不約而同地出現在三位學者統計的國內熱點詞匯中,可見大數據為思想政治教育帶來的機遇與倫理挑戰研究引起國內學者的關注,成為國內大數據研究的重要方向之一,而國外學者卻鮮有涉及,這可能與中國特色密切相關。但從表3中關鍵詞“安全(security)”和脈絡前沿所反映出的國際學者關注的數據安全問題,均未見于以上三位國內學者對中國研究熱點的梳理,可見,國內尚未出現相關詞匯與文獻,聚焦略顯不夠。

其三,從研究方式看,國內外研究均呈現高校研究為主體、學術交流缺乏的特征。王娟等(2016)通過對國內教育大數據研究機構的梳理發現:國內教育大數據研究的高產機構均來自國內高等院校,但研究團體分散,不同機構之間交流合作較少(裴瑩等, 2017)。可以看出研究合作群體的凝聚力不夠是國內外研究團隊的共性;不僅如此,在其研究中,江蘇師范大學、西南大學等高校是國內教育大數據研究的高產機構,這一點與本研究篩選出的中國科學院等結果存在一定出入。筆者認為,這可能與數據來自不同數據庫有關,從本研究的分析看,國內學者的相關研究已頗具特色,國內學者應擴大學術視野,樹立學術自信,積極參與國際教育大數據研究的交流。

總之,綜合分析看,中國教育大數據研究需要明確國際化方向,形成自己的核心研究團隊,國內高等院校更應該在其中發揮引領和奠基作用,積極參與國際交流與合作研究,以保持對國際主流與前沿方向的警覺。當然,從中國國情來看,我們也不能盲目跟風、機械照搬,扎根實踐的調查研究和經驗研究尤為關鍵。只有立足中國獨特的教育大數據研究的文化處境和實踐經驗,累積一項項調查研究和經驗研究,才可能形成中國特色的學術概念和分析框架,推動中國教育大數據研究的范式轉型與良性發展,為國際學界貢獻中國的知識與經驗。

[參考文獻]

崔曉鸞,趙可云. 2016. 大數據在教育領域的研究熱點及發展趨勢——基于共詞分析的可視化研究[J]. 現代遠距離教育(4):79-85.

胡弼成,王祖霖. 2015. “大數據”對教育的作用、挑戰及教育變革趨勢——大數據時代教育變革的最新研究進展綜述[J]. 現代大學教育(4):98-104.

金慧,劉迪,高玲慧,宋蕾. 2016. 新媒體聯盟《地平線報告》(2016高等教育版)解讀與啟示[J]. 遠程教育雜志,35(2):3-10.

劉鳳娟. 2014. 大數據的教育應用研究綜述[J]. 現代教育技術,35(8):13-19.

裴瑩,付世秋,吳鋒. 2017. 我國教育大數據研究熱點及存在問題的可視化分析[J]. 中國遠程教育(5):1-8.

王娟,陳世超,王林麗,楊現民. 2016. 基于CiteSpace的教育大數據研究熱點與趨勢分析[J]. 現代教育技術,26(2):5-13.

王萍. 2015. 大數據時代提升教師數據智慧研究[J]. 開放教育研究, 21(3):30-39.

王正青. 2016. 大數據時代美國學生數據隱私保護立法與治理體系[J]. 比較教育研究,38(11):28-33.

維克托·邁爾-舍恩伯格,等. 2013. 大數據時代[M]. 盛楊燕,等,譯. 杭州:浙江人民出版社.

張洪孟,胡凡剛. 2015. 教育虛擬社區:教育大數據的必然回歸[J]. 開放教育研究,21(1):44-52.

張懷南,楊成. 2013. 我國云計算教育應用的研究綜述[J]. 中國遠程教育(1):20-26,95.

張敏,沈雪樂. 2014. 國際知識發現研究領域核心作者群成熟度分析[J]. 情報雜志,33(8):111-116.

趙新亮,張彥通. 2017. 鄉村教師研究的國際前沿、主題演變及知識基礎分析——基于2000—2016年主題為“rural teacher”的SSCI論文數據[J]. 湖南師范大學教育科學學報,16(4):16-22.

鄭燕林,柳海民. 2015. 大數據在美國教育評價中的應用路徑分析[J]. 中國電化教育(7):25-31.

Department of Education. (2015, December). Future Ready Learning: Reimagining the Role of Technology in Education. National Education Technology Plan. Retrieved November 18, 2017, from https://tech.ed.gov/files/2015/12/NETP16.pdf

Department of Education. (2017, January). Protecting Student Privacy While Using Online Educational Services:Model Terms of Service. Retrieved January 25, 2018, from http://ptac.ed.gov/sites/default/files/TOS_Guidance_Mar2016.pdf

Hinton, G. E. Osindero S. (2006). A Fast Learning Algorithm for Deep Belief Nets. Neural Computerion, 18(7), 1527-1554.

Huang, G. B. (2004). Extreme learning machine: Theory and applications. 8th Brazilian Symposium on Neural Networks. Sao Luis, Brazil.

Huang, X. Y. (2010). Application of Data Mining in Higher Education System. Proceedings of International Forum of Knowledge As A Service, (12), 203-206.

McKinsey & Company. (June 2011). Big data: The next frontier for innovation, competition, and productivity. Retrieved November 21, 2017, from https://bigdatawg.nist.gov/pdf/MGI_big_data_full_report.pdf

New Media Consortium. (2016, November). NMC Horizon Report -2016 Higher Education. Retrieved January 18, 2018, from https://www.nmc. org/publication/nmc-horizon-report-2016-higher-education-edition/

Romero, C., & Ventura, S. (2010). Educational Data Mining: A Review of the State of the Art. IEEE Transactions on Systems Man and Cybernetics Part c-Applications and Reviews, 40(6), 601-618.

Sharma, M. (2011). Accuracy Comparison of Predictive Algorithms of Data Mining: Application in Education Sector. Communications in Computer and Information Science, (125), 189-194.

Urbancic, T. (2002). Web-based analysis of data mining and decision support education. Ai Communications, 14(5), 199-204.

Wu, X. D., & Zhu, X. Q. (2014). Data Mining with Big Data. IEEE Transactions on Knowledge and Data Engineering, 26(1), 97-107.

收稿日期:2017-11-29

定稿日期:2018-02-07

作者簡介:蔣鑫,博士研究生,福建師范大學教育學院(350117)。

洪明,博士,教授,博士生導師,福建師范大學教育學院,福建省基礎教育與教師教育研究中心(350117)。

責任編輯 郝 丹

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 久久亚洲美女精品国产精品| 国产福利影院在线观看| 91九色视频网| 日本91视频| 九色视频线上播放| 亚洲无码免费黄色网址| 在线国产91| 狠狠v日韩v欧美v| 搞黄网站免费观看| 亚洲人成日本在线观看| 中文字幕欧美日韩| 麻豆精品在线播放| 干中文字幕| 国产精品污视频| 国产aⅴ无码专区亚洲av综合网| 国产精品无码一二三视频| 99在线观看国产| 久久综合婷婷| 欧美一区二区丝袜高跟鞋| 中文字幕在线日韩91| 尤物亚洲最大AV无码网站| 91成人精品视频| 色久综合在线| 九一九色国产| 538国产视频| 欧美色视频在线| 国产在线一区二区视频| 熟妇丰满人妻av无码区| 色丁丁毛片在线观看| 91久久国产热精品免费| 亚洲精品亚洲人成在线| 538精品在线观看| 午夜久久影院| 91破解版在线亚洲| 免费看一级毛片波多结衣| 亚洲综合香蕉| 亚洲综合中文字幕国产精品欧美| 国产美女主播一级成人毛片| 国产精品白浆在线播放| 激情国产精品一区| 99精品影院| 亚洲欧美日本国产综合在线| 日韩乱码免费一区二区三区| 国产成人精品第一区二区| 久久国产精品嫖妓| 亚洲成人在线免费| 一本大道AV人久久综合| 亚洲日本中文综合在线| 韩日无码在线不卡| 青青操国产| 高清色本在线www| 高清乱码精品福利在线视频| 人禽伦免费交视频网页播放| 精品亚洲欧美中文字幕在线看| 97超级碰碰碰碰精品| 欧美中文字幕在线视频| 国产精品冒白浆免费视频| 香蕉精品在线| 精品国产美女福到在线不卡f| 国产人前露出系列视频| 人妻中文字幕无码久久一区| 国产欧美日韩视频怡春院| 亚洲资源在线视频| 青青青国产免费线在| 成人一区在线| 国产第四页| 欧美日韩国产综合视频在线观看| 亚洲一区二区三区香蕉| 欧美国产综合视频| 毛片在线播放网址| 日韩精品专区免费无码aⅴ| 亚洲精品不卡午夜精品| 国产情精品嫩草影院88av| 亚洲无限乱码一二三四区| 久久久成年黄色视频| 中文字幕日韩视频欧美一区| 四虎成人在线视频| 国产白浆视频| 免费在线成人网| 国产成人调教在线视频| 最新日本中文字幕| 欧美日韩在线亚洲国产人|