999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

教育數據挖掘:大數據時代的教育變革*

2017-06-05 15:04:52陳雯雯夏一超
中國教育信息化 2017年7期
關鍵詞:數據挖掘分析教育

陳雯雯,夏一超

(1.華南理工大學 發展規劃處,廣東 廣州510641;2.華南理工大學 公共管理學院,廣東 廣州510641)

教育數據挖掘:大數據時代的教育變革*

陳雯雯1,夏一超2

(1.華南理工大學 發展規劃處,廣東 廣州510641;2.華南理工大學 公共管理學院,廣東 廣州510641)

大數據開啟了教育領域本質上的變化和發展,一個大規模的生產、分享和應用教育數據的時代正在開啟,而發掘數據價值、征服龐大教育數據的“武器”就是教育數據挖掘。本文通過文獻分析法,對國內外文獻進行分析和綜述,首先對EDM進行概念界定和歷史溯源,比較EDM相關概念的區別和聯系,針對EDM作為大數據時代下的新技術,對其研究、發展和應用等方面進行了較系統的闡釋,最后總結了EDM目前面臨的挑戰和展望,以期對EDM進行全方位的闡述和梳理,并促進該領域在中國的深入研究。

教育數據挖掘;學習分析;大數據

一、前言

隨著大數據時代的到來,教育數據正如漂浮在海洋中的冰,第一眼只能看到冰山一角,絕大部分都隱藏在表面之下。[1]而發掘教育數據價值、征服教育數據海洋的“動力”就是教育數據挖掘 (Education Data Mining, EDM)。EDM最初應用于智能導學系統(ITS)和教育人工智能(AIED)研究領域,這些技術的深入應用也帶來教育數據爆炸式膨脹。日益增長的教學軟件中儲存著巨大的學生數據,互聯網教學E-learning等網絡教育學習行為更是呈現出極具增長的數據流趨勢。[2]這些數據集過大、難以被傳統數據庫軟件工具捕捉、儲存、管理和分析的教育類大數據,目前已成為困擾教育機構的一大難題,研究們逐漸開始關注這些教育數據的潛在價值。教育數據挖掘用統計、機器學習和數據挖掘等方法來解決這些教育領域的問題,從而對更好的理解學生學習和提高教育管理決策的質量。[3]

2012年3月,在教育部正式頒布的《教育信息化十年發展規劃(2011-2020年)》[4]中提出,促進教育管理科學決策就要“大力推行教育信息化”,而這種科學的決策來源于教育信息化與教育管理的深度結合。而教育數據挖掘則是促進這種結合的有效手段。與此同時,“智慧教育”也將改變學習和教育方式,促進傳統教育向智慧教育的轉變,使得教育變得更靈活和個性化。以教育數據挖掘為基石,深度挖掘學生的各方面情況數據,“智慧教育”也需要教育數據挖掘的發展作為支撐加快,從而加快教育管理系統信息系統和智能學習平臺建設。

國外的研究與國內相比,對于教育數據挖掘有著更為廣泛、成熟的應用。雖然2005年在國際會議上首次提出“教育數據挖掘”這一概念,但是在不到十年的發展過程中,教育數據挖掘相關應用已經越來越受到學界的關注。本文嘗試用文獻分析方法對教育數據挖掘進行綜述和梳理。國外文獻分析主要有四個文獻來源:一是利用筆者在中山大學圖書館檢索系統(http://library.sysu.edu. cn/web/guest/index)以“EDM(教育數據挖掘)”、“Educational Data Mining”、“學習分析(Learning Analysis,LA)”、“知識發現(knowledge Discovery in Database,KDD)”等相近關鍵詞對論文、圖書、電子書、DVD、以及論文題目、圖書題目和雜志題目,進行文獻搜索,其中Education Data Mining檢索論文,在Willey Online Library中有4個搜索結果,tandfonline.com有3篇文獻,在CSA原劍橋科學文獻數據庫中搜到40篇相關文獻,選擇其中12篇文獻作為研究對象,通過Google學術搜索以“教育數據挖掘(Education Data Mining)”等關鍵詞進行文獻搜索,在搜索到的上百篇文獻中,根據引用頻率進行篩選。三是對可獲取到的教育數據挖掘領域著名國際會議,例如第六屆教育數據挖掘國際會議(the 6th International Conference on Educational Data Mining)中的30多篇文獻,國際教育數據挖掘學會(International Educational Data Mining So-ciety)、學習分析研究學會(SoLAR)、教育數據挖掘IEEE專責小組中28篇論文,根據作者文章引用頻率和領域知名度進行篩選。四是根據每年的國際教育數據挖掘研討會(Workshop of Education Data Mining)中論文,根據引用頻率進行選讀和篩選。根據以上四個途徑選取的文獻資源,除去相同文獻之外,最終獲得相關文獻70多篇,其中國內相關文獻主要來源是“中國知網”等學術文獻庫中的相關文獻。

二、數據挖掘與教育數據挖掘

1.什么是數據挖掘與教育數據挖掘

數據挖掘是通過仔細分析大量數據來揭示有意義的新的關系、趨勢和模式的過程。主要應用于銀行、電信、交通、零售(如超級市場)等商業領域,而用在 elearning方面還是處于起步階段。數據挖掘是一門交叉性學科,融合了人工智能、數據庫技術、模式識別、機器學習、統計學和數據可視化等多個領域的理論和技術。由于數據挖掘是數據庫中知識發現的核心步驟,發現了隱藏的模式,所以從模式處理的角度,許多人認為兩者是等同的。[5]

目前,學術界對于教育數據挖掘的定義并未有統一的描述,比較常用的幾個定義分別來自于教育數據挖掘網站(http://www.educationaldatamining.org)是這樣定義教育數據挖掘的,“教育數據挖掘是應用數據挖掘方法從教育系統中的數據提取出有用的信息,從而更好地理解學生及其學習系統的新興學科。”這一版本的定義成為之后學者廣泛討論的基礎,引發學術界對教育數據挖掘的探討和深究。Luan認為教育數據挖掘應該是從構建數據的模型、任務、方法和算法來探索教育環境中的數據信息。[6]Baker和Yacef認為教育數據挖掘是分析教育系統中的數據并且解決教育研究問題的一門新興學科。[7]2011年出版的《教育數據挖掘手冊》上是這樣描述,“教育數據挖掘是開發、研究和應用計算機方法來對傳統教育環境中的大量數據進行分析和監測,而數據的容量之大是其他方式很難或者基本上無法進行的。”[8]教育數據挖掘從各種支持學習或者教育的信息系統中提取出有用的信息,這些數據并不是來源少數學生或者某一個教育系統,而是包括所有參與的學生、管理數據、人口統計數據(例如,性別、年齡、年級)、學生的情感(例如,動機、情緒)等等。因此,在教育大數據的背景下,我們分析更多的數據,有時候甚至可以處理某個特別現象的所有數據傳統的教育數據挖掘。

2.教育數據挖掘溯源

教育數據挖掘是伴隨著數據挖掘和教育系統的發展而逐漸形成的研究領域。在傳統教育系統的數據挖掘應用中,尤其是網絡課程,著名的是學習內容管理系統和應用智能網絡教育系統。每一個系統都會有各自的數據源和知識發現的對象。在處理每一種可利用的數據過程中,通常會應用統計、可視化、聚類、分類、離群點檢測等數據挖掘的技術,大量技術的成功應用使教育數據挖掘逐漸成為一門成熟的學科領域。在過去的十年間,教育系統中最重要的創新點在于新技術的引進。

教育數據挖掘是在多種數據挖掘和分析技術的基礎上發展而來的新興應用。教育數據挖掘是一個交叉學科領域,包括信息檢索、推薦系統,可視化數據分析,領域驅動數據挖掘、社交網絡分析(SNA)、教育心理學,認知心理學,心理測量學等學科知識。其中主要包括教育學、統計學和計算機科學,這三個領域的相互作用同樣也形成了其他子領域與教育數據相關的計算機教育。數據挖掘、及其學習和學習分析。

3.教育數據挖掘相關概念的界定

(1)教育數據挖掘與學習分析

教育數據挖掘就是將數據挖掘應用到教育領域,通過跨學科領域的研究更好地了解學生學習和教育的結果,從而對教育現象做出科學的解釋。從溯源教育數據挖掘可以看出,雖然教育數據挖掘涉及到多種不同領域的技術,但是目前與之相近的在教育領域中的技術主要有學習分析。所有之前提到的學科領域,與教育數據挖掘關系最緊密的是學習分析,也叫做學術分析。[9]學習分析主要用于數據驅動的決策制定和社會/教育相關的學習分析。然而,盡管教育數據挖掘在數據上是一個新的框架,發現新的算法或者模型,學習分析用于結構系統的預測模型。事實上,學習分析定義為測量、收集、分析和包括學習者在內的學習背景的報告,為了理解和優化學習和所發生的環境。盡管學習分析和教育數據挖掘在很多性質上具有相同的目標和興趣,關鍵的不同主要從兩方面進行辨析[8]:

·重要性:學習分析在數據和結果描述上更加重要;然而,教育數據挖掘則是描述和比較數據挖掘技術運用上更加重要。

·發現的類型:在學習分析中,利用人類的判斷是關鍵;自動發現用于完成這項目的工具。在教育數據挖掘過程中,自動發現是關鍵;利用人類的判斷是用于完成這項目標的工具。

(2)教育數據挖掘與E-Learning數據挖掘

教育數據挖掘的應用環境分為傳統教育環境和計算機教育系統。其中傳統的教育系統包括演講、課堂討論、小組練習、個人作業等傳統形式。而基于計算機教育系統的教育數據挖掘則成為E-Learning數據挖掘。ELearning數據挖掘指的是一個將各種E-Learning軟件系統(主要是網絡教學平臺)的原始數據轉換為有用信息的過程,這些有用信息可為教師、學生、家長、教育研究人員、教育管理人員以及E-Learning軟件系統開發人員所利用,以實現對學生及其所接受教育的更好理解,并可據此采用更有針對性的管理和教學優化措施。廣義講,E-Learning理解為通過因特網進行學習與教學的活動。[10]因此,E-Learning數據挖掘是教育數據挖掘的一個方面。

三、教育數據挖掘成為教育大數據背景下的新動力

教育數據挖掘通過發展、研究和應用計算機的方法來識別教育規律,對教育數據進行大規模收集。近年來,教育數據挖掘在分析發生在教育環境中的特定數據,解決教育問題方面發揮著越來越重要的作用。

1.教育數據挖掘研究日趨成熟

教育數據挖掘正在處于飛速發展階段。80%以上的教育數據挖掘文獻都是在2000年之后發表。教育數據挖掘已經擁有成熟的研討會 (Workshop of Educational Data Mining)、國際教育數據挖掘年會(the annual International Conference on Educational Data Mining)、期刊(the Journal of Educational Data Mining)和研究手冊(the Handbook of Educational Data Mining)。

最早的一篇教育數據挖掘綜述是Romero&Ventura《教育數據挖掘:1995年至2005年的調查》[11],也是目前為止引用最多的文獻。該綜述首先詳細說明了教育數據挖掘和知識發現之間的關系和區別,并且提到了教育數據挖掘應用在傳統的教育系統,網絡課程,學習內容管理系統和智能教育系統中的案例。作者只是介紹了數據挖掘技術在教育領域的初步運用,并且大部分是在介紹數據挖掘的技術和方法,例如統計和可視化,聚類,分類和離群點檢測;關聯規則和挖掘模式,以及文本挖掘等,而教育數據挖掘現階段的應用遠遠不止這些。Baker和Yacef《教育數據挖掘的現狀:綜述和未來展望(2009)》[12]從理論上對比了早期和現階段教育數據挖掘工作,分析教育數據挖掘的發展趨勢。關于教育數據挖掘方法分類上,學界大部分是根據Baker的觀點分為預測、聚類、關系挖掘等,作者認為應該在此增加人工判斷和模型發現,因為模型發現越來越學界的歡迎,并且該方法對學生學習產生了更好的效果。

雖然這兩項綜述的主題為“教育數據挖掘”,但是從內容來看,大部分已有研究的挖掘對象是E-Learning系統產生的數據,對于傳統課堂的數據挖掘占少數。

表1 教育數據挖掘相關的刊物

現階段只有兩本關于EDM書已經出版。第一本是《E-Learning的數據挖掘》[13],有17章,主要內容是在網絡環境下的教育數據挖掘。第二本是《教育數據挖掘手冊》,有36章,面向不同的教育環境(educational settings)類型。[14]

表2 教育數據挖掘文獻引用次數最多的十篇論文

最后提到了最近日益增長的對于教育數據挖掘的興趣。圖2表明引用EDM是增長很快的,在一個免費的數據庫網絡中,例如Google Scholar和基于描述的工具例如 SciVerse Scopus,當搜索“教育數據挖掘”(Education Data Mining)時候,從2004年到2011年的數據變化。如圖所示,兩個數據都是成指數增長的,表明對這個話題的興趣越來越高了,最近兩年的SciVerse Scopus引用數據都是高于Google Scholar的。

圖1 SciVerse Scopus和Google Scholar中“教育數據挖掘(EDM)”相關文獻數量對比

圖2 教育數據挖掘和學習分析在中國知網數據庫文獻數量

但是目前,國內學術界對于教育數據挖掘的研究并不多,使用“教育數據挖掘”作為關鍵詞在中國知網上進行檢索,僅得到文獻6篇,分別來自中國學術期刊網絡出版總庫(5篇)和會議(1篇)。按照與教育數據挖掘相近的關鍵詞“學習分析”來看國內教育數據挖掘的研究趨勢。可以看出,教育數據挖掘和學習分析的研究比較少,但是2013年開始就逐漸增多。總體來看,我國學術界對于教育數據挖掘的研究還處于起步階段,相關研究有待進一步開展和深入。

對國內外教育數據挖掘的文獻主題可以看出,目前國際上教育數據挖掘的研究方向主要集中于學生模型的構建(學生行為模型、學生表現模型)方面;而國內的研究還處于初級階段。教育數據挖掘的研究可能聚焦在如下幾個領域:①教育數據挖掘的功能,主要針對于教育數據挖掘的目的和應用目標,因此其工作重要主要是研究、開發和應用某一方面類似的、合作性質的工作方式;②學生模型分析,主要面向小組活動、學術成就分析、資源的利用率、學生成功因子分析、專注度、學生思維情況、領域知識等方面;③評估分析,將向應用測試、自我評估、動力提升和合作評價等方面發展;④學生支持和反饋,更多的研究將會關注學生的情緒反饋,競爭性刺激、決策支持、文本挖掘、網絡挖掘和社會網絡交互影響等方面。

2.教育數據挖掘的利益相關者

(1)教育數據挖掘利用相關者組譜

利益相關者(stakeholder)是一個實體(人、組織等),與教育數據挖掘存在著一定的利益關系。利益相關者可以認為是教育數據挖掘過程中的受益者,也可以認為是教育數據挖掘的實施主體、面向用戶等。

Romero和Ventura認為,教育數據挖掘包括不同類型的用戶或者參與者。不同的團體從不同的角度看到教育信息。根據他們的任務、視角和使用數據挖掘的目的不同。例如,通過教育數據挖掘算法而發現的知識不僅能夠幫助教師管理班級,理解學生學習的過程,反應他們的教學方法是否正確,也能夠根據學生對于環境做出反應和反饋。[15]盡管從內部使用者來看包括教師和學習者這兩個群體,但是,實際上也包括很多的對象。①學習者;②教師;③網絡課程研發人員;④教育機構(大學、培訓公司);⑤行政人員(學校區域行政人員、網絡管理人員、系統管理人員)。他們使用數據挖掘的目的如表3所示。

表3 教育數據挖掘的利益相關者

3.教育數據挖掘的技術策略

(1)教育數據挖掘技術手段

教育數據挖掘的方法有很多,其中很多方法在數據挖掘領域已經有很成熟的應用。例如,預測、聚類、離群點檢測、關系挖掘,過程挖掘,文本挖掘等。另外一方面就是專門針對教育數據挖掘而采用的技術手段,例如提煉人類判斷的數據,模型發現,知識跟蹤、非負矩陣分解等。

A.預測。預測的目的就是為了推斷出目標屬性獲知數據的一個方面(預測變量)或者從數據的其他幾個方面的結合(預測性的變量)。預測方法的類型主要是分類(被預測變量是分類變量),回歸(當被預測變量是持續性變量)或者密度估計 (當被預測變量是概率密度函數)。在教育數據挖掘中,預測編寫已經成為預測學生表現[16]和監測學生的行為[17]。

B.聚類。聚類就為了將某些方面具有相似性的小組聚集為一類。通常,這種例子測量方法就是為了覺得這些實例的相似度。一旦決定了簇,新的例子將會被分為最相似的簇。在教育數據挖掘中,聚類通常用于將相似的課程材料進行分組或者基于他們的學習和交流模式來分組。[18]

C.離群點檢測。離群點檢測的目的是發現數據顯著不同于其他的數據。一個離群點就是不同的觀察(或者測量),數據通常和其他的點很不同或者很小。在教育數據挖掘中,離群點通常會用于檢測學習困難的學生,學習者或者教育行為,表現的偏差,檢測不規則的學習過程。[19]

D.關系挖掘。關系挖掘就是堅定變量和常量之間的關系并且用新的規則去在編碼以便以后能夠繼續使用。挖掘的技術不同類型的關系,例如association rule mining(在變量之間)、關聯挖掘、序列框架挖掘(變量之間的暫時結合)、偶然數據的挖掘(變量之間的偶然關系)。教育數據挖掘中,關系挖掘已經被用在學習行為框架之間關系的鑒定和學生學習困難的對話或者錯誤的發生頻率。[20]

E.社交網絡分析。社交網絡是理解和測量準入網絡信息之間的關系。SNA基于網絡理論的社交關系來構成節點(代表網絡之間的個體因素)和聯系或者鏈接(代表個體的關系,例如友情,親緣關系,組織地位,性別關系等等)。在教育數據挖掘中,SNA主要用于挖掘解釋和分析結構和合作任務之間的關系,相互交流的工具。[21]

F.過程挖掘。過程挖掘就是通過信息系統從過去的日志中提取出與過程相關的知識來對于整個過程有一個可視化的代表的信息。包括三個子領域:一致性檢測,模型發現和模型擴建。在教育數據挖掘過程中,過程挖掘用于從學生的考試跟蹤中發現學生的行為,或者從一系列課程,年級或者每一個同學。[22]

G.文本挖掘。文本挖掘也叫做文本數據挖掘或者文本分析,從文本中取得高質量的信息。檢點的文本挖掘任務包括文本分類,文本聚類,概念提取,粒度分類,情緒分析,文件總結和實體關系模型。在教育數據挖掘工作中,文本挖掘主要用于討論委員會,論壇,聊天,網頁,文件諸如此類的內容分析。[23]

H.提煉人類判斷的數據。主要使用總結,可視化,人機交互界面等智能方法強調有用信息和決策支持。一方面,從獲得教育數據描述性停機到獲得全球數據的特征和總結,和學習者的報告等方式變得更加容易,另外一方面,信息的可視化和圖表技術的應用對探索和理解大量的教育數據一目了然。在教育數據挖掘工程中,同樣也是以人工判斷提煉著名就是已經用用幫助教師來對學生的課程表現和使用信息的情況進行可視化表現和分析。[24]

I.模型發現。模型發現的目的是使用某一現象(例如,使用預測,聚類,手工知識工程)的有效模型作為另外一種分析,例如預測或者關系挖掘的組成部分。[25]這個在教育數據挖掘上是一個很突出的辦法,也能夠支持學生行為和學生特征或者上下文變量之間的關系鑒定,著用廣泛內容的研究問題分析,已經心理測量模型架構的一體化已經應用于學習模型。[26]

J.知識跟蹤。知識跟蹤(KT)是一種有效評估學生掌握認知導學系統的技巧。[27]主要應用于認知模型,將問題解決的項目用需要的技巧,學生正確或者不正確答案的日志來回到某一技巧所需要的知識。知識跟蹤學生知識和通過四個變量來設置參數。這個作為貝葉斯網絡的一種迭代公式。

K.非負矩陣分析。非負矩陣分解NMF是一種新矩陣分解算法,自《Nature》1999年刊登了兩位科學家D.D. Lee和H.S.Seung有關非負矩陣研究的成果后,此分解算法逐漸被人們接受并應用到各種領域。NMF的基本思想可以簡單描述為:對于任意給定的一個非負矩陣M,NMF算法能夠尋找到一個非負矩陣Q和一個非負矩陣S,使得滿足M=QS,從而將一個非負的矩陣分解為左右兩個非負矩陣的乘積。NMF分解算法相較于傳統的一些算法而言,具有實現上的簡便性、分解形式和分解結果上的可解釋性,以及占用存儲空間少等諸多優點。通過矩陣分解,一方面將描述問題的矩陣的維數進行削減,另一方面也可以對大量的數據進行壓縮和概括。有很多NMF算法和不同的解決辦法。NMF構成了正數,同時也是兩個較小矩陣的結果。

M = S t u d e n t1 S t u d e n t2 … … S t u d e n tjI t e m 1 M11 M12 …I t e m 2 M21 ……………I t e m i … MijQ * S S k i l l1 … S k i l lkI t e m1 Q11 Q 1 2 …I t e m2 Q21 …… … …I t e mi … Q i k S t u d e n t1S t u d e n t2 … …S k i l l1 S11 S12 …… S21 …S k i l lk … …

(2)教育數據挖掘的應用環境

教育數據挖掘的應用環境日趨復雜,主要分為傳統教育環境和計算機網絡環境。每一個環境都提供了不同形式的數據資源,根據可利用數據的屬性和具體的問題,需要采取不同的方式進行處理。

A.傳統教育。傳統教育主要是教師與學生之間通過面對面的交流,例如演講、課堂討論、小組練習、個人作業等形式。這些環境下手機學生出勤率、分數、課程目標和個人計劃等數據信息。同時傳統的教育機構也會存儲著形式多樣的資料[28]:傳統數據庫(學生信息、教師信息、班級和課堂安排信息)、在線網絡信息等。在傳統課堂上一般會通過試卷或者觀察來監控學生的學習過程,分析他們的學習。[29]

B.計算機教育系統。計算機系統在商業領域已經有了成熟的應用。但是在教育系統中的應用還是處于成長期。計算機教育系統根據用戶的研究領域不同,而將不同的風格加以融合。該系統根據確立的目標(例如,教材、學習、問題解決、管理課件等),應用學習理論(客觀論、認知理論和社會學理論)來設置相應的功能(例如,個性化,智能化等),并且運用技術平臺來進行教學實踐活動,其中智能導學系統(ITS)完成問題引入、操作和實驗室儀器的管理等任務。[30]而智能化教育系統(AIWBES)就是將智能應用到課程、內容、排序、評估和學習等方面,以滿足不同的教育目標。而其他的計算機教育系統將重點放在用戶體驗方面,例如學生模型、評估和教師支持等。

我們認為,教育數據挖掘系統主要有以下幾種技術特征:

功能模塊化。單一的教育數據挖掘工具已經無法滿足“智慧教育”學習環境建構中對于教育數據挖掘的多樣化要求。教育數據挖掘的計算機應用系統要滿足利益相關者的各種需求,就需要強調對多種工具、技術的模塊化聚合。不同功能和特征的模塊集成為一個教育數據挖掘應用系統,模塊內高內聚,不同模塊間低耦合,針對不同的數據源采用統一的模塊進行處理和分析。系統內的模塊可以有工具集、插件等多種形式。

分析結果的可視化。教育數據挖掘的結果是面向不同的學習者和教學者,已經研究者。這就強調教育數據挖掘的結果報告一定要滿足不同人群的需要和理解能力。因此,可視化呈現時教育數據挖掘結果需求所在。

數據多源化。教育數據挖掘的應用系統已經不再局限于各類數據化學習環境,如Sakai,Moodle等,而是超越LMS嘗試對多源的教育數據進行處理。這些數據來源可以正式學習環境下的LMS數據、機構管理系統數據(學生檔案、學生基本信息等)、也可以是非正式學習環境下的各種學習行為痕跡采集。Ryan S.J.d.Baker在2013年教育數據挖掘研究進展大會(孟菲斯)提出教育數據挖掘的工作正處于一個復雜而又不斷變化的世界中。[31]

(3)教育數據挖掘的關鍵性應用

教育數據的研究者不僅針對教育軟件,計算機支持合作學習,計算機應用測試等個人學習的分析,同時也對學生失敗或者課程的因素分析。

教育數據挖掘應用在學生模型的提高。學生模型表示學生特征或者狀態的信息,例如學生當前的知識,動機,外在識別和態度。不同的學生個體建模需要軟件來對于個體的差異進行區別和反應,這樣才能夠顯著提高學生學習。教育數據挖掘的方法能讓研究者對于重要的相關的學生在真正時間范圍內進行研究,例如高水平的構建而不是之前的可能性。例如,最近幾年,研究者用教育數據挖掘的方法來鑒定學生是否在教育系統中作弊或者很差的自我效益。未完成任務,或者甚至一個學生覺得無聊或者失望。研究者也能夠延伸學生模型甚至超過教育軟件,目的是計算出預測學生失敗]或者為保留大學課程的因素。

發現或者提供領域知識結構的模型 從機器學習文件中將心理學模型與空間搜索算法結合,仍然有很多的研究者開發自動獲取準確領域結構的模型,直接從數據著手。例如,Barnes已經開發了一種能夠自動發現Q矩陣的算法來分析數據[32],Desmarai已經開發了一個算法來發現部分順序知識結構(POKS)模型,解釋領域知識的相互關系。[33]

第三個關鍵應用是研究教育支持 (在學習軟件,其他領域中,例如合作學習行為),面向發現什么類型的教育支持最有效。不同分組的學生或者不同情況下的學生。學習教育學支持最受歡迎的一個方法就是學習分解適合支持。

第四個關鍵的應用就是教育數據挖掘能夠去定義或者擴展教育的理論,對于影響學習的關鍵性因素就能夠獲得更為深入的理解,經常是用于設計一個更好的學習系統。例如,Gong,Rai和Heffernan(2009)調查了自我理論在學習上的影響,研究發現與學習相關的知識輸入越多,那么就會在學習中更少犯錯誤,而關于學習本身的影響力也是有限的。[34]Perera使用五大合作理論作為驅動理論來對于學生小組成功交流的框架。[35]Madhyastha和Tanimoto評估了一致性和學生表現之間的關系,用這個目的去指導支架式教學,基于他們的工作對于學生行為的一致性影響的超前理論。[36]

四、教育數據挖掘在大數據背景下面臨的挑戰和愿景

國際著名學術期刊《自然》和《科學》分別于2008年和2011年推出大數據專欄,在教育領域,哈佛大學、斯坦福大學、耶魯大學等世界知名大學也啟動了教育大數據研究項目。可見,大數據時代已經到來,這并將改變教育的傳統形式,在未來具有廣闊的應用前景,然而,由于種種限制,部分大數據相關應用還處于探索研究階段,筆者認為,大數據時代背景下教育數據挖掘的全面應用主要面臨兩方面的挑戰:

(1)技術層面的挑戰。大數據的應用基礎是對海量數據的存儲,因而數據處理和分析技術必須跟上信息技術發展的步伐,這就包括計算機的數據處理能力、大型超級計算機算法技術開發等。其次,教育數據挖掘的核心環節是數據采集和問題分析,應用開發這需要面對的就是采集數據技術和學習分析技術的挑戰。最后,不得不提的是數據存儲系統的兼容性問題。目前,還沒有制定教育數據的標準形式,沒有統一的數據平臺,這就對我們計算機兼容性提出了嚴峻的挑戰。

(2)組織管理的挑戰。眾所周知,大數據的最大特點在于其“混雜性”,這種“混雜性”不僅表現在不同國家、地區和學校之間數據背景的差別,也表現在不同教師和研究人員對數據的期望也千差萬別。因此,提升數據使用者的綜合素質是我們開展數據挖掘工作的關鍵。

我們已經進入了一個“數據驅動學校,分析變革教育”的大數據時代,大數據必將改變傳統教育的形式,“數據驅動決策”已經成為教育發展的潮流趨勢。發達國家已經意識到大數據背景下教育的機遇與挑戰,將大數據提升到國家戰略地位,雖然我國教育數據挖掘工作還處于起步階段,但是我們相信,只要我們整合現有資源,恰當運用數據挖掘技術優化教育規劃和管理、提高教育教學質量,這不僅是必要的,也是一定能夠做到的。

[1]Mayer-Sch?nberger V,Cukier K.Big data:A revolution that will transform how we live,work,and think[M].Houghton Mifflin Harcourt,2013.

[2]頁川.大數據時代背景下挖掘教育數據的價值——教育部科學技術研究重點項目成果《教育數據挖掘:方法與應用》出版[J].中國遠程教育,2013(4):94.

[3]Bala M,Ojha D B.Study of applications of data mining techniques in education[J].International J Res Sci Technol,2012,1:1-10.

[4]中華人民共和國教育部.教育信息化十年發展規劃 (2011-2020年)[EB/OL].[2012-03-13].http://www. edu.cn/zong_he_870/20120330/t20120330_760603.shtml.

[5]Han J W,Micheline K.數據挖掘概念與技術[M].范明,孟曉峰譯.北京:機械工業出版社,2001.

[6]Luan,Jing."Data mining and its applications in higher education."New directions for institutional research 2002.113(2002):17-36.

[7][25]Baker RSJd,Yacef K.The state of educational data mining in 2009:a review and future visions.J Edu Data Min 2009,3–17.CAS

[8][14]Romero,C.,Ventura,S.,Pechenizkiy,M.,& Baker,R.S.(Eds.).(2011).Handbook of educational data mining.CRC Press.

[9]Siemens,George,and Ryan SJ d Baker."Learning analytics and educational data mining:towards communication and collaboration."Proceedings of the 2nd international conference on learning analytics and knowledge. ACM,2012.

[10]Romero,Cristóbal,Sebastián Ventura,and Enrique García."Data mining in course management systems: Moodle case study and tutorial."Computers&Education 51.1(2008):368-384.

[11]Romero,Cristóbal,and Sebastian Ventura."Educational data mining:A survey from 1995 to 2005."Expert systems with applications 33.1(2007):135-146.

[12]Baker,Ryan SJD,and Kalina Yacef."The state of educational data mining in 2009:A review and future visions."JEDM-Journal of Educational Data Mining 1.1 (2009):3-17.

[13]Romero,C.,and S.Ventura."Data Mining in E-learning(Advances in Management Information)."(2006).

[15]Romero C,Ventura S.Educational data mining:a review of the state of the art[J].Systems,Man,and Cybernetics,Part C:Applications and Reviews,IEEE Transactions on,2010,40(6):601-618.

[16]Romero C,Espejo P,Zafra A,Romero J,Ventura S.Web usage mining for predicting marks of students that use Moodle courses.Comput Appl Eng Edu J.In Press.

[17]BakerRSJd,GowdaSM,CorbettAT.Automatically detecting a student’s preparation for future learning:help useiskey.In:FourthInternationalConferenceonEducational Data Mining.Eindhoven,The Netherlands;2011,179-188.

[18]Vellido A,Castro F,Nebot A.Clustering Educational Data.Handbook of Educational Data Mining.Boca Raton,FL:Chapman and Hall/CRC Press;2011,75-92.

[19]Ueno M.Online outlier detection system for learning time data in e-learning and its evaluation.In:InternationalConferenceon Computersand Advanced Technology in Education.Beijiing,China;2004,248-253.

[20]Merceron A,Yacef K.Measuring correlation of strong symmetric association rules in educational data.In Romero C,Ventura S,Pechenizkiy M,Baker RSJd,eds. Handbook of Educational Data Mining.Boca Raton,FL: CRC Press;2010,245-256.

[21]Rabbany R,Takaffoli M,Za¨?ane O.Analyzing participation of students in online courses using social network analysis techniques.In:International Conference on Educational Data Mining.Eindhoven,The Netherlands; 2011,21-30.

[22]Trˇcka N,Pechenizkiy M,van der Aalst W.Process mining from educational data.Handbook of Educational Data Mining.Boca Raton,FL:CRC Press;2011, 123-142.

[23]Tane J,Schmitz C,Stumme G.Semantic resource management for the web:an e-learning application.In:International Conference of the WWW.New York;2004, 1-10.

[24]Mazza R,Milani C.GISMO:a graphical interactive student monitoring tool for course management systems.In:International Conference on Technology Enhanced Learning.Milan,Italy;2004,1-8.

[26]Bienkowski M,Feng M,Means B.Enhancing teaching and learning through educational data mining and learning analytics:an issue brief.Washington,D.C.:Office of Educational Technology,U.S.Department of Education;2012,1-57.

[27]Corbett A,Anderson J.Knowledge tracing:modeling the acquisition of procedural knowledge.User Model User-Adapted Interact 1995,4:253-278.

Corbett A,Anderson J.Knowledge tracing:modeling the acquisition of procedural knowledge.User Model User-Adapted Interact 1995,4:253-278.

[28]Ma Y,Liu B,Wong C,Yu P,Lee S.Targeting the right students using data mining.In:KDD ‘00:Proceedings Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.2000,457-464.

[29]student failure at school using genetic programming and different data mining approaches with high dimensional and imbalanced data.Appl Intell.In Press.

[30]Mostow J,Beck J.Some useful tactics to modify, map and mine data from intelligent tutors.J Nat Lang Eng 2006,12:195-208.

[31]San Pedro,Maria Ofelia Z.,et al."Predicting college enrollment from student interaction with an intelligent tutoring system in middle school."Proceedings.

[32]the 6th international conference on educational data mining.2013.Johnson M,Barnes T.EDM visualization tool:watching students learn.In:Third International.

[33]Conference on Educational Data Mining.Pittsburgh,PA;2010,297-298.Desmarais MC.Mapping question items to skills with non-negative matrix factorization. ACM SIGKDD Explor 2011,13:30–36.

[34]Gong,Yue,et al."Does Self-Discipline Impact Students'Knowledge and Learning?."International Working Group on Educational Data Mining(2009).

[35]PERERA,D.,KAY,J.,KOPRINSKA,I.,YACEF, K.and ZAIANE,O.2009.Clustering and sequential pattern mining to support team learning.IEEE Transactions on Knowledge and Data Engineering 21,759-772

[36]MADHYASTHA,T.and TANIMOTO,S.2009. Student Consistency and Implications for Feedback in Online Assessment Systems.In Proceedings of the 2nd International Conference on Educational Data Mining,81-90.

(編輯:王曉明)

TP393

:A

:1673-8454(2017)07-0037-08

2015年度華南理工大學高等教育研究基金項目“基于教育質量指數的學科發展質量監測評估研究”(gj2015005);華南理工大學發展戰略與學科建設研究課題“學位點合格評估與動態調整機制研究”。

猜你喜歡
數據挖掘分析教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
教育有道——關于閩派教育的一點思考
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
辦好人民滿意的首都教育
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 日韩精品成人网页视频在线| 91成人试看福利体验区| 亚洲无码久久久久| www.国产福利| 国产在线精品99一区不卡| 欧美不卡二区| 亚洲第一av网站| 亚洲欧美另类中文字幕| 日本免费a视频| 999在线免费视频| 91网在线| 黄色a一级视频| 国产精品原创不卡在线| 国模沟沟一区二区三区| 亚洲Aⅴ无码专区在线观看q| 99久久亚洲综合精品TS| 永久在线播放| 69免费在线视频| 精品久久久久成人码免费动漫 | 成人午夜福利视频| 天堂岛国av无码免费无禁网站 | 亚洲精品福利视频| 999精品视频在线| 亚洲精品卡2卡3卡4卡5卡区| 亚州AV秘 一区二区三区| 91免费国产在线观看尤物| 超薄丝袜足j国产在线视频| 亚洲欧美成aⅴ人在线观看| 一级香蕉人体视频| 国产浮力第一页永久地址| 精品人妻AV区| 亚洲精品午夜无码电影网| 精品久久人人爽人人玩人人妻| 久久精品电影| 国产精品精品视频| 日韩国产精品无码一区二区三区 | 亚洲乱码在线视频| 欧美性猛交一区二区三区| 国产成人高清精品免费| 国产精品亚洲一区二区三区z| 538国产在线| 2021天堂在线亚洲精品专区| 亚洲男人天堂2020| 国产一级裸网站| 高清码无在线看| 香蕉视频国产精品人| 美女被操91视频| 亚洲国产成人久久精品软件| 国产精品一线天| 日韩无码视频专区| 日本在线亚洲| 国产99久久亚洲综合精品西瓜tv| 亚洲大尺度在线| 久久亚洲精少妇毛片午夜无码| 亚洲综合九九| 精品久久久久无码| 欧美人与牲动交a欧美精品 | 久久精品无码一区二区国产区| 毛片最新网址| 四虎综合网| 久久不卡国产精品无码| 欧美日韩高清在线| 农村乱人伦一区二区| 一本综合久久| 久久精品国产精品一区二区| 成人福利在线观看| 在线播放91| 亚洲无线观看| 在线日本国产成人免费的| 一级毛片在线播放| 日本精品影院| 亚洲视频a| 天天做天天爱夜夜爽毛片毛片| 国产打屁股免费区网站| 精品国产成人国产在线| 操操操综合网| 福利小视频在线播放| 国产亚洲精久久久久久久91| 久久中文字幕2021精品| 欧美日韩国产成人高清视频| 亚洲系列无码专区偷窥无码| 91久久精品国产|