王傳根+吳昊+劉路路



摘要:隨著大數據時代的到來,對當前教學、學習考核思維模式都有了新的發展需求,文章探討了當前教育大數據的存儲方式,如何對大數據進行挖掘、提煉進而分析教育大數據。這些方法對教師來說可以提高教學質量、掌握學習者的學習特征,從而針對不同的學習者給出需要的教學內容和形式,從而提高學習效率。
關鍵詞:大數據;數據挖掘;數據分析;大數據存儲
中圖分類號:G434 文獻標志碼:A 文章編號:1674-9324(2017)42-0213-03
一、引言
當前,教育信息化已成為成主流趨勢,其應用方面,如Web考試系統,技術也相當成熟,但在考試過程控制、題庫管理等方面還存在一定的問題,主要是考生的考試結果系統不能實時保存,如此考試的一些重要參數無法統計,也就很難實現對考試的客觀評價;另外還有如電子白板、在線課程、各種多媒體應用軟件等,但這些信息化技術最大的不足之處就是缺乏對課程信息的分析[1]。在大數據背景下,其目的是發掘數據是否有關系,然后透過數據之間的關系來預測下一步要發生的事情[2]。相關關系的核心是量化數據之間的關系。大數據時代有其重要的特征,如數字數據矚目的速率增長,人們的生活、生產方式也發生著前所未有的變化,這些新特點,也是當前的課程教學、考核改革方向的熱點。大數據具有三個特征[3]:數據量大、數據產生得快、數據具有多樣性。第一,由于課程的學習者、考核數據、評估數據等規模都非常大,因此用來學習的樣本量本身就很大,并且,在此系統運行過程中會產生新的數據,這些數據通常在運行過程中是指數倍增長,往往超出一般數據庫軟件所能捕捉、存儲和分析的數據量。第二,大數據往往是在課程學習、分析等過程中新產生的數據,這些數據是即時產生,而不是事件發生后去采集的。第三,大數據擁有非常多的數據類型,課程中的每個學習步驟,都可以跟蹤采集相關學習行為的數據,如觀看學習視頻時間長度、平時測試的分數、通過率、課程討論發帖數量、發帖的質量等,這樣的數據采集也是不容易的,需要一定的軟硬件環境。從這三個特征我們也可以發現,大數據時代背景下,課程的學習模式、教學模式、考核模式等都是通過對大量數據的獲取以此產生新的數據并進行分析,從而科學地進行課程改革,提高學習效率。文中主要討論如何確立數據的高效存儲、如何確保數據的高質量性,以及如何對數據進行分析以保障課程教學和學生學習質量。
二、大數據存儲技術
大數據時代,數據的多樣性以及數據量的豐富使得早期的關系數據存儲方式已經很難滿足現實的需求,存儲問題也是當前大數據時代急需解決的問題。大數據時代的另一個概念就是云存儲。當前,信息資源以海量形式存儲于“云”上已經成為一種趨勢。基于大數據的課程教學、學習結合“云計算”的存儲技術來實現的大數據存儲環境,可根據數據的類型、結構不同而選擇不同的數據存儲方案,使各種類的數據及時、高效地同步到數據的“云”中心。大數據存儲管理是一項系統工程[4],是多種技術的協同工作。目前比較主流的是分布式文件系統(DFS,Distributed File System),本質上這是一個基于C/S的應用程序,通常包括主控節點、多個數據節點和各種大數據應用或者終端用戶組成的客戶端。分布式存儲的目的是將大數據劃分為小數據,均勻分布至多個數據節點上,將數據的規模降到單個節點可以處理的程度,其結構如圖1所示:
三、基于大數據的學習評估
當前,隨著大數據的浪潮,大數據處理與分析已經成為教育領域改革與發展的熱點,世界各國政府和教育行政部門都對此高度重視。2012年美國教育部發布了《通過教育數據挖掘和學習分析促進教與學》的報告。其主要內容是要求對教育大數據進行分析挖掘,獲取有用的信息,促進美國的教育發展[2]。通過上節的分析可知當前教育大數據的存取有了較為可靠的技術基礎,但通常我們獲取的只是教育大數據的原始信息數據,如圖2所示,只有通過設計各種相應的算法對各種采集到的原始教育數據進行挖掘,開發相應的學習分析模型軟件,發現影響教育各因素之間的關系,并實現賦予這些影響教育的因素的相關意義,才能使這些因素數據轉變為信息;并經過進一步的分析和綜合,形成知識;最后通過實踐運用,知識才上升到智慧層次[5]。從圖2可以知道,大量的原始數據經過一步步處理、提煉、挖掘、分析得到我們想要的能夠應用的智慧信息。因此,教育數據挖掘和學習分析技術是大數據學習評估的關鍵技術。
1.教育數據挖掘。教育數據挖掘是運用數理統計、人工智能與機器學習和數據挖掘等數學和計算機技術等多種技術,對原始教育大數據進行分析處理,通過數理統計知識來構建相應的數據模型,對學習結果、學習內容、學習資源以及教學行為等各種變量之間的相互關系進行分析[6],當然,這種分析是通過設計的數據挖掘算法來實現的,分析的結果要求能較好地預測學習者后面所想要學習的內容(當然是根據當前推導而來),并為教育管理者、學習者、教育教學研究者以及教學軟件開發者提供信息,實現教育系統中教育資源的良性互動,最終實現改進學習的目的。數據挖掘還可以區分優等生和差生(這里強調的考試成績)的一些學習特征,如隨堂測試的分數、參與課堂討論的頻度等。因此,教育數據挖掘主要是對大量數據的分析后對學生的學習狀況,以及未來學習趨勢進行的一般反饋,不具備量體裁衣的功能,但具有指導性意義[7]。教育數據挖掘流程具體如圖3所示。
2.學習分析。學習分析與教育數據挖掘研究的對象有所區別,數據挖掘研究的對象應該是一個集合,但學習分析的研究對象主要是學習者個體、個體特定的學習環境,目的是通過對教育大數據的分析和建模即數據挖掘來進行知識發現,預測學習者潛在的問題,通過這些發掘點,我們可以設計相應的、針對個體本身的課程內容和形式來幫助對應有學習問題的學習者,同時也可以幫助教師改進教學方法和設計針對個體的教學方案[8]。學習分析強調針對個體學習的特征,例如設計適應學習者水平和能力的教學內容,對于學習有困難、有障礙的學習者進行干預,提供反饋等[9]。endprint
學習分析具體過程如圖4所示。首先,學習者對當前的教學內容以及教學方式進行學習,在這個過程中會產生大量數據,數據按照特定的存儲模式如DFS模式進行存儲。之后,系統會對存儲的數據進行挖掘、提煉,并保存結果進行大數據學習分析,這樣可以通過分析對學習者的特征進行歸類,并通過預測模型對課程內容和教學環節順序進行調整。如可以降低或者加大課程內容難度、提供更多的先修課程。對于教師和教學研究者,通過基于教育數據挖掘結果和大數據的學習分析,可以對學習有困難、有障礙的學生進行干預,對個體進行方案的調整。學習分析對數據基本沒有要求,可以是結構化數據也可以是非結構化的數據甚至是多媒體數據[10]。結構化數據往往指量化的數據,包括平時作業和平時測驗成績、考試成績、學習過程中發生的時間、次數等數據;非結構化數據一般指在線發帖子、作業內容、參與小組報告等;對媒體數據往往是學習者上傳或者下載的學習視頻、PPT課件等,這些數據構成了我們當前學習評估的新方向。例如教育數據挖掘過去評估較為簡單,即考試分數,還有一些過程性評估大都通過模糊的方式來對學習行為進行大概的描述。當前,通過教育大數據的分析可以準確、實時地跟蹤和記錄學習者發生的行為,這也必然會帶來教育研究質量的提升、研究范圍的拓展以及研究深度的挖掘[11]。
四、結論
大數據作為信息技術發展的新趨勢,同樣對于當前教育改革也是重要因素。在大數據時代這樣的背景下,教育領域同樣蘊藏著具有廣泛應用價值的海量數據,如何對這些海量數據進行提煉以便更好地指導我們的學習是研究的關鍵。文中主要討論了學習分析和數據挖掘這兩大大數據在教育領域處理的關鍵技術。教育數據挖掘可以對獲取的大數據進行統計、分析、綜合和推理,發掘數據之間的關聯以及規則,做出教育預測和決策;大數據的教育學習分析對學習者提供干預,設計相應的適應于個人的學習方案,同時對教育工作者或者教學管理者的教學方式、教學內容、教學設計提供方案,使教學實踐活動轉向關注個體,這將有利于促進教育公平。盡管基于教育大數據分析給我們展現了美好的愿望,但實現這一系列的數據采集、存儲以及分析面臨著較多的困難。第一,當前大數據挖掘和學習分析的分析者和管理者嚴重匱乏,獲取大數據的數據量遠遠不夠;第二,缺乏數據共享的政策保障;第三,數據采集和分析如何確保個人隱私保護;第四,由于大數據分析和傳輸對硬件和軟件的要求很高,這就需要有足夠的硬件和軟件資源。這都是亟待解決的問題[10]。
參考文獻:
[1]張燕南,胡繼岳.關于大數據應用與教育的思考[J].中國電力教育,2013,3(32):5-7.
[2]徐鵬,王以寧,劉艷華,張海.大數據視角分析學習變革——美國《通過教育數據挖掘和學習分析促進教與學》報告解讀及啟示[J].遠程教育雜志,2013,(6):11-17.
[3]http://en.weikipedia.org/wiki/Big_data.
[4]Jeffery D,Ghemawat S. MapReduce:simplified data processing on large clusters [J].Communications of the ACM,2008,51(1):107-113.
[5]馬婧,韓錫斌,周潛,程建鋼.基于學習分析的高校師生在線教學群體行為的實證研究[J].電化教育研究,2014,(2):13-18.
[6]魏順平.教育數據的挖掘、分析、應用[J].中小學信息技術教育,2013,(10):18-21.
[7]夏火松.數據倉庫與數據挖掘技術[M].北京:科學出版社,2004:124-205.
[8]楊慶安,趙偉男,張海.大數據在教育領域應用的學習分析框架構建[J].軟件導刊:教育技術,2013,12(5):88-89.
[9]張羽.教育政策定量評估方法中的因果推斷模型以及混合方法的啟示[J].清華大學教育研究,2013,34(3):29-40.
[10]張羽,李越.基于MOOCs大數據的學習分析和教育測量介紹[J].清華大學教育研究,2013,4(34):22-26.
[11]James Manyika,Micehael Chui,Brad Brown,et al."Big data:The Next Frontier for Innovation,Competition,and Productivity" McKinsey Global Institute(2011).endprint