999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

教育大數(shù)據(jù)分析研究

2021-01-14 12:20:57湯?,|胡秋玲
關(guān)鍵詞:分析課程研究

湯?,|,胡秋玲

(湖南第一師范學(xué)院a 信息科學(xué)與工程學(xué)院;b 圖書館,湖南 長(zhǎng)沙 410205)

教育大數(shù)據(jù)的出現(xiàn)至少要?dú)w因于數(shù)字時(shí)代的兩大趨勢(shì)。第一,傳統(tǒng)教育機(jī)構(gòu)產(chǎn)生了大量標(biāo)準(zhǔn)化教育信息。具體而言,學(xué)生信息系統(tǒng)已被廣泛用于存儲(chǔ)和組織學(xué)生的個(gè)人資料信息(例如人員統(tǒng)計(jì)、學(xué)術(shù)背景)和學(xué)術(shù)記錄(例如課程注冊(cè)和最終成績(jī))。這些數(shù)據(jù)往往涉及到幾十年來在某個(gè)教育機(jī)構(gòu)學(xué)習(xí)的學(xué)生,這些機(jī)構(gòu)的學(xué)生信息系統(tǒng)使得大規(guī)模管理和分析這些數(shù)據(jù)成為可能。第二,某些在面對(duì)面的課堂上很難記錄的學(xué)習(xí)行為現(xiàn)在可以被學(xué)習(xí)管理系統(tǒng)捕獲。在大多數(shù)情況下,教師使用學(xué)習(xí)管理系統(tǒng)分發(fā)教學(xué)材料、處理學(xué)生作業(yè)以及與學(xué)生溝通交流。就某一學(xué)生而言,從點(diǎn)擊課程模塊到修改提交的論文,這些帶有時(shí)間戳的日志相當(dāng)于數(shù)千個(gè)數(shù)據(jù)點(diǎn)。除了學(xué)生信息系統(tǒng)和學(xué)習(xí)管理系統(tǒng)之外,數(shù)字學(xué)習(xí)環(huán)境(如各種社交網(wǎng)絡(luò)、論壇、基于教育游戲的學(xué)習(xí)環(huán)境、學(xué)習(xí)存儲(chǔ)庫(kù)、虛擬環(huán)境、無處不在的計(jì)算環(huán)境等等)中的創(chuàng)新技術(shù)能夠跟蹤和收集學(xué)生的各種數(shù)字足跡,也產(chǎn)生大量異構(gòu)和多模態(tài)的數(shù)據(jù)。

教育大數(shù)據(jù)具有數(shù)量大、更新速度快、多樣化等特點(diǎn),對(duì)分析學(xué)習(xí)者行為具有很高的價(jià)值。教育大數(shù)據(jù)為解決以前代價(jià)高昂甚至不可能回答的問題提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。通過跟蹤學(xué)生行為的數(shù)字足跡,研究人員能夠更精細(xì)地把握學(xué)習(xí)過程。通過將行為數(shù)據(jù)與心理調(diào)查表結(jié)合,研究人員可以將學(xué)生的行動(dòng)序列映射到認(rèn)知特征上,并驗(yàn)證觀察到的行為痕跡是否與理論假設(shè)一致,從而有針對(duì)性地完善學(xué)習(xí)理論。豐富的教育大數(shù)據(jù)有助于人們了解具體教育政策的影響,并解決與政策有關(guān)的問題。例如,將學(xué)習(xí)過程數(shù)據(jù)和管理數(shù)據(jù)關(guān)聯(lián)起來可以揭示各種教育不平等現(xiàn)象的細(xì)微差別,并能以更短的反饋周期為采取切實(shí)的行動(dòng)提供依據(jù)。幾十年來,人們一直在尋找與一對(duì)一輔導(dǎo)相媲美的有效教學(xué)方法,而教育大數(shù)據(jù)及其分析結(jié)果可用于探索學(xué)生的學(xué)習(xí)軌跡,設(shè)計(jì)自適應(yīng)和個(gè)性化的學(xué)習(xí)環(huán)境,使個(gè)性化教學(xué)從理想走向現(xiàn)實(shí)。在教育界,越來越多的人希望通過分析教育大數(shù)據(jù)提高學(xué)習(xí)成績(jī)、推薦課程、分析學(xué)習(xí)模式、預(yù)測(cè)輟學(xué)率、提高教師工作效率、減少管理工作量等等。大數(shù)據(jù)分析正在改變教育行業(yè),并為學(xué)習(xí)者和教師提供新的機(jī)會(huì)。

目前,國(guó)內(nèi)教育大數(shù)據(jù)的研究論文不少,但是,這些論文往往局限于教育數(shù)據(jù)挖掘和學(xué)習(xí)分析兩大研究領(lǐng)域中的一個(gè)或兩個(gè),全局性的分析文章還不多見。本文致力于填補(bǔ)這一空白,全景展現(xiàn)教育大數(shù)據(jù)的分類層次、平臺(tái)技術(shù)、研究主題和面臨的挑戰(zhàn)。首先從微觀層面、中間層面和宏觀層面深入探討教育大數(shù)據(jù)的內(nèi)涵和外延,然后闡明教育大數(shù)據(jù)的各種平臺(tái)處理技術(shù),最后重點(diǎn)分析教育大數(shù)據(jù)的主要研究方向和面臨的挑戰(zhàn)。

一、教育大數(shù)據(jù)的層次

為了更好地理解教育大數(shù)據(jù)的作用,我們從三個(gè)層面對(duì)其進(jìn)行考察,即微觀層面(如點(diǎn)擊流數(shù)據(jù))、中間層面(如文本數(shù)據(jù))和宏觀層面(如機(jī)構(gòu)數(shù)據(jù))。在微觀層面,教育大數(shù)據(jù)是細(xì)粒度的交互式數(shù)據(jù),活動(dòng)之間的間隔短至數(shù)秒。大多數(shù)微觀層面的數(shù)據(jù)是學(xué)習(xí)者與其學(xué)習(xí)環(huán)境交互時(shí)被自動(dòng)收集的,這些環(huán)境包括智能家教系統(tǒng)、大規(guī)模在線開放課程(MOOC)、模擬仿真和游戲等等。中間層面的大數(shù)據(jù)涵蓋了學(xué)生在智能輔導(dǎo)系統(tǒng)、在線論壇、社交媒體等學(xué)習(xí)環(huán)境中進(jìn)行寫作活動(dòng)產(chǎn)生的各種數(shù)據(jù)。這些在自然狀態(tài)下被系統(tǒng)捕獲的原始數(shù)據(jù)能夠反映學(xué)習(xí)者的認(rèn)知能力、社交能力和學(xué)習(xí)情感狀態(tài)等。宏觀層面的教育大數(shù)據(jù)由各教育機(jī)構(gòu)產(chǎn)生。具體的例子包括學(xué)生人員統(tǒng)計(jì)、入學(xué)數(shù)據(jù)、校園服務(wù)數(shù)據(jù)、課程時(shí)間表和課程注冊(cè)數(shù)據(jù)、大學(xué)專業(yè)要求和學(xué)位完成數(shù)據(jù)等。宏觀層面的教學(xué)數(shù)據(jù)通常是在很多年的時(shí)間跨度內(nèi)收集的,很少更新,通常每個(gè)學(xué)期只更新一到兩次(例如,課程表信息,成績(jī)記錄)。值得注意的是,這些微觀/中間/宏觀層面的分類不應(yīng)該被視為嚴(yán)格不同的層次,因?yàn)樗鼈冊(cè)诿總€(gè)數(shù)據(jù)源中可能有相當(dāng)多的重疊。例如,智能輔導(dǎo)系統(tǒng)中的擊鍵日志是微觀層面的數(shù)據(jù),這些數(shù)據(jù)又可以表征寫入行為(例如,突發(fā)寫入、編輯過程等),而書面文本的內(nèi)容和語言特征代表了可以用自然語言處理技術(shù)分析的中間層數(shù)據(jù)。類似地,社交媒體交互活動(dòng)通常涉及微觀層面的時(shí)間戳(有時(shí)還需要位置信息),以及每個(gè)帖子的中間層數(shù)據(jù)。

二、教育大數(shù)據(jù)的技術(shù)平臺(tái)

Hadoop、Spark 和Samza 是目前比較流行的大數(shù)據(jù)分析系統(tǒng)。Hadoop 用于復(fù)雜的離線教育大數(shù)據(jù)處理,Spark 經(jīng)常用于離線快速教育大數(shù)據(jù)處理,Samza 主要用于解決流式教育數(shù)據(jù)處理過程中的的高數(shù)據(jù)率和大數(shù)據(jù)量問題。

(一)Hadoop 平臺(tái)

Hadoop 是一種開源框架,由一組實(shí)用程序構(gòu)成[1]。它使用簡(jiǎn)單的編程模型跨計(jì)算機(jī)集群分布式處理大型數(shù)據(jù)集,具有低成本、高效率、高可靠性、高可擴(kuò)展性和高容錯(cuò)能力。Hadoop 包括一些核心模塊,底層是hadoop 分布式文件系統(tǒng)HDFS,存儲(chǔ)了Hadoop 集群中所有存儲(chǔ)節(jié)點(diǎn)上的文件。HDFS之 上 是 由 JobTrackers 和 TaskTrackers 構(gòu) 成 的MapReduce 引擎。除此之外還包括數(shù)據(jù)倉(cāng)庫(kù)工具Hive 和非關(guān)系型數(shù)據(jù)庫(kù)NoSQL 等模塊。

(二)Spark 平臺(tái)

Apache Spark 是一個(gè)統(tǒng)一的分布式內(nèi)存計(jì)算引擎[2]。Spark 的設(shè)計(jì)目標(biāo)是為編寫大數(shù)據(jù)應(yīng)用程序提供一個(gè)統(tǒng)一的平臺(tái),它的應(yīng)用范圍限制在計(jì)算引擎之內(nèi),從存儲(chǔ)系統(tǒng)加載數(shù)據(jù)并計(jì)算,但最終結(jié)果并不永久存儲(chǔ)在Spark 中,Spark 可以和多種存儲(chǔ)系統(tǒng)結(jié)合使用,如Kafka(一個(gè)開源的流處理平臺(tái))、Hbase(一種開源的分布式非關(guān)系型數(shù)據(jù)庫(kù))、Hive、HDFS 以及關(guān)系型數(shù)據(jù)庫(kù)。Apache Spark的局限性在于沒有文件管理系統(tǒng),需要與其他平臺(tái)集成,不支持完整的實(shí)時(shí)數(shù)據(jù)處理,內(nèi)存消耗非常高,小文件發(fā)行問題,等待時(shí)間較長(zhǎng),支持算法偏少,不能自動(dòng)處理背壓,需要手動(dòng)優(yōu)化等。

(三)Samza 平臺(tái)

Samza 是一個(gè)分布式的流式數(shù)據(jù)處理框架,它基于Hadoop 并使用Kafka 分布式消息系統(tǒng)處理實(shí)時(shí)數(shù)據(jù)[3]。Samza 的目標(biāo)是將數(shù)據(jù)流作為接收到的消息進(jìn)行處理,Samza 的數(shù)據(jù)流初始元素是一個(gè)消息,數(shù)據(jù)流是分區(qū)的,每個(gè)分區(qū)都有一個(gè)特定的ID(標(biāo)識(shí))或偏移量。Samza 將存儲(chǔ)和處理放在同一臺(tái)機(jī)器上,不加載額外的內(nèi)存,盡管Samza 主要是依賴于Hadoop 的Yarn 和Kafka,但是它的Execution模塊和Streaming 模塊是可插拔的。

三、教育大數(shù)據(jù)的研究方向

教育大數(shù)據(jù)研究可大致劃分為四個(gè)方向:學(xué)習(xí)者的行為和表現(xiàn)、大數(shù)據(jù)建模和教育數(shù)據(jù)倉(cāng)庫(kù)、教育體系的改進(jìn)、大數(shù)據(jù)融入課程。

(一)學(xué)習(xí)者的行為和表現(xiàn)

這一研究方向包括如下主題:學(xué)習(xí)分析、用戶行為和態(tài)度、適應(yīng)性學(xué)習(xí)和學(xué)習(xí)滿意度。

基于不斷增長(zhǎng)的教育大數(shù)據(jù),學(xué)習(xí)分析可以增強(qiáng)對(duì)學(xué)習(xí)行為的理解,為決策者、講師和學(xué)習(xí)者提供有用的建議,幫助教育從業(yè)者提高教學(xué)效率[4]。在學(xué)習(xí)分析領(lǐng)域中,許多研究已經(jīng)開展并取得了相關(guān)的成果[5]。值得注意的例子包括對(duì)學(xué)習(xí)者失敗風(fēng)險(xiǎn)的識(shí)別[6]和來自社區(qū)間互動(dòng)的數(shù)據(jù)流分析[7]。

學(xué)習(xí)管理系統(tǒng)(LMS)在高等教育教學(xué)模式中發(fā)揮著基礎(chǔ)性作用。通過學(xué)習(xí)管理系統(tǒng)分析學(xué)生的行為和態(tài)度并改善學(xué)習(xí)過程的新研究方向已經(jīng)出現(xiàn)。例如,Cantabella 介紹了一個(gè)在穆爾西亞天主教大學(xué)進(jìn)行的案例[8],該案例考慮了LMS 的訪問量、學(xué)生使用的工具及其相關(guān)事件并根據(jù)學(xué)生的學(xué)習(xí)方式(即校內(nèi)、網(wǎng)上和混合)分析了他們過去四年的行為。

自適應(yīng)學(xué)習(xí)系統(tǒng)通過持續(xù)的互動(dòng)為學(xué)習(xí)者提供建議。豐富而個(gè)性化的學(xué)習(xí)資源、及時(shí)的反饋系統(tǒng)、快速的溝通系統(tǒng)、自適應(yīng)的實(shí)時(shí)評(píng)估更符合個(gè)人需求。個(gè)性化自適應(yīng)學(xué)習(xí)已經(jīng)成為教育大數(shù)據(jù)研究的新范式。例如,有研究考慮到MOOC 用戶多、資源豐富,但缺乏自適應(yīng)學(xué)習(xí)的特點(diǎn),建立了以學(xué)習(xí)者認(rèn)知需求為中心的自適應(yīng)學(xué)習(xí)MOOC 教育大數(shù)據(jù)系統(tǒng)模型[9]。

在線學(xué)習(xí)平臺(tái)產(chǎn)生的教育大數(shù)據(jù)提供了與滿意度相關(guān)的各種信息如學(xué)習(xí)內(nèi)容、服務(wù)、互動(dòng)、努力程度等,它是一種適合實(shí)時(shí)處理的大數(shù)據(jù)集范式。教育大數(shù)據(jù)為在線課程提供了實(shí)施非侵入性和過程性評(píng)估策略的機(jī)會(huì),對(duì)傳統(tǒng)且耗時(shí)的收集反饋方式(如問卷調(diào)查)是一種有力的補(bǔ)充。例如,Elia G 設(shè)計(jì)了一種新方法,分析學(xué)生在線學(xué)習(xí)產(chǎn)生的數(shù)據(jù),評(píng)估學(xué)生對(duì)課程的滿意程度[10]。

(二)大數(shù)據(jù)建模和教育數(shù)據(jù)倉(cāng)庫(kù)

隨著學(xué)習(xí)人數(shù)的日益增加,在線學(xué)習(xí)門戶網(wǎng)站或在線教育系統(tǒng)跟蹤和記錄的數(shù)據(jù)量越來越龐大,標(biāo)準(zhǔn)分析程序已經(jīng)無法滿足處理要求。需要建立和使用大數(shù)據(jù)模型加快分析進(jìn)程。另一方面,許多NoSQL(非關(guān)系型數(shù)據(jù)庫(kù))平臺(tái),如Hadoop、Cassandra、MongoDB 等已經(jīng)出現(xiàn),且支持MapReduce范式,這為并行地計(jì)算和分析教育大數(shù)據(jù),進(jìn)而抽取相關(guān)模式提供了基礎(chǔ)。許多研究人員根據(jù)不同的教學(xué)應(yīng)用場(chǎng)景,提出了各種教育大數(shù)據(jù)分析模型。例如ahin M 基于多種機(jī)器學(xué)習(xí)方法開發(fā)的各種模型如決策樹[11]、邏輯回歸、支持向量機(jī)、集成學(xué)習(xí)和k-最近鄰方法等,提出了一種自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)。ANFIS 結(jié)合了神經(jīng)網(wǎng)絡(luò)技術(shù)和模糊推理方法,能夠高精度地預(yù)測(cè)MOOC學(xué)生的輟學(xué)率。

教育機(jī)構(gòu)的管理人員需要及時(shí)的分析報(bào)告,以評(píng)估和跟蹤學(xué)生的成績(jī)、入學(xué)人數(shù)的增減、學(xué)術(shù)資格、實(shí)驗(yàn)室和建筑維護(hù)記錄、學(xué)生訪問記錄和全體學(xué)生就業(yè)記錄等。目前,大多數(shù)研究報(bào)告都需要花時(shí)間從分散在不同來源的數(shù)據(jù)庫(kù)中收集數(shù)據(jù),在約定的期限內(nèi),分析師們往往只能提供有限卻昂貴的信息。因此,建立提供許多接口,能夠兼容和管理各種數(shù)據(jù)類型的數(shù)據(jù)倉(cāng)庫(kù)成為教育大數(shù)據(jù)研究的核心挑戰(zhàn)。Neamah 提出了一組構(gòu)建教育數(shù)據(jù)倉(cāng)庫(kù)的步驟[12],第一階段進(jìn)行數(shù)據(jù)預(yù)處理、數(shù)據(jù)收集、數(shù)據(jù)輸入和數(shù)據(jù)驗(yàn)證,第二階段對(duì)高校不同資源庫(kù)中的信息和數(shù)據(jù)進(jìn)行加載、提取和轉(zhuǎn)換,第三階段存儲(chǔ)所有信息和數(shù)據(jù),創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù)。

(三)教育體系的改進(jìn)

改進(jìn)教育體系的研究涵蓋了統(tǒng)計(jì)工具和分析軟件的選擇、教育排名系統(tǒng)、互聯(lián)網(wǎng)的使用等主題。

當(dāng)今社會(huì),大數(shù)據(jù)軟件專家的數(shù)量遠(yuǎn)遠(yuǎn)小于實(shí)際需求。解決這一問題的潛在方法是選擇和使用專業(yè)的數(shù)據(jù)分析軟件和統(tǒng)計(jì)工具。Ozgur C 比較了Excel 插件、SPSS、SAS 和R 四種數(shù)據(jù)分析軟件[13]。作者概述了每種軟件的授權(quán)費(fèi)、培訓(xùn)時(shí)間和費(fèi)用、統(tǒng)計(jì)方法和應(yīng)用領(lǐng)域等,為大學(xué)師生提供有價(jià)值的參考。

目前有許多排名系統(tǒng)為高等教育提供地區(qū)性、全國(guó)性或國(guó)際性的評(píng)估服務(wù),然而,由于它們通常采用主觀性評(píng)價(jià)指標(biāo)和權(quán)重因素,產(chǎn)生的排名結(jié)果在客觀性和公正性方面?zhèn)涫苜|(zhì)疑。教育大數(shù)據(jù)的涌現(xiàn),為教育排名系統(tǒng)研發(fā)提供了全新的視野。例如,Qiu 等人在大數(shù)據(jù)技術(shù)的支持下,開發(fā)了一個(gè)實(shí)時(shí)、可擴(kuò)展和模型驅(qū)動(dòng)的高等教育排名系統(tǒng)[14]。

如何評(píng)估互聯(lián)網(wǎng)對(duì)教育的影響一直是研究者感興趣的主題。目前,兩種大數(shù)據(jù)分析工具即谷歌趨勢(shì)(Google Trends)和網(wǎng)絡(luò)分析工具(Web analytics tools),為了解學(xué)習(xí)者使用互聯(lián)網(wǎng)的情況提供了巨大的潛力?;谶@兩個(gè)創(chuàng)新工具,監(jiān)測(cè)大規(guī)模教育互聯(lián)網(wǎng)的使用數(shù)據(jù),研究人員能夠了解在教育教學(xué)中,互聯(lián)網(wǎng)的使用是否緩解或加劇了現(xiàn)有的教育不公平、提高或降低了學(xué)習(xí)效率等問題。

(四)大數(shù)據(jù)與課程的整合

越來越多的研究認(rèn)為,在教學(xué)中,要對(duì)大數(shù)據(jù)的概念和技能進(jìn)行實(shí)質(zhì)性的覆蓋,需要更多地、逐步地對(duì)學(xué)生進(jìn)行干預(yù),并將大數(shù)據(jù)主題整合到多個(gè)核心課程中。許多研究針對(duì)將大數(shù)據(jù)融入課程這一主題展開了有益的探索。例如,Buffum 等人開發(fā)了一個(gè)面向中學(xué)的大數(shù)據(jù)課程模塊[15],該模塊與美國(guó)課程標(biāo)準(zhǔn)結(jié)合緊密。他們的研究表明,在中學(xué)引入大數(shù)據(jù)教學(xué),能夠豐富包括科學(xué)、數(shù)學(xué)和語言藝術(shù)在內(nèi)的核心學(xué)科。Nelson 等人針對(duì)電氣和計(jì)算機(jī)工程專業(yè)的研究助理開發(fā)了一個(gè)大數(shù)據(jù)教育課程項(xiàng)目[16]。美國(guó)會(huì)計(jì)協(xié)會(huì)(AAA)和國(guó)際大學(xué)商學(xué)院促進(jìn)協(xié)會(huì)(AACSB)一直強(qiáng)調(diào)將大數(shù)據(jù)及其處理技術(shù)整合到會(huì)計(jì)課程中的重要性。為了響應(yīng)這些呼吁,并確定一個(gè)共同的教學(xué)資源主體,Sledgianowski等人設(shè)計(jì)了一個(gè)會(huì)計(jì)教育框架,幫助教育工作者將與大數(shù)據(jù)和商業(yè)分析相關(guān)的信息系統(tǒng)和技術(shù)能力整合到會(huì)計(jì)課程中[17]。

(五)教育大數(shù)據(jù)的研究挑戰(zhàn)

1.教育大數(shù)據(jù)采集和元數(shù)據(jù)(描述數(shù)據(jù)的數(shù)據(jù))自動(dòng)生成

數(shù)據(jù)采集的目標(biāo)是在數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)或其他存儲(chǔ)設(shè)備之前對(duì)數(shù)據(jù)進(jìn)行收集、過濾和清理。然而,定義數(shù)據(jù)過濾器是主要的挑戰(zhàn)之一。而另一個(gè)挑戰(zhàn)是如何自動(dòng)生成元數(shù)據(jù)。元數(shù)據(jù)描述了需要記錄哪些數(shù)據(jù),以及如何記錄和測(cè)量數(shù)據(jù)。需要新的方法和思路記錄數(shù)據(jù)的上下文環(huán)境和語義。

2.教育大數(shù)據(jù)質(zhì)量

數(shù)據(jù)的價(jià)值取決于數(shù)據(jù)的質(zhì)量。通常情況下,數(shù)據(jù)包含誤差、錯(cuò)誤和不完整性。但是,目前低質(zhì)量數(shù)據(jù)已經(jīng)成為一個(gè)嚴(yán)重的問題。在許多數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目中,數(shù)據(jù)清理消耗大約30%至80%的開發(fā)時(shí)間和預(yù)算。提高教育數(shù)據(jù)質(zhì)量是大數(shù)據(jù)分析專家面臨的重要挑戰(zhàn)。

3.教育大數(shù)據(jù)的共享和轉(zhuǎn)移

盡管數(shù)據(jù)在急劇增長(zhǎng),但大多數(shù)數(shù)據(jù)仍然無法訪問或無法全部訪問。由于大數(shù)據(jù)的異質(zhì)性和規(guī)模性,大數(shù)據(jù)的共享成為一項(xiàng)具有挑戰(zhàn)性的任務(wù)。此外,將大規(guī)模的教育數(shù)據(jù)從一個(gè)位置無縫地轉(zhuǎn)移到另一個(gè)位置也是一個(gè)潛在的挑戰(zhàn)。

4.教育大數(shù)據(jù)的查詢和索引

在教育大數(shù)據(jù)的查詢和索引中,存在一些挑戰(zhàn)。首先,大數(shù)據(jù)存儲(chǔ)在分布式系統(tǒng)中,因此大數(shù)據(jù)集的索引結(jié)構(gòu)和查詢理論應(yīng)該基于這樣的系統(tǒng)來發(fā)展。其次,樹狀結(jié)構(gòu)在傳統(tǒng)的查詢優(yōu)化和索引技術(shù)中非常流行,但在大數(shù)據(jù)集上卻不能很好地工作。第三,容錯(cuò)是大數(shù)據(jù)查詢和索引中需要注意的一個(gè)重要方面。此外,在大數(shù)據(jù)分析中保持合理的查詢性能和吞吐量是一個(gè)重大的研究挑戰(zhàn)。

5.教育大數(shù)據(jù)的不確定性

當(dāng)從多個(gè)異構(gòu)來源收集教育數(shù)據(jù)時(shí),數(shù)據(jù)的不確定性也伴隨而來。通常,不斷擴(kuò)大的數(shù)據(jù)規(guī)模導(dǎo)致數(shù)據(jù)的不確定性發(fā)生突變,傳統(tǒng)數(shù)據(jù)梳理工具失去作用。教育大數(shù)據(jù)的這種不確定性嚴(yán)重影響了深度學(xué)習(xí)算法的性能。近年來,不斷有研究人員提出各種方法,試圖解決數(shù)據(jù)的不確定性給教育大數(shù)據(jù)學(xué)習(xí)帶來的問題,然而,為了確保從大數(shù)據(jù)分析中得出可靠的結(jié)論,仍然需要更合適的方法來理解數(shù)據(jù)的不確定性。

6.教育大數(shù)據(jù)的隱私、安全與倫理

數(shù)據(jù)隱私、安全和倫理是大數(shù)據(jù)創(chuàng)新生態(tài)系統(tǒng)的三大關(guān)注點(diǎn)。數(shù)據(jù)隱私涉及到如何查看和管理教育信息,數(shù)據(jù)安全涉及到個(gè)人重要信息的保護(hù),數(shù)據(jù)倫理與數(shù)據(jù)分析的濫用有關(guān),其中,隱私是最大的擔(dān)憂。在相互聯(lián)系和開放的當(dāng)今世界,包括個(gè)人信息在內(nèi)的信息共享越來越多,而大數(shù)據(jù)的陰暗面就是允許對(duì)這些信息進(jìn)行監(jiān)視。另外,即使有強(qiáng)大的網(wǎng)絡(luò)安全,仍然可能存在隱私侵犯,因此,研究和開發(fā)新的工具和技術(shù)保護(hù)高度分布在網(wǎng)絡(luò)中的大規(guī)模數(shù)據(jù)至關(guān)重要。

7.教育數(shù)據(jù)的可視化

可視化的教育大數(shù)據(jù)能夠生成易于使用的、動(dòng)態(tài)的、交互式的分析視圖。然而,靜態(tài)或動(dòng)態(tài)教育大數(shù)據(jù)的可視化是主要的研究挑戰(zhàn)之一。這種挑戰(zhàn)來自數(shù)據(jù)感知、數(shù)據(jù)的實(shí)時(shí)性以及交互的可擴(kuò)展性。降低延遲和減少數(shù)據(jù)是解決這一問題的思路之一,同時(shí),隨著自動(dòng)化技術(shù)的不斷發(fā)展,數(shù)據(jù)的分析解釋工作在人類的適度參與下,下一代可視化技術(shù)預(yù)計(jì)會(huì)隨著時(shí)間的推移而快速發(fā)展。

結(jié)語

本文從數(shù)據(jù)分層、技術(shù)平臺(tái)、研究方向和研究挑戰(zhàn)等方面對(duì)教育大數(shù)據(jù)的研究工作進(jìn)行了全面分析。各種各樣的數(shù)據(jù)源(如學(xué)習(xí)管理系統(tǒng)、開放教育資源、大規(guī)模在線課程、社交媒體和關(guān)聯(lián)數(shù)據(jù)等)產(chǎn)生了類型各異的教育數(shù)據(jù)。為了理解這些異構(gòu)的教育大數(shù)據(jù),本文首先從微觀/中間/宏觀三個(gè)層次探討了教育大數(shù)據(jù)的產(chǎn)生和應(yīng)用場(chǎng)景,然后研究了教育大數(shù)據(jù)的分析和處理平臺(tái)。為了給研究人員提供積極的參考,本文著重分析了教育大數(shù)據(jù)研究的四個(gè)方向及其涵蓋的主題,同時(shí)梳理了教育大數(shù)據(jù)研究面臨的各種挑戰(zhàn)。

猜你喜歡
分析課程研究
FMS與YBT相關(guān)性的實(shí)證研究
遼代千人邑研究述論
數(shù)字圖像處理課程混合式教學(xué)改革與探索
隱蔽失效適航要求符合性驗(yàn)證分析
軟件設(shè)計(jì)與開發(fā)實(shí)踐課程探索與實(shí)踐
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
為什么要學(xué)習(xí)HAA課程?
EMA伺服控制系統(tǒng)研究
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
主站蜘蛛池模板: 国产一区成人| 国产精品久久久久无码网站| 成·人免费午夜无码视频在线观看 | 国产va在线观看免费| 青青操视频在线| www精品久久| 99热这里只有精品免费| 欧洲成人在线观看| 国产永久免费视频m3u8| 狼友视频一区二区三区| 97视频在线精品国自产拍| 欧美色视频日本| 99re经典视频在线| 丁香亚洲综合五月天婷婷| 在线观看精品国产入口| 日本三区视频| 亚洲一区二区成人| 国产H片无码不卡在线视频| 国产亚洲精| 在线观看欧美国产| 免费一级毛片完整版在线看| 99国产精品免费观看视频| 欧美成一级| 精品成人一区二区三区电影| 毛片网站免费在线观看| 青青草国产精品久久久久| 色天天综合久久久久综合片| 欧美视频二区| 中文字幕调教一区二区视频| 国产另类乱子伦精品免费女| 在线观看无码av免费不卡网站| 久久99热这里只有精品免费看| 呦视频在线一区二区三区| 黄色片中文字幕| 日本精品αv中文字幕| 无码免费试看| 久久性妇女精品免费| 在线a网站| 国产欧美日韩专区发布| 欧美成人亚洲综合精品欧美激情| 一本大道AV人久久综合| 一区二区三区国产精品视频| 欧美、日韩、国产综合一区| 国产精品一区在线麻豆| 欧美精品另类| 亚洲日韩AV无码精品| 亚洲欧洲日本在线| 国产精品毛片一区视频播| 婷婷色婷婷| 国内精自线i品一区202| 人妻丰满熟妇αv无码| 高清无码一本到东京热| 2021国产精品自产拍在线| 国产成人亚洲精品色欲AV| 国产导航在线| 日韩在线成年视频人网站观看| 欧美乱妇高清无乱码免费| 国产精品浪潮Av| 日韩不卡免费视频| 亚洲视频一区| 亚洲成人在线网| 伊人婷婷色香五月综合缴缴情| av在线5g无码天天| 国产女人喷水视频| 欧美一级高清视频在线播放| www精品久久| 亚洲日韩高清在线亚洲专区| 色视频国产| a天堂视频在线| 中文毛片无遮挡播放免费| 日本伊人色综合网| 视频二区亚洲精品| 国产玖玖视频| 免费观看无遮挡www的小视频| 人妻无码中文字幕一区二区三区| 久久性妇女精品免费| 久久一本日韩精品中文字幕屁孩| 国产黄网站在线观看| 成人在线综合| 手机精品福利在线观看| 国产免费网址| 亚洲国产精品日韩欧美一区|