黃敏
(西南大學(xué) 外國(guó)語(yǔ)學(xué)院,重慶 400715)
全球知名咨詢公司麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。”(郭曉科,2013)自2009年維克托·邁爾-舍恩伯格及肯尼斯·庫(kù)克耶編寫的《大數(shù)據(jù)時(shí)代》問(wèn)世以來(lái),大數(shù)據(jù)成了各行各業(yè)的流行詞匯。一般認(rèn)為,大數(shù)據(jù)具有四大特征,分別為數(shù)據(jù)體量浩大(Volumn)、數(shù)據(jù)多元(Variety)、生成快速(Velocity)、價(jià)值回報(bào)高(Value),俗稱4V特征(Mayer-Schonberger et al., 2013)。根據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心IDC(Internet Data Centre)的定義:至少要有超過(guò)100TB可供分析的數(shù)據(jù)才叫大數(shù)據(jù)。大數(shù)據(jù)種類繁多,具有異構(gòu)和多樣性,包括文本、網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等。大數(shù)據(jù)的意義在于對(duì)多種類型數(shù)據(jù)構(gòu)成的“數(shù)據(jù)集”進(jìn)行分析和研究,提取有價(jià)值的信息,獲得某種洞見(jiàn)或規(guī)律,從而幫助人們?cè)诮鉀Q問(wèn)題時(shí)作出科學(xué)的決策或預(yù)測(cè)。大數(shù)據(jù)將給社會(huì)帶來(lái)的三大變化有:(1)海量數(shù)據(jù)甚至“全部數(shù)據(jù)”將使人們不再依賴小樣本的推斷統(tǒng)計(jì); (2)為了獲取更好的洞察力,不再熱衷于追求精確度,但并不是就此放棄;(3)不再熱衷于追求因果關(guān)系,而更注重相關(guān)關(guān)系。這三條將徹底改變我們科研和教學(xué)的本體論、認(rèn)識(shí)論和方法論(劉潤(rùn)清,2014)。
在教育領(lǐng)域,以信息化帶動(dòng)教育現(xiàn)代化已然上升為國(guó)家戰(zhàn)略。隨著教育信息化的深入,對(duì)大數(shù)據(jù)的利用成為學(xué)者、教師和管理人員共同面臨的新課題。教育大數(shù)據(jù)作為大數(shù)據(jù)的一個(gè)子集,是整個(gè)教育活動(dòng)過(guò)程中所產(chǎn)生的以及根據(jù)教育需要采集到的,一切用于教育發(fā)展并可創(chuàng)造巨大潛在價(jià)值的數(shù)據(jù)集合(楊現(xiàn)民 等,2015)。教育大數(shù)據(jù)從戰(zhàn)略高度被定位為推動(dòng)教育變革的新型戰(zhàn)略資產(chǎn)、推進(jìn)教育領(lǐng)域綜合改革的科學(xué)力量以及發(fā)展智慧教育的基石,其最終價(jià)值體現(xiàn)在與教育主流業(yè)務(wù)的深度融合以及持續(xù)推動(dòng)教育系統(tǒng)的智慧化變革上(楊現(xiàn)民 等,2016)。外語(yǔ)教育作為我國(guó)教育體系重要組成部分在大數(shù)據(jù)時(shí)代也同樣面臨著機(jī)遇與挑戰(zhàn)。正如劉潤(rùn)清教授(2014)所言,現(xiàn)在教育經(jīng)歷“結(jié)構(gòu)性調(diào)整”,不僅要更換結(jié)構(gòu),更重要的是革新理念和生產(chǎn)方式。雖然利用大數(shù)據(jù)能幫助我們更加清楚地認(rèn)識(shí)外語(yǔ)教育的真實(shí)面貌和客觀規(guī)律,找準(zhǔn)理念和實(shí)踐創(chuàng)新的突破口,提升教學(xué)效率,但外語(yǔ)教育領(lǐng)域卻十分缺乏基于大數(shù)據(jù)的學(xué)習(xí)分析研究。因此,本文試圖回答以下三個(gè)問(wèn)題:(1)外語(yǔ)教學(xué)中大數(shù)據(jù)究竟能產(chǎn)生怎樣的價(jià)值?(2)外語(yǔ)教育中的大數(shù)據(jù)有哪些重要的來(lái)源?(3)我們對(duì)收集到的大數(shù)據(jù)又該進(jìn)行怎樣的技術(shù)分析呢?
大數(shù)據(jù)能為外語(yǔ)教學(xué)帶來(lái)怎樣的價(jià)值呢?總的來(lái)說(shuō),大數(shù)據(jù)能優(yōu)化外語(yǔ)學(xué)習(xí)過(guò)程、助力個(gè)性化教學(xué)的實(shí)現(xiàn),深化對(duì)外語(yǔ)學(xué)習(xí)者特征的分析,精準(zhǔn)反映教學(xué)要素之間的互動(dòng),簡(jiǎn)化外語(yǔ)教學(xué)評(píng)價(jià)方式、克服經(jīng)驗(yàn)式評(píng)價(jià)弊端。
國(guó)內(nèi)外研究表明個(gè)性化教學(xué)能最大限度發(fā)揮學(xué)生潛能、提高學(xué)生學(xué)習(xí)動(dòng)力、維持良好的學(xué)習(xí)習(xí)慣,對(duì)提升學(xué)習(xí)效果具有積極的意義(Creed, 2010;Kalivoda, 2010)。個(gè)性化教學(xué)一直是我國(guó)外語(yǔ)教育領(lǐng)域的不懈追求;從教育部頒布的《大學(xué)英語(yǔ)課程教學(xué)要求(試行)》(2004年)到《大學(xué)英語(yǔ)教學(xué)指南》(2017年)都把確立多元教學(xué)目標(biāo)、體現(xiàn)個(gè)性化教學(xué)理念、提供多種學(xué)習(xí)選擇作為其核心觀點(diǎn)和任務(wù)(王海嘯,2004;蔡基剛,2016)。但受制于傳統(tǒng)教學(xué)模式的局限,個(gè)性化指導(dǎo)和評(píng)價(jià)機(jī)會(huì)有限,個(gè)性化教學(xué)效果不理想(文秋芳, 2006, 2012)。信息技術(shù)新時(shí)代,教學(xué)模式以學(xué)生為中心,使其成為學(xué)習(xí)過(guò)程數(shù)據(jù)的生產(chǎn)者、使用者和受益者。通過(guò)學(xué)習(xí)過(guò)程大數(shù)據(jù),可以完善個(gè)性化學(xué)習(xí)者檔案、分析和預(yù)測(cè)個(gè)性化學(xué)習(xí)行為、進(jìn)行以數(shù)據(jù)驅(qū)動(dòng)的教學(xué)決策和個(gè)性化學(xué)習(xí)輔導(dǎo);自適應(yīng)學(xué)習(xí)系統(tǒng)能根據(jù)學(xué)生學(xué)習(xí)數(shù)據(jù)預(yù)測(cè)其性格特點(diǎn)和喜好,推送符合學(xué)生興趣愛(ài)好和級(jí)別的學(xué)習(xí)材料,構(gòu)建個(gè)性化的知識(shí)和能力體系。如在慕課或精品資源公開(kāi)課中,平臺(tái)可以收集學(xué)生的所有學(xué)習(xí)數(shù)據(jù),大數(shù)據(jù)與云計(jì)算的結(jié)合使教師可以通過(guò)對(duì)數(shù)據(jù)的分析掌握學(xué)生在教育資源庫(kù)上的操作痕跡,如點(diǎn)擊流(Clickstream ),了解學(xué)生學(xué)習(xí)動(dòng)態(tài)需求,了解不同學(xué)生的學(xué)習(xí)風(fēng)格,提供不同的學(xué)習(xí)支持,進(jìn)行及時(shí)、有針對(duì)性的干預(yù)和幫助(Gao, et al., 2019;Deng, et al., 2020)。如姜強(qiáng)等(2018)基于AprioriAll算法,挖掘分析相同或相近學(xué)習(xí)偏好和知識(shí)水平的學(xué)習(xí)群體的軌跡,并以學(xué)習(xí)者特征與學(xué)習(xí)對(duì)象媒體類型、理解等級(jí)、難度級(jí)別的匹配計(jì)算為基礎(chǔ),生成精準(zhǔn)化個(gè)性學(xué)習(xí)路徑,為差異化教學(xué)提供新思路。陳長(zhǎng)勝、孟祥增等(2020)以中國(guó)大學(xué)MOOC平臺(tái)中7967名學(xué)習(xí)者的學(xué)習(xí)行為記錄為對(duì)象研究了慕課學(xué)習(xí)者的時(shí)間分配,發(fā)現(xiàn)慕課學(xué)習(xí)者在線學(xué)習(xí)行為時(shí)間序列呈現(xiàn)非平穩(wěn)特征,課程周期內(nèi)學(xué)習(xí)者學(xué)習(xí)時(shí)間分配存在三段式節(jié)奏,學(xué)習(xí)者資源交互行為的時(shí)間分配存在顯著差異,不同成績(jī)等級(jí)的學(xué)習(xí)者群體資源交互行為與學(xué)習(xí)時(shí)間分配存在顯著差異。因此提出了課程運(yùn)行中及時(shí)關(guān)注“低訪問(wèn)頻次低時(shí)間投入”和“高訪問(wèn)頻次低時(shí)間投入”學(xué)習(xí)者的分類教學(xué)建議。
根據(jù)第二語(yǔ)言習(xí)得理論,學(xué)生個(gè)體差異,如年齡、學(xué)習(xí)風(fēng)格、動(dòng)機(jī)、學(xué)習(xí)目標(biāo)、元認(rèn)知等會(huì)影響語(yǔ)言學(xué)習(xí)的成效(Stephen, 1981;Rod, 1997;Dornyei, 2005)。傳統(tǒng)的教學(xué)研究只能利用獲取的隨機(jī)抽樣數(shù)據(jù),用統(tǒng)計(jì)手段進(jìn)行推斷,過(guò)程復(fù)雜,研究結(jié)果存在誤差,影響后續(xù)教學(xué)干預(yù)的準(zhǔn)確性。信息網(wǎng)絡(luò)技術(shù)可以采集微觀的學(xué)習(xí)過(guò)程數(shù)據(jù),包括學(xué)生的基本信息(姓名、性別、年齡、專業(yè)等)、學(xué)習(xí)行為日志數(shù)據(jù)信息(如學(xué)生在哪段視頻上停留了多少時(shí)間、閱讀某篇文章花了多少時(shí)間、先后瀏覽順序、作文寫作經(jīng)歷了怎樣的修改過(guò)程等細(xì)顆粒度的行為)、興趣偏好信息(語(yǔ)言技能類、文化類、應(yīng)試類等)、認(rèn)知行為信息(視覺(jué)型、聽(tīng)覺(jué)型、沖動(dòng)型、穩(wěn)重型等)、學(xué)習(xí)結(jié)果信息(作業(yè)成績(jī)、測(cè)試成績(jī)、自評(píng)成績(jī)、互評(píng)成績(jī)等);教學(xué)過(guò)程由以前不可量化到可量化(Cantabella et al., 2019; Shen et al., 2020)。如劉三女牙等(2016)以哈佛大學(xué)和麻省理工學(xué)院在edX平臺(tái)上的課程學(xué)習(xí)數(shù)據(jù)為樣本,從學(xué)習(xí)者類型、性別、學(xué)歷、年齡、課程等五個(gè)維度對(duì)學(xué)習(xí)者學(xué)習(xí)行為進(jìn)行差異性分析,其研究結(jié)果深化了對(duì)外語(yǔ)學(xué)習(xí)者特征的了解。趙慧瓊等(2017)利用多元回歸分析方法判定影響學(xué)生學(xué)習(xí)績(jī)效的預(yù)警因素,在此基礎(chǔ)上建構(gòu)了干預(yù)模型,并將其應(yīng)用于教學(xué)實(shí)踐,對(duì)產(chǎn)生的學(xué)習(xí)數(shù)據(jù)進(jìn)行二元Logistic回歸分析,結(jié)果表明基于大數(shù)據(jù)的學(xué)習(xí)分析能及時(shí)發(fā)出預(yù)警信號(hào)并提供個(gè)性化干預(yù)對(duì)策,增強(qiáng)學(xué)習(xí)動(dòng)機(jī),培養(yǎng)學(xué)習(xí)者毅力。喬璐、江豐光(2020)選取“學(xué)堂在線”平臺(tái)上參與慕課學(xué)習(xí)的1068名學(xué)習(xí)者進(jìn)行研究,以視頻觀看比例、平時(shí)作業(yè)得分率、期末考試得分率、課程得分率四個(gè)變量來(lái)表征學(xué)習(xí)者的學(xué)習(xí)行為特征,并運(yùn)用凝聚層次聚類分析、K-Means聚類算法、相關(guān)性分析和邏輯回歸分析處理課程數(shù)據(jù),研究結(jié)果把學(xué)習(xí)者分成了積極學(xué)習(xí)者、一般學(xué)習(xí)者和單純注冊(cè)者三類,并討論了四個(gè)變量在三類學(xué)習(xí)者群體之間存在的差異。
互動(dòng)是外語(yǔ)學(xué)習(xí)的普遍特征,也一直是國(guó)內(nèi)外研究者和教師關(guān)注的熱點(diǎn)(Stoch, 2008; Oxford, 2011; Sato , 2013;徐錦芬 等,2018; 徐錦芬 等, 2019)。大數(shù)據(jù)時(shí)代,以社交媒體為特征的技術(shù)能記錄學(xué)生與學(xué)習(xí)內(nèi)容、環(huán)境(包括虛擬環(huán)境和AI 機(jī)器人)、同伴和教師之間復(fù)雜交互過(guò)程產(chǎn)生的大量數(shù)據(jù)。例如在慕課平臺(tái)上選擇同一門“跨文化交際”課程的數(shù)以萬(wàn)計(jì)的學(xué)生可以通過(guò)網(wǎng)絡(luò)社交平臺(tái)進(jìn)行積極的討論,教師也可加入引導(dǎo)討論的方向和內(nèi)容,交流的廣度和深度前所未有。其產(chǎn)生的龐大數(shù)據(jù)可以通過(guò)社交分析軟件(如Ucinet、Gephi)、內(nèi)容分析等精準(zhǔn)掌握互動(dòng)的模式、頻率、范圍、內(nèi)容等 (Chen et al., 2019; Fang et al., 2019; Lu et al., 2020)。如李艷、張慕華(2015)采用質(zhì)性研究的方法,利用質(zhì)性研究分析軟件NVivo 8對(duì)收集的231條在線學(xué)習(xí)日志進(jìn)行編碼,圍繞學(xué)習(xí)者、教師、課程、技術(shù)、環(huán)境五個(gè)維度進(jìn)行內(nèi)容分析。發(fā)現(xiàn)學(xué)生在與他人互動(dòng)方面,相比在線交流,偏好面對(duì)面的交流討論,而教師對(duì)學(xué)習(xí)者的指導(dǎo)與鼓勵(lì)非常重要,多元評(píng)價(jià)方式能讓學(xué)習(xí)者體驗(yàn)到學(xué)習(xí)過(guò)程比最后得分更為重要。
在傳統(tǒng)教學(xué)中,對(duì)學(xué)生學(xué)習(xí)過(guò)程情況的收集復(fù)雜、低效。而教育技術(shù)新時(shí)代,學(xué)習(xí)者在學(xué)習(xí)平臺(tái)上的學(xué)習(xí)過(guò)程數(shù)據(jù)能被終端記錄并存儲(chǔ)下來(lái),為教師評(píng)價(jià)提供了最直接、最客觀、最準(zhǔn)確的依據(jù)。同時(shí),基于大數(shù)據(jù)建立的考試網(wǎng)絡(luò)空間能使學(xué)生在虛擬環(huán)境中與AI機(jī)器人進(jìn)行對(duì)話,系統(tǒng)根據(jù)設(shè)定的評(píng)價(jià)指標(biāo)給出評(píng)價(jià)分?jǐn)?shù),改變了以往教師靠經(jīng)驗(yàn)和主觀判斷評(píng)分的局限性(Engwall et al., 2020; Engwall et al., 2020; Hass, Vogt et al., 2020)。
2013年被媒體稱為中國(guó)的大數(shù)據(jù)元年,從這一年起,國(guó)內(nèi)教育技術(shù)領(lǐng)域掀起了基于大數(shù)據(jù)技術(shù)促進(jìn)教育改革和創(chuàng)新發(fā)展相關(guān)研究的浪潮,大數(shù)據(jù)教育應(yīng)用迅速發(fā)展起來(lái)。2014年3月,教育部辦公廳印發(fā)的《2014年教育信息化工作要點(diǎn)》中指出:加強(qiáng)對(duì)動(dòng)態(tài)監(jiān)控、決策應(yīng)用、教育預(yù)測(cè)等相關(guān)數(shù)據(jù)資源的整合與集成,為教育決策提供及時(shí)和準(zhǔn)確的數(shù)據(jù)支持,推動(dòng)教育基礎(chǔ)數(shù)據(jù)在全國(guó)共享。大數(shù)據(jù)與教育領(lǐng)域的深度融合成為當(dāng)代教育事業(yè)發(fā)展的必然趨勢(shì)。2016年,教育部印發(fā)的《教育信息化“十三五”規(guī)劃》中提出要積極利用云計(jì)算、大數(shù)據(jù)等新技術(shù),創(chuàng)新資源平臺(tái)、管理平臺(tái)的建設(shè)、應(yīng)用模式;要依托網(wǎng)絡(luò)學(xué)習(xí)空間逐步實(shí)現(xiàn)對(duì)學(xué)生日常學(xué)習(xí)情況的大數(shù)據(jù)采集和分析,優(yōu)化教學(xué)模式。2018年,教育部印發(fā)的《教育信息化2.0行動(dòng)計(jì)劃》指出要利用大數(shù)據(jù)技術(shù)采集、匯聚互聯(lián)網(wǎng)上豐富的教學(xué)、科研、文化資源,為各級(jí)各類學(xué)校和全體學(xué)習(xí)者提供海量、適切的學(xué)習(xí)資源服務(wù),實(shí)現(xiàn)從“專用資源服務(wù)”向“大資源服務(wù)”的轉(zhuǎn)變。
Piety等(2014)認(rèn)為教育大數(shù)據(jù)可以圍繞教學(xué)、學(xué)習(xí)者、教育機(jī)構(gòu)、基于數(shù)據(jù)的決策四個(gè)方面收集。Cope和Kalantzis (2014) 認(rèn)為大數(shù)據(jù)可以來(lái)自過(guò)程性、場(chǎng)景性和課堂評(píng)價(jià),以技術(shù)為中介的心理測(cè)量,自主學(xué)習(xí)和其他一些更為復(fù)雜的學(xué)習(xí)表現(xiàn)。為了滿足外語(yǔ)學(xué)習(xí)者的需求,基于技術(shù)增強(qiáng)型的學(xué)習(xí)方式也是多種多樣,如正式學(xué)習(xí)與非正式學(xué)習(xí),同步學(xué)習(xí)與異步學(xué)習(xí),現(xiàn)實(shí)世界、虛擬世界與混合世界的學(xué)習(xí),移動(dòng)學(xué)習(xí)、無(wú)縫化學(xué)習(xí)和特定場(chǎng)景的學(xué)習(xí),常規(guī)課堂學(xué)習(xí)、MOOC學(xué)習(xí)和開(kāi)放式課程軟件學(xué)習(xí)(Lan et al., 2017)。基于此,我們歸納出外語(yǔ)教學(xué)大數(shù)據(jù)的幾個(gè)主要來(lái)源:(1)外語(yǔ)真實(shí)課堂活動(dòng)中直接產(chǎn)生的數(shù)據(jù),如學(xué)生考勤、課堂回答問(wèn)題頻次、課堂測(cè)試、參與討論互動(dòng)情況等。這些數(shù)據(jù)的采集可以用問(wèn)卷、課堂觀察、錄視頻、訪談的方式獲得,也可以通過(guò)如QQ學(xué)習(xí)平臺(tái)上的簽到、搶答等功能記錄。(2)外語(yǔ)學(xué)習(xí)平臺(tái)產(chǎn)生的學(xué)習(xí)數(shù)據(jù),如學(xué)習(xí)進(jìn)度、正確率、發(fā)帖情況、測(cè)試成績(jī)等。北京外語(yǔ)教學(xué)與研究出版社Unipus學(xué)習(xí)平臺(tái)、清華大學(xué)大學(xué)英語(yǔ)數(shù)字化互動(dòng)教學(xué)平臺(tái)等,能提供學(xué)生每單元每一部分的學(xué)習(xí)時(shí)間、成績(jī)以及學(xué)生在平臺(tái)上參與互動(dòng)討論等的顯性結(jié)構(gòu)化數(shù)據(jù)。(3)慕課學(xué)習(xí)平臺(tái),包括中國(guó)外語(yǔ)MOOC平臺(tái)、學(xué)堂在線、超星慕課平臺(tái)、各級(jí)精品開(kāi)放課程平臺(tái)等。因?yàn)檫@些平臺(tái)是面向公眾開(kāi)放,數(shù)據(jù)量都比較龐大,一線教師不容易獲取,需要與慕課運(yùn)營(yíng)平臺(tái)進(jìn)行溝通。(4) 移動(dòng)設(shè)備端自主學(xué)習(xí)數(shù)據(jù)。例如學(xué)生學(xué)習(xí)詞匯的百詞斬、扇貝單詞、拓詞等能自動(dòng)記錄學(xué)生詞匯記憶的時(shí)長(zhǎng)和進(jìn)度情況。(5)教學(xué)管理活動(dòng)中通過(guò)數(shù)字化校園平臺(tái)、智慧校園平臺(tái)采集到的數(shù)據(jù),如學(xué)生基本信息、圖書館借閱書目情況、借閱時(shí)間長(zhǎng)短、大型考試成績(jī)情況等。
面對(duì)不同來(lái)源的大數(shù)據(jù),只有對(duì)數(shù)據(jù)進(jìn)行有效的處理,才能使其變成有價(jià)值的信息,為教學(xué)決策、教學(xué)過(guò)程和評(píng)價(jià)提供有價(jià)值的參考。近年來(lái),以云計(jì)算、數(shù)據(jù)挖掘與分析等為基礎(chǔ)的大數(shù)據(jù)技術(shù)為教育研究帶來(lái)了數(shù)據(jù)獲取、存儲(chǔ)、分析和決策等方面的支持。
大數(shù)據(jù)的發(fā)展促進(jìn)了大數(shù)據(jù)分析方法的發(fā)展,包括機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、預(yù)測(cè)模型、數(shù)據(jù)的可視化等。在教育領(lǐng)域,學(xué)習(xí)分析(Learning analytic)非常重要;學(xué)習(xí)分析是對(duì)“學(xué)習(xí)者和學(xué)習(xí)環(huán)境的數(shù)據(jù)測(cè)量、收集、分析和匯報(bào)”,它能為教師、研究者和政策制定者提供有用的信息,改進(jìn)教學(xué),改善教學(xué)結(jié)果。Greller 和Drachsler(2012) 提出了一個(gè)系統(tǒng)全面的定義,從六大關(guān)鍵維度來(lái)定義學(xué)習(xí)分析。這六大關(guān)鍵維度分別是內(nèi)部限制、外部限制、工具、數(shù)據(jù)、目標(biāo)和關(guān)益者。內(nèi)部限制指學(xué)生的能力和對(duì)相關(guān)知識(shí)的接受度;外部限制包括平臺(tái)的規(guī)范及與學(xué)生、教師的約定;工具有技術(shù)、算法、理論等;數(shù)據(jù)主要是來(lái)自學(xué)生的公開(kāi)數(shù)據(jù)和隱私數(shù)據(jù);目標(biāo)是反思教育模式和預(yù)測(cè)學(xué)生發(fā)展前景;關(guān)益者包括機(jī)構(gòu)、教師、學(xué)生等。Ferguson 和 Buckingham (2012)歸納了五種學(xué)習(xí)分析方法:社交網(wǎng)絡(luò)分析、話語(yǔ)分析、內(nèi)容分析、性格分析和情境分析。近年來(lái),隨著人工智能和自然語(yǔ)言處理等領(lǐng)域技術(shù)的突破和整合,學(xué)習(xí)分析工具也更加多樣和先進(jìn)。如支持對(duì)原始帖子進(jìn)行標(biāo)注或編碼、交叉引用和簡(jiǎn)短評(píng)論的工具Nvivo和Atlasti;支持基于詞典的文本分析工具CATPAC和LIWC;智能化內(nèi)容分析工具VINCA;社會(huì)網(wǎng)絡(luò)分析工具Ucinet;預(yù)測(cè)學(xué)生學(xué)習(xí)參與的實(shí)時(shí)模型工具Solutionpath StREAM;分析計(jì)算機(jī)輔助合作學(xué)習(xí)的工具M(jìn)eerkat-ED;為教師提供學(xué)生情況實(shí)時(shí)反饋的工具LOCO-Analyst;用于系統(tǒng)建模的工具Coordinator;專門的數(shù)據(jù)挖掘工具,SQL SERVER Analysis Service (SSAS)、Weka、SPSS 等(張濃芳,2010; 魏順平,2013; Romero et al., 2020)。除此之外,還有Degrees of Reading Power(DRP)、DRA1+,Pearson’s Ordinate Technology Coh-Metrix、Point of Originality、OpenEssayist和Asiya等分析工具(甘容輝 等,2016)。大數(shù)據(jù)的算法也為分析大數(shù)據(jù)提供了支持,例如運(yùn)用邏輯斯諦回歸方法和支持向量機(jī)算法對(duì)成績(jī)進(jìn)行預(yù)測(cè)(賀超凱 等,2016;呂品 等,2019),利用決策樹(shù)算法對(duì)學(xué)生在線學(xué)業(yè)成就影響因素或?qū)W生教學(xué)滿意度進(jìn)行分析(舒忠梅 等,2014;孫發(fā)勤 等,2019),基于Apriori 算法對(duì)學(xué)習(xí)群體行為進(jìn)行分析(姜強(qiáng) 等,2018),利用adaboost 算法構(gòu)建預(yù)測(cè)干預(yù)模型(韓梅梅,2018)等。
依靠現(xiàn)代教育技術(shù)產(chǎn)生的大數(shù)據(jù)對(duì)外語(yǔ)教學(xué)價(jià)值凸顯,為外語(yǔ)科研人員和教師帶來(lái)了機(jī)遇,但擁有大數(shù)據(jù)絕不是取代科研人員和教師的作用(Mayer-Schonberger et al.,2013)。在實(shí)踐中,我們?nèi)匀恍枰⒁鈳讉€(gè)問(wèn)題。
(1)大數(shù)據(jù)能提供小數(shù)據(jù)時(shí)代不能想象的海量數(shù)據(jù),幾乎能實(shí)現(xiàn)“樣本=總體”,是一種新的研究范式,但在數(shù)據(jù)分析和解釋上仍然需要教師和研究者結(jié)合語(yǔ)言習(xí)得理論和教學(xué)實(shí)踐進(jìn)行判斷、分析、歸納和總結(jié)。(2)高效、科學(xué)的學(xué)習(xí)管理數(shù)據(jù)收集平臺(tái)和管理系統(tǒng)(Learning Management System)需要研究人員、教師、編程人員的共同研發(fā)。根據(jù)知網(wǎng)CNKI的檢索結(jié)果,我們注意到,目前研究者的興趣普遍集中在英語(yǔ)寫作教學(xué)平臺(tái)大數(shù)據(jù)的收集和分析上,缺乏對(duì)語(yǔ)言教學(xué)其他技能學(xué)習(xí)平臺(tái)的開(kāi)發(fā)和學(xué)習(xí)過(guò)程的研究。(3)質(zhì)性研究方法,如訪談、問(wèn)卷、有聲思維,仍是支撐大數(shù)據(jù)分析的有效三角驗(yàn)證方法。(4)大數(shù)據(jù)分析本身具有數(shù)據(jù)、計(jì)算和系統(tǒng)復(fù)雜性的特點(diǎn),研究人員和教師要充分估計(jì)大數(shù)據(jù)收集、儲(chǔ)存和分析中出現(xiàn)的挑戰(zhàn),找出應(yīng)對(duì)之策。