摘 " 要:數(shù)字教育監(jiān)測評估是推進(jìn)和深化教育數(shù)字化轉(zhuǎn)型的一個重要環(huán)節(jié),大數(shù)據(jù)作為新一代信息技術(shù)能夠深入呈現(xiàn)數(shù)字教育狀態(tài)的要素特征和結(jié)構(gòu)關(guān)系,為實現(xiàn)多維化和細(xì)粒度的教育監(jiān)測評估提供了技術(shù)保障。數(shù)字教育監(jiān)測評估經(jīng)歷了從教學(xué)績效測量、數(shù)據(jù)驅(qū)動評價到認(rèn)證模式創(chuàng)新、增值效益提升的理念進(jìn)階,形成以主體發(fā)展需求、動態(tài)生成數(shù)據(jù)、智能融合分析、增進(jìn)管理效益為支撐的多元價值取向。數(shù)字教育監(jiān)測評估是以場景化數(shù)據(jù)為支點,以課堂大數(shù)據(jù)、在線大數(shù)據(jù)、雙線混融大數(shù)據(jù)為應(yīng)用情境,通過物理感知、數(shù)字感知、情境感知開展教學(xué)現(xiàn)象監(jiān)測、人機交互監(jiān)測與活動事件監(jiān)測。在評估方式上,數(shù)字教育評估演化為基于集中式數(shù)理統(tǒng)計的終結(jié)性教育評估、基于伴隨式數(shù)據(jù)挖掘的過程性教育評估和基于生成式人工智能的預(yù)測性教育評估。大數(shù)據(jù)驅(qū)動教育監(jiān)測評估的實踐路徑包括建立數(shù)據(jù)監(jiān)測評估體系、實施全鏈路數(shù)據(jù)監(jiān)測、開展差異化發(fā)展評測、創(chuàng)新數(shù)據(jù)治理模式、構(gòu)建反饋決策機制,以更好地促進(jìn)教育評價高質(zhì)量發(fā)展。
關(guān)鍵詞:大數(shù)據(jù);數(shù)字教育;教育監(jiān)測評估;評估模式;實踐路徑
中圖分類號:G434 " " " " 文獻(xiàn)標(biāo)志碼:A " " " " 文章編號:1673-8454(2024)06-0054-08
一、數(shù)據(jù)賦能教育監(jiān)測評估的歷程
監(jiān)測評估最早由美國密西根大學(xué)(University of Michigan)的第·艾鼎敦(Eding tong)于1978年在健康管理領(lǐng)域提出一種對身體變化的過程進(jìn)行持續(xù)監(jiān)測,并基于監(jiān)測信息對身體情況進(jìn)行判斷與決策的醫(yī)療理念。該理念被應(yīng)用于教育領(lǐng)域,形成一種新的評估構(gòu)想,即通過定期收集和分析教育信息以直觀呈現(xiàn)教育狀態(tài),從而為教育管理者執(zhí)行價值判斷與決策提供客觀依據(jù)。在管理學(xué)中,監(jiān)測評估是由監(jiān)測和評估兩種概念組成的,監(jiān)測是指對過程性信息的追蹤過程,評估則是指基于既定目標(biāo)對當(dāng)前任務(wù)進(jìn)度的價值判斷[1]。在具體實踐中,監(jiān)測通常是為了分析評估,評估的過程又需要監(jiān)測來提供判斷依據(jù)。因此,我們認(rèn)為教育實踐中的監(jiān)測評估是一個復(fù)合概念,它能夠突破監(jiān)測和評估的單一功能,既在監(jiān)測中強調(diào)價值分析的目標(biāo)作用,又在評估中深化過程性信息的支架效用,是教育評估實踐中一種新的活動形式。數(shù)字教育監(jiān)測評估是在數(shù)字化技術(shù)環(huán)境下,面向傳統(tǒng)教育場域與在線教育情境,從數(shù)據(jù)循證層面對教育活動過程進(jìn)行質(zhì)量監(jiān)控與成效評估,以期達(dá)到教育增值的目的。大數(shù)據(jù)作為一種涵蓋傳統(tǒng)物理空間與多維網(wǎng)絡(luò)空間的全數(shù)據(jù)價值挖掘技術(shù),通過對數(shù)字教育的環(huán)境數(shù)據(jù)、過程數(shù)據(jù)、結(jié)果數(shù)據(jù)進(jìn)行立體化捕捉分析,能夠為教育監(jiān)測評估提供可靠證據(jù)。
美國于2002年頒布《不讓一個孩子掉隊法》(No Child Left Behind Act)。該法案強調(diào)數(shù)據(jù)可以為不同學(xué)段、不同目標(biāo)指向的教育評價提供直接、客觀的評價依據(jù),以提升學(xué)校問責(zé)制的執(zhí)行實效[2]。2016年,為解決教育區(qū)域發(fā)展不平衡等問題,俄羅斯批準(zhǔn)了《現(xiàn)代數(shù)字教育環(huán)境建設(shè)項目(2016—2025年)》(Digital Education Environment Construction Project 2016-2025)。該項目提出建立基于大數(shù)據(jù)技術(shù)的自動評估系統(tǒng),用于改善在線課程質(zhì)量[3]。美國教育部教育技術(shù)辦公室發(fā)布的《重新構(gòu)想技術(shù)在教育中的角色:2017年國家教育技術(shù)計劃更新版》(Reimagining the Role of Technology in Education:2017 National Education Technology Plan Update)中,重申教育工作者應(yīng)積極利用評估數(shù)據(jù)以持續(xù)改善學(xué)習(xí)[4]。為了提升各國教育監(jiān)測評估能力并強化具體實踐,聯(lián)合國教科文組織發(fā)布《全球教育監(jiān)測報告(2017/8)——教育問責(zé):履行我們的承諾》(Global Education Monitoring Report 2017/8—Accountability in Education: Meeting Our Commitments),從數(shù)據(jù)來源、質(zhì)量標(biāo)準(zhǔn)、收集方法、框架設(shè)計、指標(biāo)設(shè)計以及實施計劃方面進(jìn)行監(jiān)測評估的規(guī)劃設(shè)計[5]。2023年,經(jīng)合組織發(fā)布了《過程數(shù)據(jù)在大規(guī)模教育評估中的應(yīng)用》(The uses of process data in large-scale educational assessments)報告。該報告從過程數(shù)據(jù)的定義、作用、有效性、應(yīng)用實例等方面強調(diào)過程數(shù)據(jù)在大規(guī)模評估中的實踐效益[6]。
通過梳理教育監(jiān)測評估的歷史進(jìn)程可知,國際上對教育監(jiān)測評估的關(guān)注從未間斷,從早期將數(shù)據(jù)作為佐證教育問責(zé)的證據(jù)以推進(jìn)教育公平,到近年來發(fā)揮數(shù)據(jù)的反饋性價值,將數(shù)據(jù)分析結(jié)果用于教育優(yōu)化策略的制定以提升教育質(zhì)量。隨著教育信息化邁入以教育大數(shù)據(jù)為核心的教育數(shù)字化轉(zhuǎn)型新時期[7],大數(shù)據(jù)的即時性與教育監(jiān)測評估的時效性相輔相成,激發(fā)了數(shù)字教育監(jiān)測評估中的數(shù)據(jù)本位價值。數(shù)字教育監(jiān)測評估旨在充分挖掘數(shù)據(jù)的指導(dǎo)性價值,使教育監(jiān)測評估的目標(biāo)更準(zhǔn)確,實現(xiàn)用全時、全景、全量的數(shù)據(jù)刻畫教育高質(zhì)量發(fā)展的推進(jìn)方案,能夠在新的目標(biāo)和需求驅(qū)動下,不斷拓展教育監(jiān)測評估的廣度、深度與精細(xì)度,促進(jìn)數(shù)字教育監(jiān)測評估的效能提升。
二、數(shù)字教育監(jiān)測評估的發(fā)展樣態(tài)
(一)質(zhì)量之道:基于教育問責(zé)的教學(xué)效能測量
數(shù)字教育監(jiān)測評估倡導(dǎo)大數(shù)據(jù)思維,旨在基于全部的數(shù)據(jù)樣本進(jìn)行評價分析,以輔助教育決策的制定。該思維最早體現(xiàn)在美國政府建立的基于各州標(biāo)準(zhǔn)化測試數(shù)據(jù)的學(xué)校問責(zé)中,通過測量學(xué)校的教學(xué)績效,為政府管理學(xué)校提供可靠依據(jù)。早期教育問責(zé)主要關(guān)注教學(xué)績效,分為獎懲問責(zé)與扶持問責(zé)兩大類。獎懲問責(zé)是由聯(lián)邦政府作為監(jiān)測主體,通過開展國家教育進(jìn)展評估項目,將學(xué)生的考試結(jié)果數(shù)據(jù)作為評估內(nèi)容,以衡量學(xué)校的教學(xué)績效。扶持問責(zé)則是淡化聯(lián)邦的參與性,由各州擔(dān)任監(jiān)測主體,自主制定基于州水平的評估目標(biāo),將學(xué)生的學(xué)業(yè)進(jìn)步數(shù)據(jù)作為教學(xué)績效測量的主要依據(jù)。
(二)成效之法:基于數(shù)據(jù)驅(qū)動的評價范式轉(zhuǎn)型
在評價與學(xué)習(xí)同時并存的共時性評價影響下,教育監(jiān)測評估方式逐漸由結(jié)果為重的終結(jié)性評價發(fā)展為學(xué)習(xí)目標(biāo)、學(xué)習(xí)過程和學(xué)習(xí)效果三位一體的全流程評價。隨著大規(guī)模評估從紙筆形式拓展為計算機或數(shù)字形式,評估的過程數(shù)據(jù)被有效地記錄下來。過程數(shù)據(jù)的動態(tài)性、層次性、客觀性等獨特優(yōu)勢,為教育監(jiān)測評估從階段性的終結(jié)性評價向多元數(shù)據(jù)驅(qū)動的全流程評價轉(zhuǎn)變提供了支持。數(shù)據(jù)驅(qū)動的教育監(jiān)測評估通過分析教與學(xué)的過程留痕信息來衡量教育主體在創(chuàng)造、協(xié)作、社會情感方面的水平,能夠為教育監(jiān)測評估開展更深入的教育成效機制分析提供有效的實證依據(jù)。
(三)需求之基:基于成果轉(zhuǎn)化的認(rèn)證模式創(chuàng)新
隨著數(shù)智化技術(shù)在教育系統(tǒng)中的融合創(chuàng)新與深度滲透,學(xué)習(xí)環(huán)境開始以教為中心向以學(xué)為中心轉(zhuǎn)變,使泛在學(xué)習(xí)成為一種重要的學(xué)習(xí)形式。在此影響下,數(shù)字教育監(jiān)測評估范圍需擴大至非傳統(tǒng)學(xué)習(xí)情境,其認(rèn)證形式也從傳統(tǒng)的封閉式認(rèn)證向開放學(xué)習(xí)結(jié)果認(rèn)證轉(zhuǎn)變。數(shù)字教育機制下的學(xué)習(xí)結(jié)果認(rèn)證是基于能力本位理念,根據(jù)學(xué)習(xí)者數(shù)據(jù)化學(xué)習(xí)軌跡、直觀化學(xué)習(xí)結(jié)果、可移植學(xué)習(xí)記錄進(jìn)行數(shù)字憑證的認(rèn)定,通過證書引擎為學(xué)習(xí)者的資歷框架建立映射關(guān)系,促進(jìn)學(xué)習(xí)成果積累的流動性與轉(zhuǎn)換性。
(四)發(fā)展之向:基于增值評價的質(zhì)量效益提升
隨著教育進(jìn)入高質(zhì)量發(fā)展階段,教育監(jiān)測評估的理念目標(biāo)也由保障教育公平逐漸轉(zhuǎn)向推動師生的全面發(fā)展[8]。增值評價作為關(guān)注起點、過程、變化和結(jié)果四元一體的評價方式,其評價理念貫徹立德樹人宗旨,評價目標(biāo)指向主體間的協(xié)同增值,其形式分為學(xué)生增值、教師增值以及學(xué)校增值。其中,學(xué)生增值是學(xué)生在五育并舉方面的漲幅,教師增值則是兼顧學(xué)生的學(xué)業(yè)成就增長與教師個人專業(yè)發(fā)展的凈值,學(xué)校增值是去除不可控因素的影響,單獨考察學(xué)校對學(xué)生成績影響的凈效應(yīng)。增值評價的最終旨趣在于教學(xué)效益的提升,通過評價為教育利益相關(guān)者提供多維立體的評價決策方案,增大教育投入產(chǎn)出比值,實現(xiàn)教育多方效益、學(xué)校管理效益、師生集合效益的實質(zhì)性提升。
三、數(shù)據(jù)驅(qū)動教育監(jiān)測評估的理念遵循
(一)以主體發(fā)展需求為監(jiān)測目標(biāo)
人本主義強調(diào)教育的前提是完整的人和自我實現(xiàn),堅持工具理性與價值理性的辯證統(tǒng)一,其目的是實現(xiàn)教育主體的全面發(fā)展與個性發(fā)展的雙重旨?xì)w[9]。人本主義影響下的教育監(jiān)測評估在目的上側(cè)重于主體的發(fā)展,在評估內(nèi)容上注重主體的多元表現(xiàn),在評估方法上強調(diào)定性與定量評價相整合,在評估結(jié)果上強調(diào)結(jié)論用于決策。該類監(jiān)測評估以主體的個性化需求為前提,以評價的發(fā)展性功能為核心,通過厘清教育主體與發(fā)展需求間的內(nèi)在聯(lián)系,實現(xiàn)學(xué)生發(fā)展、教師隊伍和學(xué)校辦學(xué)的量與質(zhì)并進(jìn)增長[10]。
(二)以動態(tài)生成數(shù)據(jù)為監(jiān)測過程
實證主義采用數(shù)據(jù)統(tǒng)計和建模處理教育信息,以數(shù)據(jù)和證據(jù)為基礎(chǔ)探究教育規(guī)律[11]。實證主義影響下的教育監(jiān)測評估以量化、聯(lián)通的數(shù)據(jù)為基礎(chǔ),將隱性的過程數(shù)據(jù)與顯性的監(jiān)測目標(biāo)相關(guān)聯(lián)。該類評估形式可分為預(yù)測和描述兩大類,預(yù)測類監(jiān)測評估通常以教育主體在課程系統(tǒng)的進(jìn)展數(shù)據(jù)來預(yù)測最終的課程結(jié)果,并給予及時干預(yù)[12]。描述類監(jiān)測評估是以客觀事實的生成性數(shù)據(jù)為基礎(chǔ),對教育現(xiàn)象或事物展開觀察和描述,目的是了解教育現(xiàn)象的特征、規(guī)律和效果,為教育決策制定提供全局證據(jù)。
(三)以智能融合分析為監(jiān)測技術(shù)
工具主義突出了教育的工具性職能,將技術(shù)、工具和方法視為解決教育問題和實踐的主要手段。工具主義影響下的教育監(jiān)測評估從實際的教育需要和績效要求出發(fā),追求教育效能同技術(shù)的協(xié)同與平衡。智能技術(shù)能夠全面分析數(shù)字教育中的全時域布局?jǐn)?shù)據(jù),形成從評估主體的分析洞察,到可視化呈現(xiàn)評估結(jié)果的全鏈路智能融合分析。其中包括面向多主體行為的交互式下鉆分析,通過整合教育監(jiān)測主體的多源數(shù)據(jù)以洞察主體特征,能夠?qū)崿F(xiàn)從人到場的全視角評價分析與決策。
(四)以增進(jìn)管理效益為監(jiān)測結(jié)果
管理主義通過設(shè)立明確的管理目標(biāo)、實行教育問責(zé)的方式把控教育質(zhì)量,從而強化教育評價的監(jiān)督機能,整體上追求效率和效益的最大化。管理主義影響下的教育監(jiān)測評估既表現(xiàn)出鑒定、問責(zé)和改進(jìn)的教育管理功能,也表現(xiàn)出作為一項獨立的教育改革項目或教育政策的功用[13]。作為教育質(zhì)量保障的有效手段,該類評估以提升教育質(zhì)量為目標(biāo)[14],旨在簡化評價內(nèi)容、提升評價精度、擴大評價范圍,通常以計算機測驗為主要形式,適用于大規(guī)模的學(xué)業(yè)水平測試中。通過計算機測驗的自動評分和分段反饋功能降低紙筆測驗伴隨的誠信風(fēng)險,能夠解決區(qū)域性評估中的測試反饋時效和評價效率等難題。
四、數(shù)據(jù)化教育監(jiān)測評估的模式與技術(shù)
(一)場景化數(shù)字教育監(jiān)測評估模式
1.面向課堂大數(shù)據(jù)的教育監(jiān)測評估
課堂大數(shù)據(jù)是在真實的課堂情境下,伴隨師生或生生雙向知識創(chuàng)生過程,生成高度同步課堂教學(xué)流程與教學(xué)生態(tài)的數(shù)據(jù)集。面向課堂大數(shù)據(jù)的教育監(jiān)測評估模式是以全景課堂為窗口,以智能終端與傳感器為端口,以課堂主體的行為、目標(biāo)、事件為切入口,通過常態(tài)化捕獲課堂全要素的全向互動關(guān)聯(lián)數(shù)據(jù),闡釋課堂活動背后的教與學(xué)規(guī)律。該模式作為大數(shù)據(jù)技術(shù)與課堂教育監(jiān)測評估的深度融合形式,通過課堂情境串聯(lián)教學(xué)活動與監(jiān)測數(shù)據(jù),能夠厘清教育監(jiān)測評估主體、客體和需要三者間的關(guān)系,從實踐層面解決師生在多樣課堂教學(xué)場景中的需求識別問題。
2.面向在線大數(shù)據(jù)的教育監(jiān)測評估
在線大數(shù)據(jù)是師生基于數(shù)字化教育平臺,通過雙向互動的教育資源建立協(xié)作聯(lián)結(jié),并在關(guān)系聯(lián)結(jié)過程中生成的數(shù)據(jù)集。面向在線大數(shù)據(jù)的教育監(jiān)測評估模式是基于師生在線教育云平臺的序列數(shù)據(jù),從教學(xué)、管理、服務(wù)、資源等方面對在線過程數(shù)據(jù)進(jìn)行運行狀態(tài)監(jiān)測,進(jìn)而為提升在線教育質(zhì)量的針對性提供證據(jù)指向。該模式基于在線教育的分層結(jié)構(gòu)劃分評價層次,內(nèi)嵌于在線教育的多分段事件觸點中,立足于更強的生成意識和交互體驗,能夠連續(xù)呈現(xiàn)在線教育要素的活動狀態(tài)信息。
3.面向雙線混融大數(shù)據(jù)的教育監(jiān)測評估
雙線混融大數(shù)據(jù)是遵循教學(xué)事件邏輯,將面對面教學(xué)與在線學(xué)習(xí)共時并存的顯性化結(jié)果類數(shù)據(jù)、隱性化過程性數(shù)據(jù)進(jìn)行交叉印證和相互補償,從而生成多源數(shù)據(jù)混融的數(shù)據(jù)集。面向雙線混融大數(shù)據(jù)的教育監(jiān)測評估模式是在遵循線上與線下差異化共生發(fā)展的基礎(chǔ)上,將虛實兩種時空的教學(xué)活動進(jìn)行歷時性分工和共時性交叉,結(jié)合活動的外部特征和內(nèi)在建構(gòu)屬性,圍繞教學(xué)環(huán)境、教學(xué)過程、教學(xué)效果、學(xué)習(xí)成效等方面的變化進(jìn)行虛實場景的持續(xù)監(jiān)測。該模式將線上與線下的環(huán)境、資源、方法等要素融合貫通,能夠?qū)崿F(xiàn)以多元監(jiān)測評估工具兼顧虛擬時空與物理時空的信息流動。
(二)感知化數(shù)字教育監(jiān)測技術(shù)
1.依托物理感知的教學(xué)現(xiàn)象監(jiān)測
物理感知技術(shù)主要面向課堂教學(xué)場景下的主客體及活動要素,以前端傳感器為主要感知器件,監(jiān)測教育主體的具身行為及其所在的環(huán)境信息。依托物理感知的教學(xué)現(xiàn)象監(jiān)測常發(fā)生于技術(shù)豐富環(huán)境下的物理課堂空間,通過課堂內(nèi)部的基礎(chǔ)設(shè)施感知生理信號、語音信號、面部表情信號,能夠突破以往人力監(jiān)測在感知范圍和感知規(guī)模上的限制,以構(gòu)建物理空間各要素間的有效聯(lián)系和互動機制。該類監(jiān)測技術(shù)為教師提供一種情境再現(xiàn)式監(jiān)測手段,能夠基于感知設(shè)備呈現(xiàn)出課堂現(xiàn)象中人與人、人與物、人與環(huán)境、人與信息之間的多層次協(xié)同。
2.依托數(shù)字感知的人機交互監(jiān)測
數(shù)字感知技術(shù)面向教學(xué)主體分離狀態(tài)下的在線教育關(guān)系網(wǎng),以埋點為實時接入手段,通過教育主體觸發(fā)特定行為實現(xiàn)在線數(shù)據(jù)的自動上報。數(shù)字感知的教育監(jiān)測多發(fā)生于在線教育環(huán)境,通過嵌入數(shù)據(jù)采集代碼,利用數(shù)字技術(shù)自身的無感化特性實現(xiàn)靜態(tài)開放教育資源數(shù)據(jù)與動態(tài)用戶行為數(shù)據(jù)的全時段感知。該類監(jiān)測技術(shù)基于雙通道原則,通過多種感官刺激引發(fā)主體在交互方式和行為空間上的沉浸感,并以此探究教育主體的行為模式和交互軌跡,顯現(xiàn)出主體潛在的行為模式,從而清晰連貫地推進(jìn)教育監(jiān)測評估對教與學(xué)過程的預(yù)測和優(yōu)化。
3.依托情境感知的活動事件監(jiān)測
情境感知主要面向線上與線下融合教學(xué)中“人—事—場”之間的作用關(guān)系,基于主體與事件、主體與場境之間的交互活動,利用移動教學(xué)設(shè)備圍繞主體位置、空間與行為進(jìn)行監(jiān)測。情境感知的教育監(jiān)測常用于主客體與知識場交互的場境化環(huán)境中,通過智能傳感設(shè)備從泛在學(xué)習(xí)情境中檢索活動主體與場境要素的交互狀態(tài)及傳感數(shù)據(jù),實現(xiàn)對教育活動情境的監(jiān)測。該類技術(shù)對情境學(xué)習(xí)下的預(yù)設(shè)性知識與生成性知識進(jìn)行統(tǒng)一監(jiān)測,將監(jiān)測內(nèi)容拓展至學(xué)生基于情境的知識建構(gòu)過程,能夠整合情境結(jié)構(gòu)、活動屬性及主體需求,定位評估主體知識經(jīng)驗的價值與問題所在。
(三)多元化數(shù)字教育評估方式
1.基于集中式數(shù)理統(tǒng)計的終結(jié)性教育評估
終結(jié)性評估作為階段性教育質(zhì)量評定的主要方式,能夠為教育管理者制定政策提供高效能的集成化證據(jù)。以往階段性采集方式存在數(shù)據(jù)采集維度少、采集速度慢等問題,難以滿足當(dāng)前數(shù)字教育環(huán)境下的終結(jié)性評估對數(shù)據(jù)體量與效率的需求。集中式數(shù)理統(tǒng)計的終結(jié)性評估是在確保教育數(shù)據(jù)的一致性與安全性的前提下,將各階段數(shù)據(jù)進(jìn)行統(tǒng)一搜集、整理與分組,對教育服務(wù)質(zhì)量進(jìn)行實證評估。該方式將教育評估作為一個整體與部分辯證聯(lián)系的組織系統(tǒng)展開數(shù)理統(tǒng)計,能夠基于集中式的現(xiàn)有資源,為終結(jié)性教育評估提供準(zhǔn)確的定量分析數(shù)據(jù)。
2.基于伴隨式數(shù)據(jù)挖掘的過程性教育評估
過程性評估是一種重視教育的非預(yù)設(shè)產(chǎn)出,關(guān)注目標(biāo)、過程、成效三位一體的價值取向評價,能夠為教育主體發(fā)展評估提供過程性的證據(jù)支持。過程性評估對于主體發(fā)展過程監(jiān)測的完整性與客觀性需求,決定了其評估依據(jù)不能過度零散,需結(jié)合伴隨式數(shù)據(jù)挖掘為其提供持續(xù)性的監(jiān)測數(shù)據(jù)。基于伴隨式數(shù)據(jù)挖掘的過程性評估是以實時數(shù)據(jù)采集平臺為技術(shù)支撐,以情境共存為采集標(biāo)準(zhǔn),將教育數(shù)據(jù)生成、流轉(zhuǎn)與轉(zhuǎn)換的邏輯鏈路作為過程性評估的采集節(jié)點,為最終的結(jié)果精準(zhǔn)反饋提供對應(yīng)標(biāo)簽。其面向教育全過程數(shù)據(jù)展開連續(xù)追蹤并加以動態(tài)評價,能夠縱向挖掘教育問題的成因,解決數(shù)據(jù)與評價相脫節(jié)的盲點。
3.基于生成式人工智能的預(yù)測性教育評估
預(yù)測性評估是兼顧教育效果評估和教育風(fēng)險預(yù)估為一體的集成化評估方式,能夠為教育政策的實施結(jié)果、效能和影響進(jìn)行建模預(yù)測,并根據(jù)預(yù)測結(jié)果進(jìn)行差異化方案推薦。生成式人工智能作為一種基于概率和反饋原理設(shè)計的人機協(xié)同技術(shù)[15],能夠在靜態(tài)事實與動態(tài)預(yù)測之間創(chuàng)造一種新的聯(lián)結(jié)模式,為預(yù)測性教育評估提供精益化的預(yù)測和推薦模型。基于生成式人工智能的預(yù)測性評估是在機器學(xué)習(xí)框架的基礎(chǔ)上,對教育主體在規(guī)定情境中的對話、文本、音視頻等數(shù)據(jù)信息進(jìn)行分析,進(jìn)而形成該主體后續(xù)發(fā)展的預(yù)測軌跡,并根據(jù)主體需要進(jìn)行啟發(fā)性內(nèi)容的生成推薦。
五、大數(shù)據(jù)驅(qū)動教育監(jiān)測評估的實踐路徑
(一)理念先導(dǎo):面向終身學(xué)習(xí)的數(shù)據(jù)監(jiān)測體系
終身學(xué)習(xí)作為實現(xiàn)教育可持續(xù)發(fā)展目標(biāo)的關(guān)鍵途徑,能夠適應(yīng)教育數(shù)字化轉(zhuǎn)型背景下對知識更新學(xué)習(xí)提出的新要求。終身學(xué)習(xí)的需求驅(qū)動、內(nèi)容多樣、學(xué)習(xí)高效等特征,需要有覆蓋學(xué)習(xí)起點與終點的終身學(xué)習(xí)監(jiān)測評估體系來保證終身學(xué)習(xí)的產(chǎn)教融合質(zhì)量[16]。面向終身學(xué)習(xí)的數(shù)據(jù)監(jiān)測評估體系以增強公民終身學(xué)習(xí)能力為目標(biāo),以學(xué)習(xí)背景、投入、過程、結(jié)果四個維度為監(jiān)測內(nèi)容,以“學(xué)習(xí)輸入—輸出”為分析模式,通過監(jiān)測終身學(xué)習(xí)的過程與質(zhì)量,實現(xiàn)組織性學(xué)習(xí)與個人學(xué)習(xí)并重的多維監(jiān)測。在教育監(jiān)測評估實踐中加入面向終身學(xué)習(xí)的質(zhì)量評估,能夠在評估層次上為數(shù)字教育監(jiān)測評估由供給側(cè)轉(zhuǎn)向需求側(cè)提供附加動能。
(二)實踐邏輯:融合多源異構(gòu)數(shù)據(jù)的全鏈監(jiān)測
以往的教育監(jiān)測評估主要面向教育投入與轉(zhuǎn)化成果,缺乏下沉到教育過程中的細(xì)節(jié)性評估,弱化了教育監(jiān)測評估的干預(yù)和改進(jìn)功能[17]。多源異構(gòu)的融合數(shù)據(jù)是指從教育系統(tǒng)的不同維度采集物體傳感的硬數(shù)據(jù)與主體生成的軟數(shù)據(jù),將混合型數(shù)據(jù)經(jīng)過統(tǒng)一化處理后,生成具備多維特征的價值信息。融合多源異構(gòu)數(shù)據(jù)的全鏈路教育監(jiān)測評估是以集體共生的教育場景為起點,以數(shù)字教育全時域下教育投入的轉(zhuǎn)化過程為明線,以教育傳感數(shù)據(jù)的數(shù)據(jù)級融合、教育屬性數(shù)據(jù)的特征級融合、教育應(yīng)用需求的決策級融合為暗線,通過明暗線的交叉融合共同組成教育監(jiān)測評估的鏈?zhǔn)剿季S,實現(xiàn)監(jiān)測評估流程的邏輯優(yōu)化。由多源全生命周期的數(shù)據(jù)鏈條構(gòu)成監(jiān)測維度,能夠從多源視角對高度復(fù)合的數(shù)字教育鏈進(jìn)行實時監(jiān)測并持續(xù)調(diào)優(yōu),全面刻畫教育監(jiān)測評估的數(shù)據(jù)融合路徑。
(三)變遷動力:數(shù)智技術(shù)驅(qū)動的差異發(fā)展評測
數(shù)智技術(shù)的進(jìn)階發(fā)展促使教育評測方向逐漸從標(biāo)準(zhǔn)化向差異化轉(zhuǎn)變,以多通道數(shù)智化技術(shù)為端口洞察教育全貌,能夠為教育評估的評測內(nèi)容豐富化、評測方式伴隨式、評測主體多元化提供技術(shù)底座。數(shù)智技術(shù)自身的最大攝取、存儲和處理能力能夠為差異化評測提供多端數(shù)據(jù)基礎(chǔ),通過調(diào)取教育全圖景的分析數(shù)據(jù),圍繞差異化評測目標(biāo)開展基于教育起點水平的差異督導(dǎo)與精準(zhǔn)決策,沿著差異化發(fā)展路徑推動教育主體不斷向更高的發(fā)展階段躍升。差異化評測在數(shù)智技術(shù)的加持下能夠兼顧大規(guī)模與差異化教育相統(tǒng)一,驅(qū)動評測場景從單一到多元,評價內(nèi)容從整體到局部,評價方向從橫向的協(xié)同數(shù)據(jù)到縱向的聯(lián)動數(shù)據(jù),兼顧個體與全體的綜合發(fā)展。
(四)運行依托:創(chuàng)新監(jiān)測評估的數(shù)據(jù)治理模式
以往關(guān)注存儲安全的數(shù)據(jù)治理模式難以適配當(dāng)前數(shù)字教育評測在數(shù)據(jù)規(guī)模、數(shù)據(jù)類別、數(shù)據(jù)傳送等方面更繁復(fù)的運行需求[18],為此需要創(chuàng)新教育監(jiān)測評估的數(shù)據(jù)治理模式,形成能夠滿足教育主體自我評估與教育教學(xué)質(zhì)量監(jiān)測雙層需要的治理模式。創(chuàng)新教育監(jiān)測評估的數(shù)據(jù)治理模式可以從宏觀、中觀和微觀三個不同層級來更新數(shù)據(jù)的治理方式與路徑。在宏觀層級上,通過建立評測數(shù)據(jù)全生命周期管理規(guī)范,為系統(tǒng)的評測活動營造規(guī)范的數(shù)據(jù)環(huán)境。在中觀層級上,通過參照元數(shù)據(jù)治理方式,采取覆蓋全場域監(jiān)測數(shù)據(jù)獲取、處理與應(yīng)用鏈條的治理路徑,對監(jiān)測數(shù)據(jù)進(jìn)行全周期的追蹤分析。在微觀層級上,通過執(zhí)行包含監(jiān)測策略、數(shù)據(jù)安全、數(shù)據(jù)流通與應(yīng)用的監(jiān)測數(shù)據(jù)治理策略,實現(xiàn)多源監(jiān)測數(shù)據(jù)的高效整合并推進(jìn)規(guī)范數(shù)據(jù)共享進(jìn)程。
(五)發(fā)展支撐:基于評估數(shù)據(jù)的反饋決策機制
評估結(jié)果的反饋與決策對評估主體的優(yōu)化發(fā)展有著密不可分的聯(lián)系。當(dāng)前教育監(jiān)測評估的反饋與決策機制存在反饋時效性弱、反饋方式單一、決策轉(zhuǎn)化率低等問題。需要從教育監(jiān)測評估數(shù)據(jù)出發(fā),建立主體需求驅(qū)動的評估結(jié)果反饋與決策機制。該機制是以循證醫(yī)學(xué)中的后效評價為理論指導(dǎo),從數(shù)字反饋的邏輯起點出發(fā),沿著教育主體發(fā)展的行為數(shù)據(jù)鏈條,將原始信息、統(tǒng)計信息、價值判斷信息、對策建議信息作為反饋內(nèi)容,按照自適應(yīng)推薦的方式搭建反饋與決策機制,將評估結(jié)果按照上下同行的正逆反饋形式反饋給主客體,充分彰顯了各主體的主動性。通過建立基于評估數(shù)據(jù)的評價結(jié)果反饋與決策機制,能夠發(fā)揮教育監(jiān)測優(yōu)化的主陣地作用,進(jìn)而加快推進(jìn)數(shù)字教育的高質(zhì)量發(fā)展。
參考文獻(xiàn):
[1]王戰(zhàn)軍,王永林.監(jiān)測評估:高等教育評估發(fā)展的新圖景[J].復(fù)旦教育論壇,2014,12(2):5-9.
[2]United States Congress. No child left behind Act[EB/OL]. (2002-01-08)[2023-09-15]. https://georgewbush-whitehouse.archives.gov/news/releases/2002/01/20020108.html.
[3]The Russian Government. Regarding the transfer of the national plan for “educational development” to project management[EB/OL]. (2017-12-28)[2023-10-27]. http://government.ru/docs/30832/.
[4]Office of Educational Technology. Reimagining the role of technology in education: 2017 national education technology plan[EB/OL]. (2017-01)[2023-11-02]. https://tech.ed.gov/files/2017/01/NETP17.pdf.
[5]The United Nations Organization for Education, Science and Culture. Accountability in education: meeting our commitments 2017/8 GEM Report[EB/OL]. (2017)[2023-12-14]. https://www.unesco.org/gem-report/en/accountability.
[6]Organisation for Economic Co-operation and Development. The uses of process data in large-scale educational assessments[EB/OL]. (2023-01-20)[2023-08-10]. https://www.oecd.org/publications/the-uses-of-process-data-in-large-scale-educational-assessments-5d9009ff-en.htm.
[7]張忠華.大數(shù)據(jù)驅(qū)動教育數(shù)字化轉(zhuǎn)型:關(guān)鍵應(yīng)用與實踐路徑[J].中國教育信息化,2023,29(10):17-27.
[8]劉志軍, 范韻婧.我國增值評價研究:現(xiàn)狀、問題與展望[J].中國考試,2023(4):35-41.
[9]司曉宏, 樊蓮花.義務(wù)教育均衡發(fā)展監(jiān)測的理性困境及其超越[J].教育研究,2020,41(11):83-90.
[10]趙瑞雪,靳玉樂,艾興.國外基礎(chǔ)教育監(jiān)測體系的建構(gòu)及啟示[J].基礎(chǔ)教育,2022,19(1):104-112.
[11]孔蘇,王曉曉.教育實證主義研究范式的賦魅與祛魅[J].重慶高教研究,2023,11(3):118-127.
[12]高守寶,張舒婷,孟現(xiàn)美,等.機器學(xué)習(xí)在科學(xué)教育評估中的應(yīng)用:維度、領(lǐng)域與規(guī)律[J].中國教育信息化,2023,29(10):83-92.
[13]韓映雄,李超.中國教育監(jiān)測評估制度的內(nèi)涵與變遷[J].現(xiàn)代大學(xué)教育,2022,38(4):101-110.
[14]楊秀芹,左佩瑩,李婷.美國高等教育監(jiān)測評估:特征及導(dǎo)向[J].清華大學(xué)教育研究,2017,38(1):81-86.
[15]王瑜,湯同.生成式人工智能浪潮下比較教育研究范式審思[J].比較教育研究,2023,45(10):31-38,49.
[16]陳麗,謝浩,鄭勤華.我國教育現(xiàn)代化視域下終身學(xué)習(xí)的內(nèi)涵與價值體系[J].現(xiàn)代遠(yuǎn)程教育研究,2022,34(4):3-11.
[17]徐瑾劼,張民選.教育監(jiān)測數(shù)字化變革的全球觀察及其啟示[J].中國教育學(xué)刊,2023(7):34-39.
[18]張輝,李健明,楊強.大數(shù)據(jù)視角下高校數(shù)據(jù)治理體系研究與實踐[J].中國高等教育,2022(Z2):16-18.
Empowering Digital Education Monitoring and Evaluation with Big Data:
Concepts, Models, and Pathways
Zhijia MOU1, Xiya FENG1, Fugen SU2, Shanshan LIU3
(1.Research Center of “Internet Plus Education”, Jiangnan University, Wuxi 214122, Jiangsu;
2.Research Division, Center for Education Management Information of the Ministry of Education, P.R.China, Beijing 100816;
3.The Experimental School of Jiangsu Xishan Senior High School, Wuxi 214177, Jiangsu)
Abstract: The monitoring and evaluation of digital education is an important step in promoting and deepening the digital transformation of education. As a new generation of information technology, big data can deeply present the essential characteristics and structural relationships of digital education, providing technical support for achieving multidimensional and fine-grained education monitoring and evaluation. The monitoring and evaluation of digital education has gone through an advancement of concept from measuring teaching performance, data-driven evaluation to innovating certification models and enhancing value-added benefits. It has formed a diversified value orientation supported by the needs of subject development, dynamically generating data, intelligent integration analysis, and enhancing management efficiency. The monitoring and evaluation of digital education is based on scenarioized data, with classroom big data, online big data, and dual line blended big data as application scenarios. It monitors teaching phenomena, human-computer interaction, and activity events through physical perception, digital perception, and situational perception. In terms of evaluation methods, digital education evaluation has evolved into summative education evaluation based on centralized mathematical statistics, process education evaluation based on adjoint data mining, and predictive education evaluation based on generative artificial intelligence. The practical path of big data-driven education monitoring and evaluation includes establishing a data monitoring and evaluation system, implementing full chain data monitoring, conducting differentiated development evaluation, innovating data governance models, and constructing feedback decision-making mechanisms to better promote the high-quality development of education evaluation.
Keywords: Big data; Digital education; Education monitoring and evaluation; Evaluation mode; Practical path
編輯:李曉萍 " 校對:王天鵬
DOI:10.3969/j.issn.1673-8454.2024.06.006
作者簡介:牟智佳,江南大學(xué)“互聯(lián)網(wǎng)+教育”研究基地副教授,博士(江蘇無錫 "214122);馮西雅,江南大學(xué)“互聯(lián)網(wǎng)+教育”研究基地碩士研究生(江蘇無錫 "214122);蘇福根,通訊作者,教育部教育管理信息中心研究處副研究員,博士(北京100816);劉珊珊,江蘇省錫山高級中學(xué)實驗學(xué)校教師,碩士(江蘇無錫 "214177)
基金項目:教育部教育管理信息中心教育管理與決策研究服務(wù)專項2023年度委托課題“數(shù)字教育監(jiān)測評估國際比較研究及其數(shù)據(jù)庫建設(shè)”(編號:MOE-CIEM-20230018);2022年度江蘇省教育科學(xué)規(guī)劃重點課題“多模態(tài)大數(shù)據(jù)支撐下的個性化學(xué)習(xí)活動設(shè)計與評價研究”(編號:B/2022/01/167)