999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從“關于學習的評價”到“作為學習的評價“

2025-06-17 00:00:00金婉瑩莊榕霞
中國遠程教育 2025年5期
關鍵詞:評價教育學生

一、引言

隨著人工智能、大數據、區塊鏈等智能技術的快速發展,教育教學正在被重塑,教育教學評價改革也迎來了新的機遇與挑戰。當前技術賦能教育評價改革相關研究主要集中在三個方面:一是從深化教育評價改革的戰略背景出發,從宏觀層面論證智能技術促進教育評價改革的科學性、合理性以及未來發展路徑(張進良等,2023;吳砥等,2023);二是從理論角度深人分析智能技術的特征及其在過程、結果、增值以及綜合評價中的作用,并對技術與評價融合中的風險、現實挑戰及未來發展方向進行反思(張生等,2021;劉邦奇等,2022;柴喚友等,2023;安富海,2023);三是從教學、數據分析等具體實踐層面,分析智能技術在教育教學評價中應用的邏輯場景、倫理困境以及應對策略(駱方等,2021;張志華等,2022)。相關研究已從宏觀到微觀、從理論到實踐對智能技術在教育教學評價改革中的作用展開深人探討,然而從操作層面和對評價進行“評價”的視角上,對教育評價過程中技術應用有效性展開元評價的研究還較少。

教育評價是對教育活動現實的或潛在的價值做出判斷,以期達到教育價值增值的過程(陳玉琨,1999,p.7)。元評價一般被認為是對評價的評價。盡管我國學者對元評價的用詞尚未統一,但內涵基本一致,即按照一定的標準,運用可行的科學方法,對教育評價方案、教育評價結果和獲得結果的過程進行分析,從而對教育評價做出價值判斷,也就是對教育評價的科學性、有效性和現實性等進行評價(高潔amp;蔡敏,2007)。我國學者也從元評價的角度建構了一般性的教育評價有效性指標(嚴芳amp;汪建華,2020)。元評價方法對于評價“教育評價中技術使用的有效性”有著天然的工具適切性。

作為教育評價的重要部分,智能時代的學習評價不僅聚焦于對預期目標實現度的評價,還要進一步通過評價促進學生學習,助力學生發展。學習評價的發展不是簡單地將技術應用于評價的某個環節,而是從評價理念到方法的轉變,并帶來學習評價新態勢。因此,本文從“關于學習的評價”到“作為學習的評價”,圍繞“如何評價智能技術支撐學習評價的有效性”這一問題,嘗試梳理技術支撐下學習評價變革的脈絡,對學習評價的理論演進以及技術融合與創新應用進行系統闡釋,進而探索結合背景一投人一過程—產出(Context-In-put-Process-Output,CIPO)模型和元評價理念構建分析框架,以分析和評價學習評價中技術使用的有效性,并探討評價過程中技術使用的若干倫理問題,以期為技術如何有效應用于學習評價提供參考。

二、技術支撐下的學習評價改革與創新

評價可以看作所有學習過程的核心(UNESCO,2019),新時期的學習評價目標、參與主體、評估范式、原則和標準等都發生了系統性的變化,相關的評價術語也不斷發展。在“形成性評價”和“總結性評價”之外,人們也使用了與之關聯且更強調學習的“關于學習的評價”和“促進學習的評價”,并進一步強調“作為學習的評價”。借助大數據、人工智能等技術突破傳統測評手段的局限,改進和完善現有的評價模型和工具,促進多元主體參與,系統、全面、科學地獲取、存儲、處理并匯聚各類評價數據,刻畫多維、全面的成長軌跡,將使評價從單一走向連續,實現多種評價方式相結合,促進評價多維、精準、系統化發展,對于綜合運用各類評價,發展“以學習為導向”的評價理念,有效促進教與學和學生發展有重要意義(Zeng etal.,2018)。

(一)理念演進:以學習為導向的評價

20世紀,總結性評價和形成性評價廣泛應用于教育領域。總結性評價主要用于認證或選拔特定年級或年齡段的學習者,以滿足其繼續接受學校教育、培訓或工作的需求(UNESCO,2019),而形成性評價則通過收集信息作為反饋來改進師生的教與學活動(Blackamp;Wiliam,1998)。隨著國際基礎教育課程與教學改革的推進,各國重視將教、學、評相結合,強調從學習的視角看待評價的不同作用。如英國的評價改革小組用“關于學習的評價”(Assessment of Learning,AoL)和“促進學習的評價”(Assessment forLearning,AfL)分別表征總結性和形成性評價的功能(AssessmentReformGroup,1999)。

關于學習的評價(AoL)是一種總結性評價,側重于通過衡量和報告學生的學習成果來檢驗他們的學習(AssessmentReformGroup,1999)。然而關于學習的評價(AoL)雖然回答了“評價究竟有什么用”的問題,但對“評價如何促進學習”的回答卻不夠細致徹底。因此,布萊克等人(Black etal.,2004)在系統總結形成性評價的效用之后提出了促進學習的評價(AfL)的理念。促進學習的評價(AfL)的目的是通過評價促進學生學習,并將評價作為學習過程中不可或缺的一部分貫穿于學習的整個周期。促進學習的評價(AfL)與建構主義緊密相連,側重于測量學生在特定領域的表現,不僅強調教師的反饋、同伴的評價和自我評價,還強調總結性評價的形成性使用(Taras,2010;Trumbullamp;Lash,2013)。促進學習的評價(AfL)能幫助師生利用各種方式了解學生的學習情況,教師能基于數據做出決策并為學生提供反饋,引導學生改變學習方式以提高學習成績,促進學習的評價(AfL)及其變體已經在世界各地得到廣泛應用(Kippers et al.,2018; Schildkamp et al., 2020)。

在早期促進學習的評價(AfL)中,學生不同學習階段的信息主要是由教師提供的,而不是學生在其元認知參與過程中獲得的(Sadeghiamp;Rahmati,2017)。厄爾(Earl,L.M.)認為促進學習的評價(AfL)將教師作為評價學生表現并提供反饋的“核心人物”,對提高學生自主學習能力的潛在作用發揮得還不夠,因此提出了“作為學習的評價”(Assessment asLearning,AaL)的理念作為促進學習的評價(AfL)的補充,并將自我評價作為其核心(Earl,2003;Dann,2014)。作為學習的評價(AaL)注重讓學生主動參與評價過程,通過設定成功標準,進行自我評估、自我調節和自我反思來改善學習(Schellekensetal.,2021),提高自身的元認知技能,學會學習并為未來的學習負責(Earletal.,2006)。可見,關于學習的評價(AoL)可以理解為總結性評價,而促進學習的評價(AfL)和作為學習的評價(AaL)則與形成性評價相對應。作為學習的評價(AaL)是促進學習的評價(AfL)的組成部分,其能更好地體現以學習為導向、教學評一體化的特征,已成為促進學習者獨立反思的關鍵概念。

有效的評價應能幫助我們了解、確認和改進學生的學習(TheHigherLearn-ingCommission,2007)。我國《義務教育課程方案(2022年版)》中也明確提出,“倡導評價促進學習的理念,注重提高學生自我評價、自我反思的能力,引導學生合理運用評價結果改進學習”(教育部,2022a),以學習為導向成為教育教學評價的基本理念。隨著學習評價向以學習為導向轉型,評價過程中師生課堂角色逐漸從教師主導轉變為師生共同參與,強調實現以學習者為中心的主動學習和自我監控,這與作為學習的評價(AaL)倡導的理念不謀而合,進一步凸顯了作為學習的評價(AaL)在學習評價體系中的重要性。同時,教與學實踐中還需要綜合運用總結性評價和形成性評價,將作為學習的評價(AaL)的獨特優勢與關于學習的評價(AoL)和促進學習的評價(AfL)相輔相成,以實現以學習為導向的評價。智能技術的發展為以學習為導向的評價提供了良好的環境。利用智能技術可以將三種評價理念有機結合,如針對總結性任務提供形成性反饋(AoL和AfL),也可以對學生針對先前反饋的解釋和使用情況進行評分(AoL和AaL)。自適應教學系統可以為不同學生按需配置資源和服務,支持學生遵循自己的學習軌跡創建最佳學習路徑,常態化進行同伴評價與個人反思,這使得評價內隱于學習過程成為可能(張生等,2021)。此外,借助智能技術可以對學生在學習過程中不易被觀察到的能力和素質進行數據采集、全面評估、分析和總結。在智能技術與教師的協同評價下,可以將教、學、評有機結合,為學生的全面發展提供有效參考,讓學生學會評價、學會學習。

(二)技術賦能:學習評價改革與創新

2020年10月,中共中央、國務院印發《深化新時代教育評價改革總體方案》明確提出:“堅持科學有效,改進結果評價,強化過程評價,探索增值評價,健全綜合評價,充分利用信息技術,提高教育評價的科學性、專業性、客觀性。”(中共中央&國務院,2020)文件中的四個評價也體現了“關于學習的評價”(AoL)、“促進學習的評價”(AfL)和“作為學習的評價”(AaL)的特征,是從整體上創新教育評價模式、要素和手段的路徑,是破“五唯”的治本之策。以學習為導向的評價理念,與以立德樹人為導向系統整體推進“四個評價”改革的改革路徑相契合,因此在探討智能技術支撐學習評價改革與創新時,一個關鍵點是對技術賦能四種評價方式的具體表征和作用機制進行分析,這為以學習為導向的思想落地提供重要抓手,也為建立有效全面的元評價體系提供具體參考。

第一是改進結果評價。結果評價是對學生一段時間學習結束后的學習效果的總結和判斷,體現了“關于學習的評價”(AoL)思想,常采用標準化測試、量化指標計分等方法進行評價(張學敏amp;趙國棟,2022),在教育評價領域具有重要作用。但結果評價無法全面反映學生的學習過程和綜合素質的發展情況;主觀題依賴評分專家以及結果用于高利害目的等也導致其應用存在一定局限性(張志華等,2022;吳砥 等,2023;Gobert etal.,2013)。智能技術為改進結果評價提供了新思路。一是開展遵循核心素養的智能化測試,綜合學生學段、發展特征、評價目標、活動任務等需求,設置多元測試材料、測試場景和交互方式,收集多模態學業成就數據,使結果評價真正促進學生的發展(劉浩等,2022;譚霞amp;吳欣歆,2023);二是利用智能閱卷提高評價效率和客觀性,海量數據比對分析并及時呈現評價結果以促進學生自我評價能力提升;三是助力典型技能評估,如PISA2015使用人機交互方式測評學生問題解決與科學探究能力;四是增強與學生發展的聯系,如與過程評價一起服務于學生成長,或將評價結果用于增值評價的開展,以及各學段總結性評價的貫通等。

第二是強化過程評價。過程評價體現了“促進學習的評價”(AfL)和“作為學習的評價”(AaL)的理念,表征了將目標、過程與發展并重的價值取向,注重對教與學過程以及學生的非智力因素等進行全面動態的考察,強調對學生進行及時頻繁的反饋和指導,相較于結果評價更注重學生的能力提升和長期發展(高凌飚,2004;李凌艷amp;張志紅,2022)。但由于過程評價可選擇的方法較多、教師主觀性較強、與教學過程融合要求較高、教師由于任務繁重對細節捕捉不足,導致評價的一致性和可靠性難以保證;多樣化資料分析成本高、難度大、評價強度難以把握、缺少有力工具支撐、評價易于形式化、評價數據挖掘困難等導致其難以常態化有效開展(高凌飚,2004;張志華等,2022;劉邦奇等,2022)。智能技術為過程評價的創新提供機遇。一是促進評價目標由事先設定向預設與數據挖掘相結合轉變,提高評價目標的全面性和精準性;二是全過程、伴隨式、多樣態數據采集,通過對學習全過程全方面(包括學生認知、行為、生理和心理等)數據的動態化采集,提供更加精確、全面的評價信息,協助教師深入把握學生的學習過程和表現情況;三是海量數據分析和決策(回智光,2021),通過對大規模學習數據的挖掘,分析學生的潛在能力水平、問題解決策略、思維過程和內部心理活動等認知過程,協助精細化教學實施和教學策略調整,助力揭示學習模式和趨勢(駱方等,2021;Ouyangetal.,2023);四是支持學生自我導向學習能力發展,助力學生參與評價目標設定、體驗評價過程,并根據評價結果進行自我反思,促進教、學、評的融合;五是個性化評價和指導,通過建構科學的評價模型并與結果評價、增值評價、綜合評價相結合,對學生成長加以畫像,以評促學,助力學生發展。

第三是探索增值評價。增值評價強調學校或教師對學生教育成果的價值(OECD,2008,p.17),可作為結果評價的補充反饋階段性的成果,以促進教育教學改進。但增值評價模型種類繁多,模型適用條件嚴格、專業性強、結果抽象復雜,對數據的穩定性和可靠性要求高,傳統數據存儲與管理方法難以支撐其大量數據的存儲和安全,且易忽略非標準化測驗(李世梅amp;萬華,2023)。智能技術為探索增值評價提供新機遇:一是理想模型選擇,通過反復訓練和調整模型并利用大量教育教學數據進行測試,提升增值評價模型的穩定性和可信度,為教育決策提供更有力的依據(安富海,2023);二是數據采集和維護,利用智能技術采集和整合學校記錄、教師評估、家長反饋等不同來源的數據并進行數據庫的維護與鏈接,構建更加全面的學生增值評價數據系統;三是促進增值評價與多元評價方法融合,綜合學業表現、社會技能等方面的表現,避免極端數據對評價結果的影響。我國一些區域已嘗試在對學校的綜合評價中采用增值評價(李凌艷,2020),探索總結性評價結果的形成性使用(李凌艷amp;張志紅,2022),如重慶市云陽縣將過程性考評與結果性考評有機結合,利用增值評價改進區內學校評價(凌鵬國amp;熊維建,2021)。

第四是健全綜合評價。綜合評價是對學生各方面能力和素質的全面評估、分析和總結,其有效開展需將結果評價和過程評價融合使用。現有綜合評價主要針對學生綜合素質評價,鼓勵多方評價主體參與。綜合評價在科學構建指標、合理分配權重方面存在爭議,亟須提高指標體系的一致性。加之由于缺少系統性工具且問卷調查和自我報告等方式易受到主觀因素的影響,評價準確性難以保證;大量信息的系統化分析對評價者要求較高,現有運行機制不夠完善導致其可操作性不強(李興奇amp;高曉紅,2022;徐文娜 等,2022;檀慧玲 等,2023;李可會amp;劉海龍,2023)。智能技術能賦能綜合評價全流程(柴喚友等,2023)。一是科學確定評價指標權重,通過大規模、長周期、多場域的測試工具采集多維度數據,精密計算指標權重并模擬模型進行驗證迭代,構建科學評價模型。二是多場景、多維度數據采集,科學把握綜合素質評價的價值定位和使用方法,最大化提升評價的全面性和精準性。三是差異化評價,通過對學生學習行為、興趣愛好等方面進行智能分析,以針對個體進行評價指導;四是采用數據密集型研究范式,基于多維度、多來源、多樣態數據的關聯和建模,實現對學生發展的整體評價。

三、元評價:學習評價中的技術有效性

為了確保技術在學習評價應用中的有效性,幫助評價者識別持續改進的因素,減少技術使用偏倚并預防技術濫用等問題,可以引人元評價方法對技術應用效果進行系統性評估,從而增強評價結果的可靠性,保證并提高學習評價質量。通過上述學習評價改革與創新分析可以發現,技術在“四個評價”改革中的作用及特點不盡相同,因此在建構智能技術支撐學習評價有效性的元評價指標時,需要在共性指標的基礎上,根據不同的評價類型建構具體的指標體系。因此,本文先從分析教育元評價的關鍵標準出發,結合CIPO模型建構評價技術有效性的元評價框架,再以過程評價為例具體分析。

(一)教育元評價關鍵標準

邁克爾·斯里克文(Scriven,M.)最早從字面意義上將元評價定義為“評價的評價”(Scriven,1969)。丹尼爾·L.斯塔弗爾比姆(Stufflebeam,D.L.)則從操作的角度,將元評價定義為界定、獲取、應用描述性以及判斷性信息以指導和報告評價的優缺點的過程(Stufflebeam,2001)。元評價包括形成性元評價和總結性元評價(Stufflebeam,2000)。其中,形成性元評價在策劃評價方案或實施評價時同步進行,協助評價者對自己的評價進行計劃、實施、改進和解釋;總結性元評價則在評價完成后進行,主要根據擬定的評價標準分析評價的價值和優缺點。本文主要參考總結性元評價標準,在評價完成后進行系統的回顧和評價。

隨著元評價的發展,目前已經有許多評價質量標準可供參考,如斯塔弗爾比姆針對美國教師績效評價體系提出的元評價標準(Stufflebeam,2000)、美國教育評價標準聯合委員會(the Joint Committee on Standards for Educational Evalua-tion,JCSEE)的項目評價標準(Yarbrough etal.,201O)、戴維森(Davidson,J.E.)的元評價標準(Davidson,2005,pp.205-208)、斯克里文的元評價檢查單(Scriven,2011)、我國學者嚴芳和汪建華(2020)的教育元評估標準,等等。其中,JCSEE的項目評價標準得到了美國評估協會(American Evaluation Associa-tion,AEA)的支持,在各種元評價項目中得到了廣泛使用;斯克里文的元評價檢查單列出了每個關鍵指標的組成維度方便評分;嚴芳等提出的評價框架則更符合我國教育國情。

將以上標準的一級指標進行對比(如表1所示)并分析每個一級指標的內涵,可以發現元評價至少應包含有用性、可行性、正當性、準確性和有效性五個關鍵標準。這些標準適用于所有教育評價項目,也適用于不同類型的學習評價。

表1元評價的關鍵標準

第一,有用性,用于判斷評價對受眾和利益相關者在多大程度上有用,應包括對利益相關者的關注以及對評價者可信度、評價目標或價值判斷清晰一致、所需信息選取范圍明晰、評價報告及時、評價結果明確以及評價影響等方面的考量。

第二,可行性,要求評價現實穩健,包含對評價程序和評價情境可行性的考慮,以及對成本效益、項目管理、評價內容、評價方案和評價專家的評價。

第三,正當性,要求評價合法且合乎倫理地進行,主要是對評價程序的正當性(包括法律、道德、文化方面)的考量,具體包含評價程序合法、評價符合倫理和社會文化要求、評價過程清晰公平且透明、評價結果公開展示,以及對利益沖突和財政責任的解釋和說明等。

第四,準確性,要求評價設計、過程和結果真實準確可靠,包括評價程序和情境的記錄與分析、信息來源和采集工具方法合理可靠、評價設計與分析科學合理、結論公正,以及評價程序本身是否包含元評價。

第五,有效性,考察評價結果是否能夠實現其實踐價值,應主要包括評價結果真實客觀可靠、評價結果穩健、評價結果的效用和時效以及有效建議等。

(二)技術支撐學習評價的元評價模型

元評價是評價的一種形式,應滿足評價的基本標準,即技術適當性、有用性和成本效益,還要關注評價的公平公正性、合理性以及是否符合道德性規范和倫理原則等。元評價與一般性教育評價有著不同的側重點。如在教學活動過程中,教師采用“作為學習的評價”(AaL)核心聚焦學生這一評價主體,關注學生的學習過程并促進其學習策略的及時調整等,關注的是評價目標的直接達成;而元評價關注的重點則在“作為學習的評價”(AaL)這一評價活動本身的質量,如其目標是否明確、具體,是否符合課程標準,是否能夠真實反映學生的學習情況以及評價過程是否公平可靠、評價結果是否真實有效等。斯塔弗爾比姆(Stufflebeam,1974,p.77)提出由目的(形成性元評價和總結性元評價)、步驟(界定、獲取和應用信息)和對象(評價目標、設計、過程和結果)構成的元評價三維邏輯結構,成為設計元評價活動的指南。國外已有的元評價標準也多體現該結構的部分特征,如JCSEE第一版項目評價標準對有用性等的強調體現了元評價的基本標準,美國評價研究協會(EvaluationResearch Society,ERS)從制定和溝通、結構和設計、數據收集和準備、數據分析和解釋、交流和公布以及使用六個環節提出元評價標準,體現了元評價實施步驟的要求(Lincoln,1985)。

任何類型的評價均需滿足技術適當性、有用性和成本效益要求,并要服務于其評價目的。《深化新時代教育評價改革總體方案》將“科學有效”作為我國教育評價改革的主要原則之一。《義務教育質量評價指南》也強調要“不斷提高評價工作的科學性、針對性、有效性”(教育部等六部門,2021)。據此,可以認為技術應用于學習評價的目的是賦能評價,實現評價的科學有效,促進以學習為導向的評價理念的落實。為了探究技術能在多大程度上提升學習評價的科學性和有效性,促進教與學效果的提升,本文嘗試借鑒斯塔弗爾比姆的元評價三維邏輯結構,結合上述元評價五個關鍵標準,并引入CIPO模型構建智能技術支撐學習評價有效性的元評價模型,幫助社會、學校和師生分析智能技術在學習評價中的效用,如圖1所示。

圖1智能技術支撐學習評價的元評價模型

CIPO模型是雅普·希爾倫斯(Scheerens,J.)所開發的學校運作基本系統模型,可應用于教育系統、學校和課堂,還可用作分析框架來審查教育質量(Kugeretal.,2016,pp.7-8)。CIPO模型能通過系統分析評價活動的背景(Con-text)、投人(Input)、過程(Process)和產出(Output),幫助我們全面審視和評價教育評價活動的質量和效果,其具有高度的靈活性和可操作性,對元評價活動具有較強的指導意義。其中,“背景”原指教育的一般社會條件,在學習評價中指評價發生的背景、目標以及利益相關者等相關信息;“投人”原指教育制度條件,如學校、課堂、個人等層面的基本條件,在學習評價中是為了實施評價各相關方面所做的準備;“過程”原指不同學習環境下的教育教學過程,在學習評價中則指評價的具體實施過程,包括評價活動的開展、評價數據的收集和分析等;“產出”原代表不同的教育結果,評價中則對應的是學生學業成績或其他非認知結果等。

由于技術支撐的學習評價要將關于學習的評價、促進學習的評價和作為學習的評價相結合,以促進學生的學習和發展,其不僅關注通過評價直接獲得的各種結果性數據(如學生學業成績等),更關注評價結果的有效使用,即關注學習評價的可持續性和長期影響。因此,本文在CIPO模型的基礎上,分別將“評價背景”與“Context”、“評價投入”與“Input”、“評價過程”與“Process”相對應,將“評價產出”與原“Output”相對應并擴展為包括“產出”(Output)、“成果”(Outcome)和“影響”(Impact)。其中,“產出”是對學習評價方案實施的評價活動或評價結果的量化統計結果或質性評價結果;“成果”體現的是評價目標的達成情況;“影響”則體現了學習評價方案直接或間接產生的影響。這里的評價產出在一定程度上體現了對學習評價的效果、效率和效益的關注。

技術可用于評價的各個環節,包括評價目標設定、方案制定、數據收集與分析,以及結果呈現、使用和分享,與上述評價的背景、投入、過程和產出相對應。由圖1可見,在對技術應用于學習評價開展元評價時,要以科學有效作為評價的總目標,從技術在評價背景、投入、過程和產出中的應用出發,對各維度下的評價實踐與評價標準的符合程度做出評判,它能時刻提醒人們在智能時代要關注教育評價的本質,強調技術為評價服務。由于評價各環節的目的和特征不同,開展元評價時的側重點會有所差異,特別要關注技術支撐下的評價目標的重要性、合理性和適切性,評價設計方案技術選擇的適當性和可行性,評價過程技術使用的充分性、精確性和倫理界限,評價產出所體現的技術效用、技術融合度、評價結果使用情況、各方對技術的接受度和滿意度,等等。

此外,也有學者通過對現有元評價模型的比較分析發現,各模型在評價內容觀測點方面,均要對初始評價的“評價目標、方案、工具、主體、程序、組織、技術、監控、結果形式等實施再評價”(李鵬,2020)。基于圖1和上述各評價內容觀測點,可以進一步形成多樣的智能技術應用于學習評價的元評價指標體系,服務于基于學生立體評價改進學習、優化教學、強化管理、科學選用人才和教育決策等。

(三)技術支撐過程評價的元評價模型

構建智能技術支撐學習評價有效性的元評價模型后,為了具體考察技術應用于“四個評價”的效用,本研究嘗試以過程評價為例,結合前述學習評價的理念以及技術在各類學習評價中的應用和作用機制,進一步建構智能技術支撐過程評價有效性的元評價模型。在對技術支撐過程評價的有效性進行元評價時,要關注評價方案設計中是否將評價和教師的教學改進、學生的自我導向學習相結合,關注評價結果是否用于促進教師的教學策略優化和學生的自主學習。基于此,在該模型中主要體現如下內容:

評價背景關注學習評價的需求、可能的利益相關者、具體的評價目標以及評價發生的背景環境。這個階段智能技術作為溝通工具、分析工具和制作工具等,重點支持了評價目標的調整與優化、評價方案的制定與完善。在以學習為導向的評價理念下,過程評價與其他評價方式的設計和運用理念有機結合,智能技術不僅促進評價信息在利益相關者之間高效傳遞,還深入挖掘評價數據的規律與趨勢,為評價設計提供科學依據,促進評價目標的及時調整優化和評價工具的迭代。元評價的關注重點是評價的有用性,即評價目標的有用性。

評價投人關注各方是否為學習評價的實施做好了準備,包括人員(教師、學生、學校和其他利益相關者)、評價環境和設施設備、評價資源(時間、經費等)、評價實施過程計劃、評價管理等。在這個階段,技術對評價環境的創設、評價活動和方式的選擇、數據收集和分析方案的選擇、協同評價機制的建立等進行支持。技術不僅為評價提供了更為豐富靈活且互動性強的平臺,拓寬了評價活動的邊界,使得教師評價、生生互評等多種評價模式得以實現,還為分析方案的選擇和各方良好溝通提供了有效的平臺。特別要考慮評價者和評價對象的數字評價勝任力,以及對師生所需的技術條件支持和技術人員支持(必要時應開展相關培訓)。其中,教師的數字評價勝任力可以理解為在數字環境下有效開展教與學評價所表現出來的基本能力和倫理品格,主要包括教師對技術用于評價的認知、評價方案的設計以及教師的數據素養,選擇和運用評價數據采集工具,應用數據分析模型進行學業數據分析,實現學業數據可視化與解釋,以及對技術倫理的關注等(教育部,2022b)。該階段的元評價重點要從技術充分性、有效性、投入效率比和可行性對評價方案進行評價,即評價方案的完備性、可行性和適宜性。

評價過程關注不同技術環境下過程評價的具體實施情況,關注評價方案執行過程是否能按原計劃高效率、高效益地開展,是否能真實、有效地采集、挖掘、呈現、存儲、處理評價用數據,并進行科學有效的分析。技術的支撐作用主要體現在提供多樣、包容、安全、友好、易操作的測評環境,以及真實可靠的數據采集、挖掘、呈現、存儲、處理方法和工具,確保采集數據真實準確有效、客觀公開公正,特別注意評價過程中是否注意遵守技術使用的倫理規范,防止技術濫用和偏見。該階段元評價的關注重點是評價過程的正當性和準確性。

評價產出從產出、成果和影響角度,關注大樣本、多模態數據分析所形成的評價結果及其科學性和合理性,關注技術支持下學習評價對預期目標的實現程度和對評價需求的滿足程度,關注各方對學習評價結果的使用情況(特別是教師是否利用評價結果改進自身教學,是否向學生提供及時反饋和個別化指導,是否引導學生將評價與其學習過程相融合,是否提升了學生的自我導向學習能力等,即是否實現了教學評一體化),關注各方對評價技術的接受度和滿意度,關注技術支撐的評價方案和機制的可持續性和可推廣性,以及技術支持下評價方案的創新設計等。該階段的元評價重點關注評價的有用性、準確性和有效性。

根據以上分析可以探索并構建智能技術支撐過程評價有效性的元評價模型(如圖2所示),在該模型中,各個組成部分均詳細列出了針對過程評價有效性的元評價二級指標。

標題

四、學習評價中的技術倫理問題與應對

智能技術在支撐學習評價上展現出了巨大潛力,然而也因其安全性、隱私性、不透明性等問題引發了一系列爭議。為了規避智能技術應用于學習評價的可能風險,需要厘清學習評價中可能出現的倫理問題并針對性地提出建議,以使其最大限度發揮效用。

(一)數據與隱私保護

與學習評價相關的數據問題主要涉及數據收集、處理、解釋和管理四個方面。在學習評價系統運行過程中,學生個人隱私受到前所未有的挑戰,指定學生的數據被學習評價系統收集、存儲并作為評價的依據使用,數據邊界模糊、數據冗雜、數據兩端對象不清等均會引發數據倫理風險問題(斜曉東,2023)。在處理數據過程中,若數據假設或統計方法存在偏差,則會引發嚴重后果。學習評價中的數據解釋問題主要來自對數據使用的不同觀點,以及學生、教師和學校等利益相關方之間的權力關系。此外,一旦數據泄露將會使學生面臨隱私安全的極大風險,因此對數據的管理也是一個重要挑戰。對于數據和隱私保護問題,首先,需要各界共同努力,建立相關的法律法規明確學生數據責任以及評價工具的倫理界限(蔣美仕amp;陳亮偉,2023)。其次,強化對數據隱私保護的監督,加強對市場評價工具的倫理監管,相關評價工具設計方和使用方應對數據收集界限有明確的劃分,并且需要獲得當事人或監護人的知情同意,尊重和保護學生隱私。再次,要確保評價工具具備充分的安全措施并采取明確、安全的存儲措施,相關技術和管理人員要遵守技術倫理規范,積極考慮和采納教育主體的建議(任鳳琴amp;董子涵,2023)。最后,積極提升師生的數據素養,提高他們對數據風險的認識和正確處理并保護學生數據的能力。

(二)算法決策和透明性

隨著人工智能技術的迭代創新,生成式人工智能發展迅猛。然而由于大語言模型透明度和可解釋性的問題,在實際應用中仍存在一系列現實隱憂。深度學習等機器學習算法可用于生成文字、圖像、音頻和視頻等合成媒體,但可能產生存在誤導、有害或不當的內容,預訓練的大型語言模型如采用滯后的數據庫,則可能導致其輸出錯誤或不準確的回答。此外,大型語言模型最初并不是為了教育目的而設計的,在面對大量社會性話語資料時更有可能從其大量的訓練數據中吸收社會偏見(如性別歧視等),影響評價的公正性,因此當我們試圖將其用于學習評價時,需要基于教育話語體系和特定語料庫再訓練評價模型,以提高回答的精準性和可參考性。需要推動研究和發展可解釋的人工智能算法,并建立審查和糾正訓練數據中的偏見的機制,以減少算法決策中的歧視問題。當生成不當內容時,審查機制應能夠及時發現且不向使用對象輸出,并向模型及時反饋。

(三)謹防技術至上主義

構建數字化教育評價體系需堅持價值先行、以人為本的理念與原則,審慎規避“技術至上”和“數據至上”的風險。師生的盲目信任都有可能對評價結果造成干擾。例如學生可以有意識地塑造符號身份并對評價系統畫像功能產生干擾,系統就會向教育者傳遞誤導信息。如果師生盲目接受系統的決策信息則會進一步鞏固其錯誤的符號化身份,師生雙方將面臨認知迷航的風險。目前,ChatGPT-4在一系列等級考試中取得了前 10% 的成績。如果將其生成的內容作為作業提交,教師和學習評價系統能否判斷出個人能力和貢獻度就將成為難題,這也使得僅依賴非監督性評估和提交作業判斷學生學習成果和能力的方法日益缺乏說服力(Pearce&Chiavaroli,2023)。因此需要提升師生的數字評價素養,堅持育人為本和技術為用相結合。對于教育者來說,保持在評價中的自主性是關鍵,專業判斷和靈活運用評價工具則同等重要。若教師過度依賴評價系統而不進行個人判斷和干預,學生在與技術交互的過程中就有可能會受到傷害。對于學生來說,如果盲目使用工具替代思考,也不利于自身發展。應嘗試積極開展技術倫理社會實驗,研究人工智能等技術對評價對象和評價模式的影響。此外,由于我國各地教育發展不均衡,也使得學習評價賴以開展的資源和條件存在不均衡,這也要求評價者應從以學習為導向的評價理念出發,因校制宜、因班制宜,選擇和應用適當技術支持的評價方案,合理開展評價。

五、結語

學習評價在教育評價改革中扮演著重要角色,回顧我國學生評價改革的歷程,每一次改革都與教育發展的核心價值觀和根本任務密切相關,體現出不同時期我國經濟社會發展對學生品質和能力培養的需求。當前,智能技術已經在一些學習評價領域展示出獨特的作用,因此我們需要明確技術在學習評價中的作用和其無法取代的部分,充分發揮技術在學習評價中的優勢,關注其用于評價的有效性,促進學習評價系統性變革。在持續推進學習評價改革的道路上,需要謹慎對待技術使用問題,確保評價的公平性、全面性和人本導向。未來,學習評價的改革與創新應該以促進學生全面發展為出發點,不僅關注評價目標的實現,更注重學生德智體美勞全面發展,要以價值理性為評價導向,回歸學習評價育人本位。

參考文獻

安富海.(2023).學生發展增值評價:理論闡釋與實踐進路.教育研究(9),64-75.

柴喚友,陳麗,鄭勤華,王辭曉,amp;王懷波.(2023).技術賦能學生綜合素質評價:進展、挑戰與路向.現代遠程教育研究(3),40-46,54.

陳玉琨.(1999).教育評價學.人民教育出版社

曉東.(2023).論生成式人工智能的數據安全風險及回應型治理.東方法學(5),106-116.

高潔,amp;蔡敏.(2007).美國教育評價的元評價及其啟示.世界教育信息(6),21-24.

高凌飚.(2004).過程性評價的理念和功能.華南師范大學學報(社會科學版)(6),102-106,113.

回智光.(2021).人工智能時代課堂教學變革邏輯與路徑.教學與管理(6),13-16

蔣美仕,amp;陳亮偉.(2023).教育大數據隱私安全的保護困境及其治理策略.自然辯證法研究(6),100-104.

教育部. 2022a-4-8) .教育部關于印發義務教育課程方案和課程標準(2022年版)的通知.中華人民共和國教育部網站.http://www.moe.gov.cn/srcsite/A26/s8001/202204/t20220420_619921.html

教育部.(2022b-12-2).教育部關于發布《教師數字素養》教育行業標準的通知.中華人民共和國教育部網站. http://www.moe.gov.cn/srcsite/A16/s3342/202302/t20230214_1044634.html

教育部等六部門.(2021-3-4).教育部等六部門關于印發《義務教育質量評價指南》的通知(教基[2021]3號).中華人民共和國教育部網站.htp://www.moe.gov.cn/srcsite/A06/s3321/202103/t20210317_520238.html

李可會,amp;劉海龍.(2023).有效性與倫理性:人工智能視域下的課堂教學.中國教育信息化(7),30-37.

李凌艷.(2020).如何用好教育增值評價?——對\"探索增值評價\"的主旨與行動的理性思考.中小學管理(10),8-10.

李凌艷,amp;張志紅.(2022).為學生更好地學習成長:打通教育評價改革的“最后一公里”.中小學管理(11),9-12.

李鵬.(2020).職業教育學習評價元評估標準:國際與本土的尺度整合.職業技術教育(1),6-12.

李世梅,amp;萬華.(2023).近30年我國學生增值評價研究現狀、熱點及趨勢.上海教育評估研究(1),55-60.

李興奇,amp;高曉紅.(2022).綜合評價結果的區分度與穩定性研究.統計與決策,38(16),16-21.

凌鵬國,amp;熊維建.(2021).教育質量過程性考評與結果性考評有機結合的探索——以云陽縣利用增值評價改進學校評價的實踐為例.今日教育(1),24-26.

劉邦奇,喻彥琨,amp;袁婷婷.(2022).智能技術賦能過程評價:目標、路徑與典型場景.現代教育技術(5),14-23.

劉浩,劉笑笑,amp;辛濤.(2022).人工智能賦能基礎教育監測的應用與挑戰.北京師范大學學報(社會科學版)(2),136-142.

駱方,田雪濤,屠焯然,amp;姜力銘.(2021).教育評價新趨向:智能化測評研究綜述.現代遠程教育研究(5),42-52.

任鳳琴,amp;董子涵.(2023).風險與超越:生成式人工智能賦能思政教育的倫理分析.重慶郵電大學學報(社會科學版)6),80-89.

檀慧玲,王玥,amp;萬興睿.(2023).普通高中學生綜合素質評價的現狀、問題與優化路徑——基于B市的調查研究.中國考試(7),48-56.

譚霞,amp;吳欣歆.(2023).如何落實核心素養導向的考試命題?中小學管理(5),33-36.

吳砥,郭慶,吳龍凱,amp;程浩.(2023).智能技術賦能教育評價改革.開放教育研究(4),4-10.

徐文娜,孟憲彬,,李潮海,amp;劉天成.(2022).普通高中學生綜合素質評價實施的現狀檢視與優化建議現代教育管理(11),91-97.

嚴芳,amp;汪建華.(2020).我國教育元評估指標體系構建.上海教育評估研究(2),75-80.

張進良,楊苗,amp;談桂芬.(2023).智能技術賦能基礎教育評價改革的實然困境與路徑選擇.中國遠程教育(2),18-27.

張生,王雪,amp;齊媛.(2021).人工智能賦能教育評價:\"學評融合\"新理念及核心要素.中國遠程教育(2),1-8,16,76.

張學敏,amp;趙國棟.(2022).由離散求耦合:教育結果評價與增值評價的分合取舍.教育研究與實驗(5),65-73.

張志華,王麗,amp;季凱.(2022).大數據賦能新時代教育評價轉型:技術邏輯、現實困境與實現路徑.電化教育研究(5),33-39.

中共中央,amp;國務院.(2020-10-13).中共中央國務院印發《深化新時代教育評價改革總體方案》.中華人民共和國中央人民政府網站.http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm

Assessment Reform Group. (1999).Assessment for learning: Beyond the black box. Cambridge Univ. School ofEducation. htp://www.nuffieldfoundation.org/sites/default/files/files/beyond_blackbox.pdf

Black,P.,Harrison, C.,Lee, C.,Marshall,B.,amp; Wiliam,D. (2O04). Working inside the black box: Assessmentfor learning in the classroom. Phi Delta Kappan, 86(1), 8-21.

Black,P.,amp; Wiliam,D.(1998).Assessmentand classroomlearning.Assessment inEducation: Prnciples,Poli-cy,amp; Practice, 5(1),7-74.

Dann,R. (2Ol4).Assessmentaslearning:Blurring theboundariesof assessment and learning for theorypolicyand practice.Assessment in Education: Principles,Policyamp; Practice,21(2),149-166.

Davidson,J.E.(2Oo5).Evaluation methodology basics: Thenutsand bolts of sound evaluation.Sage Publica-tions.

Earl,L.,Katz,S.,amp; The Western and Northern Canadian Protocol for Collaboration in Education (WNCP) as-sessment team. (2oo6). Rethinking classroom assessment with a purpose in mind. Western and Northern Ca-nadian Protocolfor Collaboration in Education. Retrieved from: https://www.edu.gov.mb.ca/k12/assess/wncp/

full_doc.pdf

Earl,L.M. (2o3).Assessment as learing: Using clasroom assessment to maximize student learning.Corwin Press.

Gobert,J. D.,Sao Pedro,M.,Raziuddin,J.,amp; Baker,R.S. (2013).From log files to assessment metrics: Measuring students’science inquiry skills using educational data mining.The Journal of the Learning Sciences, 22(4), 521-563.

Kippers,W.B.,Wolterinck,C.H.D.,Schildkamp,K.,Poortman,C.L.,amp;Visscher,A.J.(2018).Teachers' views on the use of assessment for learning and data-based decision making in classroom practice. Teaching and Teacher Education,75,199-213.

Kuger,S., Klieme,E., Jude,N.,amp; Kaplan,D. (2O16). Assessing contextsof learning. Springer International Publishing.

Lincoln,Y.S. (1985). The ers standards for program evaluation: Guidance for a fledging profession. Evaluation amp; Program Planning, 8(3),251-253.

OECD.(20o8). Measuring improvements in learning outcomes: Best practices to assss the value-added of schols. OECD Publishing.

Ouyang,F.,Dinh,T.A.,amp; Xu,W.(2O23).Asystematic review of AI-driven educational assessment inSTEM education. Journal for STEM Education Research, 6(3),408-426.

Pearce,J.,amp; Chiavaroli,N.(2O23).Rethinking assssment inresponse togenerativeartificial inteligence. Medical Education, 57(10), 889-891.

Sadeghi,K.,amp; Rahmati,T. (2O17). Integrating assessmentas,for,andof learning in alarge-scale exam preparation course. Assessing Writing,34,50-61.

Schellekens,L.H.,Bok,H. G.J.,de Jong,L.H.,van der Schaaf,M.F.,Kremer,W.D.J.,amp; van der Vleuten, C.P. M. (2O21).A scoping review on the notions of assessment as learning (AaL),assessment for learning (AfL),and assessment of learning (AoL). Studies in Educational Evaluation,71,101094.

Schildkamp,K.,van der Kleij,F.M.,Heitink,M.C.,Kippers,W.B.,amp; Veldkamp,B.P.(202O).Formative assessment:Asystematic review of critical teacher prerequisites for classoom practice.International Journal ofEducational Research,103,101602.

Scriven,M.(1969). An introduction to meta-evaluation. Educ Prod Rep, (2) 36-38.

Scriven,M.(2O11).Evaluating evaluations: Ameta-evaluation checklist.Memo, Claremont Graduate University. https://cnxus.org/wp-content/uploads/2022/04/EvaluatingEvals-Checklist.pdf

Stufflebeam,D.L. (1974).Meta-evaluation. Occasional Paper Series,NO.3,The Evaluation Center,Western Michigan University.

Stufflebeam,D.L. (2Oo).The methodology of metaevaluation as reflected in metaevaluations by the Western Michigan University Evaluation Center. Journal of Personnel Evaluation in Education,14(1),95-125.

Stufflebeam,D.L. (20o1).The metaevaluation imperative.American Journal of Evaluation,22(2),183-209.

Taras,M. (2O10). Assessment for learning: Assessing the theory and evidence.Procedia Social and Behavioural Sciences,2(2),3015-3022.

The Higher Learning Commission. (20o7). Student learning,assessment,and accreditation.https://www.andrews.edu/services/effectiveness/assessment/resources/hlc_resource_-_student_learning_assessment_and_ accreditation_2007.pdf

Trumbull,E., amp; Lash,A. (2013). Understanding formative assessment: Insights from learning theory and measurement theory.WestEd.https://www2.wested.org/www-static/online_pubs/resource1307.pdf

UNESCO.(2019).The promise oflarge-scale learning assessments: Acknowledging limits to unlock opportunities.UNESCO Digital Library.https://unesdoc.unesco.org/ark:/48223/pf0oo0369697

Yarbrough,D.B.,Shula,L.M.,Hopson,R.K.,amp;Caruthers,F.A.(2OlO).TheProgramEualuationStandards: Aguideforevaluatorsand evaluationusers(3rd ed). Corwin Press.

Zeng,W.,Huang,F.,Yu,L.,amp; Chen,S. (2O18).Towards a learning-oriented assessment to improve students' learning-A critical review of literature.Educational Assessment,Evaluation and Accountability,30, 211-250.

From“Assessment of Learning” to “Assessment as Learning\": Exploring the Effectiveness of Intelligent Technology in Supporting Learning Evaluation from the Perspective of Meta-evaluation

Jin Wanying and Zhuang Rongxia

Abstract:In the era of intelligence, the large-scale,long-term and multi-dimensional student behavior performance data generated by learning have become the soil of new learning evaluation. To guide the effective application of technology in learning evaluation,this research focuses on the transformation of learning evaluationideas and the effectiveness of technology-enabled learning evaluation. By organizing relevant terminology of learning evaluation,it is found that the concept of learning evaluation evolves from “assessment of learning” to “assessment as learning\",and learning-oriented evaluation,and teaching-learning-assessment as a whole, have become important educational evaluation concepts. This research further explores the pathways of integration and innovative applications of technology in learning assessment,and then applies the CIPO model and meta-evaluation ideas to construct a meta-evaluation model of the effectiveness of technology-supported learning evaluation,and takes process evaluation as an example to explore the meta-evaluation model of the effectiveness of technology-supported process evaluation. At the same time,in order to maximize the effectiveness of technology, it is necessary to pay atention to the ethical problem of technology use in the evaluation process and put forward corresponding countermeasures. The research is expected to provide reference for the current reform of learning evaluation.

Keywords: learning evaluation; technology empowerment, meta-evaluation; intelligent technology,effectiveness

Authors: Jin Wanying,graduate student of the Faculty of Education, Beijing Normal University (Beijing 10o875); Zhuang Rongxia, associate professor of the Faculty of Education, Beijing Normal University (Corresponding Author: zhuangrx@bnu. edu.cn Beijing 100875)

猜你喜歡
評價教育學生
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
教育有道——關于閩派教育的一點思考
趕不走的學生
辦好人民滿意的首都教育
學生寫話
學生寫的話
基于Moodle的學習評價
保加利亞轉軌20年評價
主站蜘蛛池模板: 伊人婷婷色香五月综合缴缴情| 亚洲国产高清精品线久久| 久久亚洲国产视频| 亚洲电影天堂在线国语对白| 国产91视频免费| 尤物成AV人片在线观看| 2022国产无码在线| 亚洲视频三级| 91丝袜乱伦| 国产欧美精品专区一区二区| 亚洲欧美日韩另类在线一| 超碰91免费人妻| 好吊妞欧美视频免费| 91免费国产高清观看| 人妻无码一区二区视频| 精品福利网| 欧美日韩在线亚洲国产人| 国产精品综合久久久| 日韩av手机在线| 国产成人a毛片在线| 婷婷色婷婷| 成人综合网址| 少妇极品熟妇人妻专区视频| 精品成人一区二区三区电影 | 69视频国产| 夜夜操国产| 亚洲国产91人成在线| 国内精品久久人妻无码大片高| 538国产在线| 国产成人综合日韩精品无码不卡| 国产成人亚洲综合A∨在线播放| 日韩专区第一页| 国内精品视频区在线2021| 内射人妻无码色AV天堂| 国产中文一区a级毛片视频| 精品伊人久久大香线蕉网站| 久久五月视频| 亚洲Aⅴ无码专区在线观看q| 欧美人人干| 國產尤物AV尤物在線觀看| 国产高清不卡| swag国产精品| 91精品啪在线观看国产| 欧美黄网在线| 亚洲va在线∨a天堂va欧美va| 99热国产这里只有精品9九| 一级做a爰片久久免费| 色综合久久综合网| 美女高潮全身流白浆福利区| 国产尤物视频在线| 91丨九色丨首页在线播放| 伦精品一区二区三区视频| 99精品高清在线播放| 国产一级精品毛片基地| 一级一级特黄女人精品毛片| 91青青草视频在线观看的| 91精品国产麻豆国产自产在线| 亚洲成a人在线播放www| 国产不卡在线看| 亚洲成人精品| 国产农村1级毛片| 国产不卡网| 久久一色本道亚洲| 一级毛片中文字幕| 国产a v无码专区亚洲av| 在线无码九区| 欧洲成人免费视频| 亚洲欧美日韩中文字幕在线| 综合社区亚洲熟妇p| 伊人色综合久久天天| 欧洲精品视频在线观看| 高清精品美女在线播放| 国产超碰在线观看| 婷婷99视频精品全部在线观看 | 色呦呦手机在线精品| 亚洲日韩Av中文字幕无码| 国产精品妖精视频| 试看120秒男女啪啪免费| 亚洲国产成人麻豆精品| 国产精品妖精视频| 精品乱码久久久久久久| 亚洲一级无毛片无码在线免费视频 |