摘要:基于信息技術的表現性評價是技術賦能學生綜合素質評價的實踐方法,對于推動學生綜合素質評價改革和基礎教育高質量發展意義重大。在教育信息化發展新階段,如何準確理解基于信息技術的表現性評價及其構成要素、分類框架,已成為學生綜合素質評價改革中的熱點問題。在教育數字化轉型背景下,基于信息技術的表現性評價是一種遍及教育評價各要素、流程和層面的立體式變革,呈現出表現性、智能性和客觀性的特點,且具有評價目標、評價任務、評價數據、評價結果、評價反饋和信息技術支持六大要素。結合教育信息化發展特點,基于信息技術的表現性評價可被劃分為預設式靜態性評價、預設式適應性評價、預設式交互式評價、預設式真實性評價和自然式非侵入性評價五類。
關鍵詞:綜合素質評價;表現性評價;技術賦能;基礎教育;教育信息化
中圖分類號:G434 文獻標識碼:A
本文系科技部“社會治理與智慧社會科技支撐”重點專項項目“大規模學生跨學段成長跟蹤研究”(項目編號:2021YFC3340800)階段性研究成果。
① 鄭勤華為本文通訊作者。
作為破除“唯分數”評價和健全立德樹人落實機制的關鍵與路徑[1],綜合素質評價對于推進我國基礎教育評價改革與創新具有重要的示范和引領作用。然而,從實踐效果來看,當前全國各地蓬勃開展的綜合素質評價活動普遍存在“數據采集方式單一、分析過程不明、評測結果輸出不全”的現實困境[2],導致評價工作總體上“流于形式,浮于表面”。
近年來,以人工智能、大數據、區塊鏈為代表的智能技術正與教育教學不斷深入融合,持續推動教育信息化縱深發展,這為解決學生綜合素質評價的“卡脖子”難題并促進基礎教育現代化高質量發展提供了有力支撐。政策層面,中共中央、國務院印發的《深化新時代教育評價改革總體方案》和教育部辦公廳印發的《關于開展信息技術支撐學生綜合素質評價試點工作的通知》均強調利用信息技術變革和創新學生綜合素質評價;研究層面,信息技術被認為有助于采集學生綜合素質評價全方位數據和推動教育評價全面數字化轉型[3][4];實踐層面,專門服務于學生綜合素質評價的電子化管理平臺、智能化評價終端、教育大數據平臺等層出不窮,成為構建新型學生評價體系的“催化劑”和試驗臺。然而,從方法論視角來看,現有實踐仍然停留在傳統教育測量范式的范疇,其典型表現是信息技術主要被用于以數字化方式采集學生寫實或作答記錄,但在測評任務呈現、測評數據采集和分析、測評結果反饋等方面尚未發揮出技術優勢[5]。
對此,“大規模跨學段學生成長跟蹤研究”課題組(以下簡稱“課題組”)面向學生綜合素質評價改革的現實需求,融合技術與教育雙向賦能思維,提出了基于信息技術的表現性評價,并將其作為信息技術支撐學生綜合素質評價的實踐方法論[6]。然而,隨著信息技術的不斷縱深發展,技術賦能學生綜合素質評價展現出多樣性與復雜性的特點,這給相關研究者和實踐者準確理解和使用該評價方法帶來了極大不便。事實上,對于基于信息技術的表現性評價的基本特點,尤其是對其分類的認識不清,給該評價方法的落地方案、實施方式和效果評估造成了重重阻礙。在我國教育信息化發展的新階段(即教育數字化轉型),科學認識該評價方法,并構建其分類框架,將有利于推動學生綜合素質評價改革和基礎教育高質量發展。
(一)基于信息技術的表現性評價概念
作為信息技術與表現性評價深度融合的產物,基于信息技術的表現性評價是指利用信息技術變革評價實踐中任務的呈現方式、數據的采集和分析過程和結果反饋形式等,考察學生在真實、復雜、未知(即不確定)情境中運用先驗知識完成某項任務或解決某個問題時的知識與技能掌握程度,以及問題解決、交流合作和批判性思考等多種復雜能力發展狀況的一種新型評價方法[7][8]。隨著我國教育信息化自2022年起正式邁入教育數字化轉型新發展階段,基于信息技術的表現性評價被賦予了豐富的新時代內涵。如祝智庭等人[9]所言,作為一種劃時代的系統性教育創變過程,教育數字化轉型是指將數字技術有機整合到教育領域(如教育評價)的各個要素、流程和層面。在該背景下,基于信息技術的表現性評價推崇將信息技術有機整合到教育評價的各個要素(包括評價內容、結果、理念、對象、方法和設計等)、流程(包括評價輸入、分析、輸出和反饋等)和層面(包括國家、地區、學校和學生個體等)之中。在先前的教育信息化發展階段,該評價方法只是將信息技術孤立或靜態地嵌入到教育評價的一個或部分要素、流程和層面中,因此就其本質而言只是一種“點”或“面”式的評價改革。例如,在要素方面,先前發展階段的評價方法只是對評價內容(由“學科基本能力”變革為“跨學科綜合素養”)、評價結果(由“千人一面”變革為“一人一面”)、評價理念(由“以評促學”變革為“學評融合”)和評價對象(由“可得性群體”變革為“代表性群體”)等進行了重點關注,相對忽略了評價方法和設計;在流程方面,先前發展階段的評價方法著重關注了評價輸入(由“結果性數據”變革為“結果與過程共存的綜合性數據”)和分析(由“人類主觀評分”變革為“機器自動評分”),但對評價輸出和反饋著力不足;在層面方面,先前發展階段的評價方法因為理念、技術和倫理等的考慮和限制,只能實現針對部分層面的評價實踐。在教育數字化轉型階段,基于信息技術的表現性評價給教育評價帶來的是一種遍及各要素、流程和層面的立體式變革,因此該過程在本質上是一種上升到機制體制創新的教育創變過程。
為更好地理解基于信息技術的表現性評價,有必要將其與一些相關概念(如傳統教育評價、一般表現性評價、智能技術賦能教育評價)加以比較分析。第一,相比傳統教育評價方法(包括常見的“考試”和心理量表或問卷),基于信息技術的表現性評價能夠有效消除其在設計與開發范式上的滯后性(難以真實、全面且客觀地記錄核心素養各維度的外在表現及內在變化過程),強力破解其在真實性、形成性和客觀性等方面的問題。第二,相比一般表現性評價,基于信息技術的表現性評價強調利用信息技術賦能表現性評價實踐中任務的呈現方式、數據的采集和分析過程、結果的反饋形式等,從而提升測評場景的真實性、測評證據的全面性和分析反饋的客觀性。第三,相比智能技術賦能教育評價(相似概念還包括智能教育測評[10]、教育智慧評價[11]等),基于信息技術的表現性評價作為其下位概念,不僅是其具體表現和具體應用,而且是其落地方案和指導方法。
(二)基于信息技術的表現性評價特征
基于信息技術的表現性評價是一般表現性評價在信息技術時代的拓展和延伸,也是一般表現性評價的新范式和新形態。相較于傳統學生綜合素質評價范式,由于信息技術的加持與賦能,基于信息技術的表現性評價逐漸呈現出表現性、客觀性和智能性的新特征。
表現性。在傳統學生綜合素質評價中,學生只能被動地上傳寫實記錄或生成作答記錄。而在基于信息技術的表現性評價中,學生可在真實或模擬場景中以言語或非言語形式(如肢體動作、按鈕點擊、人機交互等)直接展現自身的相關素養。通常情況下,這類評價場景中的評價任務具有真實、復雜和未知的特點。真實性是指評價任務來源于真實生活場景,隸屬于真實問題或真實任務;復雜性是指評價任務的構成元素眾多,學生需要主動花費時間和精力來進行理解、解釋和處理,方能實現從問題或任務的起始狀態到目標狀態的通達;未知性是指評價任務存在多種解決方案,學生需要自主探索、權衡并選擇最優方案。當評價任務的真實性、復雜性和未知性均較高時,學生更能在評價場景中自然表現出自己的相關素養。
客觀性。在傳統學生綜合素質評價中,學生的各類記錄要么不被評價,要么只是被簡單地進行數量累加式評價(即數量越多,相關素養的分數越高),要么僅由少數甚至一個評價者(通常為班主任)進行主觀評分。很明顯,這些做法無一不與學生綜合素質評價的初衷相悖,難以實現學生綜合評價的客觀性、精準性和科學性。而基于信息技術的表現性評價可通過整合專家智慧和機器學習算法實現評價數據的自動化特征提取或關鍵模式識別,極大程度上降低了人為因素對評價過程的不利影響,因此在本質上是一種客觀性評價。
智能性。如前所述,傳統學生綜合素質評價僅將信息技術運用于采集學生寫實或作答記錄,未能充分發揮技術賦能教育的重要作用。相比之下,基于信息技術的表現性評價能夠在學生綜合素質評價的各個流程中均發揮技術賦能作用,如通過創設復雜表現性任務來增強測評場景的真實性、豐富性和復雜性,通過豐富數據采集類型來促進測評證據的全面性、全程性和全時性,通過優化數據分析能力來驅動評價反饋的客觀性、智能性和科學性,從而使得學生綜合素質評價更方便、更有效、更精準,因此極大程度上體現了智能性的特點。
關于一般表現性評價,研究者已將其構成要素明晰為表現性目標、表現性任務和表現性評分規則[12]。關于智能技術賦能教育評價,研究者已厘清技術賦能主要體現在數據采集、數據處理和數據分析、結果反饋等方面。同時,從基于信息技術的表現性評價的典型實踐案例來看,該評價方法的作用點主要包含創新測評任務呈現、拓展測評數據采集、優化測評數據分析和促進測評活動實施[13]。基于上述總結梳理和整合分析,本文從評價目標、評價任務、評價數據、評價結果、評價反饋和信息技術支持六個方面來構建基于信息技術的表現性評價邏輯框架,具體如圖1所示。

評價目標。基于信息技術的表現性評價旨在利用信息技術破解綜合素質評價難題,推動綜合素質評價有效落地,其具體目標是實現針對學生關鍵能力、必備品格和內隱價值觀的精準、客觀和科學評價。當前,教育評價改革的指導思想是“落實立德樹人根本任務”,其內在要求和核心舉措之一便是五育并舉、融合育人[14]。然而,現有綜合素質評價的維度結構(德智體美勞)相對模糊且分立,在實踐中也呈現出“疏于德、偏于智、弱于體美、缺于勞”等問題,因此難以反映學生綜合表現和彰顯五育融合理念。對此,課題組在有機整合核心素養(其內容維度具有綜合性特點)與原有綜合素質評價相關內容的基礎上,提出了新概念“綜合素養”(研究用語,實踐用語仍為綜合素質),并將其理解為學生在受教育過程中形成的跨越學科的價值觀、必備品格和關鍵能力。作為技術賦能學生綜合素質評價的實踐方法,基于信息技術的表現性評價必然以新理念下的學生關鍵能力、必備品格和內隱價值觀作為其評價目標。
評價任務。依據評價設計的時間特點,可將基于信息技術的表現性評價的任務類型區分為預設式任務和自然式任務兩類。預設式任務是指研究者采用理論驅動的評價設計范式,在評價目標理論模型的指引下,為有效誘發評價目標相關的評價指標而預先設計的表現性任務。在基于該類任務的評價活動中,學生需按要求完成一系列指定任務(如繪畫、產品制(創)造或計算機交互式任務等),因此就其本質而言是一種侵入性評價任務。自然式任務是研究者采用理論與數據雙向驅動的評價設計范式,綜合考慮評價目標的相關評價指標和實際可獲得的教育信息化數據(如基于教室攝像頭的師生交互數據、國家智慧教育平臺中的數字化軌跡數據)后而事后選用的表現性任務。基于這類任務(如課堂小組活動、數字化學習)所誘發的評價數據是學生身處自然場景時的真實表現性數據,因此隸屬非侵入性評價(或無痕性評價)任務的范疇。需要指出的是,雖然傳統研究者反對將標準化測驗納入表現性任務的范疇[15],但在技術賦能作用下,學生作答此類測驗時的行為模式、時間分配等過程性表現都能得到良好記錄,因此這類測驗也可被視為(預設式)表現性任務。但考慮到這類任務偏離學生真實生活,因此是一種低真實性的表現性任務。
評價數據。在數據類型方面,基于信息技術的表現性評價主要包括結果性數據和過程性數據兩類。結果性數據是指學生完成表現性任務之后產生的一系列數據,既包括結構化數據(如是否完成(1和0)、任務的難度和數量等),也涵蓋非結構化數據(如繪畫成品、終版調查方案、作文終稿等)。過程性數據則指學生參與表現性任務時產生的各類數據,如結構性數據中的點擊流信息、協作小組討論參與頻次等,非結構性數據中的教學視頻、中間版本的作品或方案、作答涂改記錄等。
評價結果。基于信息技術的表現性評價可以通過數值、文字或圖形等多種方式輸出學生個體或群體的特征型、發展型和比較型評價結果。特征型結果是指基于針對學生個體或群體(如男/女生、城市/農村地區學生)的評價數據分析來呈現其在特定素養上的總體現狀或不同水平分布特點,發展型結果是指基于針對學生個體或群體在若干個時間點的評價數據分析來呈現其在特定素養上的發展趨勢,比較型結果則指通過對比學生個體或群體與相應總體的數據分析結果而推論其優勢項、劣勢項和一般項。相比特征型結果,后兩類結果對于學生個體或群體的成長和發展具有更為重要的指導意義。
評價反饋。基于信息技術的表現性評價能夠為學生個體或群體提供兩方面的評價反饋:個性化反饋和差異性建議。個性化反饋是指基于針對學生個體或群體的評價數據分析結果提供區別于其他個體或群體的結果反饋(即“一人(或群體)一面”),而差異化建議則是指基于個性化反饋結果提供與之相匹配的特色型成長或發展建議。
技術支持。對于基于信息技術的表現性評價而言,技術支持主要體現在任務呈現、數據采集、數據分析和反饋推送四個方面。一是遵循任務呈現規范,利用計算機自適應、虛擬仿真等技術來創新測評任務呈現;二是遵循數據采集標準,利用平臺自動記錄、視頻錄播等技術拓展測評數據采集;三是遵循數據分析規則,利用基于證據規則的算法程序和“機器學習”評分等技術來優化測評數據分析;四是遵循結果反饋原則,利用個性化推薦和自適應推薦等技術來支撐測評結果反饋。
鑒于基于信息技術的表現性評價工具在交互性水平(如靜態(項目信息固定不變)或動態(項目信息動態變化)模式)、作答方式(如多項選擇或按鍵反應)、測評結構(如標準化試題或視頻游戲)、媒體介入(如圖形、音頻或視頻等)、復雜性(受評者為完成任務所需使用的各項要素的數量和多樣性)、保真度(測驗項目真實反映測評目標的程度)等方面各不相同,本文參考Parshall等人提出的針對技術增強評價工具的綜合性分類框架[16]、Siddiq等人提出的針對信息與通訊技術(Information and Communication Technology, ICT)素養計算機評價工具的分類框架[17],并結合我國教育信息化發展脈絡以及相關評價工具在學生能力評價中的實際應用,將基于信息技術的表現性評價工具劃分為如圖2所示的五個層次類別(即基于信息技術的表現性評價的分類層次塔),各層次類別工具的詳細描述如下頁表1所示。從層次塔的底部向上,分別是預設式靜態性評價(類別1)、預設式適應性評價(類別2)、預設式交互式評價(類別3)、預設式真實性評價(類別4)和自然式非侵入性評價(類別5)五個層次類別的評價工具;每個類別內的評價工具在項目形式、項目特點、受評者反應類型以及項目呈現技術、數據采集和分析技術、反饋推送技術研發需求等方面大體相同;隨著評價工具的層次類別由低到高,相應評價場景在真實性、復雜性和未知性上不斷遞增,同時受評者反應的多樣性、自主性和靈活性以及評價數據的豐富性、全面性和立體性也不斷遞增。此外,本文還將以ICT素養測評為例,簡要概述每一類別評價工具的具體(或潛在)應用。

類別1:預設式靜態性評價 在“計算機教育普及”階段(即我國教育信息化發展的第一階段),我國開始出現計算機輔助教學的教育模式,在教育評價領域則體現為預設式靜態性評價的運用及推廣。該類工具通常是指將傳統紙質形式的標準化測驗(包括選擇題、填空題、簡答題等)遷移為計算機化版本,其測驗項目的信息相對固定,且其作答方式相對有限(即通過觸屏點擊、鼠標點擊等方式從多個選項中選擇一個正確選項,或通過鍵盤輸入、語音輸入等方式錄入作答內容)。在信息技術研發需求上,研發者無需專門研發特定技術,而只需利用業已成熟的信息技術完成評價項目呈現、數據采集和分析等工具部署操作。
案例1:為評價小學中高段學生的信息素養(ICT素養的核心成分之一),余麗芹等人[18]通過翻譯和參考國內外中小學生信息素養測評項目,編制了標準化測驗形式的《小學生信息素養測試題》(均為多項選擇題),然后將其轉換為在線版本。學生可通過鼠標點擊的方式完成全部測評題目。
類別2:預設式適應性評價 在“基礎設施與應用能力建設”階段(即我國教育信息化發展的第二階段),我國教育信息化建設主要聚焦于數字資源建設,其核心成分之一是數字化試題庫建設,可支持預設式適應性評價的實施和開展。該類工具會根據受評者對已有測驗項目的差異化作答來自動選擇最適宜的后續測驗項目,即由計算機根據受評者能力水平自動選擇測驗項目(即計算機自適應測驗),其測驗項目的信息在很大程度上是動態變化的,但其作答方式仍然相對有限。在信息技術研發需求上,研發者亦無需專門研發特定技術。目前,計算機自適應測驗已在理論和方法體系上發展相對成熟,因此可直接沿用相關信息技術和測評技術(如在評價項目呈現中,如何選擇最適宜的測驗項目)來開展相關評價。
案例2:為評價智利15歲學生的ICT素養,Claro等人[19]研發了一個基于虛擬環境的表現性評價測評工具。該工具由一系列動態情境化試題(包括選擇題和填空題)構成,這些試題均源自預先開發良好的測試題庫,配備有每道試題的難度和區分度等詳細測評參數。依據學生對初始試題的作答情況,其能后續自動選擇最適宜的試題讓學生作答。
類別3:預設式交互性評價 在“技術與教育深度融合”階段(即我國教育信息化發展的第三階段),快速發展的網絡技術能夠支持大規模信息檢索、閱讀、存儲和交互,極大程度上促進了基于游戲的測評、基于仿真的測評等預設式交互性評價工具的出現。在該類工具中,受評者可以與專門開發的數字化測驗環境(含網頁、應用等)進行多種形式交互(如點擊不同按鈕、選擇不同操作路徑),且其測驗項目信息會依據受評者的作答情況進行動態調整,即計算機交互式測評。在信息技術研發需求上,研發者需要基于評價目標專門研發適宜的評價項目呈現技術和數據采集技術,并且基于研發成熟的數據分析技術建立(針對評價目標的)理論模型與受評者交互特征之間的映射模型。
案例3:為評價兒童的ICT素養,Aesaert等人[20]研發了一個適合于兒童使用的網絡搜索引擎。在該引擎中,學生為了制作學校節日宣傳海報,需要多次完成從計算機呈現的一系列恐龍圖片中搜索到唯一一張具有兩頭恐龍的圖片的表現性任務。對于每一次任務,學生必須使用六種軟件應用程序(文件管理系統、網絡瀏覽器、電子郵件軟件、演示軟件、文字處理軟件和電子表格軟件)中的一種。此外,學生可通過點擊屏幕底部按鈕的方式對這些應用程序進行自由訪問和切換。

類別4:預設式真實性評價 在“教育流程再造”階段(即我國教育信息化發展的第四階段),教育信息化建設強調全面探索教育服務的流程與供給方式,如在教育評價中強調源于真實場景的預設式真實性評價。在該類工具中,受評者需按要求在指定的常規線上或線下情境中完成特定真實測驗任務,如在信息技術課程測驗中完成信息搜索任務、在體質測驗中完成跳繩任務等。依據評價情境的不同,該類評價工具可細分為預設式在線真實性評價和預設式線下真實性評價,其中前者在信息技術研發需求上僅需研發適宜的數據分析技術,而后者需要同時在數據采集和分析技術研發上發力。
案例4:為評價成人的ICT素養,Eshet-Alkali和Amichai-Hamburger[21]要求60名被試在計算機上完成五項真實表現性任務,具體包括:使用“Opening Night”計算機程序創建戲劇舞臺,通過文本重述來產生新含義,分析新聞事件,安排遠程旅行,在聊天室中聊天。在該評價活動中,被試可以按照往常的計算機使用操作來參與并完成相關任務。
類別5:自然式非侵入性評價 在“教育體制機制創新”階段(即我國教育信息化發展的第五階段),以物聯網、人工智能等為代表的顛覆性技術開始在創新教育流程與組織生態等方面發揮出革命性作用,如教育評價中新近出現的以非侵入性為典型特色的自然式非侵入性評價。該類工具的典型特征是綜合利用已有教育信息化基礎設施,以非侵入性方式全面采集受評者參與日常在線或線下自然場景活動時的數據,如國家智慧教育平臺中的在線學習軌跡數據、智慧教室中的教學視頻數據等。不同于前四類工具往往需要研究人員或教師等特地組織學生參與評價活動,第五類工具無需開展此操作。依據評價情境的不同,該類評價工具可細分為自然式在線非侵入性評價和自然式線下非侵入性評價。在信息技術研發需求上,該類評價需要大力研發適宜的數據分析和反饋推送技術,以實現從龐雜的信息化數據中抽取出有價值的“去噪”數據并建立起數據特征與素質指標之間的緊密關聯,以及為學生推送個性化、全面性、發展性的反饋。
案例5:在評價個體ICT素養的未來實踐工作中,研究者可考慮利用智能技術打破“數據孤島”現象,綜合采集學生在各類在線平臺(如學習平臺、娛樂平臺、社交平臺)中的數字化軌跡數據,然后遵循“特征提取——指標合成——總分計算”的步驟來實現學生ICT素養評分。
鑒于前兩類評價(類型1和2)中的學生反應類型較為有限,本文將其統稱為低表現性評價,同時將后三類評價統稱為高表現性評價(類別3、4和5)。此外,鑒于類別1到類別4的評價工具都采用的是預設式評價場景,因此本文將這四類工具統稱為預設式評價,同時鑒于第5類評價工具的自然式評價場景特點將其稱為自然式評價。
最后,為更好地理解上述五類評價工具的區別,本文進一步從便捷性(即,可促進測評活動高效實施)、適應性、交互性、真實性和非侵入性五個方面來分析這些評價工具的異同,如表2所示。相較傳統表現性評價工具,五類工具都具有便捷性的特點,即信息技術驅動測評實施過程更加便利化;后四類工具都具有適應性的特點,即信息技術支持評價支持測評項目內容更加個性化;后三類工具都具有交互性的特點,即信息技術促進測評反應類型更加豐富化;后兩類工具都具有真實性的特點,即信息技術助力測評任務場景更加真實化;僅有最后一類工具具有非侵入性的特點,即信息技術賦能測評組織形式更加自然化。

本文從學生綜合素質評價改革的現實需求出發,并結合我國教育信息化發展特點,論述了基于信息技術的表現性評價的概念與特征、構成要素及邏輯框架、分類框架。具體而言,本文從定義、內涵、相近概念等方面討論了基于信息技術的表現性評價的概念,并從表現性、客觀性和智能性三個方面闡述了其特征;從評價目標、評價任務、評價數據、評價結果、評價反饋和信息技術支持六個方面構建了基于信息技術的表現性評價的邏輯框架及要素成分;整合前人相關研究成果、我國教育信息化發展脈絡及相關評價工具特點構建了基于信息技術的表現性評價的分類層次塔,并梳理了五類工具的評價項目形式與特點、受評者反應類型和信息技術研發需求。如前所述,當前信息技術主要被用于綜合素質評價中的數字化寫實或作答記錄,即處于基于信息技術的表現性評價的分類層次塔中的低表現性層次。誠然,該類別工具能夠一定程度上賦能學生綜合素質評價,但距離實現客觀、真實、精準的終極評價目標仍然道阻且長。隨著人工智能、虛擬現實、物聯網等新興信息技術不斷驅動教育信息化縱深發展,未來亟需抓住教育數字化轉型機遇,持續推動信息技術與表現性評價深度融合,強力賦能學生綜合素質評價工具由預設式靜態性評價向自然式非侵入性評價不斷邁進,從而最終助力學生綜合素質評價改革和基礎教育高質量發展。
參考文獻:
[1] 劉志軍,徐彬.綜合素質評價:破除“唯分數”評價的關鍵與路徑[J].教育研究,2020,41(2):91-100.
[2] 魏晶,賈曦等.以促進發展為目標的大學生綜合素質評價——第二課堂成績單建設理與實踐[J].中國電化教育,2018,(9):132-137.
[3] 楊宗凱.教育的全面數字化轉型已成必然趨勢[N].中國青年報,2022-04-11(05).
[4] 黃榮懷,楊俊鋒.教育數字化轉型的內涵與實施路徑[N].中國教育報,2022-04-06(04).
[5] 吳立寶,曹雅楠等.中小學綜合素質評價研究趨勢與熱點[J].教育理論與實踐,2021,41(11):10-15.
[6][8][13] 鄭勤華,陳麗等.基于信息技術的表現性評價:內涵、作用點與發展路向[J].中國電化教育,2023,(3):55-61.
[7] 陳麗.智能技術支撐學生綜合素質評價:改革與創新[J].現代教育技術,2023,33(12):5-13.
[9] 祝智庭,胡姣.教育數字化轉型的本質探析與研究展望[J].中國電化教育,2022,(4):1-8+25.
[10] 駱方,田雪濤等.教育評價新趨向:智能化測評研究綜述[J].現代遠程教育研究,2021,33(5):42-52.
[11] 張輝蓉,朱山等.教育智慧評價:意蘊、特征與挑戰[J].中國考試,2021,(9):1-7.
[12] 周文葉,陳銘洲.指向核心素養的表現性評價[J].課程·教材·教法,2017,37(9):36-43.
[14] 鞠玉翠.基于真實情境問題的評價何以促進五育融合[J].中國電化教育,2021,(1):14-19.
[15] Stecher B M.Performance assessment in an era of standards- based educational accountability [J].Journal of Military Medicine,2010,16(1):37-44.
[16] Parshall C G,Harmes J C,et al.Innovative items for computerized testing [M].New York:Springer,2010.215-230.
[17] Siddiq F,Hatlevik O E,et al.Taking a future perspective by learning from the past-A systematic review of assessment instruments that aim to measure primary and secondary school students’ ICT literacy [J]. Educational Research Review,2016,19:58-84.
[18] 余麗芹,索峰等.小學中高段學生信息素養測評模型構建與應用研究——以四、五年級學生為例[J].中國電化教育,2021,(5):63-69.
[19] Claro M,Preiss D D,et al.Assessment of 21st century ICT skills in Chile: Test design and results from high school level students [J].Computers Education,2012,59(3):1042-1053.
[20] Aesaert K,van Nijlen D,et al.Direct measures of ICT validation of an ICT competence scale [J].Computers Education,2014,76:168-181.
[21] Eshet-Alkali Y,Amichai-Hamburger Y.Experiments in digital literacy [J]. Cyber-psychology Behavior,2004,7(4):421-429.
作者簡介:
柴喚友:博士,研究方向為智能教育測評、學習分析、教育心理學。
鄭勤華:教授,博士,博士生導師,研究方向為在線教育、人工智能教育、教育大數據、學習分析。
Performance Assessment Based on Information Technologies: Concept Analysis, Constituting Elements, and Classifying Framework
Chai Huanyou1, Zheng Qinhua2, Hu Tianhui3, Wang Huaibo4
1.Faculty of Artificial Intelligence in Education, Central China Normal University, Wuhan 430079, Hubei 2.The Research Center of Distance Education, Beijing Normal University, Beijing 100875 3.Collaborative Innovation Center of Basic Education Information Technology Service for Hubei Province, Hubei University of Education, Wuhan 430205, Hubei 4.School of Systems Science, Beijing Normal University, Beijing 100875
Abstract: Performance assessment based on information technology (PAIT) is a practical method for students’ comprehensive quality evaluation, which is of great significance for promoting the reform of comprehensive quality evaluation of students and the high-quality development of K-12 education. In the new stage of educational informatization development, how to exactly understand PAIT, as well as its components and classification framework, has become a hot issue in reforming students’ comprehensive quality evaluation. Under the background of digital transformation of education, PAIT is a three-dimensional reform covering all elements, processes and levels of educational evaluation, featuring performance, intelligence, and objectivity, and consisting of assessment goals, tasks, data, results, and feedbacks, as well as the support from information technologies. Based on the development characteristics of information technologies, PAIT could be divided into five categories: pre-set static, pre-set adaptive, pre-set interactive, pre-set authentic, and natural non-invasive assessments.
Keywords: comprehensive quality evaluation; performance assessment; technology empowerment; K-12 education; educational informatization
收稿日期:2023年11月15日
責任編輯:李雅瑄